Beskrivende statistik | Emneopgave

Indledning
I statistik bruges der to forskellige former, der er statistik med diskret variabel, det er ikke grupperet data. Det kan være ting som mål i en fodboldkamp, slag med en terning osv.

Den anden er statistik med en kontinueret variabel, her er det grupperet data, dvs. man inddeler dataen i intervaller.

Man inddeler offsets dataen i intervaller, når man har med mange forskellige observationer at gøre, på den måde bliver det mere overskueligt.

Dette kan være ting som, alder, højde, løn osv. hvor der kan være en stor forskel på mindste til størsteværdi. I statistik bruger man en masse forskellige deskriptorer, til at analysere dataen. Nedenunder er der forskellige deskriptorer, man bruger.

Indholdsfortegnelse
Data:
Observationer:
Intervaller:
Hyppighed:
Typetal:
Frekvens:
Summeret frekvens:
Kvartilsættet:
Variationsbredde:
Gennemsnittet/middelværdien:
Varians:
Spredning:
Højre-/venstreskæv:
Nspire:

Grafer med ikke grupperet data
Grafer med grupperet data
Statistik med ikke grupperet data
Statistik med grupperet data
Indeks

Uddrag
Q1 er den største observation blandt de laveste 25%, eksempel hvis vores data hedder 1,1,2,3,4,4,5,6,6, her er de 25% mellem 1 og 2, derfor finder man gennemsnittet af de to tal (1+2)/2=1,5, derved er Q1=1,5 i dette eksempel.

Medianen er den største observation blandt de laveste 50%, det vil sige det er det midterste tal i et sorteret datasæt, hvis vi kigger på eksemplet før 1,1,2,3,4,4,5,6,6, så er tallet 4 det midterste tal og derfor medianen.

Havde det været et datasæt med et lige antal observationer, beregnes det på samme måde som ved Q1, ved at finde gennemsnittet, af de to observationer.

Q3 er den største observation blandt de laveste 75%, i eksemplet som førnævnt 1,1,2,3,4,4,5,6,6, er Q3=(5+6)/2=5,5, da de 75% er mellem 5 og 6.

---

Variationsbredde:
Variationsbredden er forskellen mellem mindsteværdien og størsteværdien.

Da vi før fandt mindste- og størsteværdi, på eksemplet med grønthandleren, er det bare at minus størsteværdien med mindsteværdien. Her ses udregningen på eksemplet 16-10=6. Så variationsbredden = 6.

Gennemsnittet/middelværdien:
Gennemsnittet findes ved at lægge alt dataen sammen, derefter divideres der med antal værdier. Formlen for dette ser således ud:

---

Variansen viser hvor langt hver observation ligger fra gennemsnittet, opløftet i anden. Hvis vi tager udgangspunkt i eksemplet vi brugte, da vi fandt gennemsnittet.

Gennemsnittet skal nemlig bruges til at udregne variansen. Udregningen til variansen ser således ud: Variansen=s^2=SAK/(n-1)

Da vi ikke ved hvad spredningen(s) er, skal vi derfor finde SAK og dividere med n. N står for antal data, SAK står for summen af afvigelsernes kvadrat.

Her finder man ud af hvor langt hvert punkt er ligger fra gennemsnittet. Nedenunder ses det grafisk for langt væk tallene 1,2,5,6,6, er fra gennemsnittet på 4.

Dette skal dog skrives som en udregning, her opløfter man tallene til at stå i anden, da de ellers udligner de hinanden.

I nævneren bliver der minusset med 1, da dette er en stikprøve, og der derved er vis usikkerhed. Havde det været for hele populationen, skulle der ikke være blevet minusset med 1. Variansen er i dette tilfælde derfor:

Sådan får du adgang til hele dokumentet

Byt til nyt Upload en af dine opgaver og få adgang til denne opgave
  • Opgaven kvalitetstjekkes
  • Vent op til 1 time
  • 1 Download
  • Minimum 10 eller 12-tal
Premium 39 DKK pr måned Få adgang nu