Introduktion

Deskriptiv statistik er det samme som beskrivende statistik. Emnet rummer begreber og metoder, som tilsammen gør det muligt at beskrive sæt med data og visualisere dem. I denne guide kan du læse om de begreber, kaldet deskriptorer, som du kan bruge til at beskrive datasæt og de grafiske repræsentationer, du kan bruge til at visualisere et datasæt.

Optimer dit sprog - Læs vores guide og scor topkarakter

Sådan bruger du materialet

Formålet med deskriptiv statistik er at overskueliggøre datasæt, så de nemmere kan forstås og sammenlignes med andre datasæt.

Ugrupperet eller grupperet observationssæt

Et sæt med data består af en række observationer, der tilsammen udgør et observationssæt. Et observationssæt kan være grupperet og ugrupperet. Et observationssæt er grupperet, når man inddeler observationerne i intervaller.

Hyppighed, frekvens og kumuleret frekvens

  • Hyppighed er et begreb for, hvor mange gange man har en observation i datasættet. I eksemplet ‘Højder’ er hyppigheden for intervallet [160;165[ f.eks 4. Frekvens er et begreb for, hvor mange procent hyppigheden udgør af det samlede antal observationer.
  • Kumuleret frekvens vil sige, at man løbende lægger frekvenserne sammen. Dvs. at hvis man ser på den kumulerede frekvens for 42 i eksemplet ‘Skostørrelser’, så beskriver den hvor stor en procentdel, der bruger størrelse 42 eller mindre.

Deskriptorer

  • Maksimum: Den største værdi blandt alle observationerne, f.eks. skostørrelsen 46. For grupperede observationer kan du angive det højeste interval, men du kan ikke nødvendigvis vide, hvad maksimum er.
  • Minimum: Den mindste værdi blandt alle observationerne, f.eks. skostørrelsen 37. For grupperede observationer kan du angive det laveste interval, men du kan ikke nødvendigvis vide, hvad minimum er.
  • Variationsbredde: Afstanden fra maksimum til minimum. Den beregnes ved maksimum minus minimum. Denne kan ikke bestemmes nøjagtigt for et grupperet observationssæt, med mindre du kender de enkelte observationer i hvert interval.
  • Typetal: Den observation der optræder flest gange/har højst hyppighed, f.eks. skostørrelsen 42.
  • Typeinterval: Typetallet for grupperede observationssæt. Dvs. det interval, der har den højeste hyppighed.
  • Median: Den observation hvor nøjagtig 50% af observationerne er den samme eller mindre, og nøjagtig 50% af observationerne er den samme eller større. Dvs. medianen er “den midterste observation” i observationssættet, hvis man sætter observationerne i rækkefølge fra mindst til størst.

Grafiske repræsentationer

I dette afsnit gennemgås forskellige grafiske repræsentationer af et observationssæt. Pindediagram/søjlediagram Et pindediagram/søjlediagram er især godt til at vise hyppigheden eller frekvensen for et ugrupperet observationssæt. Herunder ses et søjlediagram for skostørrelserne På x-aksen kan man aflæse, hvilken observation der er tale om, og på y-aksen kan man aflæse hyppigheden for observationen.