Indledning
Jeg skal i denne aflevering kigge nærmere på den statistiske metode Chi-i-anden-test, rettere sagt en af de mest almindelige X^2-test nemlig uafhængighedstest.

Denne metode kan bruges når man har et observationssæt, og man dernæst gerne vil vurdere om det svarer til det man forventede. Uafhængighedstest handler om at finde en sammenhæng mellem to typer af observationer.

Det kunne være, at man vil undersøge, om der er forskel på, hvordan piger og drenge betragter skole arbejde? Om der er forskel på hvordan unge og ældre anskaffer nyhedsinformationer?

Om der er forskel på, hvordan mænd og kvinder stemmer, når der er folketingsvalg? Rettere sagt, så handler det om, om der er en sammenhæng mellem nogle faktorer eller ikke, hvis der er uafhængighed, er der ingen forskel.

Indholdsfortegnelse
Indledning:
Redegørelse af overordnede begreber inden for uafhængighedstest:
Uafhængighedstests formler:
- De forventede værdier, formel:
- Formlen til beregning af q-værdien:
- Antal frihedsgrader:
- P-værdien (signifikanssandsynligheden):
OPGAVE 1 og 2: Metodisk fremgang af hvordan man kan afgøre om der er uafhængighed eller ej for to inddelingskriterier:
- Punkt 1, tabel:
- Punkt 2, formulerer hypoteserne:
Punkt 3: Tabel over de forventede værdier og afvigelserne
- Opgave 1:
- Opgave 2:
- De forventede værdier:
- Punkt 4, at bestemme q-værdien:
- Opgave 1:
- Opgave 2:
- Punkt 5, Frihedsgrader, samt signifikanssandsynligheden:
- Punkt 6, konklusionen:
- Opgave 1:
- Opgave 2:
Opgave 1
a) Konstruér et skema som nedenstående, der indeholder data fra undersøgelsen
b) Foretag en hypotese-formulering med henblik på at teste for uafhængighed.
c) Beregn de forventede værdier.
d) Beregn samtlige forskelle ved brug af formlen:
e) Beregn q-værdien for den stokastiske variabel Q.
Signifikansniveauet vælges til at være 5 %.
f) Beregn p-værdien og vurdér, om der er tale om uafhængighed.
g) Skriv et kort notat til WWF, hvor du præsenterer betydningen af dit hypotesetest.
Opgave 2
a) Konstruer et skema som nedenstående, der indeholder data fra stikprøven
b) Opstil en nulhypotese og en alternativ hypotese og bestem de forventede værdier, når der antages uafhængighed.
c) Kan det antages, med et signifikansniveau på 5 %, at benyttelsen af de to taxaholdepladser er uafhængigt af tidspunktet?

Optimer dit sprog - Læs vores guide og scor topkarakter

Uddrag
Punkt 1, tabel: I opgave 1 ser vi på en konkret undersøgelse af sammenhængen mellem syn på udfordringer for det danske samfund og køn, og i opgave 2 ser vi også på en konkret undersøgelse af sammenhængen mellem taxapladsernes og tidspunkter på døgnet.

Første del af opgaverne skal man opstille et skema over de angivne data fra Excel filerne. Det har jeg gjort ved hjælp af funktionen privottabel i Excel.

Denne tabel er som sagt blot en stikprøve, men vi skal finde ud af hvor vidt hele populationen er uafhængig eller ej mellem to inddelingskriterier. Som i opgave 1 er følgende to hypoteser:

Punkt 2, formulerer hypoteserne:
H0 = der er uafhængighed mellem syn på udfordringer for det danske samfund og køn
H1 = der er afhængighed mellem syn på udfordringer for det danske samfund og køn

I opgave 2 er det følgende to hypoteser:
H0 = der er uafhængighed mellem taxapladserne og tidspunkter
H1 = der er afhængighed mellem taxapladser og tidspunkter