Indledning
En hypotesetest laves for at undersøge en opsat hypotese som kan be- eller afkræftes efterfølgende. Hypotesen opstilles ved at undersøge uafhængigheden mellem to faktorer.
En hypotese kunne for eksempel være om der er uafhængighed mellem ”køn” og ”spille fodbold”. Ved at følge den fremgangsmåde der vil blive gennemgået
kan man ud fra stikprøve-data fastslå nogenlunde præcist hvorvidt der er uafhængighed eller ej, som gøres ved en såkaldt χ^2-test.
I det følgende vil jeg gennemgå fremgangsmåden ved en hypotesetest, hvor jeg vil forklare teorien og underbygge det med et eksempel.
Eksemplet har vi arbejdet med i undervisningen, og omhandler spørgsmålet ”I hvilken grad er det vigtigt for dig at vide, om du har haft influenza?”.
Indholdsfortegnelse
1. Opstil H0 og HA.
2. Optæl de observerede antal (O) vha. Excel i en pivottabel.
3. Beregn de forventede antal (E=(R•S)/Totalsum ) under forudsætning af H0 er sand. Gør især redefor, hvordan regnereglen P(A∩B)=P(A)•P(B) for uafhængige hændelser A og B benyttes.
4. Beregn bidragene (O-E)^2/E til den samlede teststørrelse Χ^2=∑(O-E)^2/E.
5. Bestem frihedsgraderne df=(r-1)(s-1).
6. Vælg signifikansniveau (fx α=5%).
7. Bestem critical value i en Χ^2-fordeling grafisk vha. GeoGebra.
8. Hvordan beslutter man, om man skal forkaste H0 eller acceptere H0? Opstil en tydelig beslutningsregel.
9. Hvad er testens signifikanssandsynlighed (p-value)? Hvordan bruger man denne p-value til at beslutte, om man skal forkaste H0 eller acceptere H0?
Optimer dit sprog - Læs vores guide og scor topkarakter
Uddrag
2. Optæl de observerede antal (O) vha. Excel i en pivottabel.
Næste trin foregår i Excel, hvor den rå data skal optælles i en pivottabel. Pivottabellen sættes overskueligt op, så rækkefølgen af inddelingskriterierne giver mening
og hovedtotalen (række- og søjlesum) passer. Et eksempel ses herunder med influenza-hypotesen. I cellen nederst til venstre ses totalsummen, som angiver stikprøvens størrelse.
3. Beregn de forventede antal (E=(R•S)/Totalsum ) under forudsætning af H0 er sand. Gør især redefor, hvordan regnereglen P(A∩B)=P(A)•P(B) for uafhængige hændelser A og B benyttes.
Nu kan der laves et estimeret antal på baggrund af sandsynlighederne for de enkelte celleværdier, med den forudsætning at der er uafhængighed mellem inddelingskriterierne, som med andre ord betyder at H_0 er sand.
Her benyttes regnereglen for uafhængighed mellem hændelser: P(A∩B)=P(A)•P(B)
For at beregne den estimerede værdi finder vi altså fællesmængden mellem to uafhængige hændelser Ai og Bj, som gøres ved at gange sandsynlighederne sammen.
Mere specifikt gør vi det ved R_i/totalsum•S_j/totalsum.
Derefter ganger vi det med totalsummen for at for den forventede værdi:
E=totalsum•R_i/totalsum•S_j/totalsum
Skriv et svar