Indholdsfortegnelse
Teoretisk del
a. Hvad betyder et konfidensinterval for en andel? Inddrag herunder opstilling af hypotesetest for andel. (Bemærk! Teorien ang.
binomialfordelt variabel m.m. er blevet gennemgået i tidligere emneopgave. Det er kun konfidensinterval for en andel og hypotesetest i forbindelse med en andel, som skal præsenteres her. Spørg hvis i tvivl!)
- Hypotesetest
- Type 1 og type 2 fejl ved hypotesetest
- Eksempel på konfidensinterval
b. Hvad er henholdsvis kvalitative og kvantitative variable
- Kvantitativ variabel
- Kvalitativ variabel
c. Hvad betyder uafhængighed mellem to variable? Inddrag herunder opstilling af hypotesetest for uafhængighed.
- Betydning af afhængige og uafhængige variable
- Eksempel på afhængige og uafhængige forsøg
- Opstilling af hypotesetest for uafhængighed.
d. Hvad er forskellen mellem observerede og forventede værdier i en uafhængighedstest?
e. Hvordan beregnes de forventede værdier i en uafhængighedstest?
- Eksempel (samme eksempel som opgave c)
f. Hvordan beregnes antallet af frihedsgrader i en uafhængighedstest?
- Eksempel på antallet af frihedsgrader (samme eksempel som opgave c)
g. Hvordan beregnes testvariablen, Q, i en uafhængighedstest?
- Eksempel på testvariablen Q (samme eksempel som opgave c)
h. Hvad betyder begrebet ”kritisk værdi” i en uafhængighedstest? Tegn også fordelingen, og inddrag denne i din forklaring.
- Eksempel (samme eksempel som opgave c)
i. Hvor er arealet for p-værdien i en uafhængighedstest? Tegn også fordelingen, og inddrag denne i din forklaring. Forklar herunder betydningen af p-værdi
- Eksempel (samme eksempel som opgave c)
j. Hvordan afgør man om der er uafhængighed mellem to variable?
k. Hvad bruges en Goodness-of-fit (GOF) test til? Og hvordan laves en GOF test?
- Eksempel på Goodness-of-fit test
Praktisk del
Opgave 1
- Firmaet Fitnessdk vil undersøge, om der forskel på fordelingen af mænd og kvinder i tre udvalgte Fitnessdkcentre på Sjælland.
- Nedenstående tabel viser et udsnit af data, som findes i filen fitnessdk.
a) Konstruér et skema som nedenstående, der indeholder data fra filen fitnessdk.
b) Opstil en nulhypotese og en alternativ hypotese og bestem de forventede værdier, når det antages, at der ikke er forskel på fordelingen af mænd og kvinder i de forskellige Fitnessdk centre.
c) Kan det antages, med et signifikansniveau på 5%, at der ikke er forskel på fordelingen af mænd og kvinder i de forskellige Fitnessdk centre?
Opgave 2
Et gymnasium ønsker gennem en ny biografkampagne at øge kendskabet til gymnasiets studieretninger. Inden kampagnen har undersøgelser vist, at 9 % af byens unge kender til gymnasiets udbud af studieretninger.
a. Bestem sandsynligheden for, at mindst 35 unge ud af en gruppe på 300 har kendskab til gymnasiets udbud af studieretninger.
b. Bestem andelen af unge i undersøgelsen, der kender gymnasiets studieretninger.
c. Vurdér ud fra et 90 %-konfidensinterval, om biografkampagnen har ændret kendskabet til gymnasiets udbud.
Optimer dit sprog - Læs vores guide og scor topkarakter
Uddrag
Konfidensinterval kan beregnes, når man vil undersøge andele i en given stikprøve, altså med grundlag i en binomialfordeling, hvor der estimeres et interval for p.
Ved en repræsentativ stikprøve kan man bestemme et (1-∝)%-konfidensinterval for en andel p for populationen, hvis følgende gælder for X~b(n,p):
n•p>5 og n(1-p)>5
De to overstående betingelser skal være opfyldt.
Et konfidensinterval er karakteriseret ved et niveau
1-a
Den typiske værdi for α er 5%.
Dermed
1-α=95% konfidensinterval.
p vil være i et interval med 1-α sandsynlighed, altså 95%, når et konfidensinterval for p har konfidenskoefficient 1-α
p ̂, som er den estimerede andel, bruges til beregning af konfidensintervaller og beregnes som følgende:
p ̂=X/n
Hvor X angiver antal succeser ved n observationer i en repræsentativ stikprøve.
---
Hypotesetest
En parameter gældende for populationen er en hypotese et udsagn for, som enten kan afvises eller ikke afvises.
Nulhypotesen, der noteres H_0, antages at være sand for populationen og kan enten afvises eller ikke afvises ud fra en repræsentativ stikprøve. Der tages udgangspunkt i nulhypotesen, hvilket er hvad man prøver at bevise imod i vores hypotesetest.
Hvorimod alternativhypotesen, der noteres H_1, er det modsatte af nulhypotesen. Afvises nulhypotesen i en stikprøve, godkendes alternativhypotesen ikke automatisk.
---
Type 1 og type 2 fejl forekommer, hvis man er uheldig og stikprøven viser noget forkert i forhold til populationen eller hvis en stikprøve ikke er repræsentativ. Dette er den risiko, der er ved statistik.
Signifikansniveauet, ∝, er sandsynligheden for at lave en type 1 fejl. Altså at afvise H_0 ud fra stikprøven, selvom at H_0 er sand for populationen.
Eksempel på konfidensinterval
En repræsentativ stikprøve på 1341 personer, hvor der spørges om, der stemmes blå blok eller ej til kommunalvalg i Jammerbugt Kommune, hvor vi lader X være antal succeser (stemmer blåt).
Der var i alt 682 personer der vil stemme blåt. Vinder blå blok valget? Vi vælger ∝=0,05 og for at afgøre om blå blok forventet vinder valget eller ej, anvendes et konfidensinterval for en andel.