I forbindelse med udarbejdelsen af en ny lov vil man undersøge risikoen forbundet med rygning på arbejdspladsen.
Hertil er der indsamlet data til en stikprøve fra 792 repræsentativt udvalgte danskere som alle arbejder fuldtid og alle har været nogenlunde lige længe i deres stilling.

Disse danskere har deltaget i denne undersøgelse, hvor de bl.a. er blevet spurgt ind til hvordan rygning påvirker dem i hverdagen, og hvilken fysik tilstand de befinder sig i, med hensyn til luftvejs- og kredsløbssymptomer.

Man vil nu analysere disse data, hvor der startes med at opstille en pivottabel baseret på de oplyste data fra arket, hvilket er illustreret nedenfor.

Optimer dit sprog - Læs vores guide og scor topkarakter

Uddrag
Hermed er de forventede værdier beregnet for variablerne, og i med at de forventede værdier opfylder kriteriet E_ij>5, er de forventede værdier tilstrækkelig store, dermed er det muligt at udføre denne uafhængighedstest, med tilstrækkelig tiltro til resultatet, idet stikprøven størrelse er tilfredsstillende.

Hvis der er uafhængighed mellem de to variabler, skal de observerede værdier være tæt på de forventede værdier, for hver enkelt celle.

Hvis de derimod er signifikant forskellige, er det muligt at der er en sammenhæng mellem variablerne, eller der er en ulige fordeling af variablerne.

Derfor for at afklare om der er en uafhængighed, eller en sammenhæng mellem graden af udsættelse af røg, og den fysiske tilstand blandt de ansatte på arbejdspladsen beregnes forskellen mellem den observerede samt den forventede værdi for hver celle, hvilket vil belyse variationen.

Denne variation fra den enkelte celle, vil bidrage til den totale variation mellem den forventede værdi, og observerede værdi for datasættet.

Denne forskel beregnes ved hjælp af følgende formel: