Hur stor är sannolikheten att få vara med i en undersökning?
Publicerad: 2016-11-25
Många av SCB:s statistikprodukter bygger på urvalsundersökningar. I en urvalsundersökning undersöks en så kallad population som till exempel kan bestå av alla personer i Sverige som är 16 år eller äldre eller alla företag i Sverige med minst två anställda.
SCB:s metodstatistiker Karin Andersson berättar om hur urvalsundersökningar går till:
Ur populationen dras ett urval, så kallade stickprov. Urvalet utgör ofta en relativt liten del av hela populationen. I till exempel undersökningen om levnadsförhållanden bestod urvalet år 2014 av 19 000 av totalt 8 miljoner individer i åldern 16 år och äldre.
Karin Andersson är metodstatistiker på SCB och förklarar varför ett urval görs:
– Att alltid intervjua hela populationer skulle bli dyrt och ta för lång tid. Statistiken skulle hinna bli inaktuell innan vi publicerar den.
Sannolikhetsurval bra grund för kvalitetssäkrad statistik
Innan SCB kan dra ett urval behöver vi veta vilka som ingår i populationen. Det löser vi genom att ta fram en ram, som är en lista över alla ingående objekt. Vid SCB används ofta någon del av registret över totalbefolkningen eller företagsdatabasen som ram.
Det är slumpen som avgör vilka i ramen som kommer med i urvalet, men under kontrollerade former. SCB ställer två grundläggande krav på hur urvalsdragningen ska gå till:
- Alla i populationen ska ha en positiv sannolikhet att komma med i urvalet
- Vi måste veta exakt hur stor den sannolikheten är.
– Statistiken kan inte bli rättvisande om någon grupp i populationen systematiskt utesluts från urvalet.
Urval som dras på det här viset kallas för sannolikhetsurval och det utgör en god bas för kvalitetssäkrad statistik. Det finns många olika metoder för att dra sannolikhetsurval.
– Det är viktigt att tänka igenom vilken typ av statistik man vill ha ut från en undersökning innan man väljer hur urvalet ska dras.
Skatta – att omvandla insamlade data till statistik
Eftersom SCB bara samlar in data från ett urval kommer statistiken vara förenad med osäkerhet och därför är valet av skattningsmetod viktigt. På SCB använder vi så långt det är möjligt så kallade väntevärdesriktiga skattningsmetoder.
Exempel som illustrerar väntevärdesriktig skattning
I undersökningarna av levnadsförhållanden undersöker vi till exempel hur många personer i Sverige som är 16 år eller äldre och som har lyssnat på en ljudbok under 2014. Vi vill alltså veta det sanna, men för oss okända, antalet ljudbokslyssnare i hela Sverige.
– Vi drar ju bara ett urval från populationen och skattar endast en uppgift om ljudbokslyssnandet, men tänk dig att vi drar alla urval som är möjliga med vår urvalsmetod och att vi skattar statistik från urvalen var för sig. Vi kommer då få många olika skattningar av antalet ljudbokslyssnare i Sverige. Om vår skattningsmetod är väntevärdesriktig kommer medelvärdet av alla dessa skattningar vara precis det sanna värdet för statistiken. En väntevärdesriktig skattningsmetod skattar alltså rätt i genomsnitt.
Ett viktigt steg i skattningen är att väga de inkomna svaren.
– Urvalet ska räknas upp till populationen, vilket innebär att svaret från varje objekt multipliceras med en vikt i skattningen. På så vis får ett objekts svar representera flera objekt i populationen.
Vid väntevärdesriktig skattning bestäms viktens värde av ett objekts sannolikhet att komma med i urvalet. Det är därför vi måste känna till den sannolikheten för alla. Sannolikheten är ett värde mellan 0 och 1 och bestäms av storleken på både urval och population.
Hur stor är då sannolikheten att få vara med?
– Sannolikheten att till exempel SCB:s generaldirektör Stefan Lundgren blir utvald att vara med i undersökningarna av levnadsförhållanden är 0,001314. Hans svar skulle i så fall representera 769 personer, förklarar Karin.
Intervju: Gustaf Strandell
Kontakt
- Telefon
- 010-479 40 13
- E-post
- karin.e.andersson@scb.se