Till innehåll på sidan

Hur stort får bortfallet vara?

Publicerad: 2016-12-08

Bortfall innebär att man inte får svar från alla man frågar i en statistisk undersökning. I den här artikeln om statistiska metoder berättar enhetschef Gustaf Strandell om problemen med bortfall och hur man kan justera för bortfall.

Man kan skilja på två typer av bortfall:

  • Objektbortfall (eller individbortfall) – svar saknas på samtliga frågor för ett objekt (till exempel för en individ).
  • Partiellt bortfall (eller variabelbortfall) – svar saknas på åtminstone någon fråga, men inte alla, för ett objekt.

Problemen med bortfall

Gustaf Strandell är metodstatistiker och enhetschef för Metodenhet individer och hushåll:

– Ett problem med bortfall är att antalet svarande blir färre än planerat. Det medför att den slumpmässiga osäkerheten blir större, vilket ger sämre precision genom bredare osäkerhetsintervall.

Det problemet kan hanteras, till exempel genom att dra ett urval med tillräcklig krympmån, men det finns större svårigheter:

– Det riktigt allvarliga problemet är att vi tappar kontrollen över hur de som deltar i undersökningen tas fram. Vi kan styra varje objekts sannolikhet att komma med i urvalet men inte deras sannolikhet att svara. Det är information som vi behöver för att skattningen av statistiken ska bli riktig. Vi kan inte utgå från att alla har samma sannolikhet att svara. Till exempel är det tänkbart att personer som blir engagerade av frågorna svarar mera villigt än vad de mindre intresserade gör. Då riskerar statistiken att bli missvisande, "snedvriden".

Justering för bortfall

Det är viktigt att hålla bortfallets storlek nere. Men ett bortfall uppstår ändå, och då kan man sätta in olika åtgärder för att minska bortfallets effekter på statistiken. En vanlig metod kallas för kompensationsvägning eller omvägning.

– En enkel form av omvägning är "rak uppräkning inom strata". Det är en metod som fungerar bra om svarsbenägenheten är i stort sett lika för objekten inom de strata (urvalsgrupper) som använts. Säg till exempel att bara hälften har svarat inom ett stratum bestående av unga män. För att statistiken inte ska bli snedvriden måste de unga män som svarat representera dubbelt så många unga män jämfört med om alla svarat. I beräkningen innebär det att man kompenserar för bortfallet genom att ge de unga männens svar dubbel vikt.

Man kan dock inte anta att svarsbenägenheten är samma inom respektive stratum. Därför används ofta en mer avancerad metod, så kallad kalibrering, som ofta kan justera för bortfallet på ett effektivare sätt.

– De individer som svarat på en undersökning jämförs med hela befolkningen med avseende på registervariabler som inkomst eller utbildning. Om det till exempel är relativt sett färre låginkomsttagare som svarat på undersökningen, så tar kalibreringen hänsyn till det genom att ge svaren från låginkomsttagare en något större vikt än andras svar. Att hitta lämpliga registervariabler är avgörande för en framgångsrik kalibrering. Registervariablerna ska helst kunna "förklara" både benägenheten att svara och hur individerna svarar.

Går inte att ange en gräns

Det går inte att ange en gräns för hur stort bortfallet får vara.
– Det intressanta är egentligen bortfallets effekter på statistiken, inte bortfallsandelens storlek i sig. Ett relativt litet men mycket "snett" bortfall, koncentrerat till särskilda grupper, kan ge en större negativ effekt på statistiken än ett större bortfall som inte är så snett. Allmänt sett är ändå bortfallsandelens storlek en viktig, men inte fullkomlig, indikator på risken för missvisande statistik. Ett stort bortfall innebär en större risk för missvisande statistik.

Intervju: Jörgen Breiwitz

Kontakt

Gustaf Strandell

Telefon
010-479 68 43
E-post
gustaf.strandell@scb.se

Etiketter