Till innehåll på sidan

Analysmetoder

Statistiska analysmetoder förklarar vad som ligger bakom statistiska resultat. En av de vanligaste metoderna är regressionsanalys. Regressionsanalysen använder du när du vill ta reda på vilka bakomliggande faktorer som styr ett visst resultat. De förklarar varför något är som det är.

Här går vi igenom:

  • Regressionsanalys
  • Förklarande faktorer
  • Förklaringsgrad.

Ett konkret exempel på en regressionsanalys

Chefer har olika hög lön. Chefernas löner är det resultat som vi vill analysera. Vilka faktorer påverkar lönen mest: ålder, bransch, kön, utbildning eller något annat? När du undersöker de faktorerna och tar reda på hur de påverkar chefernas löner gör du en regressionsanalys.

För att de förklarande faktorerna som du väljer ska vara användbara i din analys måste de vara konsekventa. Det betyder att varje gång som faktorn är med så blir resultatet också detsamma. Men eftersom verkligheten inte följer matematiska regler så kommer inte samma förklarande faktor att påverka resultatet på samma sätt varje gång. Hur ofta, eller hur mycket, en faktor förklarar ett resultat kallas för förklaringsgrad. I slutet av det här avsnittet får du lära dig mer om förklaringsgrader.

Exempel med chefslöner

Vi fortsätter med chefslönerna. I en SCB-rapport om kvinnliga och manliga chefers löner gjorde man analyser för att ta reda på vad chefernas kön betyder för deras lön. I analysen jämförde man lönen mellan kvinnor och män som hade ganska lika förutsättningar i fråga om ålder, utbildning och bransch. Idén med analysmodellen är att bena ut hur starkt olika faktorer påverkar lönerna för cheferna.

Faktorerna man hade med:

  • Kön
  • Ålder
  • Utbildning
  • Bransch (näringsgren/verksamhet)

Modellen innebär att varje chefs lön beror på att effekterna av de olika faktorerna multipliceras ihop så här:

Grundnivå för lönen
x Effekt av kön
x Effekt av ålder
x Effekt av utbildning
x Effekt av bransch
x Individuell effekt
= Personens lön

Genom att analysera chefernas löner med den här regressionsmodellen kan vi beräkna vad chefernas kön betyder för deras löner. Några av resultaten kan du se i tabellen nedan. Under resten av avsnittet kommer vi att komma tillbaks till tabellen flera gånger.

 Utan analys-
modellen
Med analys-
modellen
Så här
många
procent av skill-
naden
förklarar
modellen:
Inom privat sektor
     
Verkställande direktörer m.fl.
70 73 27
Drift- och verksamhetschefer
76 84 34
Chefer för mindre företag/enheter
91 94 35
Inom statlig sektor
     
Högre ämbetsmän och politiker
96 101 18
Drift- och verksamhetschefer
83 83 37
Chefer för mindre företag/enheter
104 97 51

Här ser du kvinnornas medellöner i procent av männens beräknade utan att man använt någon analysmodell. I sifferkolumnen i mitten ser du kvinnornas medellöner i procent av männens beräknade med modellen för regressionsanalys. I tabellen kan du se att kvinnorna som är drift- och verksamhetschefer i privat sektor har 76 procent av männens medellön om man inte använder någon regressionsanalys. Då har man inte tagit med någon annan förklarande faktor än kön i analysen.

Om man tar hänsyn till de andra förklarande faktorerna som vi valde att ha med i vår regressionsanalys har kvinnorna 84 procent av männens medellön. Då har alltså kvinnorna och männen samma ålder och utbildning och arbetar inom samma bransch.

Men i lönesättningen finns också viktiga personliga delar. Till exempel gör olika personer olika bra jobb, de kommer olika bra överens med kollegor och andra chefer. Sådana saker fångas inte in som effekter av de förklarande faktorer som vi tagit med i vår analys.

Därför har vår modell med en faktor som vi kallar för individuell effekt. Den individuella effekten skiljer sig åt mellan cheferna. Det är de olikheter som inte förklaras av kön, ålder, utbildning och bransch.

Bra analys förklarar skillnader

Nu kan vi fråga oss hur bra analysmodellen lyckas förklara chefernas löner. Det ser vi genom att titta på hur stor del av löneskillnaderna som verkar bero på de individuella effekterna. Ju större betydelse de individuella faktorerna har i analysen desto sämre förklarar de andra faktorerna skillnaderna.

Hur bra eller dåligt våra faktorer förklarar skillnaderna kan vi mäta i siffror. Förklaringsgraden kallas det måttet, och det anges som en andel i procent.

Den matematiska konstruktionen av måttet förklaringsgrad är sådant att värdena ofta inte blir så höga. Dessutom är det mycket i samhället som inte helt kan förklaras med bestämda faktorer. En förklaringsgrad på till exempel 30 procent är ett ganska hyggligt värde.

Vill du höja förklaringsgraden hos en modell kan du ta in fler förklarande faktorer. Då ökar förklaringsgraden. Om faktorn du lägger till inte betyder något för lönerna så får du inte heller någon ökning i förklaringsgrad.

Ibland uppfattas förklaringsgraden som ett mått på modellens kvalitet så att en bra analysmodell borde ha en hög förklaringsgrad. Men då gör man det för enkelt. En analys med hög förklaringsgrad kan ändå vara fel tänkt. Och en noga vald analys kan berätta det vi vill veta även med en låg förklaringsgrad.

Om vi ville visa att det inte spelar någon roll för lönen hur många husdjur man har så kan vi ha med husdjur som vår förklarande faktor. Förklaringsgraden skulle bli låg eftersom husdjur inte påverkar vad cheferna får i lön. Och det var ju precis vad vi ville visa med vår analys.