Korrelaton
När v räknade ut regressonsekvatonen sa v att denna beskrver förhållandet mellan flera varabler. Man försöker htta det bästa möjlga sättet att med en formel beskrva hur x och y förhåller sg tll varandra. Att man räknat ut en regressonsekvaton betyder nte att det fnns ett bra förhållande mellan x och y, det betyder bara att man har räknat ut den bästa möjlga utfrån de observatoner man har.
Korrelatonskoeffcenten = ) )( ( y x xy n r ) ) ( )( ) ( ( y y n x x n r
För att bedöma om regressonsekvatonen är en bra anpassnng för de värden man samlat n beräknar man korrelatonskoeffcenten (r). Indvd Ålder (x) Bentäthet (y) x y x y 1 7 1.30 35.1 79 1.69 (=1.3 ) 35 1.31 45.85 1 5 1.7161 3 30 1.4 4.60 900.0164 4 41 1.14 46.74 1 681 1.996 5 44 1.17 51.48 1 936 1.3689 6 63 0.94 59. 3 969 0.8836 7 67 1.13 75.71 4 489 1.769 8 65 1.14 74.10 4 5 1.996 9 6 1.17 7.54 3 844 1.3689 10 75 1.08 81.00 5 65 1.1664 Summa 509 11.8 584.34 8 63 14.0864 Symbol Σx Σy Σx y Σx Σy
Korrelatonen mellan ålder och bentäthet är alltså 0.775. r kan bara anta värden mellan -1 och +1. Får man r tll något som är mndre än -1 eller större än +1 har man räknat fel. Då r är nära +1 Då r är nära -1 Då r är nära 0 Starkt postvt samband. Starkt negatvt samband. Svagt lnjärt samband.
I vårt exempel fck v r = -0.775 vlket nnebär att v har ett ganska starkt negatvt samband mellan ålder och bentäthet. Högre ålder ger lägre bentäthet. Räknar v ut r får v något som kallas determnatonskoeffcenten (eller förklarngsgraden). Förklarngsgraden säger hur stor andel av förändrngarna y som kan förklaras av förändrngar x. I vårt exempel blr r =0.60 vlket nnebär att 60 % av en persons bentäthet kan förklaras av personens ålder. Resten förklaras av något annat typ konsumtonsmönster, motonsvanor, röknng etc
Att man får en hög korrelaton behöver nte nödvändgtvs betyda att det fnns ett verklgt samband mellan varablerna. Det kan vara ett så kallat nonsenssamband eller skensamband. Det går t ex att bevsa ett matematskt samband mellan konjunkturen och modet på kjollängden. Det gäller med andra ord att vara försktg när man tolkar korrelatonen.
RANGKORRELATION Ibland är den vanlga korrelatonskoeffecenten nte användbar. Det gäller framförallt då: En eller båda varablerna mäts med ordnalskalan Materalet är snedfördelat. Det fnns få extremvärden. Ett alternatvt sätt att mäta sambandet mellan två varabler är då något som kallas rangkorrelatonen (r s ). r s står för Spearmans rangkorrelatonskoeffcent.
Rangkorrelatonen nnebär att man räknar korrelatonen utfrån två rangordnade varabler. En varabel blr rangordnad om ndvderna ställs placerngsordnng efter värdena på varabeln. Exempel: Man låter två konstkrtker, A och B, oberoende av varandra betygsätta 10 tavlor efter en 0-gradg skala. Betygsskalan är en ordnalskala. Tavla nr A:s betyg B:s betyg 1 14 1 10 16 3 7 3 4 1 13 5 5 6 5 7 7 16 14 8 9 10 9 17 9 10 4 11
Eftersom det är en ordnalskala varablerna mäts fungerar nte den vanlga korrelatonen. Istället kan man beräkna rangkorrelatonen utfrån en rangordnng av de två varablerna. Rangordnngen nnebär att man ställer observatonerna placerngsordnng från högsta tll lägsta eller tvärtom. I detta exempel gav person A högst betyg åt tavla 9 som då får rangordnngen 1. Näst högst betyg fck tavla 7 som fck rangordnngen osv. På samma sätt rangordnas B:s betyg. Formel: d står för skllnaden (dfferensen) mellan de båda rangordnngarna för varje ndvd.
Tavla nr A:s betyg B:s betyg Rang av A:s betyg Rang av B:s betyg d d 1 14 1 3 4-1 (=3-4) 1 (=1 ) 10 16 5 1 4 16 3 7 3 7 10-3 9 4 1 13 4 3 1 1 5 5 10 9 1 1 6 5 7 8 8 0 0 7 16 14 0 0 8 9 10 6 6 0 0 9 17 9 1 7-6 36 10 4 11 9 5 4 16 0 80
Rangkorrelatonen mellan de två personernas bedömnng är alltså 0.515. Det fnns ett postvt samband, alltså en vss lkhet personernas bedömnng av tavlorna. Precs som för den vanlga korrelatonen kan rangkorrelatonen aldrg bl större än +1 och aldrg mndre än 1. I övrgt gäller också att: Då r s är nära +1 Då r s är nära -1 Då r s är nära 0 Starkt postvt samband. Starkt negatvt samband. Svagt samband.
AVSLUTNING I detta avsntt har v tttat på hur man studerar två varabler samtdgt, hur varabler kan ha samband mellan varandra. Hur det bästa möjlga sambandet mellan två varabler ser ut kan man mäta med en regressonsekvaton. Hur starkt sambandet mellan två varabler är mäts med korrelatonskoeffcenten. Om mnst en av varablerna mäts ordnalskalan, eller om det är en snedfördelad varabel, kan sambandet mätas med rangkorrelatonen.