När vi räknade ut regressionsekvationen sa vi att denna beskriver förhållandet mellan flera variabler. Man försöker hitta det bästa möjliga sättet

Relevanta dokument
Primär- och sekundärdata. Undersökningsmetodik. Olika slag av undersökningar. Beskrivande forts. Beskrivande forts

Beräkna standardavvikelser för efterfrågevariationer

Flode. I figuren har vi också lagt in en rät linje som någorlunda väl bör spegla den nedåtgående tendensen i medelhastighet för ökande flöden.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 6. Regression & Korrelation. (LLL Kap 13-14) Inledning till Regressionsanalys

ENKEL LINJÄR REGRESSION

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

Vinst (k) Sannolikhet ( )

Dödlighetsundersökningar på KPA:s

Del A Begrepp och grundläggande förståelse.

Tentamen i Dataanalys och statistik för I den 5 jan 2016

Utbildningsavkastning i Sverige

Att identifiera systemviktiga banker i Sverige vad kan kvantitativa indikatorer visa oss?

Introduktionsersättning eller socialbidraghar ersättningsregim betydelse för integrationen av flyktingar? 1

FÖRDJUPNINGS-PM. Nr Kommunalt finansierad sysselsättning och arbetade timmar i privat sektor. Av Jenny von Greiff

Slumpvariabler (Stokastiska variabler)

Lösningar modul 3 - Lokala nätverk

Fördelning av kvarlåtenskap vid arvsskifte

Test av anpassning, homogenitet och oberoende med χ 2 - metod

Fond-i-fonder. med global placeringsinriktning. Ett konkurrenskraftigt alternativ till globalfonder? En jämförelse med fokus på risk och avkastning.

Ekonomihögskolan Lunds Universitet Vårterminen Priset på Poker. En studie av efterfrågeelasticiteten på Internetpoker.

Modellering av antal resor och destinationsval

Utbildningsdepartementet Stockholm 1 (6) Dnr 2013:5253

Föreläsning G70 Statistik A

för alla i Landskrona

Prissättningen av bostadsrätter: Vilka faktorer påverkar priserna, vad är riktpriset för en lägenhet?

Förklaring:

Den svenska sjukfrånvaron

Experimentella metoder 2014, Räkneövning 5

Beräkna standardavvikelser för efterfrågevariationer

Handlingsplan. Grön Flagg. Stadionparkens förskola

Balansering av vindkraft och vattenkraft i norra Sverige. Elforsk rapport 09:88

DAGLIGVARUPRISERNA PÅ ÅLAND

Grön Flagg-rapport Förskolan Segelkobben 15 okt 2014

Arbetslivsinriktad rehabilitering för sjukskrivna arbetslösa funkar det?

Performansanalys LHS/Tvåspråkighet och andraspråksinlärning Madeleine Midenstrand

En studiecirkel om Stockholms katolska stifts församlingsordning

Skoldemokratiplan Principer och guide till elevinflytande

Skolbelysning. Ecophon, fotograf: Hans Georg Esch

Centrala Gränsvärdessatsen:

Steg 1 Arbeta med frågor till filmen Jespers glasögon

Klarar hedgefonder att skapa positiv avkastning oavsett börsutveckling? En empirisk studie av ett urval svenska hedgefonder

Tillämpningar av dekomposition: Flervaruflödesproblemet. Flervaruflödesproblemet: Lagrangeheuristik

FK2002,FK2004. Föreläsning 5

Industrins förbrukning av inköpta varor (INFI) 2008

2014 års brukarundersökning inom socialtjänstens vuxenavdelning i Halmstads kommun

Kvalitetsjustering av ICT-produkter

Företagsrådgivning i form av Konsultcheckar. Working paper/pm

Undersökning av vissa försäkringsantaganden i efterlevandepension för anställda i kommuner och landstinget och dess påverkan på prissättningen

Introduktion Online Rapport Din steg-för-steg guide till den nya Online Rapporten (OLR) Online Rapport

Sammanfattning, Dag 1

Effekter av kön, ålder och region på sjukpenningen i Sverige

Handlingsplan mot hedersrelaterat våld och förtryck i skolan

Kompenserande löneskillnader för pendlingstid

DEL I. Matematiska Institutionen KTH

Thomas Macks beräkning av standardfelet för reservavsättningar

Mätfelsbehandling. Lars Engström

Optimering i samband med produktionsplanering av, och materialförsörjning vid, underhåll av flygmotorer

Handlingsplan. Grön Flagg. Förskolan Dalbystugan

Postadress: Internet: Matematisk statistik Matematiska institutionen Stockholms universitet Stockholm Sverige

Beställningsintervall i periodbeställningssystem

Innehåll: har missbrukat jämfört med om man inte har. missbrukat. Risk 1 Odds Risk. Odds 1 Risk. Odds

Oljeprisets inverkan på oljerelaterade aktier

Problem i sammanfattande mått i ASI

Mos. Statens väg- ochtrafi V" NationalRoad&Traffic Research Institute- $-58101Li: Lä & t # % p. i E d $ åv 3 %. ISSN

Industrins förbrukning av inköpta varor INFI

Billigaste väg: Matematisk modell i vektor/matrisform. Billigaste väg: Matematisk modell i vektor/matrisform

a) B är oberoende av A. (1p) b) P (A B) = 1 2. (1p) c) P (A B) = 1 och P (A B) = 1 6. (1p) Lösningar: = P (A) P (A B) = 1

Stresstest för försäkrings- och driftskostnadsrisker inom skadeförsäkring

KVALITETSDEKLARATION

VALUE AT RISK. En komparativ studie av beräkningsmetoder. VALUE AT RISK A comparative study of calculation methods. Fredrik Andersson, Petter Finn

gymnasievalet 2019 Dags att välja gymnasium

Moment 2 - Digital elektronik. Föreläsning 2 Sekvenskretsar och byggblock

Sammanfattning. Härledning av LM - kurvan. Efterfrågan, Z. Produktion, Y. M s. M d inkomst = Y >Y. M d inkomst = Y

Faradays lag. ger. Låt oss nu bestämma den magnetiska energin för N st kopplade kretsar. Arbetet som kretsarnas batterier utför är

En reservberäkningsmetodik baserad på enskilda skador

Lektion 8 Specialfall, del I (SFI) Rev HL

Alkohol- och narkotikasituationen En kartläggning av läget i Umeå med jämförande data från Luleå, Lund och riket år 2005

rm o rs W e d n r: A e n tio stra Illu Grön Flagg-rapport Tryserums friskola 20 feb 2014

Grön Flagg-rapport Fågelsångs förskola 23 jun 2015

Hjortdjurens inverkan på tillväxt av produktionsträd och rekrytering av betesbegärliga trädslag

Handlingsplan. Grön Flagg. Äsperedskolan förskola - skola

Läsa och kvittera. Skicka Inskrivningsmeddelandet. Besvara frågor i Lifecare SPU och starta utskrivningsplanering

Handlingsplan. Grön Flagg. Stegatorps förskola

2B1115 Ingenjörsmetodik för IT och ME, HT 2004 Omtentamen Måndagen den 23:e aug, 2005, kl. 9:00-14:00

gymnasievalet 2019 Dags att välja gymnasium

Stresstest för försäkrings- och driftskostnadsrisker inom skadeförsäkring

Handlingsplan. Grön Flagg. Saxnäs skola

F13. Förra gången (F12) Konfidensintervall och hypotesprövning Chi-tvåtest. Stratifierat urval

Förstärkare Ingångsresistans Utgångsresistans Spänningsförstärkare, v v Transadmittansförstärkare, i v Transimpedansförstärkare, v i

Granskning av grundskolans effektivitet, kvalitet och kostnader

Grön Flagg-rapport Förskolan Tåget 28 mar 2013

Matrismodellen vs Two-part regressionsmodeller -effekter på Region Skånes resursfördelning-

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

HR Kort beskrivning. 1. Leveransomfattning

Stelkroppsdynamik i tre dimensioner Ulf Torkelsson. 1 Tröghetsmoment, rörelsemängdsmoment och kinetisk energi

i = 1. (1.2) (1.3) eller som z = x + yi

Grön Flagg-rapport Skogsgläntans förskola 1 aug 2017

Grön Flagg-rapport Vallaskolan 4 jul 2014

ANN fk. Örjan Ekeberg. Strukturell Riskminimering. Kernels. Konsten att undvika att räkna högdimensionellt. Kernels

Förberedelse INSTALLATION INFORMATION

Transkript:

Korrelaton

När v räknade ut regressonsekvatonen sa v att denna beskrver förhållandet mellan flera varabler. Man försöker htta det bästa möjlga sättet att med en formel beskrva hur x och y förhåller sg tll varandra. Att man räknat ut en regressonsekvaton betyder nte att det fnns ett bra förhållande mellan x och y, det betyder bara att man har räknat ut den bästa möjlga utfrån de observatoner man har.

Korrelatonskoeffcenten = ) )( ( y x xy n r ) ) ( )( ) ( ( y y n x x n r

För att bedöma om regressonsekvatonen är en bra anpassnng för de värden man samlat n beräknar man korrelatonskoeffcenten (r). Indvd Ålder (x) Bentäthet (y) x y x y 1 7 1.30 35.1 79 1.69 (=1.3 ) 35 1.31 45.85 1 5 1.7161 3 30 1.4 4.60 900.0164 4 41 1.14 46.74 1 681 1.996 5 44 1.17 51.48 1 936 1.3689 6 63 0.94 59. 3 969 0.8836 7 67 1.13 75.71 4 489 1.769 8 65 1.14 74.10 4 5 1.996 9 6 1.17 7.54 3 844 1.3689 10 75 1.08 81.00 5 65 1.1664 Summa 509 11.8 584.34 8 63 14.0864 Symbol Σx Σy Σx y Σx Σy

Korrelatonen mellan ålder och bentäthet är alltså 0.775. r kan bara anta värden mellan -1 och +1. Får man r tll något som är mndre än -1 eller större än +1 har man räknat fel. Då r är nära +1 Då r är nära -1 Då r är nära 0 Starkt postvt samband. Starkt negatvt samband. Svagt lnjärt samband.

I vårt exempel fck v r = -0.775 vlket nnebär att v har ett ganska starkt negatvt samband mellan ålder och bentäthet. Högre ålder ger lägre bentäthet. Räknar v ut r får v något som kallas determnatonskoeffcenten (eller förklarngsgraden). Förklarngsgraden säger hur stor andel av förändrngarna y som kan förklaras av förändrngar x. I vårt exempel blr r =0.60 vlket nnebär att 60 % av en persons bentäthet kan förklaras av personens ålder. Resten förklaras av något annat typ konsumtonsmönster, motonsvanor, röknng etc

Att man får en hög korrelaton behöver nte nödvändgtvs betyda att det fnns ett verklgt samband mellan varablerna. Det kan vara ett så kallat nonsenssamband eller skensamband. Det går t ex att bevsa ett matematskt samband mellan konjunkturen och modet på kjollängden. Det gäller med andra ord att vara försktg när man tolkar korrelatonen.

RANGKORRELATION Ibland är den vanlga korrelatonskoeffecenten nte användbar. Det gäller framförallt då: En eller båda varablerna mäts med ordnalskalan Materalet är snedfördelat. Det fnns få extremvärden. Ett alternatvt sätt att mäta sambandet mellan två varabler är då något som kallas rangkorrelatonen (r s ). r s står för Spearmans rangkorrelatonskoeffcent.

Rangkorrelatonen nnebär att man räknar korrelatonen utfrån två rangordnade varabler. En varabel blr rangordnad om ndvderna ställs placerngsordnng efter värdena på varabeln. Exempel: Man låter två konstkrtker, A och B, oberoende av varandra betygsätta 10 tavlor efter en 0-gradg skala. Betygsskalan är en ordnalskala. Tavla nr A:s betyg B:s betyg 1 14 1 10 16 3 7 3 4 1 13 5 5 6 5 7 7 16 14 8 9 10 9 17 9 10 4 11

Eftersom det är en ordnalskala varablerna mäts fungerar nte den vanlga korrelatonen. Istället kan man beräkna rangkorrelatonen utfrån en rangordnng av de två varablerna. Rangordnngen nnebär att man ställer observatonerna placerngsordnng från högsta tll lägsta eller tvärtom. I detta exempel gav person A högst betyg åt tavla 9 som då får rangordnngen 1. Näst högst betyg fck tavla 7 som fck rangordnngen osv. På samma sätt rangordnas B:s betyg. Formel: d står för skllnaden (dfferensen) mellan de båda rangordnngarna för varje ndvd.

Tavla nr A:s betyg B:s betyg Rang av A:s betyg Rang av B:s betyg d d 1 14 1 3 4-1 (=3-4) 1 (=1 ) 10 16 5 1 4 16 3 7 3 7 10-3 9 4 1 13 4 3 1 1 5 5 10 9 1 1 6 5 7 8 8 0 0 7 16 14 0 0 8 9 10 6 6 0 0 9 17 9 1 7-6 36 10 4 11 9 5 4 16 0 80

Rangkorrelatonen mellan de två personernas bedömnng är alltså 0.515. Det fnns ett postvt samband, alltså en vss lkhet personernas bedömnng av tavlorna. Precs som för den vanlga korrelatonen kan rangkorrelatonen aldrg bl större än +1 och aldrg mndre än 1. I övrgt gäller också att: Då r s är nära +1 Då r s är nära -1 Då r s är nära 0 Starkt postvt samband. Starkt negatvt samband. Svagt samband.

AVSLUTNING I detta avsntt har v tttat på hur man studerar två varabler samtdgt, hur varabler kan ha samband mellan varandra. Hur det bästa möjlga sambandet mellan två varabler ser ut kan man mäta med en regressonsekvaton. Hur starkt sambandet mellan två varabler är mäts med korrelatonskoeffcenten. Om mnst en av varablerna mäts ordnalskalan, eller om det är en snedfördelad varabel, kan sambandet mätas med rangkorrelatonen.