Sänkningen av parasitnivåerna i blodet

Relevanta dokument
a) Facit till räkneseminarium 3

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

InStat Exempel 4 Korrelation och Regression

Medicinsk statistik II

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Höftledsdysplasi hos dansk-svensk gårdshund

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Uppgift 1. Deskripitiv statistik. Lön

Statistiska samband: regression och korrelation

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Linjär regressionsanalys. Wieland Wermke

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Gamla tentor (forts) ( x. x ) ) 2 x1

Metod och teori. Statistik för naturvetare Umeå universitet

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

ÖVNINGSUPPGIFTER KAPITEL 6

Matematisk statistik, Föreläsning 5

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Laboration 4 R-versionen

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Grundläggande matematisk statistik

10.1 Enkel linjär regression

import totalt, mkr index 85,23 100,00 107,36 103,76

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Medicinsk statistik II

Tentamen i Metod C-kurs

Regressionsanalys av lägenhetspriser i Spånga

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

TVM-Matematik Adam Jonsson

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Statistik B Regressions- och tidsserieanalys Föreläsning 1

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Multipel Regressionsmodellen

, s a. , s b. personer från Alingsås och n b

Parade och oparade test

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Föreläsning 12: Regression

Laboration 2: Styrkefunktion samt Regression

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

ÖVNINGSUPPGIFTER KAPITEL 6

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Obligatorisk uppgift, del 1

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Statistik och epidemiologi T5

Användning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Statistisk undersökningsmetodik (Pol. kand.)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Repetitionsföreläsning

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Hur länge ska fisken vara i dammen?

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

tentaplugg.nu av studenter för studenter

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

LABORATION 3 - Regressionsanalys

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Transkript:

4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet Kroppstemperatur En individs längd beror delvis på individens kön men individens kön beror INTE på individens längd (bara för att personen blir längre så byter hen inte kön). En individs vikt beror delvis på individens kön (män väger i genomsnitt mer än kvinnor). En individs vikt beror delvis på individens längd men individens längd beror INTE på individens vikt (bara för att individen går upp i vikt så blir hen inte längre). En individs vikt beror delvis på individens ålder men individens ålder beror INTE på individens vikt (bara för att individen går upp i vikt så blir hen inte äldre). Den maximala läkemedelskoncentrationen i blodet beror delvis på läkemedelsdosen men läkemedelsdosen beror INTE på den maximala läkemedelskoncentrationen i blodet. Sänkningen av antalet parasiter i blodet beror delvis på läkemedelsdosen men läkemedelsdosen beror INTE på sänkningen av antalet parasiter i blodet. Sänkningen av antalet parasiter i blodet beror delvis på den maximala läkemedelskoncentrationen i blodet men den maximala läkemedelskoncentrationen i blodet beror INTE på sänkningen av antalet parasiter i blodet. Kroppstemperaturen beror till viss del på antalet parasiter i blodet men antalet parasiter i blodet beror INTE på kroppstemperaturen.

4.2 a) Regressionslinjen är den linje som ger det minsta sammanlagda avståndet från alla punkter till linjen. Det är den linje som bäst stämmer överens med punkterna i spridningsdiagrammet. Regressionslinjen består av ett intercept och en regressionskoefficient (lutningskoefficient). Interceptet är det värde den beroende variabeln (y) i genomsnitt antar då den oberoende variabeln (x) är noll. Regressionskoefficienten beskriver hur värdet på den beroende variabeln i genomsnitt förändras då den oberoende variabeln ändras en enhet. b) En residual är avståndet i y-led mellan en punkt i spridningsdiagrammet och regressionslinjen. Om regressionslinjen ger en bra beskrivning av sambandet mellan variablerna så ska residualerna (för samtliga punkter i spridningsdiagrammet) vara jämnt spridda runt regressionslinjen. c) Korrelationskoefficienten är ett mått på det linjära sambandet mellan två variabler. Korrelationskoefficienten är nära +1 om det finns ett starkt positivt linjärt samband mellan variablerna och den är nära -1 om det finns ett starkt negativt linjärt samband mellan variablerna. Om det inte finns något linjärt samband mellan variablerna så är korrelationskoefficienten nära noll. Korrelationskoefficientens största begränsning är att den enbart beskriver linjära samband. Variablerna kan, trots ett lågt värde på korrelationskoefficienten, ha ett starkt icke-linjärt samband. d) Determinationskoefficienten kallas även förklaringsgraden. Determinationskoefficienten anger hur stor del av variationen (mellan individer) i den beroende variabeln (y) som kan förklaras av att individerna har olika värden på den oberoende variabeln (x). Determinationskoefficienten kan beräknas genom att ta värdet på korrelationskoefficienten i kvadrat. e) För att undersöka om sambandet mellan två variabler är signifikant eller ej så måste man genomföra en hypotesprövning. I hypotesprövningen undersöker man om regressionskoefficienten är signifikant skild från noll, d.v.s. om en signifikant andel av variabiliteten i den beroende variabeln (y) kan förklaras av skillnader i den oberoende variabeln (x). Hypotesprövningen genomförs genom beräkning av ett t-värde (eller Z-värde om antalet individer/punkter är >5) som sedan jämförs mot kritiska värden för den valda signifikansnivån. Hypotesprövningen kan även undersöka om korrelationskoefficienten är signifikant skild från noll. Även denna hypotesprövning genomförs genom beräkning av ett t-värde (eller Z-värde) som sedan jämförs mot kritiska värden för den valda signifikansnivån.

4.3 2 Längd (cm) 19 18 17 16 y = 9.95x + 169.85 R² =.2842 15 14.2.4.6.8 1 Kön (man=, Kvinna=1) Fig 1. Spridningsdiagram som visar hur längden samvarierar med kön. Regressionsekvationen visar att den genomsnittlige ugandiske mannen är 9.91 cm längre än den genomsnittliga ugandiska kvinnan (regressionskoefficienten (lutningen), b, är -9.91). Determinationskoefficienten ( ) visar att 28.4% av variationen i längd mellan olika individer kan förklaras med vilket kön individerna har (d.v.s. 71.6% av variationen i längd beror på andra saker än att individerna har olika kön). Korrelationskoefficienten ( ) kan beräknas genom.533. Eftersom regressionskoefficienten är negativ så är även korrelationskoefficienten negativ. En korrelationskoefficient på.533 innebär att det finns ett relativt svagt, negativt (linjärt) samband mellan variablerna längd och kön (man=, kvinna=1). Vikt (kg) 8. 75. 7. 65. 6. 55. 5. 45. 4. 35. 3. y =.81x + 59.292 R² =.2.2.4.6.8 1 Kön (man=, Kvinna=1) Fig 2. Spridningsdiagram som visar hur vikten samvarierar med kön. Regressionsekvationen visar att den genomsnittlige ugandiske mannen väger.81 kg mer än den genomsnittliga ugandiska kvinnan (regressionskoefficienten (lutningen), b, är -.81). Determinationskoefficienten ( ) visar att.2% av variationen i vikt mellan olika individer kan förklaras med vilket kön individerna har (d.v.s. 99.8% av variationen i vikt beror på andra saker än att individerna har olika kön). Korrelationskoefficienten ( ) kan beräknas genom.45. Eftersom regressionskoefficienten är negativ så är även korrelationskoefficienten negativ. En korrelationskoefficient på.45 innebär att inte finns något linjärt samband mellan variablerna vikt och kön (det samband som vi ser har troligtvis uppkommit av en slump och skulle inte vara signifikant vid en hypotesprövning).

Vikt (kg) 8. 75. 7. 65. 6. 55. 5. 45. 4. 35. 3. y =.5373x 29.417 R² =.364 14 15 16 17 18 19 2 Längd (cm) Fig 3. Spridningsdiagram som visar hur vikten samvarierar med längden. Regressionsekvationen visar att för en individ i Uganda så ökar vikten med i genomsnitt.54 kg då längden ökar med 1. cm (regressionskoefficienten (lutningen), b, är.54). Determinationskoefficienten ( ) visar att 3.6% av variationen i vikt mellan olika individer kan förklaras med att individerna är olika långa (d.v.s. 69.4% av variationen i vikt beror på andra saker än att individerna är olika långa). Korrelationskoefficienten ( ) kan beräknas genom.553. Eftersom regressionskoefficienten är positiv så är även korrelationskoefficienten positiv. En korrelationskoefficient på.553 innebär att det finns ett relativt starkt, positivt, linjärt samband mellan variablerna vikt och längd. Observera att regressionslinjens lutning påverkas mycket av en så kallad outlier. Vikt (kg) 8. 75. 7. 65. 6. 55. 5. 45. 4. 35. 3. y =.58x + 59.9 R² = 2E 5 15 2 25 3 35 4 45 5 Ålder (år) Fig 4. Spridningsdiagram som visar hur vikten samvarierar med åldern. Regressionsekvationen visar att för en individ i Uganda så minskar vikten med i genomsnitt.58 kg då åldern ökar med 1. år (regressionskoefficienten (lutningen), b, är -.58). Determinationskoefficienten ( ) visar att det enbart är.2% av variationen i vikt mellan olika individer som kan förklaras med att individerna är olika gamla (d.v.s. 99.998% av variationen i vikt beror på andra saker än att individerna är olika gamla). Korrelationskoefficienten ( ) kan beräknas genom.45. Eftersom regressionskoefficienten är negativ så är även korrelationskoefficienten negativ. En korrelationskoefficient på.45 innebär att det inte finns något linjärt samband mellan variablerna vikt och ålder.

4 C max (ng/ml) 35 3 25 2 15 1 y =.5177x 6.5597 R² =.7638 5 1 2 3 4 5 6 Dos (mg) Fig 5. Spridningsdiagram som visar hur den maximala läkemedelskoncentrationen (C max ) samvarierar med läkemedelsdosen. Dataset_alternativ, med enbart läkemedlet AMP15 användes. Regressionsekvationen visar att för en genomsnittlig individ i Uganda så ökar den maximala läkemedelskoncentrationen med.518 ng/ml då dosen ökar med 1. mg (regressionskoefficienten (lutningen), b, är.518). Determinationskoefficienten ( ) visar att 76.4% av variationen i C max mellan olika individer kan förklaras med att individerna fått olika läkemedelsdoser (d.v.s. 23.6% av variationen i C max beror på andra saker än att individerna fått olika läkemedelsdoser). Korrelationskoefficienten ( ) kan beräknas genom.874. Eftersom regressionskoefficienten är positiv så är även korrelationskoefficienten positiv. En korrelationskoefficient på.874 innebär att det finns ett starkt, positivt, linjärt samband mellan variablerna C max och dos läkemedel. 5 Sänkning parasit (parasiter/µl) 5 1 15 2 25 3 35 1 2 3 4 5 6 y = 275.48x 19713 R² =.2144 Dos (mg) Fig 6. Spridningsdiagram som visar hur sänkningen av antalet parasiter i blodet samvarierar med läkemedelsdosen. Dataset_alternativ, med enbart läkemedlet AMP15 användes. Spridningsdiagrammet visar att det verkar finnas en samvariation mellan variablerna men att denna samvariation inte är linjär (den linjära regressionslinjen går inte alls genom punkterna).

1 Sänkning parasit (parasiter/µl) 5 5 1 15 2 25 3 35 1 2 3 4 C max (ng/ml) y = 464.23x 96913 R² =.2137 Fig 7. Spridningsdiagram som visar hur sänkningen av antalet parasiter i blodet samvarierar med den maximala läkemedelskoncentrationen. Dataset_alternativ, med enbart läkemedlet AMP15 användes. Spridningsdiagrammet visar att det finns en tydlig samvariation mellan variablerna men att denna samvariation inte är linjär (den linjära regressionslinjen går inte alls genom punkterna). 43. Kroppstemperatur (ᵒC) 42. 41. 4. 39. 38. 37. h 6h 36. 1 2 3 4 5 Parasitnivå i blodet (parasiter/µl) Fig 8. Spridningsdiagram som visar hur kroppstemperaturen samvarierar med antalet parasiter i blodet. Spridningsdiagrammet visar att det finns en tydlig samvariation mellan variablerna men att denna samvariation inte är linjär.

43. Kroppstemperatur (ᵒC) 42. 41. 4. 39. 38. 37. h 6h 36. 1 1 1 1 1 1 Parasitnivå i blodet (parasiter/µl) Fig 9. Spridningsdiagram som visar hur kroppstemperaturen samvarierar med antalet parasiter i blodet, här med en logaritmerad x-axel. Spridningsdiagrammet visar att det finns en linjär samvariation mellan variablerna då x-axeln är logaritmerad, d.v.s. det finns ett logaritmiskt samband mellan kroppstemperaturen och antalet parasiter i blodet. Ett logaritmiskt samband beskrivs med formeln: ln.

4.4 12 1 8 Frekvens 6 4 2 Parasiter i blodet vid studiens början (parasiter/µl) Fig 9. Histogram som visar fördelningen av antalet parasiter i blodet vid studiens början. Histogrammet tyder på att antalet parasiter i blodet vid studiens början inte verkar vara normalfördelad i populationen. De flesta av individerna i studien har 1-15 parasiter/µl i blodet vid studiens början men fördelningen svansar ut åt höger och det finns två individer som har så pass många som 4-45 parasiter/µl i blodet vid studiens början. Utifrån det här histogrammet så ser det ut som om variabeln är log-normalfördelad men det krävs data från fler individer (det här stickprovet består av endast 3 individer) för att vi med säkerhet ska kunna avgöra om variabeln är log-normalfördelad eller ej.

4.5 a) Determinationskoefficienten (R 2 -värdena) är samma oavsett om den beräknats i regressionsanalysen eller i spridningsdiagrammet. b) Sambandet mellan längd och vikt är signifikant på både 1% och 5% signifikansnivå (pvärde:.15). Sambandet mellan ålder och vikt är inte signifikant alls (p-värde:.98). Sambandet mellan C max och sänkningen av antalet parasiter i blodet är signifikant på 5% signifikansnivå men inte på 1% signifikansnivå (p-värde:.4). c) Värdena på regressionsparametrarna är samma i regressionsanalysen som de som beräknades för spridningsdiagrammets regressionslinje. d) p-värdet för regressionskoefficienten är precis samma som Significans F-värdet (som också är ett p-värde). e) x-variabel 1 (längd) har ett signifikant samband med vikt på både 1% och 5% signifikansnivå (p-värde:.12) men x-variabel 2 (ålder) har inget signifikant samband med vikt (p-värde:.37). Lägg dock märke till att p-värdet för sambandet mellan ålder och vikt är betydligt lägre i den multipla regressionsanalysen, då sambandet mellan längd och vikt också är med, än det var i Regressionsanalys2 och även p-värdet för sambandet mellan längd och vikt är lägre i den här analysen. Detta går även att se på värdet av determinationskoefficienten vilken var.36 då enbart längden användes för att prediktera vikten,.175 då enbart åldern användes för att prediktera vikten och.327 då både längden och åldern användes för att prediktera vikten. Det innebär alltså att längden och åldern tillsammans förklarar mer av de skillnader som observerats i vikt än vad längden gör på egen hand men skillnaden är inte signifikant. f) Inget av p-värdena för regressionskoefficienterna är samma som Significans F-värdet (som också är ett p-värde) och inget annat samband hittas heller mellan dem. g) Residual plot -diagrammen visar på en jämn spridning av residualerna för sambanden mellan läng och vikt samt ålder och vikt medan residualerna för sambandet mellan C max och sänkningen av antalet parasiter i blodet inte alls uppvisar en jämn spridning utan en väldigt tydlig trend. h) Från deluppgift b) vet vi att sambandet mellan längd och vikt är signifikant på 1% signifikansnivå och att sambandet mellan C max och sänkningen av antalet parasiter i blodet är signifikant på 5% signifikansnivå. När vi studerar residualerna (deluppgift g)) ser vi dock att dessa inte alls uppvisar en jämn spridning för sambandet mellan C max och sänkningen av antalet parasiter i blodet. Det gör att det enda linjära samband som analyserats här som är signifikant och där regressionslinjen ger en bra beskrivning av data är sambandet mellan längd och vikt ( Regressionsanalys1 ). 4.6 Korrelationskoefficienten ( ) och regressionskoefficienten (lutningen, ) har alltid samma tecken, om är positiv så är även positiv och om är negativ är även negativ. Korrelationskoefficienten antar alltid ett värde inom intervallet 1, 1, kan alltså inte vara mindre än 1 och inte större än 1. Regressionskoefficienten kan anta vilket värde som helst.

Kombinationen.2 och.5 är en möjlig kombination eftersom båda parametrarna har samma tecken och korrelationskoefficienten ligger inom intervallet 1, 1. Regressionslinjen ska ha en negativ lutning (.5) och punktsvärmen runt regressionslinjen ska vara väldigt utspridd (.2 innebär att det är ett svagt (negativt) linjärt samband mellan variabel x och variabel y). Variabel y 2 18 16 14 12 1 8 6 4 2 y =.5x + 12 R² =.4 2 4 6 8 1 12 Variabel x Fig 12. Exempel på hur ett spridningsdiagram mellan variabel x och variabel y skulle kunna se ut om korrelationskoefficienten ( ) är -.2 och regressionskoefficienten ( ) är -.5. Determinationskoefficienten kan beräknas utifrån korrelationskoefficient (.2.4). Kombinationen.2 och 1. är en omöjlig kombination eftersom parametrarna har olika tecken. Kombinationen.98 och 2. är en möjlig kombination eftersom båda parametrarna har samma tecken och korrelationskoefficienten ligger inom intervallet 1, 1. Regressionslinjen ska ha en positiv lutning ( 2.) och punktsvärmen runt regressionslinjen ska vara väldigt tätt samlad (.98 innebär att det är ett starkt (positivt) linjärt samband mellan variabel x och variabel y).

25 2 Variabel y 15 1 5 y = 2.x.19 R² =.96 2 4 6 8 1 12 Variabel x Fig 13. Exempel på hur ett spridningsdiagram mellan variabel x och variabel y skulle kunna se ut om korrelationskoefficienten ( ) är.98 och regressionskoefficienten ( ) är 2.. Determinationskoefficienten kan beräknas utifrån korrelationskoefficient (.98.69). Kombinationen 2. och.98 är en omöjlig kombination eftersom korrelationskoefficienten inte ligger inom intervallet 1, 1. Kombinationen.75 och 1. är en möjlig kombination eftersom båda parametrarna har samma tecken och korrelationskoefficienten ligger inom intervallet 1, 1. Regressionslinjen ska ha en negativ lutning ( 1.) och punktsvärmen runt regressionslinjen ska vara samlad (.75 innebär att det är ett relativt starkt (negativt) linjärt samband mellan variabel x och variabel y). 3 Variabel y 25 2 15 1 y = 1.x + 22 R² =.56 5 2 4 6 8 1 12 Variabel x Fig 14. Exempel på hur ett spridningsdiagram mellan variabel x och variabel y skulle kunna se ut om korrelationskoefficienten ( ) är -.75 och regressionskoefficienten ( ) är -1.. Determinationskoefficienten kan beräknas utifrån korrelationskoefficient (.75.56).