Höftledsdysplasi hos dansk-svensk gårdshund
Sjö A Sjö B Förekomst av parasitdrabbad öring i olika sjöar Sjö C
Jämföra medelvärden hos kopplade stickprov Tio elitlöpare springer samma sträcka i en för dem ny miljö två på varandra efterföljande dagar. Skiljer det något i hastighet mellan dagarna?
Hypotesprövning två medelvärden - t-test Diastoliskt blodtryck hos behandlad grupp och kontrollgrupp Förutsättningar för testet: 1. OSU. NF 3. Lika varians i populationerna
Motorisk förmåga hos barn av olika ålder Barn nr Ålder Poäng i test 1 3 4 5 4 1 3 5 6 5 3 3 8 Motorisk förmåga hos barn Poäng i test 10 8 6 4 0 0 4 6 Ålder Finns det något samband?
REGRESSION Analys av sambandet mellan en beroende variabel och en eller flera oberoende variabler Förutsäga värdet på en variabel givet värdet på en annan Oberoende variabel: variabel som påverkar (x) Beroende variabel: variabel som påverkas (y) H 0 : inget linjärt samband mellan x och y (linjens lutning=0)
REGRESSION Enkel en oberoende variabel Multipel flera oberoende variabler Linjär materialet ansluter till en rät linje Krökt icke linjärt samband
Ex. Sambandet mellan utetemperatur på morgonen och mängden såld glass under dagen. Med ledning av temperaturen vill man kunna förutsäga hur mycket glass man ska ta med sig till sin strandkiosk. Oberoende variabel temperatur (x) Beroende variabel mängden glass (y) Tittar på data för 5 dagar från förra sommaren (stickprovet borde egentligen ha varit större)
Observationer x (temp) y (kg glass) 14 56 6 35 18 60 15 48 70
80 Kg glass 60 40 0 0 0 5 10 15 0 5 Temperatur
Hjälpmedel för att kunna predicera från temp. till glassmängd: regressionekvation: Y = α + βx Regressionskoefficienter: α = y-interceptet β = linjens riktningskoefficient a = y bx b ( x x)( y = ( x x) y) Skattning av regressionsekvation: Stickprovets ekvation: y = a + bx
Med hjälp av talen i tabellen y = a + bx Regressionsekvationen blir ett hjälpmedel för att kunna predicera ( översätta ) från temperatur till glassmängd Regressionskoefficienterna kan räknas ut med nedanstående maskinformler : a y = b * n n x x y xy b = n x ( ) x n
x (temp) y (kg glass) xy x y 14 56 784 196 3136 6 35 10 36 15 18 60 1080 34 3600 15 48 70 5 304 70 1540 484 4900 S:a 75 69 4334 165 15165
Med hjälp av talen i tabellen y = a + bx Regressionsekvationen blir ett hjälpmedel för att kunna predicera ( översätta ) från temperatur till glassmängd Regressionskoefficienterna kan räknas ut med nedanstående maskinformler : a y = b * n n x a = 1.76 x y xy b = n x ( ) x n b =.14 y = 1.76 +.14x
Linjens riktningskoefficient (b) b>0 b<0 b=0 y ökar när x ökar y minskar när x ökar Ingen ändring i y b: anger hur mycket y ändras när x ökar en enhet I vårt fall: y = 1.76 +.14x Alltså, y ökar.14 när x ökar en enhet.
Prediktion Antag att morgontemperaturen är 10 C (x) y = 1.76 +.14 x 10 y = 4.8 Man kan alltså räkna med att sälja ungefär 43 kg glass.
KORRELATION Graden av anpassning till en rät linje Riktningen och styrkan hos ett samband Säger inget om orsakssamband...
Korrelationens riktning Positiv Negativ Nollkorrelation Inget samband
ρ [rho] : graden av anpassning till en rät linje ( Styrkan mellan X och Y bestäms av ρ) Pearsons produktmomentkorrelationskoefficient H 0 : ρ ( styrkan, sambandet ) = 0 r xy (stickprovet) -1 r +1 r = ( x ( x x)( y x) ( y y) y)
x (temp) y (kg glass) xy x y 14 56 784 196 3136 6 35 10 36 15 18 60 1080 34 3600 15 48 70 5 304 70 1540 484 4900 S:a 75 69 4334 165 15165 Maskinformel: r = x xy x ( x) ( y) y n n y n r xy = + 0.96
I vårt exempel: r xy = 0.96 Starkt samband hög anpassning till en rät linje! 80 Kg glass 60 40 0 0 0 5 10 15 0 5 Temperatur
Samband mellan β (linjens lutning) och ρ ( styrkan, riktningen ): Om β < 0 ρ < 0 Om β > 0 ρ > 0
Samband mellan r xy (korrelationskoefficienten) och hur mycket av den totala variationen hos y som kan förklaras av variationen hos x (regressionsmodellen) Determinationskoefficient (r ) = r xy x r xy Hur bra är morgontemp som prediktor? r = 0.96 r = 0.9 Alltså, 9% av variationen i glassförsäljning förklaras av vår modell (det linjära sambandet)
Hypotesprövning β = 0 är identiskt med ρ = 0 Detta kan testas på flera olika sätt, t.ex: t-test för β = 0 t-test för ρ = 0
Statistiskt test för korrelation ρ H 0 : (styrkan) = 0 (dvs. inget samband finns) t = r ρ 1 r n
Statistiskt test för korrelation ρ H 0 : (styrkan) = 0 (dvs. inget samband finns) t = 1 r r 0.96 ρ = 0 = 5.94 n df = n- Stickprovsstorlek (5 dagar)
T-tabell df p 0.995 0.5 0.1 0.05 0.01 0.005 1 0.01 1 6.31 1.71 63.66 17.3 3 0.01 0.01 0.8 0.76.9.35 4.30 3.18 9.9 5.84 14.09 7.45 p < 0.01 Förkasta H 0 ρ 0 ß 0 4 0.01 0.74.13.78 4.60 5.60 5 0.01 0.73.0.57 4.03 4.77
Motorisk förmåga hos barn av olika ålder Barn nr Ålder Poäng i test 1 3 4 5 4 1 3 5 6 5 3 3 8 Motorisk förmåga hos barn 10 Poäng i test 8 6 4 0 0 4 6 Finns det något samband? Gör en regressionsanalys! Svar på nästa bild. Ålder
Finns det något samband?