Vad man bör tänka på innan man börjar analysera sina data SLU

Storlek: px
Starta visningen från sidan:

Download "Vad man bör tänka på innan man börjar analysera sina data SLU"

Transkript

1 Vad man bör tänka på innan man börjar analysera sina data SLU

2 Datakvalitet Fyra olika dataset gav följande samband: y = 3 + 0,5 x r 2 = 0,67 p = 0,002 Finns det ett samband mellan x och y?

3 Datakvalitet Titta på data: y1 y x x3

4 Bedömning av datakvalitet Finns det skrivfel? Finns det saknade värden eller saknade perioder? Finns det avvikande värden (Outliers) eller avvikande perioder? Finns det tillräckligt med data? Finns det brytpunkter i serien?

5 Datamaterialets egenskaper Hur ser data ut? Är observationerna oberoende? Finns det värden under en eller flera detektionsgräns(er)? Vilken fördelning har observationerna?

6 Ytterligare problem vid analys av data Homogenitet i Y Många nollor i Y Samvariation i X

7 Skrivfel Första kontroll av ett digitalt dataset bör omfatta: Har alla variabler rätt typ Numerisk / Text / Heltal, etc. Medel-, max- och minvärden Är dessa inom rimliga gränser? Hur kodas saknade värden? Tom cell, 0, -99, punkt

8 Skrivfel Vanliga misstag: Decimalkomma eller -punkt: 3,14 eller 3.14 Mellanrum eller apostrofer i nummer: eller Censurerade värden, t.ex. <100 Byte av enhet mitt i en kolumn: µg * l -1 till mg * l -1 Feltolkning av noll (0): mätvärde i stället för saknat värde Kolumnfel vid import av data

9 Saknade värden Enstaka, slumpvis fördelade saknade värden = inget stort problem Systematiska luckor i data = problem Var medveten om hur ditt program och din metod hanterar saknade värden: Tar bort hela raden Tar bort hela kolumnen Modelleras (imputeras) Inget program klarar av saknade värden!

10 Avvikande värden Stort problem i vissa statistiska metoder Litet eller inget problem i andra metoder Vagt definierat som ett avvikande värde

11 Box plot Hur hittar man avvikare? y3 y x x3 Cleveland plot, observerat värde mot radnummer Row number TOC (mg/l)

12 Avvikande värden Visuell inspektion av data Grubbs test Relaterat till t-test. Avgör om ett värde tillhör samma statisiska population som resten av värdena. Flera andra test för kontroll av avvikande värden Finns även för multivariata data

13 När tar man bort avvikande värden? Uppenbara felaktigheter Endast om avvikande värden påverkar analysen Mindre riskabelt i stora dataset Borttagning måste baseras på ämneskunskap (miljö, biologi, kemi, etc.) När tar man inte bort avvikande värden? Om det avvikande värdet är korrekt och visar sanna variationen När analysen inte påverkas av avvikande värden Bör övervägas vid små dataset

14 Finns tillräckligt med data? Vilken fråga vill jag ha svar på? Hur stor risk är jag villig att ta att data råkar vara en samling extremvärden? Vad är kostnaden (ekonomiskt, ekologiskt, trovärdighet) för att: a) Missa en påverkan på miljön (typ II-fel) b) Felaktigt påstå att det finns en miljöpåverkan (typ I-fel)

15 Finns det brytpunkter i en dataserie? R 2 =.42 P <.001 P(x1) = 0.12 P(x2) <.001 Före Efter Utan hänsyn till brytpunkten: Y = α + β X + ε Bra samband mellan X 1 och Y Med hänsyn till brytpunkten: Y = α + β 1 X 1 + β 2 X 2 + ε Inget samband mellan X 1 och Y. Brytpunkten (X 2 ) signifikant

16 Finns det brytpunkter i en dataserie? Brytpunkt: I medelvärde I variation Orsak till brytpunkt måste undersökas Viktigt resultat i sig!

17 Hur ser data ut? Titta på data! y1 y x x3

18 Stationsko Min Max Abs_OF Abs_F Stationsnam ordinat Stationsko Stationsty Provtagnin Provtagnin Provtagnin Provdjup Provdjup SO4_IC NO2_NO3 Kjeldahl_N NH4_N Ca Kond_25 PO4_P Mg (420nm/5c Fluorid Tot_N_ps Alk (420nm/5c Na n N/X ordinat E/Y p Provdatum gs? gsm?ad gsdag (m) (m) (mekv/l) TOC (mg/l) Cl (mekv/l) _N (?g/l) (?g/l) Si (mg/l) (?g/l) (mekv/l) (ms/m25) ph () (?g/l) (mekv/l) m) (mg/l) (?g/l) (mekv/l) K (mekv/l) m) (mekv/l) Vattendra Alelyckan g ,5 0,5 0,265 4,9 0, , ,375 9,57 7,15 7 0,135 0,188 0, ,26 0,032 0,046 0,316 Vattendra Alelyckan g ,5 0,5 0,27 4,2 0, , ,375 9,87 7,17 5 0,139 0,127 0, ,269 0,03 0,045 0,329 Vattendra Alelyckan g ,5 0,5 0,264 5,7 0, , ,38 9,6 7,12 3 0,134 0,177 0, ,26 0,028 0,046 0,305 Vattendra Alelyckan g ,5 0,5 0, , ,7 13 0,383 9,7 7,22 4 0,14 0,112 0, ,267 0,031 0,036 0,331 Vattendra Always good to have a look at the relationships! Alelyckan g ,5 0,5 0,256 4,1 0, , ,378 9,41 7,08 6 0,14 0,157 0, ,267 0,031 0,049 0,298 Vattendra Alelyckan g ,5 0,5 0,257 4,5 0, , ,371 9,19 7,11 4 0,133 0,156 0, ,255 0,028 0,044 0,291 Vattendra Alelyckan g ,5 0,5 0,251 4,9 0, , ,369 9,29 7,48 5 0,13 0,131 0, ,262 0,03 0,034 0,287 Vattendra Alelyckan g ,5 0,5 0,261 4,1 0, , ,38 9,19 7,61 3 0,129 0,1 0, ,271 0,03 0,028 0,289 Vattendra Alelyckan g ,5 0,5 0,265 4,3 0, , ,383 9,21 7,29 2 0,132 0,07 0, ,268 0,031 0,029 0,293 Vattendra Alelyckan g ,5 0,5 0,264 4,6 0, ,64 8 0,369 9, ,132 0,118 0, ,271 0,031 0,042 0,293 Vattendra Alelyckan g ,5 0,5 0,255 4,3 0, , ,38 9,31 7,15 3 0,133 0,106 0, ,274 0,031 0,038 0,295 Vattendra Alelyckan g ,5 0,5 0,252 4,8 0, , ,361 9,42 7,16 9 0,134 0,131 0, ,263 0,031 0,054 0,304 Vattendra Alelyckan g ,5 0,5 0,258 4,9 0, , ,378 9,61 7,2 1 0,141 0,159 0, ,265 0,033 0,056 0,32 Vattendra Alelyckan g ,5 0,5 0,254 3,9 0, , ,371 9,46 7,18 4 0,136 0,152 0, ,268 0,032 0,051 0,316 Vattendra Alelyckan g ,5 0,5 0,257 4,5 0, , ,379 9,17 7,22 3 0,134 0,145 0, ,248 0,033 0,051 0,299 Vattendra Alelyckan g ,5 0,5 0,254 4,6 0, , ,374 9,98 7,26 5 0,143 0,2 0, ,282 0,033 0,045 0,317 Vattendra Alelyckan g ,5 0,5 0,257 4,3 0, , ,383 9,31 7,39 1 0,139 0,117 0, ,279 0,029 0,033 0,294 Vattendra Alelyckan g ,5 0,5 0,253 4,2 0, ,5 14 0,377 9,55 7,35 2 0,139 0,141 0, ,276 0,03 0,033 0,308 Vattendra Alelyckan g ,5 0,5 0,26 4,7 0, , ,374 9,48 7,36 9 0,129 0,123 0, ,271 0,027 0,031 0,295 Vattendra Alelyckan g ,5 0,5 0,258 4,3 0, , ,375 9,02 7,19 5 0,133 0,106 0, ,28 0,03 0,047 0,285 Vattendra Alelyckan g ,5 0,5 0,234 4,7 0, , ,365 8,85 7,2 4 0,135 0,119 0, ,26 0,032 0,056 0,312 Vattendra Alelyckan g ,5 0,5 0, , , ,369 8,68 7,33 4 0,135 0,087 0, ,271 0,031 0,042 0,302 Vattendra Alelyckan g ,5 0,5 0,232 4,6 0, , ,354 9,15 7,31 4 0,131 0,101 0, ,278 0,03 0,025 0,301 Vattendra Alelyckan g ,5 0,5 0,241 4,9 0, , ,372 8,19 7,23 7 0,137 0,132 0, ,281 0,031 0,04 0,307 Vattendra Alelyckan g ,5 0,5 0,233 4,6 0, , ,372 9,33 7, ,138 0,243 0, ,316 0,04 0,049 0,338 Vattendra Alelyckan g ,5 0,5 0,233 4,7 0, , ,368 9,37 7,19 6 0,134 0,089 0, ,317 0,033 0,029 0,336 Vattendra Alelyckan g ,5 0,5 0,201 5,3 0, , ,356 9,06 7,11 9 0,129 0,3 0, ,313 0,034 0,072 0,304 Vattendra Alelyckan g ,5 0,5 0,21 4,2 0, , ,351 8,6 7,45 5 0,117 0,106 0, ,302 0,031 0,04 0,275 Vattendra Alelyckan g ,5 0,5 0,214 4,3 0, , ,352 8,85 7,14 5 0,12 0,104 0, ,316 0,032 0,034 0,285 Vattendra Alelyckan g ,5 0,5 0,429 4, , ,438 42,7 7,24 6 0,608 0,147 0, ,328 0,083 0, Vattendra Alelyckan g ,5 0,5 0,677 4, , ,542 73,6 7, ,147 0, ,355 0,131 0, Vattendra Alelyckan g ,5 0,5 0,21 4,6 0, , ,366 8,98 7,27 8 0,124 0,144 0, ,315 0,031 0,034 0,288 Vattendra Alelyckan g ,5 0,5 0,203 5,2 0, , ,348 8,98 7, ,129 0,23 0, ,304 0,035 0,072 0,295 Vattendra Alelyckan g ,5 0,5 0,21 4,2 0, , ,351 8,6 7,45 5 0,117 0,106 0, ,302 0,031 0,04 0,275 Vattendra Alelyckan g ,5 0,5 0,214 4,3 0, , ,352 8,85 7,14 5 0,12 0,104 0, ,316 0,032 0,034 0,285 Vattendra Alelyckan g ,5 0,5 0,429 4, , ,438 42,7 7,24 6 0,608 0,147 0, ,328 0,083 0, Vattendra Hur ser data ut? Alelyckan g ,5 0,5 0,677 4, , ,542 73,6 7, ,147 0, ,355 0,131 0,

19 Hur ser data ut? Always good to have a look at the relationships! Avvikande värden Nollor mätvärde eller saknat värde? Fördelning Typ av samband Saknade värden / felkodade värden Trender

20 Oberoende observationer De flesta statistiska tester förutsätter att variablerna är oberoende av varandra! Om inte, måste detta tas med vid analys av data! Exempel: Hierarkiska försöksupplägg Naturreservat i länet Våtmarker i reservaten Provytor i våtmarkerna Upprepad provtagning i samma objekt Tidsseriedata på vattenkemi Personpåverkan Mindre variation mellan prover tagna av samma protagare, än mellan två slumpvis utvalda provtagare

21 Censurerade data Värden över/under detektionsgränsen lägsta koncentration en analysmetod klarar av när siktdjup > vattendjup Se t.ex. miljostatistik.se för förslag på lösning!

22 Vilken fördelning har mina data? Många statistiska tester förutsätter normalfördelade data, t.ex. ANOVA regression t-test Andra tester har inga krav på fördelning, t.ex.: Multivariata metoder Icke-parametriska tester Chi-två tester

23 Vilken fördelning har mina data? Visuell inspektion Många statistiska tester av normalfördelning Goodness-of-Fit Test Shapiro-Wilk W Test W Prob<W <0.0001* Note: Ho = The data is from the Normal distribution. Small p-values reject Ho. Goodness-of-Fit Test Shapiro-Wilk W Test W Prob<W Note: Ho = The data is from the Normal distribution. Small p-values reject Ho.

24 Vilken fördelning har mina data? Om data inte är normalfördelade: Transformera data om lämpligt Använd andra statistiska tester, t.ex.: Icke-parametriska tester Generalized linear model (GLIM), (avancerad statistik)

25 Vilken fördelning har mina data? Transformering inte alltid lämpligt! Dela upp ett dataset i faktorer för att kontrollera Vår Alla data Sommar Goodness-of-Fit Test Shapiro-Wilk W Test W Prob<W 0, <,0001* Note: Ho = The data is from the Normal distribution. Small p-values reject Ho. Vinter Honor Hanar

26 Heterogenitet i Y Variationen i Y-led måste vara lika stor för alla X Testas enklast genom plot av residualer mot predikterat Y R² = 0, Regression är inte tillåten -5 på dessa data! Predicted Y Residuals

27 Heterogenitet i Y Transformering av Y kan ta bort heterogeneiteten Ett annat alternativ är Generalized linear models 2 1 log Y 1,5 1 0,5 0-0,5-1 -1,5-2 R² = 0,3432 Residuals 0,5 0-0,5-1 -1,5-2 -2,5-2, ,5 1 1,5 X Predicted log Y

28 Många nollor Kallas ibland zero inflated data Kan ställa till problem Det finns statistiska tester för dataset med många nollor Problem vid analys av förekomstdata: Dubbel frånvaro

29 Många nollor Den gröna blomman saknas i yta 2 och 3 Vilket är det ekologiska avståndet mellan yta 2 och 3? Ligger ytorna bredvid varandra Ligger en yta i tropikerna och en Arktis? Går inte att svar på!

30 Pseudosamband IQ Skostorlek

31 Pseudosamband När en tredje variabel kontrollerar x och y IQ och skostorlek båda bestäms av ålder Förekomst av blåbär och vattenföring båda bestäms (bl.a.) av nederbörd

32 Samvariation Korrelerade variabler i samma modell kan ge felaktiga resultat t.ex. både vattendjup och avstånd till strand Y ** ** ** ** N.S. ** X1 X2 X3 X4 X5 X6 Signifikant samband mellan vart och ett av paren: Y-X 1, Y-X 2, Y-X 3 förutom Y-X 5.

33 Samvariation Hur upptäcker man samvariation? Korrelationsmatris Principalkomponentanalys (PCA)

34 Samvariation Samband mellan vart och ett: y-x1; y-x2, y-x3 Y ** ** ** ** N.S. ** X1 X2 X3 X4 X5 X6 Hur ser en sammansatt modell ut? Y = α + β 1 X 1 + β 2 X 2 + β 3 X 3 + β n X n + ε

35 Samvariation Variance Inflation Factor, VIF, kan ge svar Y ** ** ** ** N.S. ** X1 X2 X3 X4 X5 X6 Y = α + β 1 X 1 + β 2 X 2 + β 3 X 3 + β n X n + ε Term Estimate Std Error t Ratio Prob> t VIF Intercept -5,33 0,62-8,63 0,001*. X1-0,09 0,15-0,61 0,57 17,73 X2 0,39 0,1 4,12 0,015* 6,31 X3 0,45 0,06 8,02 0,001* 2,32 X4 0,88 0,07 11,77 0,0003* 4 Random number 0,16 0,12 1,3 0,26 2,95 Korrelerad till X1 0,25 0,13 1,89 0,13 23,23 VIF > 10 indikerar korrelation

36 Samvariation Variance Inflation Factor, VIF, kan ge svar Y ** ** ** ** N.S. ** X1 X2 X3 X4 X5 X6 Y = α + β 1 X 1 + β 2 X 2 + β 3 X 3 + β n X n + ε Term Estimate Std Error t Ratio Prob> t VIF Intercept -6,2 0,51-12,1 <,0001. X1 0,17 0,09 1,89 0,12 3,75 X2 0,52 0,08 6,27 0,0015* 3,15 X3 0,49 0,07 7,51 0,0007* 2,04 X4 0,82 0,08 9,79 0,0002* 3,33 Random number 0,31 0,12 2,64 0,05 1,76 VIF > 10 indikerar korrelation

37 Samvariation Vilken variabel ska man ta bort i ett par? Behåll den mest relevanta Behåll den enklaste Behåll den som är billigast att mäta

38 Mer att läsa Detta föredrag är baserat på: Zuur, A.F. m.fl.(2010) A protocol for data exploration to avoid common statistical problems. Methods in Ecology and Evolution 1: 3-14.

39

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. Tony Pansell, optiker Universitetslektor Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (9) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Parade och oparade test

Parade och oparade test Parade och oparade test Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning: möjliga jämförelser Jämförelser mot ett

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Sid 1 (10) Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp Uppgift 1 Betrakta nedanstående täthetsfunktion för en normalfördelad slumpvariabel X med väntevärde

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Sänkningen av parasitnivåerna i blodet

Sänkningen av parasitnivåerna i blodet 4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Gamla tentor (forts) ( x. x ) ) 2 x1

Gamla tentor (forts) ( x. x ) ) 2 x1 016-10-10 Gamla tentor - 016 1 1 (forts) ( x ) x1 x ) ( 1 x 1 016-10-10. En liten klinisk ministudie genomförs för att undersöka huruvida kostomläggning och ett träningsprogram lyckas sänka blodsockernivån

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser

Läs mer

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Regressions- och Tidsserieanalys - F7

Regressions- och Tidsserieanalys - F7 Regressions- och Tidsserieanalys - F7 Tidsserieregression, kap 6.1-6.4 Linda Wänström Linköpings universitet November 25 Wänström (Linköpings universitet) F7 November 25 1 / 28 Tidsserieregressionsanalys

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012 Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov

Läs mer

Obligatorisk uppgift, del 1

Obligatorisk uppgift, del 1 Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten

Läs mer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större

Läs mer

Bygga linjära modeller! Didrik Vanhoenacker 2007

Bygga linjära modeller! Didrik Vanhoenacker 2007 Bygga linjära modeller! Didrik Vanhoenacker 2007 1 Bygga enkla modeller Tänk att vi ska försöka förstå vad som styr hur många blommor korsblommiga växter har. T ex hos Lomme och Penningört. Hittills har

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik. Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik Urvalsstorlek Mätnivå/skaltyp Fördelning av data Studiedesign Frida Eek

Läs mer

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Kamratgranskning Analys Exempel: exekveringstid Hur analysera data? Hur vet man om man kan lita på skillnader och mönster som man observerar?

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Trender för vattenkvaliteten i länets vattendrag

Trender för vattenkvaliteten i länets vattendrag Fakta 2014:21 Trender för vattenkvaliteten i länets vattendrag 1998 2012 Publiceringsdatum 2014-12-17 Kontaktpersoner Jonas Hagström Enheten för miljöanalys Telefon: 010-223 10 00 jonas.hagstrom@lansstyrelsen.se

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Skrivning i ekonometri lördagen den 29 mars 2008

Skrivning i ekonometri lördagen den 29 mars 2008 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan

Läs mer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9. Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 4I2B KINAF4, KINAR4, KINLO4, KMASK4 7,5 högskolepoäng Tentamensdatum: 28 oktober 206 Tid:

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Slump och slumptal Analys Boxplot Konfidensintervall Experiment och test Kamratgranskning Kursmeddelanden Analys Om laborationer: alla labbar

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare

Läs mer

Föreläsning 15: Faktorförsök

Föreläsning 15: Faktorförsök Föreläsning 15: Faktorförsök Matematisk statistik Chalmers University of Technology Oktober 17, 2016 Ensidig variansanalys Vi vill studera om en faktor A påverkar en responsvariabel. Vi gör totalt N =

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Regressionsanalys av lägenhetspriser i Spånga

Regressionsanalys av lägenhetspriser i Spånga Regressionsanalys av lägenhetspriser i Spånga Mahamed Saeid Ali Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2016:11 Matematisk statistik Juni 2016

Läs mer

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Mälardalens Högskola. Formelsamling. Statistik, grundkurs Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman

STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman STOCKHOLMS UNIVERSITET HT 2006 Statistiska institutionen Jan Hagberg, Bo Rydén, Christian Tallberg, Jan Wretman OBLIGATORISK INLÄMNINGSUPPGIFT STATISTISK TEORI, GK 10 och GK 20:2, heltid, HT 2006 Den obligatoriska

Läs mer

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00 Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 5Hp 41I12B KINAF13, KINAR13, KINLO13,KMASK13 7,5 högskolepoäng Tentamensdatum: 30 oktober

Läs mer

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng.

Maximalt antal poäng för hela skrivningen är28 poäng. För Godkänt krävs minst 17 poäng. För Väl Godkänt krävs minst 22,5 poäng. Försättsblad KOD: Kurskod: PC1307/PC1546 Kursnamn: Kurs 7: Samhällsvetenskaplig forskningsmetodik/forskningsmetodik och fördjupningsarbete Provmoment: Statistik, 5 hp Ansvarig lärare: Sara Landström Tentamensdatum:

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 9 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 9 December 1 / 43 Longitudinella data

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Skrivning i ekonometri torsdagen den 8 februari 2007

Skrivning i ekonometri torsdagen den 8 februari 2007 LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS

TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö. UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för tekniska fysiker, MSTA6, 4p Peter Anton Per Arnqvist LÖSNINGSFÖRSLAG TILL TENTAMEN 7-- LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se

Läs mer

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1 Multipel linjär regression l: Y= β 0 + β X + β 2 X 2 + + β p X p + ε Välj β 0,β,β 2,, β p så att de minimerar summan av residualkvadraterna (Y i -β 0 -β X i - -β p X pi ) 2 Geometrisk tolkning Med Y=β

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Tentamen i matematisk statistik

Tentamen i matematisk statistik Sid 1 (7) i matematisk statistik Statistik och kvalitetsteknik 7,5 hp Tillåtna hjälpmedel: Miniräknare. Studenterna får behålla tentamensuppgifterna. Skrivtid: 9.00-12.00 ger maximalt 24 poäng. Betygsgränser:

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall,

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013 Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas

Läs mer

Mata in data i Excel och bearbeta i SPSS

Mata in data i Excel och bearbeta i SPSS Mata in data i Excel och bearbeta i SPSS I filen enkät.pdf finns svar från fyra män taget från en stor undersökning som gjordes i början av 70- talet. Ni skall mata in dessa uppgifter på att sätt som är

Läs mer

Korrelation och autokorrelation

Korrelation och autokorrelation Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) 1. a) F1(Sysselsättning) F2 (Ålder) F3 (Kön) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) nominalskala kvotskala nominalskala ordinalskala ordinalskala b) En möjlighet är att beräkna

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan och att en inblandning mellan 10% och 40% är bra. För att

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA HIERARKISKA DATA Linda Wänström Linköpings universitet 25 November Wänström (Linköpings universitet) HIERARKISKA DATA 25 November 1 / 53 Regressionsmodell för icke-hierarkiska

Läs mer

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012

Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 Statistiska Institutionen Patrik Zetterberg Skriftlig Tentamen i Finansiell Statistik Grundnivå 7.5 hp, HT2012 2013-01-18 Skrivtid: 9.00-14.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar: Flerfaktorförsök Blockförsök, randomiserade block Modell: yij i bj eij i 1,,, a j 1,,, b y ij vara en observation för den i:te behandlingen och det j:e blocket gemensamma medelvärdet ( grand mean ) effekt

Läs mer

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Målet för D2 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS Datorövning 2 Statistisk teori med tillämpningar Simulering i SAS Syfte Att simulera data är en metod som ofta används inom forskning inom ett stort antal ämnen, exempelvis nationalekonomi, fysik, miljövetenskap

Läs mer

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 7 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Fortsättning envägs-anova Scheffes test (kap 11.4) o Tvåvägs-ANOVA Korsade faktorer (kap 12.1, 12.3) Randomiserade blockförsök

Läs mer

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E Innehåll I. Grundläggande begrepp II. Deskriptiv statistik (sid 53 i E) III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser 1 II. Beskrivande statistik,

Läs mer