Enkel linjär regression: skattning, diagnostik, prediktion. Multipel regression: modellval, indikatorvariabler
|
|
- Vilhelm Sandberg
- för 7 år sedan
- Visningar:
Transkript
1 UPPSALA UNIVESITET Matematiska institutionen Jesper ydén Matematisk statistik 1MS026 vt 2014 DATOÖVNING MED : EGESSION I den här datorövningen studeras följande moment: Enkel linjär regression: skattning, diagnostik, prediktion Multipel regression: modellval, indikatorvariabler Exempel på transformation Spelet kan börja! 1 Enkel linjär regression Vi återvänder här till data om bilmodeller från laboration 1, ladda in data (som är inbyggt i ): data(mtcars); attach(mtcars) Enkel linjär regression utgår från ett samband av typen y i = β 0 + β 1 x i + ɛ i där β 0 och β 1 är regressionskoefficienter, (x i, y i ) är mätvärden och ɛ i N(0, σ 2 ). Låt oss först studera inverkan av bilars vikt på bränsleförbrukningen, dvs. y-värden återfinns som variabeln mpg, x-värden i wt. En plot över data ges av följande kommando: plot(mpg ~ wt, xlab = "Vikt", ylab="förbrukn") 1.1 Skattning av parametrar En i användbar rutin för regression är lm (förkortning för linear model, dvs linjär modell). Modellen formuleras med symbolisk notation enligt Wilkinson och ogers: y = β 0 + β 1 x 1 motsvaras av y x1 y = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 1 x 2 motsvaras av y x1+x2+x1*x2 Anrop av lm ger upphov till en mängd information. En lagring av resultatet i m1 (modell 1) samt en sammanfattande utskrift i en tablå på skärmen kan ske med följande kommandon för våra aktuella variabler:
2 m1 <- lm(mpg ~ wt, mtcars) summary(m1) Identifiera från tablån förklaringsgrad, värden på koefficienter, signifikanta variabler. Om man enbart är intresserad av koefficienternas värde går det att få dessa genom coef(m1) Undersök även vad följande kommando utför: summary(m1)$coefficients[2,1] Man kan alltså komma åt numeriska värden som presenteras i tablån. Låt oss rita in den skattade linjen i den tidigare uppritade figuren med hjälp av följande kommando: abline(coef(m1), col="red") Titta i figuren och övertyga dig om att de skattade koefficienterna verkar rimliga vid jämförelse med de som finns i utskriften. Konfidensintervall för regressionskoefficienter I tablån i levereras direkt medelfelen för skattningarna (standard error). För att därefter beräkna ett konfidensintervall för exempelvis β 1 behövs lämplig t-kvantil, vilken erhålls med kommandot qt. # Förberedelser: beta1 <- summary(m1)$coefficients[2,1] medfel <- summary(m1)$coefficients[2,2] f <- m1$df.res # Frihetsgrader kvantil <- qt(0.975,f) # Intervallet: c(beta1 - kvantil*medfel, beta1 + kvantil*medfel) En andra ordningens modell Antag att vi vill införa en andra ordningens modell (en kvadratisk term). Studera den ursprungliga plotten och övertyga dig om att det kan vara tänkbart. Följande kommandon anpassar en kvadratisk modell: mqua <- lm(mpg ~ wt + I(wt^2), mtcars); summary(mqua) Studera förändringen i förklaringsgrad jämfört med modellen m1. Betrakta även förändringarna i justerad förklaringsgrad.
3 1.2 Studium av modell residualer m.m. Slumpens inverkan studeras genom analys av residualerna. Dessa kan extraheras genom residuals(m1) En bild säger mer än tusen ord; låt oss först rita upp sekvensen av residualerna. (De är naturligtvis lika många som antalet observationer.) plot(residuals(m1)) Fundera över: 1. Kan residualerna anses ha väntevärde 0? (Titta i figuren, använd eventuellt mean för att beräkna stickprovsmedelvärde.) 2. Är de oberoende dvs. inga mönster uppträder? För att grovt kontrollera modellantagandet om normalfördelade residualer kan vi rita ett histogram och iakttaga spridningen: hist(residuals(m1)) Ett anrop av qqnorm kan även vara på sin plats. Vi har här relativt få observationer; det är inte lätt att dra någon säker slutsats. Extrahera designmatris Givet en modell från ett anrop av lm, kan den s.k. designmatrisen erhållas, dvs X i den vanliga matrisformuleringen y = Xβ. Följande kommandosekvens extraherar matrisen och beräknar sedan (X T X) 1, en matris som ju förekommer flitigt i regressionssammanhang. X <- model.matrix(m1); solve( t(x) %*% X ) UPPGIFT. Beräkna V[ ˆβ 0 ] genom att dels utnyttja lämpligt element i matrisen (X T X) 1, dels den skattade residualvariansen (hitta den i tablån). Kontrollera ditt svar genom att jämföra med vad som presenteras direkt i tablån (dock där i form av medelfel, standard error). Figurer för diagnostik Här kan vi dels rita olika residualer genom eget manipulerande och utnyttjande av definitioner, dels använda en färdig presentation i. Om man vill styra själv vad som ska ritas kan man exempelvis göra som följer (fyra figurer i en, men givetvis kan man även rita varje figur var för sig): par(mfrow=c(2,2)) # Sekvens av residualer plot(residuals(m1)) # esidualer mot yhat-värden
4 plot(m1$fit,m1$res) # Studentiserade residualer plot(rstudent(m1)) # Cook s distance plot(cooks.distance(m1)) En och annan punkt verkar ha inflytande att döma av Cook s distance. Kommandot identify, se nedan, kan användas för att identifiera vilken bilmodell det handlar om. Ett hårkors kommer att dyka upp i figuren; klicka med vänster musknapp över intressanta punkter. Avsluta genom att klicka med mellanliggande (eller höger) musknapp. car.models <- row.names(mtcars) identify(1:32,cooks.distance(m1),car.models) Om endast numret på observationen är av intresse, utelämna car.models i anropet av identify. Givet ett objekt resulterande från användning av lm, t.ex. m1 i vårt aktuella fall, kan erbjuda en kavalkad av figurer för diagnostik av residualer. Man skriver helt enkelt plot(m1) Genom att trycka på Enter stegar man sig fram mellan figurerna. 1.3 Prediktion Med en resulterande modell från rutinen lm kan prediktion enkelt utföras: predict(m1,mtcars) Jämför de predikterade värdena med de ursprungliga. Prediktionsintervall kan erhållas genom att lägga till predict(m1, mtcars, interval="prediction") Antag nu att vi vill prediktera för godtyckliga vikter (samlade i en vektor) och vill åskådliggöra resultatet i en figur. Vi passar på att rita såväl konfidensband (för linjen själv) som prediktionsband (för framtida observation). attach(mtcars) # Sekvens av värden på ober. var. för vilka prediktion ska göras pred.frame <- data.frame(wt=seq(1.5,5.5,0.5)) # Beräkning av prediktions- resp. konfidensintervall pp <- predict(m1, int="p", newdata = pred.frame) pc <- predict(m1, int="c", newdata = pred.frame) # Grafik (lite trixande, användning av kommandot matlines) plot(wt,mpg,ylim=range(mpg,pp,na.rm=t)) pred.mpg <- pred.frame$wt matlines(pred.mpg,pc,lty=c(1,2,2),col="blue") matlines(pred.mpg,pp,lty=c(1,3,3),col="black") Notera att prediktionsintervallen är vidare, större osäkerhet.
5 2 Multipel regression Vi använder oss nu av ytterligare en förklarande variabel: motorstyrkan (hp). Ett anrop med lm och därtill hörande lagring i modellen m2 lyder nu m2 <- lm(mpg ~ wt + hp); summary(m2) Tag fram matrisen X i den vanliga matrisformuleringen y = Xβ med kommandot model.matrix. Undersök gärna residualer osv. precis som ovan, utgå från m2. Jämför förklaringsgraden i m1 med den i m2. Som förväntat? Prediktion: Antag att vi vill förutsäga förbrukningen för en ny, rätt tung bil med förhållandevis liten motor: wt= 3.5, hp= 90. Kommandon: x0 <- data.frame(wt=3.5,hp=90) yhat <- predict(m2,x0) UPPGIFT. Pröva något eget exempel med prediktion för en tänkt bilmodell och jämför med värdena för de befintliga bilmodellerna! 3 Indikatorvariabler och modellval Vi studerar användandet genom ett exempel. En ingenjör vill modellera den förväntade tiden E[Y ] per månad (i timmar) för pga. reparationsarbeten avstängda maskiner som funktion av de förklarande variablerna maskintyp (1 eller 2) samt maskinens ålder (i år). Följande modell föreslås: E[Y ] = β 0 + β 1 x 1 + β 2 x β 3 x 2 där x 1 är maskinens ålder, x 2 maskintyp (x = 1: Typ 1, x = 0, Typ 2). I filen shutdown.dat finns dat insamlat. Spara data i lämplig katalog, läs in i och titta på datas struktur: mask <- read.table("shutdown.dat") mask str(mask) attach(mask) Identifiera de olika variablerna, notera indikatorvariablerna V3 och V4. (a) Skattning av parametrar: mask0 <- lm(v1 ~ V2 + I(V2^2) + V4) summary(mask0) Verkar modellen rimlig? Vilka variabler är signifikanta i regressionsmodellen?
6 (b) Man vill nu testa den enklare modellen där β 1 = β 2 = 0 (på nivån α = 0.10). Mer specifikt formulerat, H 0 : β 1 = β 2 = 0 H 1 : Minst ett β i 0, i = 1, 2. Med beteckningar från kompendiet i regressionsanalys är då storheten w = Q (1) Q (2) Q(2) /p /(n k p 1) av intresse; man har W F (p, n k p 1). Kvadratsumman Q (1) den mindre modellen, Q (2) till den kompletta. Vi anpassar först den enklare modellen och sparar under namnet mask1: mask1 <- lm(v1 ~ V4) summary(mask1) härrör till Det går att extrahera kvadratsummorna från respektive modell genom att visa modellerna i s.k. ANOVA-tablå och utifrån dessa göra tilldelningar. Därefter kan värdet på w beräknas: anova(mask0) anova(mask1) Q1 <- anova(mask1)$sum[2] Q2 <- anova(mask0)$sum[4] w <- ( (Q1-Q2)/(3-1) )/ ( Q2/( ) ) wcrit <- qf(0.90,3-1, ) w > wcrit Det observerade värdet på teststorheten är större än kvantilen från F -fördelningen. Det finns statistiskt belägg för att maskintyp bidrar till modellen på nivå α = Sammanfattningsvis, efter att ha justerat för maskintyp finns det belägg för att reparationstiden beror av ålder. 4 Transformationer I många sammanhang görs transformationer. Vi ska här närmare studera effekten på hållfastheten hos grönsaker (tänk er morötter) efter att dessa blivit upphettade ( skållade ) under en viss tid. Sådana experiment har betydelse för studier av förpackningsstrategier i livsmedelsteknik. Data härstammar från ett försök gjort i Belgien. Temperaturen hölls fix (90 C), tiden för upphettning mättes i sekunder och kraften i N. Vi läser in data och ritar hållfastheten som funktion av längden på upphettningen. Även en figur med logaritmerad hållfasthet på ordinatan ritas:
7 skalla <- read.table("skalla.dat", col.names=c("temp","tid","hallf") ) attach(skalla) plot(hallf~tid) plot(log(hallf)~tid) Inser du att logaritmeringen av beroende variabel kan leda dels till en bättre linjär relation, dels mer homogen varians? egressionsmodeller estimeras som vanligt: m3 <- lm(hallf ~ Tid) m4 <- lm(log(hallf) ~ Tid) Betrakta resultatet av regressionen: signifikanta variabler, förklaringsgrad, etc. Fortsättningsvis arbetar vi med logaritmerad beroende variabel. (Om du har tid: använd gärna rutinen boxcox (glöm inte att först skriva library(mass)) för att övertyga dig om att logaritmering verkar vara en bra idé.)
Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08 Laboration 5: Regressionsanalys Syftet med den här laborationen är att du skall
Läs merLaboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
Läs merUnder denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.
Laboration 5 Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Deluppgift 1: Enkel linjär regression Övning Under denna uppgift ska enkel
Läs merSTOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på
Läs merResultatet läggs in i ladok senast 13 juni 2014.
Matematisk statistik Tentamen: 214 6 2 kl 14 19 FMS 35 Matematisk statistik AK för M, 7.5 hp Till Del A skall endast svar lämnas. Samtliga svar skall skrivas på ett och samma papper. Övriga uppgifter fordrar
Läs mera) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?
Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten
Läs merResidualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Läs merSyftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 6 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 6: Regression Syftet med den här laborationen är att du skall bli
Läs merLaboration 2: Styrkefunktion samt Regression
Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens
Läs merLaboration 4: Lineär regression
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08 Laboration 4: Lineär regression 1 Syfte Denna laboration handlar om regressionsanalys och
Läs merMatematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2
Lunds universitet Matematikcentrum Matematisk statistik Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2 Rapporten till den här laborationen skall lämnas in senast den 19e December 2014.
Läs mer1 Förberedelseuppgifter
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli
Läs merGör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).
Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta
Läs merlära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FMS035: MATEMATISK STATISTIK FÖR M DATORLABORATION 5, 11 MAJ 2012 Syfte Syftet med dagens laboration är att du ska lära dig tolka ett av de
Läs merSyftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 01, HT-07 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen, enkla punktskattningar
Läs merTillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1
Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-19 Motivering Vi motiverade enkel linjär regression som ett
Läs merF13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Läs merRegressionsanalys av huspriser i Vaxholm
Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se
Läs merF14 Repetition. Måns Thulin. Uppsala universitet thulin@math.uu.se. Statistik för ingenjörer 6/3 2013 1/15
1/15 F14 Repetition Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 6/3 2013 2/15 Dagens föreläsning Tentamensinformation Exempel på tentaproblem På kurshemsidan finns sex gamla
Läs merLaboration 4 R-versionen
Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner
Läs merTVM-Matematik Adam Jonsson
TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet
Läs merAnalys av bostadsrättspriset i Stockholms innerstad
Analys av bostadsrättspriset i Stockholms innerstad En multipel linjär regression Kandidatexamensarbete i Teknisk Fysik Anda Zhang andaz@kth.se Handledare Boualem Djehiche Avdelningen för Matematisk Statistik
Läs merAvd. Matematisk statistik
Avd. Matematisk statistik TENTAMEN I SF1902 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 23:E MAJ 2013 KL 14.00 19.00. Kursledare och examinator : Björn-Olof Skytt Tillåtna hjälpmedel: miniräknare, lathund
Läs merStatistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
Läs merTentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2011-10-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Lennart
Läs merUPPSALA UNIVERSITET Matematiska institutionen Jesper Rydén Statistik för ingenjörer 1MS 008 vt 2010 DATORÖVNING 1: INTRODUKTION, BESKRIVANDE STATISTIK 1 Inledning Utvecklingen av datorer har lett till
Läs merFinansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen
Finansiell Statistik (GN, 7,5 hp,, HT 8) Föreläsning 7 Multipel regression (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,
Läs merDatorlaboration 2 Konfidensintervall & hypotesprövning
Statistik, 2p PROTOKOLL Namn:...... Grupp:... Datum:... Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta den statistiska
Läs merUppgift 1. Deskripitiv statistik. Lön
Uppgift 1 Deskripitiv statistik Lön Variabeln Lön är en kvotvariabel, även om vi knappast kommer att uppleva några negativa värden. Det är sannolikt vår intressantaste variabel i undersökningen, och mot
Läs merFöreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merStatistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs
Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 4 Syfte: 1. Lära sig beräkna konfidensintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera
Läs merWienerprocesser. Finansiell statistik, vt-05. Enkel slumpvandring. Enkel slumpvandring. Varför: model för aktiekurs (dock med aber...
Varför: model för aktiekurs dock med aber... exempel: Black-Scholes jfr Binomialoptionsmodellen Johan Koskinen Statistiska institutionen Stockholms universitet Finansiell statistik vt-05 F5 Tidsserieanalys
Läs merLaboration 2: 1 Syfte. 2 Väntevärde och varians hos en s.v. X med fördelningen F X (x) MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08 Laboration 2: Om väntevärden och fördelningar 1 Syfte I denna laboration skall vi försöka
Läs merTentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Läs mera) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)
5:1 Studien ifråga, High School and beyond, går ut på att hitta ett samband mellan vilken typ av program generellt, praktiskt eller akademiskt som studenter väljer baserat på olika faktorer kön, ras, socioekonomisk
Läs merTAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval
TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen
Läs merSF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011
Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i
Läs merLaboration 4 Regressionsanalys
Matematikcentrum Matematisk Statistik Lunds Universitet MASB11 VT14, lp4 Laboration 4 Regressionsanalys 2014-05-21/23 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner som finns
Läs merDekomponering av löneskillnader
Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden
Läs merMatematisk statistik, Föreläsning 5
Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk
Läs merLABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs merFöreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en
Läs merLaboration 2 multipel linjär regression
Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera
Läs merförstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 2, 6 DECEMBER 2017 Syfte Syftet med den här laborationen är att du ska
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merLinjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Läs merMatematisk statistik kompletterande projekt, FMSF25 Övning om regression
Lunds tekniska högskola, Matematikcentrum, Matematisk statistik Matematisk statistik kompletterande projekt, FMSF Övning om regression Denna övningslapp behandlar regression och är tänkt som förberedelse
Läs mer1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-04. 2.2 Angående grafisk presentation
LUNDS TEKNISKA HÖSKOLA ATEATIKCENTRU ATEATISK STATISTIK ATEATISK STATISTIK, AK FÖR L, FS 33, HT-4!"$&' (*) 1 Syfte I den första delen av detta projekt skall vi försöka hitta begripliga tolkningar av begreppen
Läs merk x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)
Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSLÄRA OCH STATISTIK MÅNDAGEN DEN 17 AUGUSTI 2009 KL 08.00 13.00. Examinator: Gunnar Englund, tel. 790 74 16. Tillåtna hjälpmedel: Formel- och tabellsamling
Läs merMatematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,
Läs merFöreläsning 14: Försöksplanering
Föreläsning 14: Försöksplanering Matematisk statistik Chalmers University of Technology Oktober 14, 2015 Modellbeskrivning Vi har gjort mätningar av en responsvariabel Y för fixerade värden på förklarande
Läs merTentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl. 09.00-13.00
Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 4 januari 004, kl. 09.00-13.00 Tillåtna hjälpmedel: Ansvarig lärare:
Läs mer(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?
LÖSNINGAR till tentamen: Statistik och sannolikhetslära (LMA12) Tid och plats: 8.3-12.3 den 24 augusti 215 Hjälpmedel: Typgodkänd miniräknare, formelblad Betygsgränser: 3: 12 poäng, 4: 18 poäng, 5: 24
Läs merDATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2014 Avd. Matematisk statistik GB 2014-03-17 DATORLABORATION: JÄMFÖRELSE AV FLERA STICKPROV. Till den här datorlaborationen
Läs merLABORATION 3 - Regressionsanalys
Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys
Läs merStatistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merStatistiska analyser C2 Inferensstatistik. Wieland Wermke
+ Statistiska analyser C2 Inferensstatistik Wieland Wermke + Signifikans och Normalfördelning + Problemet med generaliseringen: inferensstatistik n Om vi vill veta ngt. om en population, då kan vi ju fråga
Läs merMatematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering
Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3 Laboration 2 Fördelningar och simulering Introduktion 2014-02-06 Syftet med laborationen är dels
Läs merTentamen för kursen. Linjära statistiska modeller. 17 februari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,
Läs merTentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl 08.15-13.15
Tentamen i Statistik, STA A och STA A13 (9 poäng) Onsdag 1 november 00, Kl 0.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen miniräknare.
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merInlämningsuppgift 4 NUM131
Inlämningsuppgift 4 NUM131 Modell Denna inlämningsuppgift går ut på att simulera ett modellflygplans rörelse i luften. Vi bortser ifrån rörelser i sidled och studerar enbart rörelsen i ett plan. De krafter
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs merSTOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 1: TIDSSERIER.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-03-24 DATORLABORATION 1: TIDSSERIER. I Tarfala har man under en lång följd av
Läs merStatistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..
TENTAMEN Tentamensdatum 8-3-7 Statistik för ekonomer, Statistik A, Statistik A (Moment ) : (7.5 hp) Namn:.. Personnr:.. Tentakod: A3 Var noga med att fylla i din kod samt uppgiftsnummer på alla lösningsblad
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merFöreläsning 13, Matematisk statistik 7.5 hp för E, HT-15 Multipel linjär regression
Föreläsning 13, Matematisk statistik 7.5 hp för E, HT-15 Multipel linjär regression Anna Lindgren 14 december, 2015 Anna Lindgren anna@maths.lth.se FMSF20 F13 1/22 Linjär regression Vi har n st par av
Läs merBIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09)
LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09) Aktuella avsnitt i boken är Kapitel 7. Lektionens mål: Du
Läs merLaboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
Läs merOmtentamen i DV & TDV
Umeå Universitet Institutionen för Datavetenskap Gunilla Wikström (e-post wikstrom) Omtentamen i Teknisk-Vetenskapliga Beräkningar för DV & TDV Tentamensdatum: 2005-06-07 Skrivtid: 9-15 Hjälpmedel: inga
Läs merTentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove
Läs merLULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400
LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 Tentamen i: Statistik 1, 7.5 hp Antal uppgifter: 5 Krav för G: 11 Lärare: Robert Lundqvist, tel
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs merMultipel regression och Partiella korrelationer
Multipel regression och Partiella korrelationer Joakim Westerlund Kom ihåg bakomliggande variabelproblemet: Temperatur Jackförsäljning Oljeförbrukning Bakomliggande variabelproblemet kan, som tidigare
Läs merDatorövning 5 Exponentiella modeller och elasticitetssamband
Datorövning 5 Exponentiella modeller och elasticitetssamband Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Minitab för att 1. anpassa och tolka analysen av en exponentiell
Läs merUppgift 2 Betrakta vädret under en följd av dagar som en Markovkedja med de enda möjliga tillstånden. 0 = solig dag och 1 = regnig dag
Avd. Matematisk statistik TENTAMEN I SF904 MARKOVPROCESSER MÅNDAGEN DEN 26 AUGUSTI 203 KL 08.00 3.00. Examinator: Gunnar Englund tel. 073 32 37 45 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk
Läs merAtt bekanta dig med NetBeans programmeringsmiljö och skriva några enkla program med programmeringsspråket Java.
Laboration 1 Avsikt Att bekanta dig med NetBeans programmeringsmiljö och skriva några enkla program med programmeringsspråket Java. Del 1 Ta fram dokumentet NetBeans5_5.pdf från kurssidan och arbeta med
Läs merTextsträngar från/till skärm eller fil
Textsträngar från/till skärm eller fil Textsträngar [Kapitel 8.1] In- och utmatning till skärm [Kapitel 8.2] Rekursion Gränssnitt Felhantering In- och utmatning till fil Histogram 2010-10-25 Datorlära,
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Läs merDiskussionsproblem för Statistik för ingenjörer
Diskussionsproblem för Statistik för ingenjörer Måns Thulin Rolf Larsson rolf.larsson@math.uu.se Jesper Rydén jesper.ryden@math.uu.se Senast uppdaterad 27 januari 2016 Diskussionsproblem till Lektion 3
Läs merMatematisk Modellering
Matematisk Modellering Föreläsning 1 Anders Heyden Matematikcentrum Lunds Universitet Matematisk Modellering p.1/37 Denna föreläsning (läsvecka 1) Vad handlar kursen om, mål, kurskrav, ide. Matematisk
Läs merTentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Läs merMatematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression
Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merTENTAMEN I MATEMATISK STATISTIK
UMEÅ UNIVERSITET Institutionen för matematisk statistik Regressions- och variansanalys, 5 poäng MSTA35 Leif Nilsson TENTAMEN 2003-01-10 TENTAMEN I MATEMATISK STATISTIK Regressions- och variansanalys, 5
Läs merLaboration: Grunderna i Matlab
Laboration: Grunderna i Matlab Att arbeta i kommandofönstret och enkel grafik Den här delen av laborationen handlar om hur man arbetar med kommandon direkt i Matlabs kommandofönster. Det kan liknas vid
Läs merLaboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar
Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 3 Matematisk statistik AK för CDIFysiker, FMS012/MASB03, HT15 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla
Läs merFöreläsning 9: Linjär regression del II
Föreläsning 9: Linjär regression del II Johan Thim (johan.thim@liu.se) 29 september 2018 No tears, please. It s a waste of good suffering. Pinhead Vi fixerar en vektor u T = (1 u 1 u 2 u k ), där u i kommer
Läs merFöreläsning 13: Multipel Regression
Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på
Läs mer732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läs merTAMS65 DATORÖVNING 2
TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Läs merFöreläsning 3 Kap 3.4, 3.6, 4.2. 732G71 Statistik B
Föreläsning 3 Kap 3.4, 3.6, 4.2 732G71 Statistik B Exempel 150 slumpmässigt utvalda fastigheter till salu i USA Pris (y) Bostadsyta Tomtyta Antal rum Antal badrum 179000 3060 0.75 8 2 285000 2516 8.1 7
Läs merMMA132: Laboration 1 Introduktion till MATLAB
MMA132: Laboration 1 Introduktion till MATLAB De flesta numeriska metoder låter oss få en tillräckligt bra lösning på ett matematiskt problem genom att byta ut komplexa matematiska operationer med kombinationer
Läs merÖVNINGSUPPGIFTER KAPITEL 9
ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar
Läs merTENTAMEN KVANTITATIV METOD (100205)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B, Vetenskaplig metod TENTAMEN KVANTITATIV METOD (205) Examinationen består av 11 frågor, några med tillhörande följdfrågor. Besvara alla frågor i direkt anslutning
Läs mer1 Förberedelseuppgifter
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 4 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03 Syfte: Syftet med den här laborationen är att du skall bli mer
Läs mer3 Maximum Likelihoodestimering
Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till
Läs mer