Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007

Storlek: px
Starta visningen från sidan:

Download "Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007"

Transkript

1 Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 7 februari Datorlaboration 3 1 Inledning I denna laboration behandlas Kapitel 5 i kursboken (Chemometrics av Brereton), men det skall också ge tillfälle att återigen prova programpaketet MODDE. Kapitel 5 är uppbyggt från vanlig regression, via Principal Component Regression (PCR) till Partial Least Squares (PLS1 och PLS2) och laborationen följer också denna ordning. Boken lägger ganska stor vikt vid att utreda hur man kan vända på regressionsekvationen, och för att beteckningarna skall överensstämma med det exempel som finns i bakgrunden så kallas den beroende variabeln för c. Detta är lite olyckligt eftersom man i vissa programpaket har reserverat bokstaven c för ett begrepp i PLS, men i analogi med boken används också här beteckningen c för responsen och x som förklarande variabel (C och X om det är flera variabler). Tyngdpunkten kommer att läggas på PCR och PLS med mindre kommentarer om MLR, Multipel Linjär Regression. Med MLR menas i den här boken att man har flera responsvariabler, i Olbjers kompendium har man bara en responsvariabel men många förklarande variabler i multipel regression. Kapitel 5 i boken är lite svårläst på några ställen och därför går en del av laborationen åt till att utreda vissa begrepp. Strukturen på denna laboration är någonting mittemellan laboration 1 och laboration 2; först en ganska ordentlig utredning om hur de olika metoderna fungerar för några enkla datamaterial och därefter några datamaterial som löses med all den kreativitet ni har skaffat er under kursen. 1.1 Förberedelse Läs igenom avsnitt 5.1. Titta speciellt på vad kalibrering är i denna bok, det är inte alltid man definierar kalibrering på detta sätt. 2 Grunderna Det finns metoder för PLS i de flesta program, men de toolboxar som finns för detta i Matlab är kommersiella. Det är därför nödvändigt att antingen göra beräkningarna för hand i Matlab eller använda ett färdigt program. Här skall vi göra båda delar, det underlättar förståelsen om man gör beräkningen för hand, men man får automatiskt en rad intressanta utskrifter om man använder ett färdigt program. 1

2 2.1 Förberedelse Läs avsnitt 5.2, och lägg märke till att modellerna i början av avsnittet (t.ex. x = c s) saknar intercept. I avsnitt 5.2 läggs en del tid på att förklara vilket som är responsen och hur man kan vända på relationen mellan c och x medsåkalladinversregression.i Olbjers kompendium (sidan 226 ff.) finns mer sofistikerade metoder för att göra kalibrering (dvs. att från ett känt värde på responsen y förutsäga värdet på den förklarande variabeln x). Det problem som framhålls är att man mäter avvikelse i olika riktningar när man anpassar c som en funktion av x eller x som en funktion av c. Genom att skriva om formeln för enkel linjär regression är det mycket lätt att förstå när de båda linjerna som illustrerats i Figur 5.5 i boken liknar varandra och när de är relativt långt ifrån varandra. 2.2 En reflektion om regression Rekommendation: Räkna Problem 5.2 som diskuterar när linjer av den typ som finns i Figur 5.5 är lika eller ej (men Problem 5.2 har med intercept till skillnad från Figur 5.5). Om r betecknar den skattade korrelationskoefficienten för x och c, dvs P r = i (x i x)(c i c), s x s c (I 1) där s x och s c betecknar standardavvikelserna och I är antalet observationer (på grund av symmetrin är givetvis r också korrelationskoefficienten för c och x) så kan man visa att regressionslinjen för c som en funktion av x kan skrivas c c s c = r x x s x. Om man istället beräknar regressionslinjen för x som en funktion av c blir på grund av symmetrin x x s x = r c c s c och detta kan skrivas om enligt (jämför den beräkning som gjordes vid PCA i laboration 2) c c s c = 1 r x x s x. Ur detta kan man dra slutsatsen att invers regression fungerar bra när r är nära ±1, men att det annars kan fungera mindre bra. Om man redan innan man börjar beräkningen standardiserar observationerna genom att dra bort medelvärdet och dividera med standardavvikelsen och kallar de standardiserade variablerna för c s och x s, så får uttrycket den ännu enklare formen c s = r x s. Inledningsfråga: När är r =1och när är r = 1? 2

3 3 Multipel linjär regression Nyheten i detta avsnitt (och även jämfört med regress i Matlab och Olbjers kompendium) är att man kan ha en matris som respons. De tidigare formlerna för skattningen av parametern, som nu heter B, gäller med den enda förändringen att C nu är en matris. Tittar man närmare på formeln för skattningen av B, dvs. bb = X 0 X 1 X 0 C så inser man att denna kan delas upp i oberoende delar, där varje del skattar de olika kolumnerna i C. 3.1 Förberedelse När man läser kapitlet behöver man sedan inte bry sig så mycket om att det kallas kalibrering, det hade fungerat lika bra om man i formlerna istället hade kallat responsen för Y. Vad som däremot blir lite förvirrande är när man har så många kolumner på matrisen C att skattningarna inte fungerar. Låt N beteckna antalet kolumner i matrisen C, låt I beteckna antalet observationer och J beteckna antalet kolumner i matrisen X. Om J > I så framgick av regressionslaborationen att det inte gick att beräkna skattningarna. Den metod som används i boken (och som kan vara lite svår att hänga med på) är att helt enkelt genom invers regression skriva om detta enligt X = C S + E där matrisen C har storlek I N och man hoppas nu att I>Nså att det går att beräkna matrisen (C 0 C) 1. Då får man nämligen att bs = C 0 C 1 C 0 X, och efter lite resonemang och omskrivningar så kommer man sedan fram till att bc = X bs 0 ³ bs b S 0 1. Denna typ av beräkningar överges dock senare i kapitlet när man använder PCR och PLS och därför måste nog detta betraktas som lite kuriosa. Matlabs regress räknar inte med matriser som responser, men det är ju lätt att göra med matriskommandona i Matlab. Använd Matlab för att visa att parameterskattningarna i Tabell 5.6 är riktiga. Kommentera det stycke i boken på sidan 286 som börjar med The estimates by this approach... och slutar med compounds are used in the model.. Förvissa dig om att du inte har missuppfattat vad där står (eller har författaren missuppfattat vad där står?). 4 Principal Components Regression (PCR) 4.1 Förberedelse Läs avsnitt 5.4. Man kan främst tänka sig två skäl till att använda PCR: 3

4 1. De förklarande variablerna i matrisen X är starkt beroende av varandra och man vill ersätta dessa med variabler som är mindre beroende. 2. Man har situationen att J > I med för många förklarande variabler och måste reducera dessa för att kunna få några skattningar överhuvudtaget. I boken och i kemometrin är det ofta det skäl som ges i 2) som är det aktuella, typiskt är att man har ett spektra med väldigt många våglängder och inte speciellt många observationer. Idén är helt enkelt att man ersätter de förklarande variablerna i matrisen X med en matris av scores från PCA. Denna matris kallas som tidigare T,och eftersom scores är ortogonala (T 0 T är en diagonalmatris) så är också villkor 1) ovan uppfyllt. För att bestämma antalet komponenter kan man göra som vid PCA, men man kan också använda tekniken i boken och rita upp RMS error (se Figur 5.11) för variablerna i c. Det innebär ju att man till viss del tittar på responsen c när man bestämmer matrisen T, men som vi skall se nedan så utnyttjar PLS responsen c på ett mer avancerat sätt. 4.2 Uppgifter Rekommendation: Räkna Problem 5.5. Standardisera variablerna i Problem 5.1 med hjälp av stickprovsstandardavvikelsen och använd PCR för att prediktera A1. Hur många förklarande variabler behövs i modellen? 5 PLS1 5.1 Förberedelse Läs från början av avsnitt 5.5 fram till och med avsnitt Här handlar det alltså om att man har en variabel som är respons och flera förklarande variabler, men man kan upprepa proceduren för flera responser och då få olika scores för de olika responserna. I PCR reducerade man de förklarande variablerna med hjälp av PCA oberoende av responsen c (man använde indirekt responsen för att bestämma antalet komponenter), men i PLS1 tar man också hänsyn till responsen när man skall reducera antalet förklarande variabler. Hela proceduren är i steg och för att på något sätt strukturera upp det så numreras stegen. 1. Det allra vanligaste är att programmen automatiskt har standardiserat alla variablerna till medelvärde 0 och standardavvikelse 1 innan beräkningarna börjar. 2. Man vill bilda en linjärkombination av variablerna i matrisen X som så bra som möjligt predikterar c. Eftersom kovariansen mäter beroende mellan variabler så väljer man den kombination som ger störst kovarians mellan linjärkombinationen och c. Medw =(w 1,...,w J ) 0 så kan linjärkombinationen 4

5 skrivas Xw och kovariansen mellan Xw och c kan beräknas till (eftersom både Xw och c är centrerade) (Xw) 0 c I 1 = w0 X 0 c I 1. Här kan kovariansen bli hur stor som helst om man inte sätter någon begränsning på w och därför förutsätter man att w har längden 1, dvs.attw 0 w =1. Det är nu relativt enkelt att visa (t.ex. genom att använda Cauchy-Schwarz olikhet) att den kombination som maximerar uttrycket är proportionell mot X 0 c och därför gäller att w = X 0 c c 0 XX 0 c = X0 c kx 0 ck. 3. Modellen vid PLS1 i boken är (bortsett från att vi återigen har bytt P till P 0 ) X = TP 0 + E c = Tq+ f och om t 1 = Xw är den första kolumnen i matrisen T så kan man få fram den första raden i P 0 och det första elementet i q genom att utnyttja formlerna för regression. (Lägg märke till att man inte behöver bry sig om några intercept eftersom observationerna redan är centrerade.) Med regressionsformlerna blir detta alltså p 0 1 = t 0 1 1t 1 t 0 1 X q 1 = t 0 1 1t 1 t 0 1 c vilket förenklas något av att t 0 1 t 1 är en skalär. Man har alltså till skillnad från i PCR gjort en uppdelning som grundar sig på både c och X, och denna uppdelningen är gemensam för de båda blocken. Lägg också märke till att T och P inte är desamma som i de tidigare metoderna, så är t.ex. inte P säkert en ortonormerad matris. Den beskrivning som är ovan är precis den som beskrivs på sidan 413 bortsett att P 0 används istället för P,ochdärför kan man nu med Matlab beräkna de olika komponenterna för hand. 4. Man har nu en formel för den första komponenten i respektive block och kan beräkna residualerna resid X = X t 1 p 0 1 resid c = c t 1 q 1 Upprepa nu beräkningen för att få t 2, p 2 och q 2, men använd nu residualerna ovan i beräkningen istället för de ursprungliga värdena. 5. Fortsätter man på detta sätt får man till slut ett antal X-scores som man tillsammans kan använda för att prediktera vektorn c. Genom att nu beräkna regressionen av T med avseende på c kan man få förklaringsgraden för modellen, dvs. hur mycket av variationen i c som förklaras av modellen, och detta kan ju också användas för att hur många komponenter man behöver i modellen. När man skall bestämma antalet komponenter i modellen använder man emellertid oftast också korsvalidering i programmen. 5

6 5.2 Uppgifter Rekommendation: Räkna Problem 5.7. Genomför stegen ovan med upp till fem komponenter på det material som finns i Problem 5.1 utan korsvalidering med vektorn c som A1. Standardisera värdena med stickprovsstandardavvikelsen innan beräkningarna börjar. Bestäm förklaringsgraden R 2 för olika antal komponenter i modellen. I boken nämns inte de loading och score plots man ofta får ut i programmen, och det är här man ibland använder beteckningen c i ett annat sammanhang. I framställningen ovan framgår att man letar linjärkombinationer som på bästa sätt knyter ihop X och c. Ritar man in värdena för både X och c så får man en loading och scoreplot som visar vilka variabler i X som mest hänger ihop med c. För att förstå denna utskrift måste man dock veta vilken modell som används och därför sparas denna diskussion till avsnittet om PLS2. 6 MODDE Problemet med MODDE framgick redan i laboration 1, det finns inget enkelt sätt att lägga in observationer som man redan har i t.ex. ett excelark, men när man väl har lyckats med det så kan man göra PLS. Man börjar med att definiera respons (det som alltså Brereton kallas c eller C) ochfaktorer(x). När man skall göra PLS så upptäcker man att MODDE inte skiljer på PLS1 och PLS2 utan det är genomgående PLS2 som används. I datamaterialet skall man lägga variablerna i kolumnerna och observationerna i raderna, precis så som datamaterialen är upplagda i boken. 6.1 Inläsning av data och analys 1.LäsinvariablernaochanvändDesignWizardsåattdufårettworksheet i MODDE. (Strunta i hur designen ser ut bara du har alla variablerna i Worksheet.) 2. Spara dina data i en vanlig textfil ( tabseparerad ) och hämta in dem med Design och Investigation. Importera in detta i worksheet, och ta bort de tidigare observationerna som inte längre har någon funktion. (Det går också att klistra in siffrorna direkt i Worksheet och då kan man klistra över de värden som man inte längre vill ha.) 3. Tala om att du vill göra en PLS. 4. Välj rätt modell (utan samspel) i Edit Model/Reference Mixture Välj sedan Analysis och Fit(PLS). 6. Resultatet av modellanpassningen kommer upp i ett fönster. 7. Genom att välja bland menyerna kan man nu få ut figurer som visar resultatet, t.ex. scatter plots, loading plots, etc. 8. Man kan också få ut värden på koefficienter med hjälp av Plot/Lists. 9. Beskrivningar av MODDE:s olika menyer finns utlagda i datorsalarna. 6

7 7 PLS2 7.1 Förberedelse Läs avsnitt (hoppa över avsnitt 5.5.3). MODDEskiljerintepåPLS1ochPLS2ochhärkanmansetvåolikamodeller. MODDE har en matris U i responsen enligt (med modifieringar så att beteckningarna överensstämmer och med antagandet att det är centrerade variabler) X = TP 0 + E C = UQ 0 + F där U = T + H kallas för den inre relationen, men vi använder inte den modellen utan tar den som finns i boken med T både i den första och andra ekvationen. Man gör återigen proceduren stegvis: 1. Börja med att hitta den kombination Xw som har störst kovarians med kombinationen Cv (det är v som i MODDE kallas c men för att undvika beteckningskollision så används här genomgående v). Hur detta görs beskrivs i bokens appendix. 2. När man har hittat dessa w och v så kan man alltså beräkna t 1 = Xw respektive u 1 = Cv, och därefter hitta de första kolumnerna i P och Q med hjälp av de vanliga formlerna för regression. 3. När man sedan går vidare i nästa steg så arbetar man med residualerna av X och C från det första steget. Då man använder t 1 i båda ekvationerna som i boken så får man första kolumnen i Q med skattningen enligt t t 1 t 0 1 C = w 0 X 0 Xw 1 w 0 X 0 C. Den så kallade wc-plotten ritar upp de två första värdena på w och v isamma diagram och då kan man se vilka variabler i X och c som är mest beroende. Man kan också rita upp scores t 1 och u 1 mot varandra i ett diagram. Modellen bestäms ju så att dessa blir så beroende som möjligt, och därför skall denna plot visa upp observationer som är korrelerade med varandra. Om man ritar upp t i mot u i så kan man avgöra hur många komponenter som behövs genom att det inte finns något samband mellan t i och u i när man har tillräckligt många komponenter. 7.2 Uppgifter Låt MODDE göra en PLS på materialet i Problem 5.1 och jämför med det resultat du räknade fram ovan. (MODDE standardiserar alltså alla variablerna innan man börjar räkna.) Försök också att få ut så mycket information som möjligt ur materialet genom att rita figurer. Lös Problem 5.3 med hjälp av MODDE. Det viktiga är att utnyttja kunskaperna för att göra en bra analys av materialet, och mindre viktigt är att göra alla steg som finns i uppgiften. 7

8 8 Korsvalidering 8.1 Förberedelse Läs avsnitt 5.6 om olika sätt att validera modellerna. Korsvalidering har använts tidigare i samband med både PCA och diskriminantanalys och idén är hela tiden densamma. Validera modellen korsvis genom att ta bort en eller flera observationer åt gången och använd de återstående observationerna för att prediktera dessa observationer. Upprepa detta för alla observationerna. Det som i regressionsmodellerna kallades Q 2 är just den korsvaliderade varianten av R Uppgifter Återvänd till Problem 2.16 som löstes med hjälp av MODDE i laboration 1. Låt MODDE beräkna Q 2 och beräkna detta sedan för hand i Matlab med hjälp av korsvalidering som åstadkommes med en for-loop. Formeln för Q 2 är Q 2 =1 PRESS SS där PRESS är residualkvadratsumman för det korsvaliderade materialet och SS är den totalkvadratsumma (corrected) man får när man bara använder medelvärdet i modellen. Gör korsvalideringen för PLS i Problem 5.1 med hjälp av MODDE. Hur många komponenter är lämpligt att använda? 9 PLSDA Det finns något som i boken kallas SIMCA-modeller, och som där är något besvärligt beskrivna. Här ger vi bara ett exempel på den metod som kallas PLSDA, dvs. diskriminantanalys med hjälp av PLS, och denna modell kallas i boken för DPLS. 9.1 Förberedelse Läs avsnitt PLSDA beskrivs alltså som en metod med PLS när man har gruppindelade data. Prova PLSDA på Problem 4.7. Lägg märke till att man rekommenderas att logaritmera observationerna före standardiseringen och att man säger att en observation är så konstig att den bör tas bort. Gör dock inte alla stegen i uppgiften, utan använd bara PLSDA på det datamaterial som finns i uppgiften genom att definiera en variabel c som är 0 om kålroten är färsk och 1 om kålroten är lagrad. Använd denna respons och PLS för att försöka klassindela kålrötterna. Kontrollera också hur de två extra kålrötterna klassificeras. Prova att lösa Problem 4.7 med vanlig diskriminantanalys. 8

9 10 Blandade problem Materialet som finns tillgängligt på hemsidan är konsumtion av protein i gram per person samt procent anställda inom olika industrigrenar. Analysera detta material på ett sätt som du finner lämpligt och försök också att hitta alternativa lösningar för att se eventuella skillnader. 9

10 10

11 Lunds universitet Lunds Tekniska Högskola Matematikcentrum Matematisk statistik FMS 210 / MAS 224 VT 2007 Laboranter (namn och grupp): Handledare: Utförd/Inlämnad: Godkänd: Redovisning av datorlaboration nr 3 Checklista Ja Nej 1. Är alla momenten i laborationen utförda? Har rapporten blivit korrekturläst? Är språk- och skrivfel rättade? Är figurer, tabeller och liknande försedda med figurtexter och tydlig numrering? Har alla figurer storheter inskrivna på alla axlar? Är de beräkningar som kan kontrollräknas kontrollräknade? Har du gjort en rimlighetsbedömning av samtliga resultat? Har eventuella orimliga resultat blivit vederbörligen kontrollerade och kommenterade? Är den löpande texten väl strukturerad med tydliga avsnittsrubriker? Är skriften försedd med: Sammanfattning? 2 2 Innehållsförteckning? 2 2 Referenslista? 2 2 Sidnumrering? 2 2 Datum? Har förutsättningar, förenklingar och gjorda antaganden tydligt redovisats? Är din rapport läsbar utan tillgång till laborationshandledningen? Är detta försättsblad med checklista fullständigt ifyllt? 2 2

Datorlaboration 2. Läs igenom avsnitt 4.1 så att du får strukturen på kapitlet klar för dig.

Datorlaboration 2. Läs igenom avsnitt 4.1 så att du får strukturen på kapitlet klar för dig. Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 24 januari Datorlaboration 2 1 Inledning I denna laboration behandlas

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Matematikcentrum VT 2007 Matematisk statistik 14 januari Datorlaboration 1

Matematikcentrum VT 2007 Matematisk statistik 14 januari Datorlaboration 1 Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik 14 januari 2007 Datorlaboration 1 1 Inledning I denna laboration behandlas Kapitel

Läs mer

Hemuppgift 2 ARMA-modeller

Hemuppgift 2 ARMA-modeller Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 2 ARMA-modeller 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika simuleringar

Läs mer

Hemuppgift 3 modellval och estimering

Hemuppgift 3 modellval och estimering Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 3 modellval och estimering 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Laboration 4: Lineär regression

Laboration 4: Lineär regression LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08 Laboration 4: Lineär regression 1 Syfte Denna laboration handlar om regressionsanalys och

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

Laboration 4 R-versionen

Laboration 4 R-versionen Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 6 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 6: Regression Syftet med den här laborationen är att du skall bli

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

1 Förberedelseuppgifter

1 Förberedelseuppgifter LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli

Läs mer

Laboration 2: Styrkefunktion samt Regression

Laboration 2: Styrkefunktion samt Regression Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08 Laboration 5: Regressionsanalys Syftet med den här laborationen är att du skall

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 01, HT-07 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen, enkla punktskattningar

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 3 Statistiska metoder 1 Dagens föreläsning o Samband mellan två kvantitativa variabler Matematiska samband Statistiska samband o Korrelation Svaga och starka samband När beräkna korrelation?

Läs mer

Statistiska samband: regression och korrelation

Statistiska samband: regression och korrelation Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel

Läs mer

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II. Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 2, 6 DECEMBER 2017 Syfte Syftet med den här laborationen är att du ska

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

TVM-Matematik Adam Jonsson

TVM-Matematik Adam Jonsson TVM-Matematik Adam Jonsson 014-1-09 LABORATION 3 I MATEMATISK STATISTIK, S0001M REGRESSIONSANALYS I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistikprogrammet

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

TAMS65 DATORÖVNING 2

TAMS65 DATORÖVNING 2 TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster

Läs mer

oberoende av varandra så observationerna är

oberoende av varandra så observationerna är Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n

Läs mer

Datorövning 1 Enkel linjär regressionsanalys

Datorövning 1 Enkel linjär regressionsanalys Datorövning 1 Enkel linjär regressionsanalys Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Excel och Minitab för att 1. få en visuell uppfattning om vad ett regressionssamband

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 4

ÖVNINGSUPPGIFTER KAPITEL 4 ÖVNINGSUPPGIFTER KAPITEL 4 REGRESSIONSLINJEN: NIVÅ OCH LUTNING 1. En av regressionslinjerna nedan beskrivs av ekvationen y = 20 + 2x; en annan av ekvationen y = 80 x; en tredje av ekvationen y = 20 + 3x

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

lära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten.

lära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten. LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FMS035: MATEMATISK STATISTIK FÖR M DATORLABORATION 5, 11 MAJ 2012 Syfte Syftet med dagens laboration är att du ska lära dig tolka ett av de

Läs mer

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 STOCKHOLMS UNIVERSITET MT 5001 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 13 januari 2014 Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 Examinator: Martin Sköld, tel.

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett

Läs mer

Regressionsanalys av huspriser i Vaxholm

Regressionsanalys av huspriser i Vaxholm Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se

Läs mer

Laboration 4 Regressionsanalys

Laboration 4 Regressionsanalys Matematikcentrum Matematisk Statistik Lunds Universitet MASB11 VT14, lp4 Laboration 4 Regressionsanalys 2014-05-21/23 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner som finns

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2013-03-27

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan) Statistiska institutionen VT 2012 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Lunds tekniska högskola Matematikcentrum Matematisk statistik. FMS035: Matematisk statistik för M Datorlaboration 5

Lunds tekniska högskola Matematikcentrum Matematisk statistik. FMS035: Matematisk statistik för M Datorlaboration 5 Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS035: Matematisk statistik för M Datorlaboration 5 Syfte Syftet med dagens laboration är att du ska lära dig tolka ett av de vanligaste beroendemåtten

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p. Tentamen Linköpings Universitet, Institutionen för datavetenskap, Statistik Kurskod och namn: Datum och tid: Jourhavande lärare: Tillåtna hjälpmedel: Betygsgränser: 732G21 Sambandsmodeller 2009-01-14,

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 1: TIDSSERIER.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 1: TIDSSERIER. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-03-24 DATORLABORATION 1: TIDSSERIER. I Tarfala har man under en lång följd av

Läs mer

Instruktioner till arbetet med miniprojekt II

Instruktioner till arbetet med miniprojekt II Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS035: Matematisk statistik för M Miniprojekt II, 17 maj 2013 Instruktioner till arbetet med miniprojekt II Innan ni börjar arbeta vid Datorlaboration

Läs mer

Instruktioner till Inlämningsuppgift 1 och Datorövning 1

Instruktioner till Inlämningsuppgift 1 och Datorövning 1 STOCKHOLMS UNIVERSITET HT 2005 Statistiska institutionen 2005-10-14 MC Instruktioner till Inlämningsuppgift 1 och Datorövning 1 Kurs i Ekonometri, 5 poäng. Uppgiften ingår i examinationen för kursen och

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-04. 2.2 Angående grafisk presentation

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-04. 2.2 Angående grafisk presentation LUNDS TEKNISKA HÖSKOLA ATEATIKCENTRU ATEATISK STATISTIK ATEATISK STATISTIK, AK FÖR L, FS 33, HT-4!"$&' (*) 1 Syfte I den första delen av detta projekt skall vi försöka hitta begripliga tolkningar av begreppen

Läs mer

Laboration 3: Enkel linjär regression och korrelationsanalys

Laboration 3: Enkel linjär regression och korrelationsanalys STOCKHOLMS UNIVERSITET 13 februari 2009 Matematiska institutionen Avd. för matematisk statistik Gudrun Brattström Laboration 3: Enkel linjär regression och korrelationsanalys I sista datorövningen kommer

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 1, 14 NOVEMBER 2017 Syfte Syftet med dagens laboration är att du ska träna

Läs mer

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson 1 STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III, statistiska metoder) 3 högskolepoäng, ingående i kursen Undersökningsmetodik

Läs mer

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade HT 2011 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas in senast 29/9 kl 16.30.

Läs mer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

RödGrön-spelet Av: Jonas Hall. Högstadiet. Tid: 40-120 minuter beroende på variant Material: TI-82/83/84 samt tärningar

RödGrön-spelet Av: Jonas Hall. Högstadiet. Tid: 40-120 minuter beroende på variant Material: TI-82/83/84 samt tärningar Aktivitetsbeskrivning Denna aktivitet är utformat som ett spel som spelas av en grupp elever. En elev i taget agerar Gömmare och de andra är Gissare. Den som är gömmare lagrar (gömmer) tal i några av räknarens

Läs mer

Resultatet läggs in i ladok senast 13 juni 2014.

Resultatet läggs in i ladok senast 13 juni 2014. Matematisk statistik Tentamen: 214 6 2 kl 14 19 FMS 35 Matematisk statistik AK för M, 7.5 hp Till Del A skall endast svar lämnas. Samtliga svar skall skrivas på ett och samma papper. Övriga uppgifter fordrar

Läs mer

Introduktion till Word och Excel

Introduktion till Word och Excel Introduktion till Word och Excel HT 2006 Detta dokument baseras på Introduktion till datoranvändning för ingenjörsprogrammen skrivet av Stefan Pålsson 2005. Omarbetningen av detta dokument är gjord av

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall,

Läs mer

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Övningshäfte till kursen Regressionsanalys och tidsserieanalys Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström April 8, 2011 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande

Läs mer

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh 1 STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14

Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 20 mars 2015 9 14 Examinator: Anders Björkström, bjorks@math.su.se Återlämning: Fredag 27/3 kl 12.00, Hus 5,

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik, LP1, HT 2015, Adam Jonsson LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i enkel regressionsanalys

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

Bedömningsanvisningar

Bedömningsanvisningar NpMab vt 01 Bedömningsanvisningar Exempel på ett godtagbart svar anges inom parentes. Till en del uppgifter är bedömda elevlösningar bifogade för att ange nivån på bedömningen. Om bedömda elevlösningar

Läs mer

TAMS65 - Seminarium 4 Regressionsanalys

TAMS65 - Seminarium 4 Regressionsanalys TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet

Läs mer

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 3 Matematisk statistik AK för CDIFysiker, FMS012/MASB03, HT15 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn SM Matematisk statistik Datum LP - Material Laboration 4 Kursexaminator Adam Betygsgränser Tentamenspoäng Övrig kommentar Försättsblad inlämningsuppgift

Läs mer

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation UNDS TEKNISKA ÖGSKOA MATEMATIKCENTRUM MATEMATISK STATISTIK MATEMATISK STATISTIK, AK FÖR, FMS 33, T-3!"$&' (*) 1 Syfte I den första delen av detta projekt skall vi försöka hitta begripliga tolkningar av

Läs mer

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller S0004M Statistik 1 Undersökningsmetodik. Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller Till denna laboration ska det angivna datamaterialet användas och bearbetas med den statistiska

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,

Läs mer

Datorövning 1: Fördelningar

Datorövning 1: Fördelningar Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS012/MASB03: MATEMATISK STATISTIK, 9 HP, VT-17 Datorövning 1: Fördelningar I denna datorövning ska du utforska begreppen sannolikhet och

Läs mer

Del A: Schema för ifyllande av svar nns på sista sidan

Del A: Schema för ifyllande av svar nns på sista sidan Del A: Schema för ifyllande av svar nns på sista sidan 1 1 Nedladdningstiden (i sekunder) för en bestämd l registrerades 16 gånger vid var och en av tre olika tidpunkter på dygnet. ANOVA-analys av dessa

Läs mer

Laboration 4: Hypotesprövning och styrkefunktion

Laboration 4: Hypotesprövning och styrkefunktion LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR L, FMS 032, HT-07 Laboration 4: Hypotesprövning och styrkefunktion 1 Syfte I denna laboration

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove

Läs mer

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet

Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet 1 Instruktioner till Inlämningsuppgiften i Statistik Kursen Statistik och Metod Psykologprogrammet (T8), Karolinska Institutet För att bli godkänd på inlämningsuppgiften krävs att man utför uppgiften om

Läs mer

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. 1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga

Läs mer

Laboration med Minitab

Laboration med Minitab MATEMATIK OCH STATISTIK NV1 2005 02 07 UPPSALA UNIVERSITET Matematiska institutionen Silvelyn Zwanzig, Tel. 471 31 84 Laboration med Minitab I denna laboration skall du få stifta bekantskap med ett statistiskt

Läs mer

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering Matematikcentrum (7) Matematisk Statistik Lunds Universitet Per-Erik Isberg Laboration Simulering HT 006 Introduktion Syftet med laborationen är dels att vi skall bekanta oss med lite av de olika funktioner

Läs mer