Matematikcentrum VT 2007 Matematisk statistik 14 januari Datorlaboration 1

Storlek: px
Starta visningen från sidan:

Download "Matematikcentrum VT 2007 Matematisk statistik 14 januari Datorlaboration 1"

Transkript

1 Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik 14 januari 2007 Datorlaboration 1 1 Inledning I denna laboration behandlas Kapitel i kursboken (Chemometrics av Brereton). Framställningen i boken är inte sammankopplad med det som behandlades i grundkursen (kompendiet Experimentell och industriell statistik 1 av Lennart Olbjer), och syftet är lite grann att samordna dessa två angreppssätt. Förutom det som finns i boken så innehåller laborationen också en del extra material om grunderna i variansanalys, ett ganska viktigt begrepp som inte behandlas så mycket i grundkursen. I slutet av laborationen finns dessutom en introduktion till programpaketet MODDE. Uppgifterna är hämtade från kursboken. De rekommenderade problem som finns angivna skall inte vara med i laborationsredogörelsen. 1.1 Förberedelse Läs snabbt igenom Kapitel 1 i Brereton så att du vet vad syftet med boken är. 1.2 Problem Lösningar till problemen finns i ett separat dokument. Dessa lösningar har sin grund i de lösningar som går att hitta på internet, men lösningar till några tal som inte ingår i tidsschemat är strukna och några lösningar är kompletterade. I denna laboration behandlas delar av Problem 2.1, Problem 2.6, Problem 2.11 och Problem De övriga problem som finns angivna är tänkta som rekommendationer att studera på egen hand som en inledning på laborationen, men det kan bli svårt att hinna räkna alla de rekommenderade uppgifterna. På några av problemen i boken är avsnitten fel angivna så det är lämpligt att följa uppgifterna i den ordning som de finns angivna här i laborationen. 1.3 MATLABs statistiska verktygslåda, Statistics Toolbox Förutom de vanliga funktionerna i MATLAB finns diverse verktygslådor att komplettera med. En sådan, som är särskilt användbar i statistiska sammanhang, 1 De sidnummer som anges avser femte upplagan av kompendiet. 1

2 är Statistics Toolbox. Ge kommandot help stats, så får du en lista över de funktioner som ingår i denna verktygslåda. Använd sedan hjälpfunktionen help för att ta reda på in- och utparametrar m.m. Om du t.ex. skulle vara intresserad av funktionen finv, som finns i listan, får du veta mera genom kommandot help finv. Använd help-kommandot närhelst du befinner dig i nöd, det är mycket användbart! (Prova redan nu help help och help samt help lookfor, så att du kan utnyttja hjälpen när du behöver den.) Den funktion som mest kommer att användas i denna laboration är funktionen regress för att skatta parametrar i linjära regressionsmodeller. 2 Försöksplanering och frihetsgrader 2.1 Förberedelse Läs igenom avsnitt i Brereton som introducerar begreppen försöksplanering och frihetsgrader. 2.2 Grundläggande problem Luft med varierande koncentrationer av koldioxid passerar över blad av vete (vid temperaturen 35 C) och man mäter upptaget av koldioxid i bladen. Upptaget (y) för 17 blad med olika koncentrationer i luften (x) blev som följer Koncentration (x) Upptag (y) För att bestämma förhållandet anpassas en linjär modell enligt (med bokens beteckningar) y = b 0 + b 1 x. Bestäm parametrarna N, P, D och R i modellen och förklara vad dessa symboliserar. 2

3 Är det ett väl planerat försök och en bra modell utifrån de givna förutsättningarna eller skulle man ha kunnat göra på något annat sätt? (Här skall ni alltså bara argumentera och rita figurer, inte göra några beräkningar.) 3 Regressionsmodellen I kapitel 2 i kursboken har man en något annorlunda framställning av regression och variansanalys än vad man brukar ha i statistikböcker (här jämförs med Olbjer), och vi skall därför här till att börja med försöka förena dessa båda angreppssätt. En sak som skiljer framställningarna åt är att man i statistiken alltid har någon form av replikat för att kunna uppskatta försöksfelet. I de exempel som finns i boken är detta inte alltid uppfyllt, och man har istället så många parametrar att man får en perfekt anpassning. 3.1 Förberedelse Läs avsnitt men hoppa över anvisningarna för hur man ritar normalfördelningspapper i avsnitt (Det är också lite svårt att förstå varför man använder beteckningen I på sidan 26, det hade varit mycket lättare att läsa om man behållit N som beteckning för antalet observationer.) 3.2 Beteckningar I statistiken har man en regressionsmodell som tidigare har skrivits (Olbjer, s. 246) y i = β 0 + β 1 x 1i + β 2 x 2i + + β p x pi + ε i, i =1,...,n eller i matrisform enligt Y = Xβ + E, där Y är en vektor av storlek n 1, X är en matris av storlek n p, β är en vektor av storlek p 1 och E är en vektor av storlek n 1. MK-skattningen av vektorn β anges till β = X T X 1 X T Y förutsatt att X T X är inverterbar. Brereton använder beteckningen y = b 0 + b 1 x 1 + b 2 x för regressionen och skiljer inte på parametern och skattat värde (detta påpekas också på sidan 34). Matrisen X motsvaras sedan av D i kursboken och därmed blir modellen här y = Db + E (D står förmodligen för design, men tyvärr användes ju också bokstaven D som en beteckning för frihetsgrader tidigare i kapitlet.) 3

4 Om man nu har en situation med lika många observationer som parametrar så blir matrisen D en kvadratisk matris, och om D 0 D är inverterbar (det är den om D är inverterbar eftersom rangen för D och rangen för D 0 D är densamma) så förenklas skattningen av b till att bli b = D 1 y 3.3 Regression Rekommendation: Räkna Problem 2.6. Lös Problem 2.1, del 1. Beräkna D 1 och (D 0 D) 1 D 0 iproblem2.1,del1,medhjälpavmatlaboch förvissa dig om att de i detta fallet är lika. Vad är det som gör att dessa båda är lika? Det finns alltså två alternativ till lösning av del 2 i uppgiften, att beräkna b = D 1 y eller att beräkna b = D 0 D 1 D0 y. Man kan också använda den inbyggda regressionsfunktionen i Matlab för att beräkna skattningen genom att läsa in y och D imatlabochskriva >> regress(y,d) Gör detta för att konstatera att alla tre metoderna ger samma resultat 2. När man har skattat parametrarna kan man också beräkna de förväntade värdena enligt by = D b b och residualerna y by. I detta fallet blir residualen y by = y DD 1 y =0, och det är just detta som är det statistiska problemet; man har ingen möjlighet att skatta slumpfelet eftersom det är en perfekt anpassning till modellen. Residualerna får man ur regressionskommandot som variabeln R om man skriver >> [b,bint,r] = regress(y,d) Beräkna residualerna i Problem 2.1 med hjälp av regress för att förvissa dig om att anpassningen i detta fall är perfekt. Lös Problem 2.1, del 3. Vad kan ni se för fördelar/nackdelar med att använda kodade variabler? 2 Tittar man i källkoden till programmet så framgår det att man löser problemet genom att göra en så kallad QR-uppdelning av matrisen D. 4

5 3.4 Test av modeller För att ge exempel på replikat och sambandet mellan regression och variansanalys så tittar vi på datamaterialet med upptaget av koldioxid på bladen av vete tidigare i laborationen. Detta är ett datamaterial med mer än en observationer för några x-värden, och därmed finns det en upprepning. Det finns också bara en oberoende variabel (koldioxidkoncentration) och för att få en större designmatris kan man därför inte bilda samspel mellan olika variabler för att utöka antalet parametrar utan är istället hänvisad till att t ex använda polynomregression. För datamaterialet kan man tänka sig ett antal olika modeller: 1. Upptaget är i medeltal b 0 oberoende av koldioxidkoncentrationen: y i = b 0 + ε i, i =1,...,17 med 1 parameter. (Detta är en ganska orealistisk modell i det här fallet.) 2. Upptaget ändras linjärt med koldioxidkoncentrationen och linjen går genom origo. Detta ger modellen y i = b 1 x i + ε i, i =1,...,17 med 1 parameter. 3. Upptaget ändras linjärt med koldioxidkoncentrationen enligt modellen y i = b 0 + b 1 x i + ε i, i =1,...,17 med 2 parametrar. 4. Upptagets förhållande till koldioxidkoncentrationen ges av en modell för ensidig 3 variansanalys (ANOVA = ANalysis Of VAriance) där upptaget är olika för olika värden på koldioxidkoncentrationerna, men det går inte att hitta någon enkel funktion som binder ihop koldioxidkoncentrationen med upptaget. För att beskriva modellen behövs två index på responsen enligt y ij = µ i + ε ij, i =1,...,9 där j i detta fallet går från 1 till 4 beroende på vilken koncentration man studerar. Detta blir en en modell med 9 parametrar, en för varje nivå på kolioxidhalterna. Ivarochenavmodellernakanmanskattaparametrarnasamtberäknadet förväntade värdena by och residualerna y by. Den så kallade residualkvadratsumman (y by) 0 (y by) anger sedan hur bra modellen är. Givetvis blir modellen bättre om man gör den större, och därför finns här en naturlig utveckling av modellerna. Eftersom det finns två olika modeller med 1 parameter finns det två vägar att gå, antingen Modell 1 Modell 3 Modell 4 3 Kallas ibland också envägs variansanalys. 5

6 eller Modell 2 Modell 3 Modell 4 Ange designmatrisen D i de fyra olika modellerna ovan. Beräkna residualkvadratsummorna för de fyra olika modellerna med hjälp av Matlab. Ange också hur många frihetsgrader (dvs. N, P, D och R) det finns i varje modell. För att beräkna residualkvadratsumman i modell 4 är det lättast att använda kommandot >> anova1(y,x) men regress fungerar också med en lämpligt definierad designmatris. Kommandot anova1 ger dock också en så kallad variansanalystabell. Ett alternativt sätt att skriva Modell 4 som man ofta ser i litteraturen är y ij = µ + α i + ε ij, i =1,...,9 och detta sätt att skriva modellen har fördelen att lättare kunna generaliseras till fallet att man studerar fler faktorer än koldioxidhalten. Försök att skriva upp designmatrisen D för denna modell och använd Matlab för att konstatera att inversen till D 0 D inte existerar. Vad har det för effekt på parameterskattningarna? Hur kan man se på matrisen D 0 D att den inte går att invertera? 3.5 Lack-of-fit ochvariansanalys För att undersöka om modell 3 med regression är tillräckligt bra jämför man den med modell 4, som är den största möjliga modellen, med hjälp av ett lack-of-fittest. När man jämför en liten modell mot en större kan man beräkna F -värdet (Reskvs = Residualkvadratsumma) (Reskvs för liten modell - Reskvs för stor modell) / (skillnad i antal parametrar). (Reskvsförstormodell)/(frihetsgrader i stor modell) Det F -värde man får fram jämförs sedan med kvantilen i en F -fördelning med parametrarna skillnad i antal parametrar respektive frihetsgrader i stor modell. Detta så kallade kritiska värde kan man få fram i Matlab genom kommandot finv. För att få fram det så kallade p-värdet i Matlab kan man använda kommandot fcdf. Rekommendation: RäknaProblem2.9ochProblem2.7. Beräkna F -värdet för jämförelsen av modell 3 och 4. Är en linjär regression en bra beskrivning av modellen? Försök att beskriva vad detta så kallade lack-of-fit-test egentligen går ut på. Beräkna F -värdet för att kunna jämföra av modell 1 och 3. Vad är det man testar i detta fall? 6

7 (Motsvarande t-värde som anges i Olbjer (s. 217) är t = β 1 s/ S xx som jämförs med en t-fördelning med n 2 frihetsgrader.) Ensidig (eller envägs) variansanalys går i detta fallet ut på att jämföra två modeller: H 0 : ingen skillnad i upptag för de olika kolidoxidkoncentrationerna H 1 : skillnad i upptag för de olika koldioxidkoncentrationerna Om nollhypotesen är sann så är totalmedelvärdet av alla observationerna den bästa gissningen av det förväntade värdet på upptaget oberoende av vilken koldioxidkoncentration man har. Eftersom det är dubbla index i modell 4 kan man använda detta också i modell 1 och säga att b 0 =ȳ och residualkvadratsumman blir X X (y ij ȳ ) 2. i j Om man däremot anser att mothypotesen är sann så blir den bästa gissningen av det förväntade värdet av upptaget medelvärdet för de observationer som har denna koldioxidkoncentration, och man får därmed (det är denna residualkvadratsumma som kallas S rep iboken), X X (y ij ȳ i ) 2. i j För att få ordning på detta och se om reduktionen i residualkvadratsumman är tillräckligt stor för att förkasta modellen H 0 sätter man upp dessa värden i en variansanalystabell som leder till att man till höger i tabellen får fram det intressanta F -värdet (och även p-värdet om man har en dator). Om det bara är slumpen som har påverkat skillnaden i upptag mellan de olika koldioxidkoncentrationerna så borde F -värdet bli 1, men om det är en skillnad så bör detta värde bli betydligt större än 1. Om de ursprungliga observationerna var normalfördelade så kommer F -värdet att följa en F -fördelning om nollhypotesen är sann. Jämförelsen mellan modell 1 och 4 är en ensidig variansanalys och detta resultat kan man också få fram genom att använda kommandot anova1,då man också får en så kallad variansanalystabell. Skriv ut variansanalystabellen och beskriv vad de olika värdena i tabellen anger. Förvissa dig också om hur det F -värde som angavs tidigare byggs upp med hjälp av variansanalystabellen. Jämförelsen mellan modell 3 och 4 med hjälp av lack-of-fit går givetvis att utöka till fallet att modell 3 har mer än två parametrar, om man t.ex. har modellen y i = b 0 + b 1 x 1i + b 2 x 2i + ε i så blir beräkningarna analoga och man testar om b 1 och b 2 är tillräckliga för att beskriva modellen. 7

8 3.6 Normalfördelningspapper I grundkursen i statistik används normalfördelningsdiagram för att avgöra om ett stickprov kan sägas komma från en normalfördelning. Beskriv kort hur detta går till. Om man inte har några replikat kan man inte göra några statistiska tester, däremot anger man en metod i boken för att se vilka parametrar som är signifikanta. Man ritar helt enkelt upp parameterskattningarna i ett normalfördelningspapper och säger att de parametervärden som inte ligger längs en rät linje (dock inte den linje som Matlab ritar ut!) är de som är signifikant skilda från 0. Lägg speciellt märke till att det skall vara kodade variabler för att metoden skall fungera. Detta fungerar eftersom skattningarna är väntevärdesriktiga och att skattningen b i har en varians som ges av det i:te diagonalelementet i matrisen σ 2 (D 0 D) 1 (seolbjer).ävenomintevariansenσ 2 är känd eller ens går att skatta så kan man alltså konstatera att metoden med normalfördelningspapper fungerar för de parametrar som har samma värde på diagonalelementet om inte beroendet mellan parameterskattningarna är för stort. Gör en normalfördelningsplot för parameterskattningarna i Problem 2.6 med hjälp av Matlab(kommandot heter normplot). Lägg märke till att skalan i normplot är i sannolikhet och inte i standardavvikelser som man har i boken, men punkternas inbördes förhållande förändras inte av detta. Beräkna också matrisen (D 0 D) 1 och förklara vad det är för egenskaper hos denna som gör att metoden fungerar. Vad händer om variablerna inte är kodade? 3.7 Hattmatrisen I Brereton används hattmatrisen H = D (D 0 D) 1 D 0 för att hitta punkter som ger säkra prediktioner. Det framgår däremot inte i övrigt vilka trevliga egenskaper matrisen H har. Namnet kommer av att matrisen H sätter hatt på observationerna eftersom by = Hy och residualen kan då skrivas y by = y Hy =(I H) y. Försök att visa att by = Hy samt att det för residualkvadratsumman gäller att (y by) 0 (y by) =y 0 (I H)y. Eftersom leverage i ordboken översätts med hävstång, inflytande eller makt, så är det svårt att förstå varför avsnittet har denna rubrik. Det beror på att man 8

9 också kan använda diagonalelementen i hattmatrisen H till att tala om hur stort inflytande en enskild observation har på skattningarna. Hattmatrisens diagonalelement anger helt enkelt om skattningarna påverkas mycket om man tar bort den aktuella observationen då man gör skattningarna. Om diagonalelementet är nära 1 så har den observationen stor betydelse på skattningarna, om det är nära 0 så påverkar den observationen inte skattningarna lika mycket. Gå tillbaka till Modell 3 med linjär regression i datamaterial med koldioxidkoncentrationer. Beräkna matrisen H för denna designmatris. Ta bort en av de observationer som har störst värde på diagonalelementet i H och skatta parametrarna i detta nya datamaterial. Ta sedan bort en av de observationer som har minst värde på diagonalelementet i H och skatta parametrarna i detta nya datamaterial. Stämmer idén med punkternas inflytande? Försök att illustrera med en figur. 4 Introduktion till MODDE 4.1 Förberedelse Läs avsnitt 2.3 och 2.4 (2.3.3 och ganska ytligt). 4.2 Inledning Här skall vi framförallt se hur MODDE fungerar med avseende på försöksplanering och grafiska illustrationer. De grafiska illustrationerna skall förhoppningsvis ge ökad förståelse för beräkningarna i de tidigare delarna av laborationen. Det problem som först behandlas är Problem 2.16 och senare Problem Tanken är också att du genom att leka lite med programmet inser hur saker och ting hänger ihop, så följ inte beskrivningarna nedan alltför slaviskt, ta gärna en omväg. I den User s guide 4 som finns står ju också med stora bokstäver uppmaningen Play around, Enjoy!. Starta programmet MODDE 7. Välj New Investigation och mata in ett namn på datamaterialet. MODDE är nu självinstruerande om man gör det i den ordning som anges i guiden. Dubbelklicka på Name i faktorfönstret och fyll i de faktorer som skall varieras. Välj att faktorerna är Quantitative, vilket innebär att de är på två nivåer men att de inte är klassindelade. De faktorer som skall läsas in är (från Problem 2.16) 1. Power: 30 och 60 percent 2. Time: 20 och 30 sekunder 3. Cycles: 5 och 7 Gå sedan vidare genom att fylla i respons (percent recovery) genom att klicka på samma sätt i responsfönstret. Modde arbetar stegvis och därför skall man först få en försöksplan innan man läser in värdena. Tanken är alltså här att man först 4 På Umetrics hemsida på internet ( kan man hitta både en Tutorial to MODDE och en Users Guide to MODDE. Dessa kommer att läggas ut i datorsalarna och kommer förhoppningsvis att få ligga kvar där under kursen. 9

10 gör sin plan över vilka faktorer man skall använda, ber programmet att göra en försöksplan, och sedan ur programmet får ut i vilken ordning försöken skall utföras. I detta fallet har vi ju dock redan värdena på responsen, men vi låtsas att de inte finns uppmätta ännu. 4.3 Försöksplanering med MODDE För att nu få en design som går att använda trycker man sig vidare i guiden och väljer Response Surface Modelling (RSM). Genom att ha valt RSM så tänker man sig att anpassa en kvadratisk modell, men i ett 3 3 -försök har man ju 27 observationer, så det måste reduceras på något sätt. Välj CCF som modell och 6 stycken "centerpoints". Skriv ned den ordning på försöken som programmet rekommenderar dig. Programmet rekommenderar alltså i vilken ordning försöken skall göras, men vi gör inte försöket utan använder de värden som finns i Problem Modellering med MODDE Mata in de uppmätta värdena på responsen. Bygg en modell för systemet genom att välja menyn Analysis och Fit (MLR). Gör en så bra analys som möjligt av hela materialet för att försöka hitta optimala betingelser för responsen. Försök speciellt att få ut ganska många figurer från MODDE som talar om hur bra modellen passar, var de optimala betingelserna är, etc. Var inte rädd för att ta med figurer som du inte helt förstår, men förklara då vad som är oklart! Gör motsvarande beräkningar i Matlab för att få fram parameterskattningarna och R 2. Stämmer beräkningarna överens? 5 Mixed designs 5.1 Förberedelse Läs avsnitt Tolkning av triangeln Avsnittet om mixed designs handlar i huvudsak om hur man lägger ut designpunkterna över de möjliga värden som man kan ha. Vid första anblicken kan det kanske vara svårt att förstå hur triangeln som symboliserar blandningen skall tolkas, och därför används Problem 2.11 som ett exempel på detta. Lägg också märke till att om man har förstått hur triangeln fungerar så är det mycket enkelt att rita ut begränsningarna istället för att räkna ut dem. Rekommendation: Räkna Problem Om man utgår från Figur 2.31 i boken och för enkelhets skull antar att triangeln (och inte kuben) har höjden 1, men byter plats på punkterna (så som man har angivit triangeln i lösningarna till uppgifterna) så att punkten B motsvarar origo, punkten C är 2/ 3, 0 och punkten A är 1/ 3, 1. Med hjälp av avståndsformeln 10

11 kan man sedan beräkna att punkten (x, y) (under förutsättningen att den ligger inne i triangeln) motsvarar blandningen y av faktor A 2 3x y av faktor B 2 3x y av faktor C 2 Det som nu karakteriserar punkterna inne i triangeln är att alla dessa tre värden är positiva. I Problem 2.11 begränsar man sedan genom att ange en övre och undre gräns för varje komponent, och använder nya variabler z 1, z 2 och z 3 för att ange designpunkterna. När man sedan skattar parametrar går man emellertid tillbaka till de ursprungliga värdena. 5.3 Beräkningar Om man gör beräkningen i Modde så får man en contourplot automatiskt, men det kan ibland tyckas lite ologiskt att använda hela försöksplaneringssteget när man redan har samlat in sina värden. Öppna en ny investigation i Modde och läs in de tre faktorna och deras min och max (0 resp 1). Ange att de är av typen formulation. Kryssa rutan Place constraints on the experimental region och ange i nästa steg begränsningarna. Läs också in namnet på responsen. Välj sedan select the objective till RSM och klicka dig ganska godtyckligt vidare så att du får några värden i Worksheet. Ersätt värdena i Worksheet med de x-värden och responser som gäller för problemet. Välj Analysis och Select Fit Method och sedan Scheffé MLR(för att se vad som menas med Scheffés modell i motsats till Cox modell, se boken). Välj Edit och Model för att läsa in den modell som du skall använda. Gör nu analysen och plocka ut de olika resultaten i de olika menyerna. Gör en contourplot (under menyn prediction) och försök att se om det värde som anges i del 4 av problemet verkar vara minimum för konduktiviteten. Rekommendation: Räkna Problem 2.15 som behandlar fallet med fyra faktorer. Då måste man fixera en av dem när man ritar sin contourplot. 11

12 12

13 Lunds universitet Lunds Tekniska Högskola Matematikcentrum Matematisk statistik FMS 210 / MAS 234 VT 2007 Laboranter (namn och grupp): Handledare: Utförd/Inlämnad: Godkänd: Redovisning av datorlaboration nr 1 Checklista Ja Nej 1. Är alla momenten i laborationen utförda? Har rapporten blivit korrekturläst? Är språk- och skrivfel rättade? Är figurer, tabeller och liknande försedda med figurtexter och tydlig numrering? Har alla figurer storheter inskrivna på alla axlar? Är de beräkningar som kan kontrollräknas kontrollräknade? Har du gjort en rimlighetsbedömning av samtliga resultat? Har eventuella orimliga resultat blivit vederbörligen kontrollerade och kommenterade? Är den löpande texten väl strukturerad med tydliga avsnittsrubriker? Är skriften försedd med: Sammanfattning? 2 2 Innehållsförteckning? 2 2 Sidnumrering? 2 2 Datum? Har förutsättningar, förenklingar och gjorda antaganden tydligt redovisats? Är din rapport läsbar utan tillgång till laborationshandledningen? Är detta försättsblad med checklista fullständigt ifyllt? 2 2

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007

Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007 Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 7 februari Datorlaboration 3 1 Inledning I denna laboration behandlas

Läs mer

Matematisk statistik, Föreläsning 5

Matematisk statistik, Föreläsning 5 Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk

Läs mer

Datorlaboration 2. Läs igenom avsnitt 4.1 så att du får strukturen på kapitlet klar för dig.

Datorlaboration 2. Läs igenom avsnitt 4.1 så att du får strukturen på kapitlet klar för dig. Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 24 januari Datorlaboration 2 1 Inledning I denna laboration behandlas

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 6 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 6: Regression Syftet med den här laborationen är att du skall bli

Läs mer

Hemuppgift 3 modellval och estimering

Hemuppgift 3 modellval och estimering Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 3 modellval och estimering 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika

Läs mer

Hemuppgift 2 ARMA-modeller

Hemuppgift 2 ARMA-modeller Lunds Universitet Ekonomihögskolan Statistiska Institutionen STAB 13 VT11 Hemuppgift 2 ARMA-modeller 1 Inledning Denna hemuppgift är uppdelad i två delar. I den första ska ni med hjälp av olika simuleringar

Läs mer

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression Lunds tekniska högskola, Matematikcentrum, Matematisk statistik Matematisk statistik kompletterande projekt, FMSF Övning om regression Denna övningslapp behandlar regression och är tänkt som förberedelse

Läs mer

Föreläsning 13: Multipel Regression

Föreläsning 13: Multipel Regression Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Tentamen för kursen. Linjära statistiska modeller. 17 februari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,

Läs mer

Laboration 4: Lineär regression

Laboration 4: Lineär regression LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK MATEMATISK STATISTIK, AK FÖR BYGG, FMS 601, HT-08 Laboration 4: Lineär regression 1 Syfte Denna laboration handlar om regressionsanalys och

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Laboration 2: Styrkefunktion samt Regression

Laboration 2: Styrkefunktion samt Regression Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Tentamen för kursen. Linjära statistiska modeller. 13 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 13 januari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari

Lösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se

Läs mer

Föreläsning 15: Faktorförsök

Föreläsning 15: Faktorförsök Föreläsning 15: Faktorförsök Matematisk statistik Chalmers University of Technology Oktober 17, 2016 Ensidig variansanalys Vi vill studera om en faktor A påverkar en responsvariabel. Vi gör totalt N =

Läs mer

MVE051/MSG Föreläsning 14

MVE051/MSG Föreläsning 14 MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska

Läs mer

Matematisk statistik för D, I, Π och Fysiker

Matematisk statistik för D, I, Π och Fysiker Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 1, 14 NOVEMBER 2017 Syfte Syftet med dagens laboration är att du ska träna

Läs mer

Statistisk försöksplanering

Statistisk försöksplanering Statistisk försöksplanering Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Skriftlig tentamen 3 hp 51SF01 Textilingenjörsutbildningen Tentamensdatum: 2 November Tid: 09:00-13 Hjälpmedel: Miniräknare

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

F13 Regression och problemlösning

F13 Regression och problemlösning 1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell

Läs mer

Föreläsning 12: Linjär regression

Föreläsning 12: Linjär regression Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera

Läs mer

Härledning av Black-Littermans formel mha allmänna linjära modellen

Härledning av Black-Littermans formel mha allmänna linjära modellen Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 01, HT-07 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen, enkla punktskattningar

Läs mer

1 Förberedelseuppgifter

1 Förberedelseuppgifter LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli

Läs mer

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 27 oktober

Tentamen för kursen. Linjära statistiska modeller. 27 oktober STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

Laboration 4 R-versionen

Laboration 4 R-versionen Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner

Läs mer

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 3 Matematisk statistik AK för CDIFysiker, FMS012/MASB03, HT15 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla

Läs mer

Laboration 4: Hypotesprövning och styrkefunktion

Laboration 4: Hypotesprövning och styrkefunktion LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR L, FMS 032, HT-07 Laboration 4: Hypotesprövning och styrkefunktion 1 Syfte I denna laboration

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 februari

Tentamen för kursen. Linjära statistiska modeller. 22 februari STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida

Läs mer

Statistisk försöksplanering

Statistisk försöksplanering Statistisk försöksplanering Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Skriftlig tentamen 3 hp 51SF01 Textilingenjörsutbildningen Tentamensdatum: 25 Oktober 2017 Tid: 09:00-13 Hjälpmedel: Miniräknare

Läs mer

Datorövning 1: Fördelningar

Datorövning 1: Fördelningar Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS012/MASB03: MATEMATISK STATISTIK, 9 HP, VT-17 Datorövning 1: Fördelningar I denna datorövning ska du utforska begreppen sannolikhet och

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret

Läs mer

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.

förstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II. Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 2, 6 DECEMBER 2017 Syfte Syftet med den här laborationen är att du ska

Läs mer

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL

TENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL TENTAMEN I SF950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 010 KL 14.00 19.00 Examinator : Gunnar Englund, tel. 790 7416, epost: gunnare@math.kth.se Tillåtna hjälpmedel: Formel-

Läs mer

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression

Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression

Läs mer

AMatematiska institutionen avd matematisk statistik

AMatematiska institutionen avd matematisk statistik Kungl Tekniska Högskolan AMatematiska institutionen avd matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR B OCH K FREDAGEN DEN 11 JANUARI 2002 KL 14.00 19.00. Examinator: Gunnar

Läs mer

LABORATION 3 - Regressionsanalys

LABORATION 3 - Regressionsanalys Institutionen för teknikvetenskap och matematik S0001M Matematisk statistik LABORATION 3 - Regressionsanalys I denna laboration ska du lösa ett antal uppgifter i regressionsanalys med hjälp av statistik-programmet

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Enkel och multipel linjär regression

Enkel och multipel linjär regression TNG006 F3 25-05-206 Enkel och multipel linjär regression 3.. Enkel linjär regression I det här avsnittet kommer vi att anpassa en rät linje till mätdata. Betrakta följande värden från ett försök x 4.0

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

3 Maximum Likelihoodestimering

3 Maximum Likelihoodestimering Lund Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 Parameterestimation och linjär tidsserieanalys Denna laborationen ger en introduktion till

Läs mer

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att

Läs mer

Föreläsning 15, FMSF45 Multipel linjär regression

Föreläsning 15, FMSF45 Multipel linjär regression Föreläsning 15, FMSF45 Multipel linjär regression Stas Volkov 2017-11-28 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F15 1/23 Linjär regression Vi har n st par av mätvärden (x i, y i ), i = 1,..., n

Läs mer

Lycka till!

Lycka till! Avd. Matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR K OCH B MÅNDAGEN DEN 25 AUGUSTI 2003 KL 14.00 19.00. Examinator: Gunnar Englund, 790 7416. Tillåtna hjälpmedel: Formel- och

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 2 & 9 oktober 217 Johan Lindström - johanl@maths.lth.se FMSF7/MSB2 F11 1/32 Repetition Multipel linjär regression

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

oberoende av varandra så observationerna är

oberoende av varandra så observationerna är Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att

Läs mer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall,

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Instruktioner till arbetet med miniprojekt II

Instruktioner till arbetet med miniprojekt II Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS035: Matematisk statistik för M Miniprojekt II, 17 maj 2013 Instruktioner till arbetet med miniprojekt II Innan ni börjar arbeta vid Datorlaboration

Läs mer

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser: 1 Uppgiftsbeskrivning Syftet med denna laboration var att utifrån uppmätt data avgöra: (i) Om något samband finnes mellan kroppstemperatur och hjärtfrekvens. (ii) Om någon signifikant skillnad i sockerhalt

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Laboration 2 multipel linjär regression

Laboration 2 multipel linjär regression Laboration 2 multipel linjär regression I denna datorövning skall ni 1. analysera data enligt en multipel regressionsmodell, dvs. inkludera flera förklarande variabler i en regressionsmodell 2. studera

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 5 MATEMATISK STATISTIK AK FÖR CDE, FMS012, VT08 Laboration 5: Regressionsanalys Syftet med den här laborationen är att du skall

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

1 Förberedelseuppgifter

1 Förberedelseuppgifter LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 4 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03 Syfte: Syftet med den här laborationen är att du skall bli mer

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2 Matematisk Statistik SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2 1 Introduktion Denna laboration är inte poänggivande utan är till för den som vill bekanta sig med MATLAB. Fokusera

Läs mer

Laboration 4 Regressionsanalys

Laboration 4 Regressionsanalys Matematikcentrum Matematisk Statistik Lunds Universitet MASB11 VT14, lp4 Laboration 4 Regressionsanalys 2014-05-21/23 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner som finns

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer Lunds universitet Matematikcentrum Matematisk statistik Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer Information om laborationerna I andra halvan av MASA01 kursen ingår två laborationer.

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning

Läs mer

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9. Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 4I2B KINAF4, KINAR4, KINLO4, KMASK4 7,5 högskolepoäng Tentamensdatum: 28 oktober 206 Tid:

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

GMM och Estimationsfunktioner

GMM och Estimationsfunktioner Lunds Universitet med Lund Tekniska Högskola Finansiell Statistik Matematikcentrum, Matematisk Statistik VT 2006 GMM och Estimationsfunktioner I laborationen möter du två besläktade metoder för att estimera

Läs mer

Laboration 5: Regressionsanalys

Laboration 5: Regressionsanalys Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 5 Matematisk statistik AK för Π och E, FMS012, HT14/VT15 Laboration 5: Regressionsanalys Syftet med den här laborationen är att

Läs mer

Laboration med Minitab

Laboration med Minitab MATEMATIK OCH STATISTIK NV1 2005 02 07 UPPSALA UNIVERSITET Matematiska institutionen Silvelyn Zwanzig, Tel. 471 31 84 Laboration med Minitab I denna laboration skall du få stifta bekantskap med ett statistiskt

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 14 januari

Tentamen för kursen. Linjära statistiska modeller. 14 januari STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Sal 22, hus

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Johan Lindström Repetition Johan Lindström - johanl@maths.lth.se FMS86/MASB2 1/44 Begrepp S.V. Fördelning Väntevärde Gauss CGS Grundläggande begrepp (Kap.

Läs mer

TAMS65 - Seminarium 4 Regressionsanalys

TAMS65 - Seminarium 4 Regressionsanalys TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet

Läs mer

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00 Statistisk försöksplanering och kvalitetsstyrning Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen 5Hp 41I12B KINAF13, KINAR13, KINLO13,KMASK13 7,5 högskolepoäng Tentamensdatum: 30 oktober

Läs mer

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 3 MATEMATISK STATISTIK AK FÖR CDIFYSIKER, FMS012/MASB03, HT12 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla

Läs mer

FACIT (korrekta svar i röd fetstil)

FACIT (korrekta svar i röd fetstil) v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta

Läs mer

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02 Sannolikhetsteori Följande gäller för sannolikheter:

Läs mer

Hemuppgift 2, SF1861 Optimeringslära för T, VT-10

Hemuppgift 2, SF1861 Optimeringslära för T, VT-10 Hemuppgift 2, SF1861 Optimeringslära för T, VT-1 Kursansvarig: Per Enqvist, tel: 79 6298, penqvist@math.kth.se. Assistenter: Mikael Fallgren, werty@kth.se, Amol Sasane, sasane@math.kth.se. I denna uppgift

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Regressions- och Tidsserieanalys - F1

Regressions- och Tidsserieanalys - F1 Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer