Vad är faktoranalys? Faktoranalys. Vad är dimensioner? Vad är dimensioner?

Storlek: px
Starta visningen från sidan:

Download "Vad är faktoranalys? Faktoranalys. Vad är dimensioner? Vad är dimensioner?"

Transkript

1 Vad är faktoranalys? Faktoranalys Thomas Ågren Faktoranalys är ett samlingsnamn för dimensionsreducerande statistiska metoder syftande till att åskådliggöra underliggande strukturer i data Vad är dimensioner? Vad är dimensioner? Vi kan beskriva varje punkt i rummet omkring oss med hjälp av tre koordinater: en i x-led, en i y-led och en i z-led y z Datamatris Namn Längd (cm) Vikt (kg) Ålder (år) Pelle Ulla Voldemort Paul Peter Mary Snowden x Antalet dimensioner i en datamatris är samma som antalet variabler vi mäter Vad är dimensionsreduktion? Analogi: Ett fotografi är plant och har bara 2 dimensioner, men det avbildar det 3- dimensionella rummet. I ett foto har vi reducerat 3 dimensioner till 2. Vad menas med dimensioner i dimensionsreduktion av en datamatris? Antalet dimensioner är samma som antalet variabler vi mäter. Om vi ska återge data precist behöver vi en axel per item/variabel. Vi kan reducera antalet dimensioner genom att vikta ihop variablerna så att vi får nya variabler som tar olika mycket hänsyn till de gamla. 1

2 Vikt och längd Vikt och längd Längd r 2 = 0.82 BMI = Body Mass Index Vikt / Längd 2 Längd r 2 = Vikt Vikt Gör ny variabel som består både av vikt och längd. Gör ny variabel som består både av vikt och längd. Faktorer = nya sammanslagna variabler Ett enklare sätt att se på data. Enklare med en variabel än två. Kan vara något verkligt, kanske inte. Är BMI mer existerande än längd eller vikt? Om vi klumpar ihop variabler som inte har något med varandra att göra får vi godtyckliga, meningslösa faktorer. Faktorer Längd Längd Längd Vikt Vikt Vikt Vikt beror av längd Längd beror av vikt A och B beror på C BMI OBS! Vi kan inte säga nåt om kausala samband. Faktorer är inte automatiskt orsaker. BMI? En faktor till många mätvariabler Intelligenstest 1 Intelligenstest 6 Intelligenstest 2 G-faktorn Intelligenstest 5 Intelligenstest 3 Intelligenstest Vad faktoranalys gör I faktoranalys försöker vi slå ihop variabler till faktorer som beskriver data så bra som möjligt. (Obs! Vi reducerar antalet variabler/dimensioner genom att slå ihop flera av våra variabler i dessa faktorer.) Om faktorerna är lätta att tolka har vi lyckats göra data mer överskådligt. (Klassiskt exempel: Big five!) 2

3 Exempel på överskådlighet: djurarters särdrag Ordna observationer i en datamatris Hair Feathers Eggs Milk Airborne Aquatic Predator Toothed Backbone Breathes Venomous Fins Legs Tail Domestic Catsize Hair Feather s Egg Milk Airborn Etc Antelope Bass Bear Vilka underliggande variabler kan vi hitta? PC cavy hamster vampire fruitbat calf goat pony reindeer elephant deer giraffe buffalo antelope vole hare oryx gorilla pussycat girl bear aardvark squirrel wallabymole opossum wolf mongoose boar lynx leopard lion cheetah polecat puma raccoon mink sealion seal platypus dolphin porpoise honeybee moth housefly wasp bass catfish chub piranha herring tuna dogfish pike stingray PC 1 carp gnat ladybird termite flea dove parakeet chicken wren sparrow pheasant lark scorpionflamingo crow hawk vultureworm slug duck ostrich tortoise swan kiwi skimmer skua gull rhea octopus crayfish lobster tuatara toad clam starfish penguin crab frog frog slowworm newt pitviper seasnake sole seahorse haddock seawasp PC 2 Vi kan se olika kluster Däggdjur Sjölevande däggdjur Kräldjur Fiskar Insekter Fåglar Molusker PC 1 Resultat - Visualisering av data Vi hade 16 variabler vilka var för många för att vi skulle kunna åskådliggöra dem. Med hjälp av faktoranalys fick vi fram 2 faktorer och då blev det möjligt att åskådliggöra data grafiskt. Sedan kunde vi notera olika kluster i dessa. Vi har gjort data mer överskådligt. Vilka variabler var viktigast för våra faktorer? Catsize Domestic Tail Legs Fins Venomous Breathes Backbone Toothed Predator Aquatic Airborne Weights in projection vector 1 Milk Eggs Feathers 2 Hair

4 Vilka variabler var viktigast för våra faktorer? Catsize Domestic Tail Legs Fins Venomous Breathes Backbone Weights in projection vector 2 Resultat viktiga komponenter i faktorerna Vi tittade på vikterna i våra 2 faktorer och såg att olika variabler fick olika vikter. I bästa fall innebär det att vi kan sätta en etikett på de faktorerna. Faktor 1 skulle kunna heta Grad av däggdjur möjligen. Toothed 8 Predator Aquatic 6 Airborne Milk Eggs Feathers 2 Hair Hur bra är faktorerna? Faktor = Latent variabel = Komponent Samma sak, olika ord. I vårt exempel med djur-datat ovan så tittade vi på 2 faktorer som vi fick ut av faktoranalysen. Dessa var bra på att göra vårt material överskådligt. Ur ett hänseende kan vi säga att det var dom bästa vi kunde få. Nämligen Faktoranalys väljer ut de faktorer som förklarar mest av variansen i vårt datamaterial. Begreppet förklarad varians Begreppet förklarad varians faktor Vikt faktor Längd Tänk dig att du har två variabler. Hur mycket av den totala spridningen täcker vardera variabel in? Tänk dig att du roterar koordinatsystemet. Du ser snart att du kan rotera så att det mesta av datat ligger kring EN axel.

5 Begreppet förklarad varians Faktoranalys(PCA) faktor 2 faktor 1 Nu ser du att faktor 1 täcker in kanske 90% av den totala spridningen. Kanske kan vi nöja oss med en faktor för att beskriva det här datamaterialet. Det är just det som faktoranalys gör. I en faktoranalyslösning kommer den första faktorn att förklara mest varians, den andra faktorn näst mest osv. Till varje faktor hör ett egenvärde som är ett direkt mått på hur mycket av den totala variansen som den faktorn förklarar. Den vanligast formen av faktoranalys kallas principalkomponentanalys (PCA) och är den som vi kommer att använda. Egenvärde = förklarad varians i data av en faktor Hur gör vi faktoranalys? Egenvärde: > 2.7 > 1.8 > Varians i första faktorn Varians i andra faktorn Varians i tredje faktorn Osv Vi börjar med att konstruera en korrelationsmatris eller en kovariansmatris Total varians = sammanlagda spridningen i alla variabler Korrelationsmatrisen avgör vilka variabler som hör ihop V1 V2 V3 V V5 V6 V1 V2 V3 V V5 V6 1,023 -,22(**) -,001 -,005 -,001, ,979(**),01,003 -,029 -,22(**) -,979(**) 1 -,039 -,002,029 -,001,01 -, ,220(**) -,875(**) -,005,003 -,002 -,220(**) 1,665(**) -,001 -,029,029 -,875(**),665(**) 1 Total varians Den totala variansen i ett material får man om man adderar variansen för varje variabel för sig. Dessa hittar vi på diagonalen av kovariansmatrisen eller korrelationsmatrisen. Vi kommer bara att använda korrelationsmatrisen. För korrelationsmatriser blir detta = antal variabler. (Exempel variabler ger total varians. Första faktorn har egenvärde=1 -> 1/ = täcker in 25% av variansen) 5

6 Korrelationsmatrisen avgör vilka variabler som hör ihop Vi får ut 2 faktorer (components) V1 V2 V3 V V5 V6 V1 V2 V3 V V5 V6 1,023 -,22(**) -,001 -,005 -,001, ,979(**),01,003 -,029 -,22(**) -,979(**) 1 -,039 -,002,029 -,001,01 -, ,220(**) -,875(**) -,005,003 -,002 -,220(**) 1,665(**) -,001 -,029,029 -,875(**),665(**) 1 V1 -,058,238 V2 -,267,938 V3,271 -,962 V -,829 -,182 V5,673,206 V6,969,22 Värdena i tabellen kallas för faktorladdningar och talar om för oss hur mycket varje variabel korrelerar med just den faktorn. På så sätt kan man se i vilken mån vilka variabler som slagits ihop till de olika faktorerna. (Jämför vikterna i djurexemplet) Vi plottar våra 2 faktorer Faktorlösning - tolkning V1 -,058,238 V2 -,267,938 V3,271 -,962 V -,829 -,182 V5,673,206 V6,969,22 Component 2 Component Plot v2 v1 v Component 1 v3 v5 v6 Nu måste vi tolka vår faktorlösning. Hur vill vi att det ska se ut? Vi vill få en enkel och klar bild av data Vi vill gärna lätt kunna dela in variablerna i de olika faktorerna så att vi lätt kan namnge våra faktorer Vi vill helst att alla variablers varians ska finnas representerade i lösningen. Om en variabel inte viktas ihop i någon faktor så tappar vi ju informationen i den variabeln. Det vore perfekt om det såg ut så här V1 0 1 V2 0 1 V3 0 1 V 1 0 V5 1 0 V6 1 0 Varför vill vi att det ser ut så? Tänk er att det vore ett personlighetstest! Jag trivs bäst i sociala sammanhang Om det överhuvud finns chans att prata med nån så gör jag det. Jag måste ha social interaktion, NU!! Faktor 1 Faktor Jag oroar mig för ditten och datten 1 0 Jag tittar ofta upp så att jag inte ska få ett kassaskåp i huvudet Idag kanske blir dagen då jag inte klarar av mitt liv

7 men det gör det inte Varför vill vi att det ser ut så? V1 -,058,238 V2 -,267,938 V3,271 -,962 Component Plot v2 v1 v v5 v6 Tänk er att det vore ett personlighetstest! Faktor 1 Faktor 2 Gummibåtar är det bästa jag vet -58 0,238 Jag trivs bäst i sociala sammanhang -0,267 0,938 Jag trivs bäst i en isoleringscell 0,271-0,962 V -,829 -,182 V5,673,206 V6,969,22 Component Component 1 v3 Jag oroar mig nästan aldrig för nåt -0,829-0,182 Jag tittar ofta upp så att jag inte ska få ett kassaskåp i huvudet Idag kanske blir dagen då jag inte klarar av mitt liv. 0,673 0,206 0,969 0,22 Rotering - analogi Vi hade dessa data. Kan vi hitta en bättre vinkel att titta på data ifrån? Jämför med fotografen som tar en gruppbild: vinkeln vi fotograferar ifrån är viktig för att beskriva gruppen så bra som möjligt eftersom 3 dimensioner ska beskrivas med 2. V1 -,058,238 V2 -,267,938 Component Plot v2 v1 v5 v6 V3,271 -,962 v V -,829 -,182 V5,673,206 V6,969,22 Component Component 1 v3 Vi roterar koordinatsystemet så att varje variabel så mycket som möjligt laddar på endast EN faktor! V1,005,2 V2 -,018,975 V3,017 -,999 V -,88,035 V5,703,028 V6,999 -,013 Component Component Plot in Rotated Space v - Component 1 v1 v3 v5 v6 Rotering vad gör den? Efter roteringen kommer vi att ha omdistribuerat den förklarade variansen hos faktorerna. Faktor 1 kommer förmodligen inte att förklara lika mycket varians som innan. Alltså, faktorladdningarna ändras Istället har vi, om vi har tur, fått en mer lättolkad faktorlösning. En för oss mer teoretiskt meningsfull. 7

8 Rotering flera olika metoder Men det finns ett problem kvar. Täcker vår lösning verkligen in tillräckligt av V1:s varians. Ortogonal (Varimax) Oblik (Ortotran) V1,005,2 V2 -,018,975 V3,017 -,999 V -,88,035 V5,703,028 V6,999 -,013 Component 2 Component Plot in Rotated Space v1 v v5 v6 - v Component 1 Hur stor ska en faktorladdning vara för att vi ska bry oss om den? Vad gör vi då med vår V1? Faktorladdning Samplestorlek som behövs V1,005,2 V2 -,018,975 V3,017 -,999 V -,88,035 V5,703,028 V6,999 -,013 Antingen lägger vi till ännu en faktor. Uppenbarligen ligger V1:s varians utmed någon annan axel som vi inte har med. Eller så tar vi helt enkelt bort den variablen ur vår analys. Kanske mätte den inte vad vi ville mäta? Är frågan vars varians vi inte täcker in relevant? Tänk er att det vore ett personlighetstest! Faktor 1 Faktor 2 Gummibåtar är det bästa jag vet -58 0,238 Jag trivs bäst i sociala sammanhang -0,267 0,938 Jag trivs bäst i en isoleringscell 0,271-0,962 Jag oroar mig nästan aldrig för nåt -0,829-0,182 Jag tittar ofta upp så att jag inte ska få ett kassaskåp i huvudet Idag kanske blir dagen då jag inte klarar av mitt liv. 0,673 0,206 0,969 0,22 Communalities Beskriver hur mycket av variansen i en variabel som förklaras av de faktorer vi tog med i lösningen. Om en variabels varians inte täcks in av lösningen och vi inte vill addera fler faktorer kan vi välja att ta bort variabeln. Två vanliga kriterier är: 1) ta bort variabeln om den inte har en enda signifikant faktorladdning 2) ta bort variabeln om vår lösning förklarar mindre än 50% av variansen. 8

9 Communalities-exempel Variable Råd 31 Info 36 Utlopp 13 Hålla känsl 29 Communalities (Data2.sta) Extraction: Principal components Rotation: Unrotated From 1 From 2 Multiple Factor Factors R-Square 0, , , ,2720 0, , , , , , , , Variansmått Egenvärde: Hur mycket varians i data som beskrivs av en komponent Communalities: Hur mycket varians i en variabel som beskrivs av alla extraherade komponenter Communality för en variabel i EN faktor = faktorladdningen 2. tips: tänk på korrelationer, r och r 2 Hur många faktorer ska vi ha? Scree plot samma data A priori: t ex. Det ska vara fem underliggande variabler. Big five! Data: 2 sätt: 1. egenvärden över 1 2. armbågen i scree ploten Eigenvalue Scree Plot 2 2, Component Number Scree plot. Annat exempel Tolkning av faktorer 5,0,0 3 3,0 Plot of Eigenvalues Kan delas upp i 2 problem: 1. Vilken variabel hör till vilken faktor 2. Namnge faktorn Value 2 2,0 1 0 Number of Eigenvalues 9

10 Vilken variabel hör till vilken faktor? Faktorladdningar räknas som höga om de minst är mellan Använd tabell eller bestäm egen cut-off och redovisa den! Titta på faktorladdningarna för varje variabel i den oroterade lösningen. Laddar samma variabel högt på flera faktorer så titta på den roterade lösningen. Laddar en variabel lågt på alla faktorer så titta på communalities, går den överhuvud att förklara med de extraherade komponenterna? Vad har variabler som hör till samma faktor gemensamt? Här finns frihet för tolkning, tänk bara på att andra skall kunna hålla med. Du måste kunna argumentera för din tolkning. Exempel: Tolkning av faktorer Man har frågat 200 personer hur mycket de gillar/ogillar följande musikstilar: Oroterad faktorlösning Man finner en faktorlösning med endast två faktorer som har egenvärden över 1 Jazz, Blues, Klassisk musik, Rap, Heavy metal. Man vill veta om det finns underliggande strukturer i de uppmätta variablerna Vi ser att den första faktorn täcker upp ganska mycket av den totala variansen. Eftersom vi utgår från en korrelationsmatris med 5 variabler är den totala variansen = 5. Första faktorn täcker då in 2/5 = 0.77% Ganska mycket. Men hur kan vi tolka och namnge våra faktorer? Tolkning av faktorer Kan delas upp i 2 problem: 1. Vilken variabel hör till vilken faktor 2. Namnge faktorn Oroterad faktorlösning Man finner en faktorlösning med endast två faktorer som har egenvärden över 1 Vilken variabel hör till vilken faktor? Det ser ju ut som om alla variabler skulle höra till faktor 1. Vi ser dock att rap och heavy metal har höga laddningar på Både faktor 1 och faktor 2. De är dubbelladdningar. Då roterar vi och ser vad Som händer. 10

11 Roterad faktorlösning Notera att i den roterade faktorlösningen nedan så har den förklarade variansen omfördelats mellan faktorerna. Nu förklarar faktor 1 endast 1.75/5 = 35% av den totala variansen. Vi har omfördelat 5% av faktor 1:s varians till faktor 2 för att göra lösningen mer lättolkad. Communalities Låt oss för säkerhets skull kolla communalities också för att se om vår faktorlösning täcker in alla våra variablers varians. Nu är det lätt att se till vilken faktor som varje variabel tillhör. Till faktor 1 hör blues, klassisk musik och jazz. Till faktor 2 hör rap och heavy metal. Då kan vi fundera på att namnge våra faktorer. Vi ser att klassisk musik s varians täcks in endast till 6.6%. Kanske är vi nöjda med det. Kanske tycker vi att det är för lite och tar med en till faktor. Uppenbarligen finns det fans av klassisk musik som inte är fans av någon av de andra mätta musikstilarna. PCA vs Common factor analysis Variansen hos varje variabel kan delas upp i: Delad varians, den varians som variabeln delar med de andra variablerna Specifik varians, den varians som är unik för variabeln Felvarians, den varians i variabeln som kommer av mätfel, processfel osv PCA vs Common factor analysis Common factor analysis menar att man blottlägger den underliggande strukturen i data bäst om man bara använder variablernas delade varians. Blåser upp korrelationer mellan variabler Ingen unik lösning finns Problem med estimering av communalities. (Heywood cases) Kanske bäst om man vill åt ev underliggande struktur bland variablerna. PCA vs Common factor analysis Principal component analysis använder all varians. Menar att de första stora faktorerna ändå kommer att innehålla väldigt lite felvarians och unik varians Teoretiskt enklast Fokuserar på att med så få faktorer som möjligt beskriva så mycket som möjligt av den totala variansen i materialet. Krav på data Tillräckligt många observationer. Faktoranalys bygger på att vi har reliabla skattningar av korrelationerna mellan variablerna. Tumregel: Minst 5 per variabel, helst 10 eller fler. Kravet på att variablerna skall vara normalfördelade är svagt. Det är egentligen mest intressant om vi vill använda oss av statistiska tester, vilket vi kanske inte alltid är intresserade av. 11

12 Krav på data Data har många dimensioner som vi vill reducera för att se strukturer i data Det är viktigt att vi har en teoretisk grund och tror att det finns underliggande variabler som kan förklara våra mätningar. Vi kan inte bara välja godtyckliga variabler: Glassförsäljning i jun, Brösarp bandys benbrottsfrekvens 198, antal ompalompier siktade i Gränby centrum Vad betyder resultatet? Korrelationsmatrisen eller kovariansmatrisen? 1 V1 00 V2,023 V3 -,22 V -,001 V5 -,005 V6 -,001 Eigenvalue Scree Plot 2 Component Number Skillnad mellan kovarians och korrelation Kovarians Cov xy =[Σ(x-x m )(y-y m )] /N-1 Korrelation r = Cov xy /s x s y Sammanfattning: Hur gör vi faktoranalys? Vi bestämmer om vi ska använda kovariansmatrisen eller korrelationsmatrisen (default) och ser till att vi har tillräckligt med deltagare/observationer Antalet latenta variabler bestäms a priori, eller utifrån egenvärdena genom att antingen sätta ett tröskelvärde på 1 eller att leta rätt på armbågen i scree-ploten Vi ser efter att våra variabler laddar högt på endast en faktor. Vi kanske får titta på den roterade lösningen, kanske på den oblika. Kanske får vi radera några variabler som har liten delad varians med övriga Vi namnger våra komponenter Några viktiga användningsområden Konstruktion av frågeformulär Reduktion av data till ett litet antal tolkningsbara komponenter som sedan används i fortsatt analys t ex regression Ur många variabler välja ut ett fåtal målvariabler som sedan kan användas som beroendevariabler (särdragsextraktion) Konstruktion av frågeformulär Vi har från början en teoretisk idé om vilka subskalor vårt nya frågeformulär ska innehålla. Vi låter lämplig population fylla i formuläret och ser om vi hittar tillbaks till dessa subskalor. Har vissa items dubbelladdningar plockar vi bort dem. 12

13 Reduktion av data för ytterligare analys Har vi mångdimensionella data kan det vara olämpligt att använda regression direkt. Vi kan ha stor kolinearitet i data som gör tolkningen av en regression svår. Vi reducerar ner data till en eller ett par latenta variabler och kör regression med dem. Kom ihåg att här blir kraven på att data ska vara normalfördelade hårdare! Q-faktoranalys Urskiljer strukturer bland deltagare. Man kan säga en form av klusteranalys som utnyttjar hur deltagarna korrelerar med varandra. Kan finna teoretiskt intressanta subpopulationer i datamängden som man sedan kan jämföra med andra statistiska test. Kritik mot faktoranalys Används ibland då inferensstatistik kanske inte gav några resultat men man ändå ville publicera något. En slaskmetod. Man kan få vilka resultat man vill, det är bara att rotera variablerna med olika metoder. Sammanfattning Faktoranalys är en metod för att hitta underliggande strukturer i data genom att reducera antalet dimensioner. Några viktiga begrepp inom faktoranalys är egenvärde, communalities, komponent/faktor och faktorladdning. Några viktiga användningsområden är att hitta subskalor i frågeformulär, att reducera data för ytterligare analys samt särdragsextraktion. 13

Faktoranalys - Som en god cigarr

Faktoranalys - Som en god cigarr Innehåll Faktoranalys - Som en god cigarr Faktoranalys. Användningsområde. Krav/rekommen. 3. Olika typer av FA 4. Faktorladdningar 5. Eigenvalue 6. Rotation 7. Laddningar & Korr. 8. Jämförelse av metoder

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F3 Linda Wänström Linköpings universitet 17 september Wänström (Linköpings universitet) Multivariata metoder 17 september 1 / 21 Principalkomponentanalys Syfte med principalkomponentanalys

Läs mer

Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio

Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio med SPSS Kimmo Sorjonen 1. Faktoranalys Innan man utför en faktoranalys kan det vara bra att testa om det finns några outliers i data. Detta kan

Läs mer

Resultat. Principalkomponentanalys för alla icke-kategoriska variabler

Resultat. Principalkomponentanalys för alla icke-kategoriska variabler Introduktion Den första delen av laborationen baserar sig på mätdata som skapades i samband med en medicinsk studie där en ny metod för att mäta ögontryck utvärderas. Den nya metoden som testas, Applanation

Läs mer

STATISTISK ANALYS AV KOMPLEXA DATA

STATISTISK ANALYS AV KOMPLEXA DATA STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys

Läs mer

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet 732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris

Läs mer

Differentiell psykologi

Differentiell psykologi Differentiell psykologi Tisdag 24 september 2013 Confirmatory Factor Analysis CFA Dagens agenda Repetition: Sensitivitet och specificitet Övningsuppgift från idag Confirmatory Factor Analysis Utveckling

Läs mer

Regressions- och Tidsserieanalys - F4

Regressions- och Tidsserieanalys - F4 Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall

Läs mer

Granskning av en medarbetarenkät. - En explorativ och konfirmativ faktoranalys

Granskning av en medarbetarenkät. - En explorativ och konfirmativ faktoranalys Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:19 Granskning av en medarbetarenkät - En explorativ och konfirmativ faktoranalys Evaluating an employee survey

Läs mer

InStat Exempel 4 Korrelation och Regression

InStat Exempel 4 Korrelation och Regression InStat Exempel 4 Korrelation och Regression Vi ska analysera ett datamaterial som innehåller information om kön, längd och vikt för 2000 personer. Materialet är jämnt fördelat mellan könen (1000 män och

Läs mer

chi 2 : A B A: B: p-värde: A B K M K M phi A B Ja 25 50 75 Ja 50 100 150 Nej 75 50 125 Nej 150 100 250 100 100 200 200 200 400 (2 tentor av 8)

chi 2 : A B A: B: p-värde: A B K M K M phi A B Ja 25 50 75 Ja 50 100 150 Nej 75 50 125 Nej 150 100 250 100 100 200 200 200 400 (2 tentor av 8) Parametiskt vs. icke-parametriskt 1. Icke-parametriska analysmetoder kallas med ett annat ord för fördelningsfria analyser. Hur förklarar du relevansen hos detta begrepp? Och vad står parametrisk och dess

Läs mer

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012 Föreläsning 7 Stokastiska Processer och ARIMA Patrik Zetterberg 19 december 2012 1 / 22 Stokastiska processer Stokastiska processer är ett samlingsnamn för Sannolikhetsmodeller för olika tidsförlopp. Stokastisk=slumpmässig

Läs mer

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2 Lunds universitet Matematikcentrum Matematisk statistik Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2 Rapporten till den här laborationen skall lämnas in senast den 19e December 2014.

Läs mer

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler

Läs mer

Införandet av nätjournal

Införandet av nätjournal Införandet av nätjournal En analys av vårdförbundets medlemmars inställning Sara Nilsson Hörnell och Jonas Ström Statistiska Institutionen Kandidatuppsats Handledare: Inger Persson Höstterminen 2014 Sammanfattning

Läs mer

Matematisk modellering fortsättningskurs Visuell variation

Matematisk modellering fortsättningskurs Visuell variation Matematisk modellering fortsättningskurs Visuell variation Johan Hedberg, Fredrik Svensson, Frida Hansson, Samare Jarf 12 maj 2011 1 1 Sammanfattning I denna rapport undersöker vi en modell för att beskriva

Läs mer

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Statistik B Regressions- och tidsserieanalys Föreläsning 1 Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs

Läs mer

10.1 Enkel linjär regression

10.1 Enkel linjär regression Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot

Läs mer

Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24)

Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1 Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1. Variabler och tänkt modell Data simulerar de som använts i följande studie (se Appendix A): Hull, J. G., & Mendolia, M. (1991). Modeling

Läs mer

Datorlaboration 2. Läs igenom avsnitt 4.1 så att du får strukturen på kapitlet klar för dig.

Datorlaboration 2. Läs igenom avsnitt 4.1 så att du får strukturen på kapitlet klar för dig. Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 24 januari Datorlaboration 2 1 Inledning I denna laboration behandlas

Läs mer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3 Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest

Läs mer

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.

Läs mer

Inferensstatistik. Hypostesprövning - Signifikanstest

Inferensstatistik. Hypostesprövning - Signifikanstest 011-11-04 Inferensstatistik En uppsättning metoder för att dra slutsatser om populationers egenskaper (parametrar) med hjälp av stickprovs egenskaper (statistik) Hypostesprövning - Signifikanstest Ett

Läs mer

Sammanfattning av dugga 2

Sammanfattning av dugga 2 Sammanfattning av dugga 2 Vad som påverkar svarsfrekvens på en enkät Respondentens dagsform och intresse Dock brukar den överlag följa klockformad kurva - över 20 svar brukar approximativt antas vara normalfördelade

Läs mer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer Datorövning 2 Regressions- och tidsserieanalys Syfte 1. Lära sig skapa en korrelationsmatris 2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna mot varandra 3. Lära sig beräkna

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större

Läs mer

Några vanliga fördelningar från ett GUM-perspektiv

Några vanliga fördelningar från ett GUM-perspektiv Några vanliga fördelningar från ett GUM-perspektiv I denna PM redovisas några av de vanligaste statistiska fördelningarna och deras hantering inom ramen för GUM: Guide to the Expression of Uncertainty

Läs mer

Differentiell psykologi

Differentiell psykologi Differentiell psykologi Tisdag 25 september 2012 Frågestund Repetition Agenda Skillnader i definitioner mellan underlagen Statistik Instuderings- och tentamensfrågor Regressionsdiagnostik Fråga om Reliabilitet

Läs mer

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial? MULTIPEL IMPUTATION Ett sätt att fylla i hålen i ditt datamaterial? Pär Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par Ola.Bendahl@med.lu.se Översikt 1. Introduktion till problemet 2.

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 3 Statistiska metoder 1 Dagens föreläsning o Samband mellan två kvantitativa variabler Matematiska samband Statistiska samband o Korrelation Svaga och starka samband När beräkna korrelation?

Läs mer

Ordlista Enkätmetodik

Ordlista Enkätmetodik Ordlista Enkätmetodik A Alfaförändring. Förändringar av medelvärdet över tid som kan tillskrivas en känd händelse. Ankare. Ytterlighetsalternativen i en svarsskala, exempelvis i en Likertskala. Autokorrelation.

Läs mer

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat

Läs mer

Multivariata metoder

Multivariata metoder Multivariata metoder F5 Linda Wänström Linköpings universitet 1 oktober Wänström (Linköpings universitet) Multivariata metoder 1 oktober 1 / 18 Kanonisk korrelationsanalys Syfte: Undersöka om en grupp

Läs mer

Två kulturer på Internet Resultat av faktor- och klusteranalys

Två kulturer på Internet Resultat av faktor- och klusteranalys Resultat av faktor- och klusteranalys Håkan Selg Department of Information Technology Technical report 2009-015 Swedish IT-User Centre May 2009 Uppsala University ISSN 1404-3203 Box 337, SE-751 05 Uppsala,

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett

Läs mer

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1. En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar

Läs mer

Examinationsuppgifter del 2

Examinationsuppgifter del 2 UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare

Läs mer

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval

TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen

Läs mer

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering Matematikcentrum (7) Matematisk Statistik Lunds Universitet Per-Erik Isberg Laboration Simulering HT 006 Introduktion Syftet med laborationen är dels att vi skall bekanta oss med lite av de olika funktioner

Läs mer

Finansiell statistik. Multipel regression. 4 maj 2011

Finansiell statistik. Multipel regression. 4 maj 2011 Finansiell statistik Föreläsning 4 Multipel regression Jörgen Säve-Söderbergh 4 maj 2011 Samband mellan variabler Vi människor misstänker ofta att det finns många variabler som påverkar den variabel vi

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1

Multipel linjär regression. Geometrisk tolkning. Tolkning av β k MSG Staffan Nilsson, Chalmers 1 Multipel linjär regression l: Y= β 0 + β X + β 2 X 2 + + β p X p + ε Välj β 0,β,β 2,, β p så att de minimerar summan av residualkvadraterna (Y i -β 0 -β X i - -β p X pi ) 2 Geometrisk tolkning Med Y=β

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

13.1 Matematisk statistik

13.1 Matematisk statistik 13.1 Matematisk statistik 13.1.1 Grundläggande begrepp I den här föreläsningen kommer vi att definiera och exemplifiera ett antal begrepp som sedan kommer att följa oss genom hela kursen. Det är därför

Läs mer

Höftledsdysplasi hos dansk-svensk gårdshund

Höftledsdysplasi hos dansk-svensk gårdshund Höftledsdysplasi hos dansk-svensk gårdshund Sjö A Sjö B Förekomst av parasitdrabbad öring i olika sjöar Sjö C Jämföra medelvärden hos kopplade stickprov Tio elitlöpare springer samma sträcka i en för dem

Läs mer

Analys av data från FIFA med hjälp av korrespondensanalys (Analysis of data from FIFA through correspondence analysis)

Analys av data från FIFA med hjälp av korrespondensanalys (Analysis of data from FIFA through correspondence analysis) STOCKHOLMS UNIVERSITET Statistiska institutionen Analys av data från FIFA med hjälp av korrespondensanalys (Analysis of data from FIFA through correspondence analysis) Ximena Espinoza 15-högskolepoäng

Läs mer

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor

Exempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor Kontinuerliga stokastiska variabler Exempel En stokastisk variabel är kontinuerlig om den kan anta vilka värden som helst i ett intervall, men sannolikheten för varje enskilt utfall är noll: P(X = x) =.

Läs mer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera

Läs mer

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT Jointly distributed Joint probability function Marginal probability function Conditional probability function Independence

Läs mer

Laboration 2: Styrkefunktion samt Regression

Laboration 2: Styrkefunktion samt Regression Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens

Läs mer

Stokastiska vektorer och multivariat normalfördelning

Stokastiska vektorer och multivariat normalfördelning Stokastiska vektorer och multivariat normalfördelning Johan Thim johanthim@liuse 3 november 08 Repetition Definition Låt X och Y vara stokastiska variabler med EX µ X, V X σx, EY µ Y samt V Y σy Kovariansen

Läs mer

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 STOCKHOLMS UNIVERSITET MT 5001 MATEMATISKA INSTITUTIONEN TENTAMEN Avd. Matematisk statistik 13 januari 2014 Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14 Examinator: Martin Sköld, tel.

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

Matematisk statistik för B, K, N, BME och Kemister

Matematisk statistik för B, K, N, BME och Kemister Matematisk statistik för B, K, N, BME och Kemister Föreläsning 11 & 12 Johan Lindström 5 & 14 oktober 2015 Johan Lindström - johanl@maths.lth.se FMS086/MASB02 F11 1/27 Johan Lindström - johanl@maths.lth.se

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT2007. Laboration. Simulering Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs HT007 Laboration Simulering Grupp A: 007-11-1, 8.15-.00 Grupp B: 007-11-1, 13.15-15.00 Introduktion Syftet

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007

Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007 Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 7 februari Datorlaboration 3 1 Inledning I denna laboration behandlas

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD 6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller

Läs mer

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION. MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på

Läs mer

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression Enkel linjär regression Exempel.7 i boken (sida 31). Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben och höjder på sockeln. De halvledare

Läs mer

Differentiell psykologi

Differentiell psykologi Differentiell psykologi Tisdag 20 september 2011 Integrering och frågestund Moment II: Personlighet och intelligens Petter Gustavsson 20 september 20112 Upplägg: Momentansvarig: Petter Första veckan: Intelligens

Läs mer

TMS136. Föreläsning 7

TMS136. Föreläsning 7 TMS136 Föreläsning 7 Stickprov När vi pysslar med statistik handlar det ofta om att baserat på stickprovsinformation göra utlåtanden om den population stickprovet är draget ifrån Situationen skulle kunna

Läs mer

Bildmosaik. Bilddatabaser, TNM025. Anna Flisberg Linne a Mellblom. linme882. Linko pings Universitet

Bildmosaik. Bilddatabaser, TNM025. Anna Flisberg Linne a Mellblom. linme882. Linko pings Universitet Bildmosaik Bilddatabaser, TNM025 Linko pings Universitet Anna Flisberg Linne a Mellblom annfl042 linme882 28 maj 2015 Innehåll 1 Introduktion 2 2 Metod 2 2.1 Features..............................................

Läs mer

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade) 5:1 Studien ifråga, High School and beyond, går ut på att hitta ett samband mellan vilken typ av program generellt, praktiskt eller akademiskt som studenter väljer baserat på olika faktorer kön, ras, socioekonomisk

Läs mer

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys) Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,

Läs mer

Ny indikator för svensk arbetsmarknad. - En faktoranalys som sammanfattar 14 variablers variation. A new indicator for the Swedish labour market

Ny indikator för svensk arbetsmarknad. - En faktoranalys som sammanfattar 14 variablers variation. A new indicator for the Swedish labour market Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:15 Ny indikator för svensk arbetsmarknad - En faktoranalys som sammanfattar 14 variablers variation A new indicator

Läs mer

1 Produktivitet kontra kvalitet vid tillverkning av bilar

1 Produktivitet kontra kvalitet vid tillverkning av bilar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FMS 035: MATEMATISK STATISTIK FÖR M, VT-11 DATORLABORATION 5 Syfte Syftet med dagens laboration är att du ska lära dig tolka ett av de vanligaste

Läs mer

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval

Läs mer

ARIMA del 2. Patrik Zetterberg. 19 december 2012

ARIMA del 2. Patrik Zetterberg. 19 december 2012 Föreläsning 8 ARIMA del 2 Patrik Zetterberg 19 december 2012 1 / 28 Undersöker funktionerna ρ k och ρ kk Hittills har vi bara sett hur autokorrelationen och partiella autokorrelationen ser ut matematiskt

Läs mer

lära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten.

lära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten. LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FMS035: MATEMATISK STATISTIK FÖR M DATORLABORATION 5, 11 MAJ 2012 Syfte Syftet med dagens laboration är att du ska lära dig tolka ett av de

Läs mer

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1! LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska

Läs mer

Stokastiska signaler. Mediesignaler

Stokastiska signaler. Mediesignaler Stokastiska signaler Mediesignaler Stokastiska variabler En slumpvariabel är en funktion eller en regel som tilldelar ett nummer till varje resultatet av ett experiment Symbol som representerar resultatet

Läs mer

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år). Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta

Läs mer

3.6 Generella statistiska samband och en modell med för sockerskörden begränsande variabler

3.6 Generella statistiska samband och en modell med för sockerskörden begränsande variabler 3.6 Generella statistiska samband och en modell med för sockerskörden begränsande variabler Hans Larsson, SLU och Olof Hellgren, SLU Inledning En uppgift för projektet var att identifiera ett antal påverkbara

Läs mer

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.

Poolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4. Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student)

Läs mer

Statistik 2 2010, 3.-9.5.2010. Stansens PC-klass ASA-huset. Schema: mån ti ons to fre 9.15-12.00 9.15-12.00 10.15-13.00 10.15-12.00 10.15-12.

Statistik 2 2010, 3.-9.5.2010. Stansens PC-klass ASA-huset. Schema: mån ti ons to fre 9.15-12.00 9.15-12.00 10.15-13.00 10.15-12.00 10.15-12. Statistik 2 2010, 3.-9.5.2010 Stansens PC-klass ASA-huset. Schema: mån ti ons to fre 9.15-12.00 9.15-12.00 10.15-13.00 10.15-12.00 10.15-12.00 13.15-15.00 13.15-15.00 13.15-16.00 13.15-16.00 Under kursens

Läs mer

Bilaga 1, Exempel på dålig uppdatering

Bilaga 1, Exempel på dålig uppdatering Bilaga 1, Exempel på dålig uppdatering Bilden nedan visar att vissa delar av LTU:s webbplats är ouppdaterad. Ett exempel på detta är att läsårsindelningen är för läsår 5/6 och detta kunde ses den 6 oktober

Läs mer

1 Förberedelseuppgifter

1 Förberedelseuppgifter LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

Kandidatuppsats. Nr 2015:1. Utbildning och inkomst viktigare än vänster-höger. Statistiska institutionen. Vladimir Calderón

Kandidatuppsats. Nr 2015:1. Utbildning och inkomst viktigare än vänster-höger. Statistiska institutionen. Vladimir Calderón Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2015:1 Utbildning och inkomst viktigare än vänster-höger Principalkompanalyser av riksdagsvalen 2006-2014 Vladimir

Läs mer

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3 Laboration 2 Fördelningar och simulering Introduktion 2014-02-06 Syftet med laborationen är dels

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen

Syftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 6 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 6: Regression Syftet med den här laborationen är att du skall bli

Läs mer

Läs noggrant informationen nedan innan du börjar skriva tentamen

Läs noggrant informationen nedan innan du börjar skriva tentamen Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26

Läs mer

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består

Läs mer

Examinationsuppgift 2014

Examinationsuppgift 2014 Matematik och matematisk statistik 5MS031 Statistik för farmaceuter Per Arnqvist Examinationsuppgift 2014-10-09 Sid 1 (5) Examinationsuppgift 2014 Hemtenta Statistik för farmaceuter 3 hp LYCKA TILL! Sid

Läs mer

Multivariat databehandling och dataanalys

Multivariat databehandling och dataanalys U.U.D.M. Project Report 2016:20 Multivariat databehandling och dataanalys en faktoranalys av slutbetyg i åk 9 inom Lgr11 på kommunnivå Robin Samuelsson Examensarbete i matematik, 15 hp Handledare: Jesper

Läs mer