För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
|
|
- Maj-Britt Blomqvist
- för 7 år sedan
- Visningar:
Transkript
1 Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt fördelad slumpvariabel. Om z i = β 1 + β 2 x i så kan den (kumulativa) logistiska fördelningsfunktionen uttryckas: p i = e z /(1 + e z ) = 1 / (1+ e z ) p i = 1/(1 + e (β1 + β2xi) ) = e (β1 + β2xi) /(1 + e (β1 + β2xi) ) 1
2 Man kan visa att; - när z i går från - till + så kommer p i att ligga mellan 0 and 1 - p i är icke-linjärt relaterat till z i - p i närmar sig noll i avtagande takt när x i antar mycket låga värden och närmar sig ett i avtagande takt när x i antar mycket höga värden ger en S-formad kurva som ser ut som en kumulativ fördelningsfunktion för en stokastisk variabel (cdf) 2
3 Om p i = sannolikheten för att y i = 1 är (1 p i ) = sannolikheten för att y i = 0 1 p i = 1/(1 + e Zi ) vilket också innebär att: p i /(1 p i ) = e Zi [p i /(1 p i )] kallas oddskvoten, eller relativ risk, för att y i =1, dvs är kvoten mellan sannolikheten för alternativ 1 och alternativ 0 om p i = 0.8 (och (1 p i ) = 0.2) är oddsen 4 mot 1 till fördel för alternativ 1 osv 3
4 Den naturliga logaritmen av funktionen ger; L i = ln [p i /(1 p i )] = z i = β 1 + β 2 x i dvs den naturliga logaritmen av oddskvoten är nu linjär inte enbart med avseende på x utan också m a p β, vilket också innebär att modellen under vissa speciella förhållanden också kan skattas med linjära metoder. 4
5 För den icke logaritmerade formen av modellen, för ; p i /(1 p i ) = e x β ( = exp(x β) ) gäller att om x j ökar med en enhet ökar exp(x β) till exp(x β + β j ) = exp(x β) x exp(β j ) Antag β j = 0.1, en ökning av x j med enhet ger en multiplikation av den initiala oddskvoten med exp(0.1) vilket innebär att den relativa sannolikheten för att y = 1 ökar med 10.5% Dvs om [p i /(1 p i )] = e β1+β2xi = e β1 e β2xi så kommer en ökning av X i med en enhet att öka oddsen till fördel för y i = 1 med e β2*1 5
6 Annat ex: om β 2 = e = oddsen för att Y i = 1 ökar med eller med 8.17 procent Denna tolkning av logitmodellen dock mer vanlig i biostatistiska applikationer I ekonomiska sammanhang tolkar man dock oftare i termer av den logaritmerade modellen. β j = 0.1 skulle här tolkas som att en enhets ökning av x j ökar den logaritmerade oddskvoten med 0.1 vilket för små β j överensstämmer med tolkningen ovan eftersom exp(β j ) 1 β j. (Se dock det andra exemplet) Om data på individnivå (företag, familj etc ) gäller att L i = ln (1/0) om y = 1 L i = ln (0/1) om y = 0 Maximum Likelihood (ML) estimation 6
7 För MLE gäller att: Signifikanstest baseras på den standardiserade normalfördelningen istället för på t-test. Vid test av H 0 ; att samtliga β i samtidigt är lika med noll, motsvaras den linjära regressionsmodellens F test av Likelihood Ratio (LR) testet. Under H 0 följer LR-testet χ 2 fördelningen med df = antal förklaringsvariabler (exkl intercepttermen) Betr mått på goodness of fit så ger R 2 inte längre särskilt meningsfull information Istället R 2 liknande värden; pseudo R 2, the McFadden R 2, R 2 McF, och count R 2 7
8 Tolkning av modellens parametrar (individuella data och ML estimation): Varje lutningskoefficient tolkas i partiella termer och mäter förändringen i the estimated logit (= den logaritmerade oddskvoten) för en enhets förändring i värdet på den aktuella regressorn. Alternativt görs en tolkning i termer av odds, den tolkning man får om man tar antiloggen av de olika lutningsparametrarna. Sannolikheten för att y i = 1 beror på nivån på x i. Genom att substituera in värden på x i i p i = 1/(1 + e Zi ) = e Zi /(1 + e Zi ), Z i = β 1 + β 2 x i och använda de gjorda skattningarna av β kan vi beräkna sannolikheten direkt från funktionen ovan. 8
9 Vi kan också beräkna förändringen hos sannolikheten för y i = 1 när x i varierar. Marginaleffekten för logitmodellen kan beräknas relativt enkelt m hj av de skattade parametrarna eftersom p i / x j = p i (1- p i )β j, och stickprovsmedelvärdet för y ger en grov skattning av p i. Vi kan vid beräkning av marginaleffekten alternativt också ta hänsyn till den nivå på sannolikheten från vilken förändringen beräknas, PP*, och som beror på det * värde på x i (x i ) för vilket sannolikheten beräknats initialt. β 2 (1-P * )P * där PP* = sannolikheten beräknad vid x * i, och β 2(1-P * )P * är den marginella förändringen av sannolikheten för y i = 1 vid en enhets ökning av x i från x * i Notera slutligen att den linjära sannolikhetsmodellen (korrigerad för den heteroskedasticitet) trots allt erbjuder en bra start när det gäller att få en första uppfattning om vilka variabler som är signifikanta, även om modellen uppvisar stora svagheter vid krav på mer precisa skattningar och tolkningar. 9
10 Probitmodellen Probitmodellen utgår, som tidigare konstaterats, från ett antagande om en bakomliggande standardiserad normalfördelning för p i. z G(z) = Φ(z) = φ(v)dv - där φ(z) är den standardiserade normala täthetsfunktionen φ(z) = (2π) -1/2 exp(- z 2 /2) För G gäller, såväl om funktionen antar formen av en logitformulering som om funktionen antar en probitformulering, att (G(z) 0 när z - och G(z) 1 när z. 10
11 Vilken model, logit- eller probitmodellen, är bäst? Probitmodellen är beräkningsmässigt svårare än logitmodellen. Vid beräkning av marginaleffekter för probitmodellen, p i / x ij = β j f(z i ) där f(z i ) är täthetsfunktionen för en standardiserade och normalfördelad variabel och Z i = β 1 + β 2 X 2i + + β k X ki, finns inga förenklingar motsvarande de som finns för logitmodellen annat än att p i / x ij < 0.4β j (mer om detta senare). I flertalet tillämpningar är modellerna till stora delar likvärdiga och den huvudsakliga skillnaden består i att den logistiska fördelningen har fetare svansar dvs den betingade sannolikheten för att y i = 1 närmar sig noll eller ett i en långsammare takt för logitmodellen. 11
12 Men, eftersom modellerna ger olika värden på skattningarna för β måste man vara uppmärksam på detta vid jämförelse av resultat av modellskattningar. Båda de bakomliggande (standardiserade) fördelningarna har μ = 0, men för normalfördelningen är σ 2 = 1 och för den logistiska fördelningen är σ 2 = π 2 /3 där π 3.14 β logit = 1.81β probit eller, omvänt, (1/1.81)β logit = β probit, (π / ) Amemiya förslår istället multiplikation med 1.6 (resp 1/1.6), ett alternativ man ofta kan se i olika studier, och har visat att dessa jämförelser fungerar bra om 0.1 < p < 0.9. Att modellerna ger olika skattningar av β är i sig inget problem utan beror alltså på att man använder olika formler för de bakomliggande sannolikhetsfördelningarna 12
13 Det meningsfulla är dessutom egentligen jämförelsen av skattade marginaleffekter för de olika modellerna; för logitmodellen är p/ x j < 0.25β j för probitmodellen är p/ x j < 0.4β j och för den linjära sannolikhetsmodellen (LPM) är p/ x j = β j. Detta ger tumregeln ; β Logit 4β OLS β Probit 2.5β OLS β Logit 1.6β Probit (enl Amemiya s förslag) 13
14 Latenta variabler En latent variabel är en variabel som vi inte kan observera fullt ut. Denna typ av variabler kan introduceras i modellerna för diskreta val på två olika sätt; - i form av ett index - som skillnaden i upplevd nytta om en händelse ifråga inträffar jämfört med om den inte gör det Av det andra fallet framgår att det blir centralt att skilja mellan regressorer som skiljer sig åt mellan olika alternativ (pris, restid etc) och regressorer som inte påverkas av vilket alternativ som väljs (socioekonomiska faktorer som utbildning etc) 14
15 Indexmodeller Funktionsformulering i termer av ett index syftar till att förklara en bakomliggande, men icke observerbar, kontinuerlig variabel, y*, när det enda vi egentligen kan observera är en binär variabel som antar värdet 1 eller 0 beroende på om y* passerar ett visst tröskelvärde eller ej. Antag att y* är en latent variabel i en modell där vi ska förklara varför en individ önskar förvärvsarbeta. Den naturliga regressionsmodellen blir här; y* = x β + u Vi kan egentligen inte observera och mäta önskan att förvärvsarbeta men vi kan observera om individen faktiskt förvärvsarbetar eller ej vilket ger att; y = 1 if y* > 0 = 0 if y* < 0 15
16 där P[y = 1 x] = P[y* > 0] = P[x β + u > 0] = P[- u < x β ] = F(x β) och där F är den kumulativa fördelningsfunktionen för u vilken, givet en fördelning som är symmetrisk runt 0, motsvarar den kumulativa fördelningsfunktionen för u. Modellen kan därför formuleras på det sätt som vi tidigare formulerat en binär valmodell, vi har egentligen bara gett modellen en teoretisk förankring; p i P[y i = 1 x] = F(x i β) Notera att tröskelvärdet för indexmodellen inte behöver vara noll. Mer generell kan antas att om y = 1 när y* > z δ så är P[y = 1 x] = F(x β z δ) där δ bara kan identifieras om samtliga komponenter i z och x skiljer sig åt. 16
17 Random Utility Models I denna typ av modeller antas en individ välja mellan alternativ 0 och alternativ 1 baserat på vilket av alternativen som erbjuder den högsta nyttan (största tillfredsställelsen). Givet en additiv modell kan modellen specificeras: U 0 = V 0 + ε 0 U 1 = V 1 + ε 1 V 0 och V 1 motsvarar modellens deterministiska del och ε 0 och ε 1 är de slumpmässiga inslagen P[y = 1] = P[U 1 > U 0 ] = P[V 1 + ε 1 > V 0 + ε 0 ] = P[ε 0 ε 1 < V 1 V 0 ] = F(V 1 V 0 ) där F är den kumulativa fördelningsfunktionen för (ε 0 ε 1 ) 17
18 Ett givet val av fördelningsfunktion för slumptermerna är normalfördelningen. Om ε 0 and ε 1 är normalfördelade gäller detta även för (ε 0 ε 1 ) (linjära kombinationer av normalfördelade variabler är också normalfördelade). Variansen för (ε 0 ε 1 ) antas vara lika med 1och eftersom F( ) antar formen av en standardiserad normalfördelning får vi en probitmodell. Notera också att eftersom U 1 > U 2 så måste också gälla att au 1 > au 2. Även detta hanteras genom antagandet om normalfördelning. 18
19 Test av multipla hypoteser Det finns tre olika sätt att testa restriktioner som innebär exkludering av parametrar; - Lagrange multiplier testet (score testet) som bara kräver skattning av modellen under H 0, dvs av modellen med restriktioner - Wald testet som enbart kräver att man skattar modellen utan restriktioner. Testet tillåter test av exkludering av vissa parametrar efter det att modellen utan restriktioner skattats. Wald-testet har en asymptotisk χ 2 -fördelning med df = antal restriktioner. - Om både modellen med, och modellen utan, restriktioner är enkla att skatta - vilket ju oftast är fallet om det handlar om exkludering av variabler är Likelihood Ratio testet mycket användbart. Testet baseras på samma principer som F-testet för den linjära regressionen. F-testet baseras skillnader mellan RSS R och RSS UR medan LR-testet baseras på skillnader mellan log-likelihood-funktionerna för modellen med och modellen utan restriktioner 19
20 LR =2(Lur Lr ) Där Lur är värdet på log-likelihood funktionen för modellen utan restriktioner och Lr är värdet på loglikelihood funktionen för modellen med restriktioner. Eftersom Lur > Lr, är LR positivt men vid beräkning av LR statistikan för binära valmodeller antar loglikelihood funktionen alltid ett negativt värde. Det faktum att båda log-likelihood funktionerna antar negative värden påverkar dock inte hur vi beräknar LR värdet, vi behåller helt enkelt minustecknet i formeln. Multiplikationen med två krävs för att LR testet ska vara approximativt χ 2 fördelat under H 0. Om vi använder testet för att testa för exkludering av variabler är LR ~ χ 2 q. 20
21 Dessutom : Även logit- och probitmodeller kan förstås innehålla endogena regressorer. Möjligt att använda logit- och probitmodeller även på poolade tvärsnittsdata och/eller data där observationerna identiskt fördelade. Förekomst av s k choice-based samples inte helt ovanligt i samband med logit- och probitmodeller man översamplar vissa grupper. För konsistens hos β krävs viktad MLE. Grupperade och aggregerade data I vissa fall kan, trots att individdata saknas och grupperade och/eller aggregerade data är de enda tillgängliga datamängderna, modeller för diskreta val fortfarande vara den lämpligaste modellformuleringen. Spelar dock roll hur gruppering och/eller aggregering ser ut. 21
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merPoissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
Läs merVid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar
ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )
Läs merModeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller.
Multinominella modeller Modeller för fler än två valmöjligheter. Förekommer både som logit- och som probitmodeller. Möjligt att, genom olika modellformuleringar, beakta att vissa regressorer varierar mellan
Läs merPaneldata och instrumentvariabler/2sls
Extra anteckningar om paneldata; Paneldata och instrumentvariabler/2sls Oavsett REM, FEM eller poolad OLS så görs antagandet att Corr(x,u) = 0, dvs att vi har svagt exogena regressorer. Om detta inte gäller
Läs merLogistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 12, 2013 Bertil Wegmann (statistik, LiU) Kategoriska data November 12, 2013
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 28, 2012 Bertil Wegmann (statistik, LiU) Kategoriska data November 28, 2012
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Kategoriska data Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 18, 2016 Bertil Wegmann (statistik, LiU) Kategoriska data November 18, 2016
Läs merTill ampad statistik (A5) Förläsning 13: Logistisk regression
Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.
Läs merKapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Kategoriska data, ht 2017 Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, IDA, LiU) Kategoriska data 1 / 28 Översikt kategoriska data Kategoriska
Läs merLektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Läs merExempel på tentamensuppgifter
STOCKHOLMS UNIVERSITET 4 mars 2010 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Exempel på tentamensuppgifter Uppgift 1 Betrakta en allmän I J-tabell enligt 1 2 3 J Σ 1 n 11
Läs merFormler och tabeller till kursen MSG830
Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)
Läs merFÖRELÄSNING 8:
FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data
Läs merFöreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Läs merPoolade data över tiden och över tvärsnittet. Oberoende poolade tvärsnittsdatamängder från olika tidpunkter.
PANELDATA Poolade data över tiden och över tvärsnittet Alternativ 1: Oberoende poolade tvärsnittsdatamängder från olika tidpunkter. Oberoende stickprov dragna från stora populationer vid olika tidpunkter.
Läs merFinansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3
Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics
Läs merTenta i Statistisk analys, 15 december 2004
STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, ML 15 december 004 Lösningar Tenta i Statistisk analys, 15 december 004 Uppgift 1 Vi har två stickprov med n = 5 st.
Läs merDel I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...
Avd. Matematisk statistik TENTAMEN I SF9/SF94/SF95/SF96 SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 4:E OKTOBER 08 KL 8.00 3.00. Examinator för SF94/SF96: Tatjana Pavlenko, 08-790 84 66 Examinator för
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merMVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Läs merInnehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)
Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3
Läs merSF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 4 7 november 2017 1 / 29 Idag Förra gången Viktiga kontinuerliga fördelningar (Kap. 3.6) Fördelningsfunktion (Kap. 3.7) Funktioner av stokastiska
Läs merSF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test
SF1915 Sannolikhetsteori och statistik 6 hp Föreläsning 12 χ 2 -test Jörgen Säve-Söderbergh Anpassningstest test av given fördelning n oberoende försök med r möjliga olika utfall Händelse A 1 A 2... A
Läs merEnvägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
Läs merFÖRELÄSNING 7:
FÖRELÄSNING 7: 2016-05-10 LÄRANDEMÅL Normalfördelningen Standardnormalfördelning Centrala gränsvärdessatsen Konfidensintervall Konfidensnivå Konfidensintervall för väntevärdet då variansen är känd Samla
Läs merTentamen MVE302 Sannolikhet och statistik
Tentamen MVE302 Sannolikhet och statistik 2019-06-05 kl. 8:30-12:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 031-7725325 Hjälpmedel: Valfri miniräknare.
Läs merTentamen MVE300 Sannolikhet, statistik och risk
Tentamen MVE300 Sannolikhet, statistik och risk 205-08-8 kl. 8.30-3.30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Johan Jonasson, telefon: 0706-985223 03-7723546 Hjälpmedel:
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala
Läs merTAMS65 - Föreläsning 2 Parameterskattningar - olika metoder
TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder Martin Singull Matematisk statistik Matematiska institutionen Innehåll Fö2 Punktskattningar Egenskaper Väntevärdesriktig Effektiv Konsistent
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE31 Sannolikhet, statistik och risk 218-5-31 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
Läs merData på individ/hushålls/företags/organisationsnivå. Idag större datamänger än tidigare
MIKROEKONOMETRI Data på individ/hushålls/företags/organisationsnivå Tvärsnittsdata och/eller longitudinella data o paneldata Idag större datamänger än tidigare Tekniska framsteg erbjuder möjligheter till
Läs merStatistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merF9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Läs merSF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
Läs merMatematisk statistik KTH. Formel- och tabellsamling i matematisk statistik
Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =
Läs merRegressionsanalys med SPSS Kimmo Sorjonen (2010)
1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;
Läs merTentamen MVE302 Sannolikhet och statistik
Tentamen MVE32 Sannolikhet och statistik 219-6-5 kl. 8:3-12:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Oskar Allerbo, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
Läs merMatematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Läs merStokastiska signaler. Mediesignaler
Stokastiska signaler Mediesignaler Stokastiska variabler En slumpvariabel är en funktion eller en regel som tilldelar ett nummer till varje resultatet av ett experiment Symbol som representerar resultatet
Läs merTAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65
Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................
Läs mer(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.
Avd. Matematisk statistik TENTAMEN I SF1901, SF1905 SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 11 JANUARI 2016 KL 14.00 19.00. Kursledare för CINEK2: Thomas Önskog, tel: 08 790 84 55 Kursledare för
Läs merStatistisk analys av komplexa data
Statistisk analys av komplexa data Trunkerade data och Tobitregression Bertil Wegmann Avdelning statistik, IDA, Linköpings universitet November 10, 2015 Bertil Wegmann (statistik, LiU) Trunkerade data
Läs merSkrivning i ekonometri torsdagen den 8 februari 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)
Läs merStatistik 1 för biologer, logopeder och psykologer
Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data
Läs mer1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
Läs merF5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)
Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative
Läs merNågra extra övningsuppgifter i Statistisk teori
Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,
Läs merFöreläsning 12: Repetition
Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2017-06-01 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merPROGRAMFÖRKLARING III
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING III Matematisk statistik, Lunds universitet stik för modellval och prediktion p./22 Statistik
Läs merExempel. Kontinuerliga stokastiska variabler. Integraler i stället för summor. Integraler i stället för summor
Kontinuerliga stokastiska variabler Exempel En stokastisk variabel är kontinuerlig om den kan anta vilka värden som helst i ett intervall, men sannolikheten för varje enskilt utfall är noll: P(X = x) =.
Läs merMatematisk statistik 9hp Föreläsning 7: Normalfördelning
Matematisk statistik 9hp Föreläsning 7: Normalfördelning Anna Lindgren 29+3 september 216 Anna Lindgren anna@maths.lth.se FMS12/MASB3 F7: normalfördelning 1/18 Kovarians, C(X, Y) Repetition Normalfördelning
Läs merF23 forts Logistisk regression + Envägs-ANOVA
F23 forts Logistisk regression + Envägs-ANOVA Repetition Detta går inteattbeskriva på någotrimligtsättmed en linjär funktion PY Xx) β 0 +β x Den skattade linjen går utanför intervallet0, ): Y ärenbinärvariabel0-,dikotom)manvillmodellera,
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Läs merStatistiska metoder för säkerhetsanalys
F10: Intensiteter och Poissonmodeller Frågeställningar Konstant V.v.=Var Cyklister Poissonmodeller för frekvensdata Vi gör oberoende observationer av de (absoluta) frekvenserna n 1, n 2,..., n k från den
Läs merBayesiansk statistik, 732g43, 7.5 hp
Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-10-12 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri
Läs merFinns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?
När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns
Läs merTMS136. Föreläsning 10
TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis
Läs merSannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0
Avd. Matematisk statistik TENTAMEN I SF191, SANNOLIKHETSTEORI OCH STATISTIK, ONSDAGEN DEN 1:A JUNI 216 KL 8. 13.. Kursledare: Thomas Önskog, 8-79 84 55 Tillåtna hjälpmedel: Formel- och tabellsamling i
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Läs merExtremvärden att extrapolera utanför data och utanför teori/modell. Statistik för modellval och prediktion p.1/27
Extremvärden att extrapolera utanför data och utanför teori/modell Statistik för modellval och prediktion p.1/27 Ledning utgjuter sig Centrala Uppsala översvämmades på tisdagskvällen för andra gången den
Läs merFöreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två
Läs merFACIT för Förberedelseuppgifter: SF1911 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 2016 KL Examinator: Timo Koski
FACIT för Förberedelseuppgifter: SF9 STATISTIK FÖR BI0TEKNIK inför tentan MÅDAGEN DEN 9 DECEMBER 206 KL 4.00 9.00. Examinator: Timo Koski - - - - - - - - - - - - - - - - - - - - - - - - 0. FACIT Problem
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE30 Sannolikhet, statistik och risk 207-08-5 kl. 8:30-3:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 03-7725325 Hjälpmedel: Valfri miniräknare.
Läs mer1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att
Läs merKapitel 9 Egenskaper hos punktskattare
Sannolikhetslära och inferens II Kapitel 9 Egenskaper hos punktskattare 1 Egenskaper hos punktskattare En skattare är en funktion av stickprovet och således en slumpvariabel. En bedömning av kvaliteten
Läs merFöreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013
Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)
Läs merF11. Kvantitativa prognostekniker
F11 Kvantitativa prognostekniker samt repetition av kursen Kvantitativa prognostekniker Vi har gjort flera prognoser under kursen Prognoser baseras på antagandet att historien upprepar sig Trenden följer
Läs merLÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp
LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5
Läs merSannolikheter och kombinatorik
Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter
Läs merTentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl
Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
Läs merHärledning av Black-Littermans formel mha allmänna linjära modellen
Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem
Läs merF2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion
Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten
Läs merFöreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
Läs merSF1911: Statistik för bioteknik
SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
Läs merStokastiska processer med diskret tid
Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna
Läs merFöreläsning 8: Konfidensintervall
Föreläsning 8: Konfidensintervall Matematisk statistik Chalmers University of Technology Maj 4, 2015 Projektuppgift Projektet går ut på att studera frisättningen av dopamin hos nervceller och de två huvudsakliga
Läs merFöreläsning 15, FMSF45 Multipel linjär regression
Föreläsning 15, FMSF45 Multipel linjär regression Stas Volkov 2017-11-28 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F15 1/23 Linjär regression Vi har n st par av mätvärden (x i, y i ), i = 1,..., n
Läs merTentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE31 Sannolikhet, statistik och risk 218-1-12 kl. 8:3-13:3 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 31-7725325 Hjälpmedel: Valfri miniräknare.
Läs merKap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen
Kap 6: Normalfördelningen Normalfördelningen Normalfördelningen som approximation till binomialfördelningen σ μ 1 Sats 6 A Om vi ändrar läge och/eller skala på en normalfördelning så har vi fortfarande
Läs mer8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR
8. NÅGRA SPECIELLA KONTINUERLIGA SANNOLIKHETSFÖRDELNINGAR 8.1 Normalfördelningen Den kanske viktigaste och mest kända sannolikhetsfördelning är den s k normalfördelningen. Den har en mycket stor betydelse
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.
Läs merTAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära
TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära Martin Singull Matematisk statistik Matematiska institutionen TAMS65 - Mål Kursens övergripande mål är att ge
Läs merProvmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Läs mera) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.
Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, TISDAGEN DEN 14:E MARS 017 KL 08.00 13.00. Examinator: Thomas Önskog, 08 790 84 55. Tillåtna hjälpmedel: Formel- och tabellsamling
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)
Läs merSF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29 Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer
Läs merRepetitionsföreläsning
Slumpförsök Repetitionsföreläsning Föreläsning 15 Sannolikhet och Statistik 5 hp Med händelser A B... avses delmängder av ett utfallsrum. Slumpförsök = utfallsrummet + ett sannolikhetsmått P. Fredrik Jonsson
Läs merMonte Carlo-metoder. Bild från Monte Carlo
Monte Carlo-metoder 0 Målen för föreläsningen På datorn Bild från Monte Carlo http://en.wikipedia.org/wiki/file:real_monte_carlo_casino.jpg 1 Begrepp En stokastisk metod ger olika resultat vid upprepning
Läs merTMS136. Föreläsning 4
TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,
Läs merTAMS17/TEN1 STATISTISK TEORI FK TENTAMEN ONSDAG 10/ KL
TAMS17/TEN1 STATISTISK TEORI FK TENTAMEN ONSDAG 1/1 18 KL 8.-13.. Examinator och jourhavande lärare: Torkel Erhardsson, tel. 8 14 78. Tillåtna hjälpmedel: Formelsamling i matematisk statistik utgiven av
Läs merSF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018
SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 14-15 PASSNING AV FÖRDELNING: χ 2 -METODER. Tatjana Pavlenko 14 maj 2018 PLAN FÖR DAGENS FÖRELÄSNING Icke-parametriska metoder. (Kap. 13.10) Det
Läs mer