Laboration 3: Icke-parametrisk korrelations- och regressionsanalys
|
|
- Bo Samuelsson
- för 5 år sedan
- Visningar:
Transkript
1 STOCKHOLMS UNIVERSITET 7 oktober 2004 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Laboration 3: Icke-parametrisk korrelations- och regressionsanalys I den här laborationen skall vi analysera sambandet mellan två variabler genom att beräkna några av de vanligaste icke-parametriska korrelationskoefficienterna och testa om de är skilda från noll. Vi skall även skatta lutningen i en linjär regressionsmodell. Instruktionerna är skrivna för MATLAB, men det går bra att lösa uppgifterna med hjälp av annan programvara om man så önskar. I första avsnittet gås ett exempel igenom i detalj, precis som tidigare, och i andra avsnittet finns själva uppgiften. 1 Introduktion I det här avsnittet skall vi analysera följande problem: Vid en försöksfarm i England genomfördes ett försök där man ville undersöka sambandet mellan lufttemperaturen och fetthalten i mjölk från ett antal utegåe mjölkkor. Under femton dagar i april uppmättes därför dygnsmedeltemperaturen (i C ) och genomsnittlig fetthalt (i %) i mjölken enligt Temp Fetthalt Temp Fetthalt Börja med att mata in data i MATLAB i vektorerna x och y. För att skaffa oss en uppfattning om hur variablerna är kopplade till varandra kan vi åskådliggöra datamaterialet i ett punktdiagram enligt >> plot(x,y, o ) Som vi ser finns det en antydan till avtagande fetthalt med stigande temperatur, men långt ifrån uppenbar. 1
2 1.1 Pearsons korrelationskoefficient Vi börjar som tidigare med att analysera problemet under den klassiska förutsättningen att data kommer från en bivariat normalfördelning. Pearsons korrelationskoefficient ρ p kan enkelt uppskattas enligt >> cm=corrcoef([x y ]) cm = >> rp=cm(1,2) rp = Funktionen corrcoef(a) ger en korrelationsmatris för kolumnerna i matrisen A. Vi måste alltså först skapa en matris innehållande x och y som kolumner, vilket vi kan åstadkomma genom kommandot [x y ]. Apostroferna är nödvändiga därför att x och y är definierade som radvektorer. Vi vill nu testa hypoteserna H 0 : ρ p = 0 H 1 : ρ p 0 Under H 0 gäller att T = n 2rp 1 r 2 p är t-fördelad med n 2 frihetsgrader. Det innebär att vi kan beräkna p-värdet enligt >> T=sqrt(13)*rp/sqrt(1-power(rp,2)) T = >> 2*tcdf(T,13) Här måste vi multiplicera med 2 eftersom vi utför ett tvåsidigt test. 2
3 1.1.1 Bootstrap av Pearsons korrelationskoefficient Bootstrap-simulering ger oss möjligheten att inte bara utföra ovanståe test utan normalfördelningsantagande men även beräkna konfidensintervall, vilket annars är ganska komplicerat. Vi börjar som vanligt med att generera bootstrap-stickprov enligt >> slump=ceil(rand(1000,15)*15); bootstrapx(i,:)=x(slump(i,:)); bootstrapy(i,:)=y(slump(i,:)); Notera att vi använder samma slumpmatris för att generera båda uppsättningarna bootstrapstickprov. Det beror på att observationerna i de ursprungliga stickproven är parvis kopplade och måste förbli så för att inte förstöra beroestrukturen och därmed ge missvisande korrelationskoefficienter. Därefter skattar vi Pearsons ρ p för varje bootstrap-stickprov enligt cm=corrcoef([bootstrapx(i,:) bootstrapy(i,:) ]); pearson(i)=cm(1,2); >> pearson=sort(pearson); Vi åskådliggör fördelningen enligt >> hist(pearson,-1:.05:1) beräknar p-värdet enligt >> 2*sum(pearson>=0)/ och gränserna i ett 95 %-igt konfidensintervall enligt >> pearson(25) >> pearson(975)
4 1.2 Spearmans korrelationskoefficient För att kunna uppskatta Spearmans ρ s behöver vi först bestämma rangerna för respektive stickprov enligt >> r=tiedrank(x) >> s=tiedrank(y) Som vi ser förekommer inga ties, vilket innebär att vi kan beräkna r s enligt formeln r s = 1 6T n(n 2 1) där T = n i=1 (r i s i ) 2. Detta gör vi nu enkelt genom >> T=sum(power(r-s,2)) T = 764 >> rs=1-6*t/(15*(power(15,2)-1)) rs = För att testa hypoteserna H 0 : ρ s = 0 H 1 : ρ s 0 behöver vi fördelningen för r s under H 0. Teoretiskt sett kan vi bestämma den genom att beräkna r s för samtliga n! permutationer av y-vektorn. I vårt fall skulle det innebära totalt 15! = permutationer, vilket är fullkomligt orealistiskt. Ett sätt att förenkla detta är att välja exempelvis 1000 av dessa permutationer slumpmässigt och beräkna r s. Vi får då bara en approximation av den fullständiga fördelningen, som dessutom är slumpmässig, men det förkortar beräkningstiden väsentligt. Vill man få bättre precision går det naturligtvis bra att utöka antalet simuleringar. I MATLAB kan man enkelt generera slumpmässiga permutationer genom kommandot randperm(n) enligt följande perms(i,:)=randperm(15); Detta ger oss en slumpmatris perms vars 1000 rader består av slumpmässiga permutationer av heltalen 1, 2,..., 15. Värdena för r s fås nu som rs0(i)=1-6*sum(power(r-perms(i,:),2))/(15*(power(15,2)-1)); >> hist(rs0,-1:.05:1) 4
5 Vi får nu p-värdet enligt >> 2*sum(rs0<=rs)/ För stora stickprov kan vi använda oss av resultatet att T = n 2rs 1 r 2 s är approximativt t-fördelat med n 2 frihetsgrader. Detta ger ett approximativt p-värde enligt >> T=sqrt(13)*rs/sqrt(1-power(rs,2)) T = >> 2*tcdf(T,13) vilket överensstämmer ganska bra med approximationen ovan Bootstrap av Spearmans korrelationskoefficient Vi kan naturligtvis tillämpa bootstrap-simulering även på Spearmans ρ s. Nackdelen är att eftersom sannolikheten är stor att vi väljer samma observation flera gånger måste vi ta hänsyn till ties och kan därför inte använda formeln för r s ovan. Däremot kan vi använda funktionen corrcoef eftersom Spearmans ρ s kan betraktas som Pearsons ρ p tillämpat på rangerna även då vi har ties. I MATLAB kan vi beräkna detta enligt >> slump=ceil(rand(1000,15)*15); bootstrapr(i,:)=tiedrank(x(slump(i,:))); bootstraps(i,:)=tiedrank(y(slump(i,:))); och sedan beräkna r s för varje bootstrap-stickprov enligt cm=corrcoef([bootstrapr(i,:) bootstraps(i,:) ]); spearman(i)=cm(1,2); >> spearman=sort(spearman); 5
6 Ett histogram för fördelningen ges av >> hist(spearman,-1:.05:1) vi får p-värdet enligt >> 2*sum(spearman>=0)/ och gränserna i ett 95 %-igt konfidensintervall enligt >> spearman(25) >> spearman(975) Kalls korrelationskoefficient Som bekant bygger uppskattningen av Kalls τ k på antal konkordanser n c och antal diskordanser n d. Enligt boken kan dessa beräknas genom att betrakta antal positiva och negativa skillnader s j s i då i = 1, 2,..., n 1 och j > i om r i = i. Det innebär att vi först måste sortera r 1, r 2,..., r n i storleksordning enligt >> [r,ord]=sort(r); >> s=s(ord); Genom att ange två vektorer r och ord där resultatet av sorteringen skall lagras, får vi de sorterade värdena i r och själva ordningen i indexvektorn ord. Denna vektor är viktig för att kunna ordna rangerna i s så att de fortfarande överensstämmer med rangerna i r parvis. Nu kan vi beräkna antalet konkordanser och diskordanser enligt >> nc=0; >> nd=0; >> for i=1:14 for j=i+1:15 if s(j)-s(i)>0 nc=nc+1; if s(j)-s(i)<0 nd=nd+1; 6
7 Kommandot if anger att det andra uttrycket skall utföras om det första uttrycket är uppfyllt. Nu får vi t k enligt formeln t k = n c n d n(n 1)/2 vilket i MATLAB blir >> tk=(nc-nd)/(15*14/2) tk = För att testa hypoteserna H 0 : τ k = 0 H 1 : τ k 0 behöver vi även här teoretiskt sett betrakta samtliga n! permutationer av rangerna. Eftersom detta är praktiskt omöjligt skall vi även här approximera genom att välja permutationer slumpmässigt enligt perms(i,:)=randperm(15); och sedan beräkna r s för samtliga dessa permutationer enligt >> for k=1:1000 nc=0; nd=0; for i=1:14 for j=i+1:15 if perms(k,j)-perms(k,i)>0 nc=nc+1; if perms(k,j)-perms(k,i)<0 nd=nd+1; tk0(k)=(nc-nd)/(15*14/2); Vi får histogram över fördelningen enligt >> hist(tk0,-1:.05:1) och p-värdet enligt >> 2*sum(tk0<=tk)/
8 Vi kan också få ett approximativt p-värde genom att använda oss av det faktum att Z = 3t k n(n 1) 2(2n + 5) är approximativt standard normalfördelat för stora stickprov. Detta innebär att p-värdet kan beräknas enligt >> Z=3*tk*sqrt(15*14)/sqrt(2*35) Z = >> 2*normcdf(Z,0,1) vilket ligger nära vår första uppskattning. Vi gör ingen bootstrap-simulering för Kalls τ k eftersom det är betydligt mer komplicerat att hantera ties i det fallet. 1.4 Linjär regression Slutligen skall vi se hur vi kan analysera lutningen β i en linjär regressionsmodell y i = α + βx i + ε i i = 1, 2,..., n både parametriskt och icke-parametriskt. Under normalfördelningsantagande kan vi få ML-skattning av lutningen β med konfidensintervall genom kommandot regress i MATLAB enligt >> [b,bint]=regress(y,[ones(15,1) x ],.05) b = bint = Vi går inte genom i detalj hur regress fungerar eftersom det parametriska fallet bara tjänar som referensfall. Hursomhelst innehåller vektorn b ML-skattningar av α och β medan bint innehåller 95 %-iga konfidensintervall. Sammanfattningsvis får vi alltså ˆβ = och β (95%) 8
9 Den lämpligaste metoden att skatta β och ta fram konfidensintervall i det icke-parametriska fallet är Thiel-Kalls metod som är nära förknippad med Kalls τ k. Vi behöver först alla parvisa lutningar b ij = y j y i x j x i i = 1, 2,..., n 1; j > i vilket i MATLAB kan beräknas enligt >> b=[]; >> for i=1:14 for j=i+1:15 b=[b (y(j)-y(i))/(x(j)-x(i))]; >> b=sort(b); En skattning av β ges nu av medianen >> median(b) För att få ett konfidensintervall behöver vi först ett acceptansområde för T t (b) = n c n d Eftersom T t (b) skiljer sig från Kalls τ k enbart genom nämnaren n(n 1)/2 kan vi få fördelningen för T t (b) under hypotesen H 0 : β = 0 enligt >> T=tk0*15*14/2; Av numeriska skäl kan det bli så att T inte bara innehåller heltalsvärden, men detta kan åstadkommas genom kommandot >> T=round(T); Kommandot round avrundar alla värden till närmaste heltal. Genom att sedan pröva sig fram får man acceptansområdet >> sum(t>=-37 & T<=37)/ (Tänk på att T t (b) ast innehåller udda heltal.) Observera att detta resultat bygger på slumptalsapproximation så era resultat kan variera något. Eftersom n c + n d = n(n 1)/2 = 15 14/2 = 105 medför exempelvis T t (b) = 37 att n d = (105 37)/2 = 34. Vi skall alltså förkasta de 34 minsta och de 34 största värdena bland b ij, vilket innebär att gränserna i konfidensintervallet ges av 9
10 >> b(35) >> b(71) Uppgift År 1970 gjordes en världsomspännande undersökning för att statistiskt försöka belägga ett samband mellan tobakskonsumtion och förekomsten av hjärt- och kärlsjukdomar. Statistik över genomsnittligt antal cigarretter per år och vuxen invånare samt dödligheten i hjärt- och kärlsjukdom per invånare i åldrarna år samlades in för 21 olika länder. Resultatet blev: Land Antal cig./år Dödlighet Australien Belgien Danmark Finland Frankrike Grekland Irland Island Italien Kanada Mexiko Nederländerna Norge Nya Zeeland Schweiz Spanien Storbritannien Sverige USA Västtyskland Österrike Undersök om det finns en positiv korrelation mellan tobakskonsumtion och hjärt- och 10
11 kärlsjukdomar genom att beräkna 1) Pearsons, 2) Spearmans och 3) Kalls korrelationskoefficient samt 4) lutningen i en linjär regressionsmodell med Thiel-Kalls metod. Beräkna även p-värden för test av hypotesen att det inte finns någon korrelation med Monte Carlosimulering och normalapproximation för Spearman och Kall och bootstrap-simulering för Pearson och Spearman. I bootstrap-fallet skall även 95 %-iga konfidensintervall beräknas. Slutligen skall p-värden för ingen lutning i regressionsmodellen och konfidensintervall för lutningen beräknas med Thiel-Kalls metod. I den skriftliga redovisningen skall ingå p-värden för alla test, övre och undre gräns i konfidensintervallen och histogram över fördelningarna för de olika korrelationskoefficienterna både under hypotesen om ingen korrelation och i bootstrap-simuleringarna. Dessutom skall en jämförelse göras mellan de fyra metoderna och en diskussion angåe vilken/vilka som kan anses mest lämplig/lämpliga för det aktuella datamaterialet ingå. 11
Laboration 1: Icke-parametriska enstickprovstest
STOCKHOLMS UNIVERSITET 8 september 2004 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Laboration 1: Icke-parametriska enstickprovstest Syftet med denna datorlaboration är ni
Läs merSF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011
Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i
Läs merPreliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden
Läs merGör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).
Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merLaboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
Läs merFöreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
Läs merförstå modellen enkel linjär regression och de antaganden man gör i den Laborationen är dessutom en direkt förberedelse inför Miniprojekt II.
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 2, 6 DECEMBER 2017 Syfte Syftet med den här laborationen är att du ska
Läs merHöftledsdysplasi hos dansk-svensk gårdshund
Höftledsdysplasi hos dansk-svensk gårdshund Sjö A Sjö B Förekomst av parasitdrabbad öring i olika sjöar Sjö C Jämföra medelvärden hos kopplade stickprov Tio elitlöpare springer samma sträcka i en för dem
Läs merF13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
Läs merTentamen för kursen. Linjära statistiska modeller. 17 februari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 17 februari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312,
Läs merFORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD Sannolikhetsteori. Beskrivning av data. Läges-, spridnings- och beroendemått
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING MATEMATISK STATISTIK FÖR W; FMSF75 UPPDATERAD 208-08-26 Sannolikhetsteori Följande gäller för sannolikheter: 0 P(A P(Ω = P(A
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs merMatematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,
Läs merSTOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på
Läs merSyftet med den här laborationen är att du skall bli mer förtrogen med det i praktiken kanske viktigaste området inom kursen nämligen
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 6 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 6: Regression Syftet med den här laborationen är att du skall bli
Läs merTAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval
TAMS65 - Föreläsning 11 Regressionsanalys fortsättning Modellval Martin Singull Matematisk statistik Matematiska institutionen Innehåll Repetition (t-test för H 0 : β i = 0) Residualanalys Modellval Framåtvalsprincipen
Läs merF18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT
Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är
Läs merMedicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Läs mer1 Förberedelseuppgifter
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMS086 & MASB02 Syfte: Syftet med dagens laborationen är att du skall: bli
Läs merLaboration 4 R-versionen
Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner
Läs merLaboration 2: Styrkefunktion samt Regression
Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens
Läs merTenta i Statistisk analys, 15 december 2004
STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik, ML 15 december 004 Lösningar Tenta i Statistisk analys, 15 december 004 Uppgift 1 Vi har två stickprov med n = 5 st.
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel
Läs merTAMS65. Formel- och tabellsamling i matematisk statistik TAMS65. Martin Singull TAMS65 TAMS65
Formel- och tabellsamling i matematisk statistik Martin Singull Innehåll 4.1 Multipel regression.............................. 15 1 Sannolikhetslära 7 1.1 Några diskreta fördelningar.........................
Läs merFÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik
Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende
Läs merRättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal
Läs merAMatematiska institutionen avd matematisk statistik
Kungl Tekniska Högskolan AMatematiska institutionen avd matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR B OCH K FREDAGEN DEN 11 JANUARI 2002 KL 14.00 19.00. Examinator: Gunnar
Läs merLycka till!
Avd. Matematisk statistik TENTAMEN I 5B1503 STATISTIK MED FÖRSÖKSPLANERING FÖR K OCH B MÅNDAGEN DEN 25 AUGUSTI 2003 KL 14.00 19.00. Examinator: Gunnar Englund, 790 7416. Tillåtna hjälpmedel: Formel- och
Läs merSannolikheter och kombinatorik
Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter
Läs merBild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Läs merMatematisk statistik KTH. Formelsamling i matematisk statistik
Matematisk statistik KTH Formelsamling i matematisk statistik Vårterminen 2017 1 Kombinatorik ) n n! = k k! n k)!. Tolkning: mängd med n element. ) n = antalet delmängder av storlek k ur en k 2 Stokastiska
Läs merLunds tekniska högskola Matematikcentrum Matematisk statistik. FMS035: Matematisk statistik för M Datorlaboration 5
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS035: Matematisk statistik för M Datorlaboration 5 Syfte Syftet med dagens laboration är att du ska lära dig tolka ett av de vanligaste beroendemåtten
Läs merFöreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
Läs merFÖRELÄSNING 8:
FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data
Läs merTMS136. Föreläsning 10
TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis
Läs merTabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer
Tabell- och formelsamling A4 Grundläggande Statistik A8 Statistik för ekonomer Observera att inga anteckningar får finnas i formelsamlingen vid tentamenstillfället Thommy Perlinger 17 september 2015 Innehåll
Läs merAvd. Matematisk statistik
Avd. Matematisk statistik TENTAMEN I 5B508 MATEMATISK STATISTIK FÖR S TISDAGEN DEN 20 DECEMBER 2005 KL 08.00 3.00. Examinator: Gunnar Englund, tel. 790 746. Tillåtna hjälpmedel: Formel- och tabellsamling
Läs merObligatorisk uppgift, del 1
Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten
Läs merTAMS65 - Seminarium 4 Regressionsanalys
TAMS65 - Seminarium 4 Regressionsanalys Martin Singull Matematisk statistik Matematiska institutionen Problem 1 PS29 Vid ett test av bromsarna på en bil bromsades bilen upprepade gånger från en hastighet
Läs merMatematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 9 Joakim Lübeck (Johan Lindström 25 september 217 Johan Lindström - johanl@maths.lth.se FMSF7/MASB2 F9 1/23 Repetition Inferens för diskret
Läs merFöreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
Läs merFORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02 Sannolikhetsteori Följande gäller för sannolikheter:
Läs merTentamen för kursen. Linjära statistiska modeller. 27 oktober
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 27 oktober 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merInstitutionen för teknikvetenskap och matematik, S0001M LABORATION 2
Institutionen för teknikvetenskap och matematik, S0001M LABORATION 2 Laborationen avser att illustrera användandet av normalfördelningsdiagram, konfidensintervall vid jämförelser samt teckentest. En viktig
Läs merAutokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
Läs merMatematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 15 Johan Lindström 4 december 218 Johan Lindström - johanl@maths.lth.se FMSF45/MASB3 F15 1/28 Repetition Linjär regression Modell Parameterskattningar
Läs merTentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2016-06-03 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande
Läs merF12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24
1/24 F12 Regression Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/2 2013 2/24 Dagens föreläsning Linjära regressionsmodeller Stokastisk modell Linjeanpassning och skattningar
Läs meroberoende av varandra så observationerna är
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n
Läs merKorrelation och autokorrelation
Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.
Läs merLaboration 3: Enkla punktskattningar, styrkefunktion och bootstrap
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 3, HT -06 MATEMATISK STATISTIK FÖR F, PI OCH NANO, FMS 012 MATEMATISK STATISTIK FÖR FYSIKER, MAS 233 Laboration 3: Enkla punktskattningar,
Läs merUppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion
Avd. Matematisk statistik TENTAMEN I 5B57 MATEMATISK STATISTIK FÖR T och M ONSDAGEN DEN 9 OKTOBER 25 KL 8. 3.. Examinator: Jan Enger, tel. 79 734. Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk
Läs merHärledning av Black-Littermans formel mha allmänna linjära modellen
Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem
Läs merLaboration 4 Regressionsanalys
Matematikcentrum Matematisk Statistik Lunds Universitet MASB11 VT14, lp4 Laboration 4 Regressionsanalys 2014-05-21/23 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner som finns
Läs merFormler och tabeller till kursen MSG830
Formler och tabeller till kursen MSG830 Deskriptiva mått För ett datamängd x 1,, x n denieras medelvärde standardavvikelse standardfelet (SEM) Sannolikheter x = 1 n n i=1 = x 1 + + x n n s = 1 n (x i x)
Läs merMatematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer
Lunds universitet Matematikcentrum Matematisk statistik Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer Information om laborationerna I andra halvan av MASA01 kursen ingår två laborationer.
Läs merTMS136. Föreläsning 13
TMS136 Föreläsning 13 Jämförelser mellan två populationer Hittills har vi gjort konfidensintervall och tester kring parametrar i EN population I praktiska sammanhang är man ofta intresserad av att jämföra
Läs merbli bekant med summor av stokastiska variabler.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 2 MATEMATISK STATISTIK FÖR E FMSF20 Syfte: Syftet med dagens laborationen är att du skall: få förståelse för diskreta, bivariate
Läs merMatematisk statistik KTH. Formel- och tabellsamling i matematisk statistik
Matematisk statistik KTH Formel- och tabellsamling i matematisk statistik Varterminen 2005 . Kombinatorik n = k n! k!n k!. Tolkning: n k mängd med n element. 2. Stokastiska variabler V X = EX 2 EX 2 =
Läs mer0 om x < 0, F X (x) = c x. 1 om x 2.
Avd. Matematisk statistik TENTAMEN I SF193 SANNOLIKHETSLÄRA OCH STATISTIK FÖR 3-ÅRIG Media TIMEH MÅNDAGEN DEN 16 AUGUSTI 1 KL 8. 13.. Examinator: Gunnar Englund, tel. 7974 16. Tillåtna hjälpmedel: Läroboken.
Läs merTENTAMEN I SF2950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 2010 KL
TENTAMEN I SF950 (F D 5B1550) TILLÄMPAD MATEMATISK STATISTIK, TORSDAGEN DEN 3 JUNI 010 KL 14.00 19.00 Examinator : Gunnar Englund, tel. 790 7416, epost: gunnare@math.kth.se Tillåtna hjälpmedel: Formel-
Läs merPrediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval
Läs mer7.3.3 Nonparametric Mann-Whitney test
7.3.3 Nonparametric Mann-Whitney test Vi har sett hur man kan testa om två populationer har samma väntevärde (H 0 : μ 1 = μ 2 ) med t-test (two-sample). Vad gör man om data inte är normalfördelat? Om vi
Läs merLaboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer
Laboration 2 i 5B52, Grundkurs i matematisk statistik för ekonomer Namn: Elevnummer: Laborationen syftar till ett ge information och träning i Excels rutiner för statistisk slutledning, konfidensintervall,
Läs merTentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2015-10-23 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Jesper Martinsson,
Läs merDATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03 Syfte: Syftet med dagens laborationen är att du skall: få förståelse
Läs merBeskrivande statistik
Beskrivande statistik Tabellen ovan visar antalet allvarliga olyckor på en vägsträcka under 15 år. år Antal olyckor 1995 36 1996 20 1997 18 1998 26 1999 30 2000 20 2001 30 2002 27 2003 19 2004 24 2005
Läs merTentamen för kursen. Linjära statistiska modeller. 22 februari
STOCKHOLMS UIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 februari 2017 9 14 Examinator: Ola Hössjer, tel. 070/672 12 18, ola@math.su.se Återlämning: Meddelas via kurshemsida
Läs merlära dig tolka ett av de vanligaste beroendemåtten mellan två variabler, korrelationskoefficienten.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK FMS035: MATEMATISK STATISTIK FÖR M DATORLABORATION 5, 11 MAJ 2012 Syfte Syftet med dagens laboration är att du ska lära dig tolka ett av de
Läs merDemonstration av laboration 2, SF1901
KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion
Läs merDatorövning 1 Enkel linjär regressionsanalys
Datorövning 1 Enkel linjär regressionsanalys Datorövningen utförs i grupper om två personer. I denna datorövning skall ni använda Excel och Minitab för att 1. få en visuell uppfattning om vad ett regressionssamband
Läs merProvmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Läs merAvd. Matematisk statistik
Avd. Matematisk statistik TENTAMEN I SF1913 MATEMATISK STATISTIK FÖR IT OCH ME ONSDAGEN DEN 12 JANUARI 2011 KL 14.00 19.00. Examinator: Camilla Landén, tel. 7908466. Tillåtna hjälpmedel: Formel- och tabellsamling
Läs merDel 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.
STOCKHOLMS UNIVERSITET Statistiska institutionen VT 2009 Tatjana Pavlenko och Bertil Wegmann OBLIGATORISK INLÄMNINGSUPPGIFT STATISTISK TEORI, GK 10 och GK 20:2, heltid, VT 2009 Den obligatoriska inlämningsuppgiften,
Läs merStatistik 1 för biologer, logopeder och psykologer
Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett
Läs merLÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp
LÖSNINGAR TILL Matematisk statistik, Tentamen: 011 10 1 kl 14 00 19 00 Matematikcentrum FMS 086, Matematisk statistik för K och B, 7.5 hp Lunds tekniska högskola MASB0, Matematisk statistik kemister, 7.5
Läs merTillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2
Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning
Läs merLösningar till tentamensskrivning för kursen Linjära statistiska modeller. 14 januari
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Lösningar till tentamensskrivning för kursen Linjära statistiska modeller 14 januari 2010 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se
Läs merFinansmatematik II Kapitel 2 Stokastiska egenskaper hos aktiepriser
STOCKHOLMS UNIVERSITET MATEMATISKA INSTITUTIONEN Avd. för Matematisk statistik Thomas Höglund Version Finansmatematik II Kapitel Stokastiska egenskaper hos aktiepriser Finansmatematik II För att kunna
Läs merTAMS65 DATORÖVNING 2
TAMS65 DATORÖVNING 2 Datorövningen behandlar multipel linjär regression Förberedelser Läs allmänt om regressionsanalys i boken och på föreläsningsanteckningarna Glöm inte att rensa minnet och alla fönster
Läs merExaminationsuppgifter del 2
UMEÅ UNIVERSITET Institutionen för Matematik och Matematisk statistisk Statistik för ingenjörer, poäng, Anders Lundquist 7-- Examinationsuppgifter del Redovisas muntligt den / (Ö-vik) samt / (Lycksele).
Läs mer1 Förberedelseuppgifter
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 4 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03 Syfte: Syftet med den här laborationen är att du skall bli mer
Läs merTabeller. Förklaring till symbolerna i tabellerna. Kategorin är inte relevant för det aktuella landet varför data inte kan finnas.
165 BILAGA A Tabeller Förklaring till symbolerna i tabellerna a m n x Kategorin är inte relevant för det aktuella landet varför data inte kan finnas. Data är inte tillgängligt. Omfattningen är endera försumbar
Läs merLaboration 2: Statistisk hypotesprövning
STOCKHOLMS UNIVERSITET 13 februari 2009 Matematiska institutionen Avd. för matematisk statistik Gudrun Brattström Laboration 2: Statistisk hypotesprövning Huvudsyftet med denna andra datorlaboration är
Läs merLaboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar
Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 3 Matematisk statistik AK för CDIFysiker, FMS012/MASB03, HT15 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla
Läs merSvenska skatter i internationell jämförelse. Urban Hansson Brusewitz
Svenska skatter i internationell jämförelse Urban Hansson Brusewitz Skatt på arbete stabilt högre i Procent av BNP OECD-länderna Övriga skatter Egendomsskatter Inkomstskatt företag Konsumtionsskatter Sociala
Läs merTentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14
STOCKHOLMS UNIVERSITET MT4003 MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik 3 maj 013 Lösningar Tentamen i Tillämpad statistisk analys, GN, 7.5 hp 3 maj 013 kl. 9 14 Uppgift 1 a Eftersom
Läs merLaboration 3: Enkel linjär regression och korrelationsanalys
STOCKHOLMS UNIVERSITET 13 februari 2009 Matematiska institutionen Avd. för matematisk statistik Gudrun Brattström Laboration 3: Enkel linjär regression och korrelationsanalys I sista datorövningen kommer
Läs merEn rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.
En rät linje ett enkelt samband Y β 1 Lutning (slope) β 0 Skärning (intercept) 1 Y= β 0 + β 1 X X En rät linje + slumpbrus Y Y= β 0 + β 1 X + brus brus ~ N(0,σ) X Observationspar (X i,y i ) Y Ökar/minskar
Läs merDatorövning 1: Fördelningar
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS012/MASB03: MATEMATISK STATISTIK, 9 HP, VT-17 Datorövning 1: Fördelningar I denna datorövning ska du utforska begreppen sannolikhet och
Läs merSF1901 Sannolikhetsteori och statistik, VT 2017 Datorlaboration 1 för CELTE2, CTFYS2
Matematisk Statistik SF1901 Sannolikhetsteori och statistik, VT 2017 Datorlaboration 1 för CELTE2, CTFYS2 1 Introduktion Detta är handledningen till Datorlaboration 1, ta med en utskriven kopia av den
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merMatematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression
Matematisk statistik 9 hp, HT-16 Föreläsning 15: Multipel linjär regression Anna Lindgren 28+29 november, 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F15: multipel regression 1/22 Linjär regression
Läs merTentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
Läs merAvd. Matematisk statistik
Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 5:E APRIL 2018 KL 14.00 19.00. Examinator: Thomas Önskog, 08 790 84 55. Tillåtna hjälpmedel: Formel- och tabellsamling
Läs merrepetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF25: MATEMATISK STATISTIK KOMPLETTERANDE PROJEKT DATORLABORATION 1, 14 NOVEMBER 2017 Syfte Syftet med dagens laboration är att du ska träna
Läs merAnalytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Läs merfaderns blodgrupp sannolikheten att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0
Avd. Matematisk statistik TENTAMEN I SF1902 SANNOLIKHETSTEORI OCH STATISTIK, TISDAGEN DEN 9:E JUNI 2015 KL 14.00 19.00. Kursledare och examinator : Björn-Olof Skytt, tel 790 8649. Tillåtna hjälpmedel:
Läs merExempel på tentamensuppgifter
STOCKHOLMS UNIVERSITET 4 mars 2010 Matematiska institutionen Avd. för matematisk statistik Mikael Andersson Exempel på tentamensuppgifter Uppgift 1 Betrakta en allmän I J-tabell enligt 1 2 3 J Σ 1 n 11
Läs mer