Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Relevanta dokument
Föreläsning G70 Statistik A

Föreläsning G70 Statistik A

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Föreläsning G04: Surveymetodik

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

F10 ESTIMATION (NCT )

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Föreläsning 5. Kapitel 6, sid Inferens om en population

S0005M V18, Föreläsning 10

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

1. Test av anpassning.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Grundläggande matematisk statistik

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

================================================

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

TMS136: Dataanalys och statistik Tentamen med lösningar

a) Beräkna E (W ). (2 p)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 5

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

4.2.3 Normalfördelningen

Introduktion till statistik för statsvetare

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

θx θ 1 om 0 x 1 f(x) = 0 annars

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Tentamen i Matematisk statistik för V2 den 28 maj 2010

2. Konfidensintervall för skillnaden mellan två proportioner.

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Datorövning 2 Fördelningar inom säkerhetsanalys

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Avd. Matematisk statistik

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

SAMMANFATTNING TAMS65

TENTAMEN I MATEMATISK STATISTIK

Tentamen i matematisk statistik

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Statistik 1 för biologer, logopeder och psykologer

Tentamen i matematisk statistik

Föreläsning G60 Statistiska metoder

Matematisk statistik TMS063 Tentamen

Datorövning 2 Fördelningar inom säkerhetsanalys

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Laboration 5: Konfidensintervall viktiga statistiska fördelningar

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning 2: Punktskattningar

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

95%-igt konfidensintervall för andel kalsongbärare i populationen: Slutsats: Med 95% säkerhet finns andelen kalsongbärare i intervallet 38-48%

Statistik för bioteknik SF1911 // KTH Matematisk statistik // Formler och tabeller. 1 Numeriska sammanfattningar (statistikor)

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Lösningsförslag

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

101. och sista termen 1

a. Nej, eftersom alla utfall inte har samma sannolikhet. Förutsättningarna enligt första stycket på sida 12 är inte uppfyllda.

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Transkript:

Föreläsig 6 732G70, 732G01 Statistik A Föreläsigsuderlage är baserade på uderlag skriva av Karl Wahli

Kapitel 6 Iferes om e populatio Sid 151-185

Puktskattig och itervallskattig Statistisk iferes om populatiosmedelvärde Puktskattig: att aväda e stickprovsstatistika som e uppskattig av motsvarade populatiosparameter Dock: stickprovsstatistikor är slumpvariabler och atar olika värde för varje stickprov. Hur ska vi hatera de osäkerhete? Vi ka bilda ett kofidesitervall för populatiosmedelvärdet: vi lägger ett osäkerhetsitervall krig puktskattige vilket tillåter oss att med e viss säkerhet säga att de okäda populatiosparameter täcks av itervallet. 3

Dubbelsidigt kofidesitervall för populatiosmedelvärde med hjälp av ormalfördelig Två fall: 1. OSU där > 30. X ka vara fördelad hur som helst, σ ka vara käd eller okäd 2. OSU där < 30. X måste vara ormalfördelad och populatiosstadardavvikelse σ måste vara käd. Dubbelsidigt kofidesitervall med kofidesgrad 1 - α: x ± z där z-värde hämtas frå ormalfördeligstabell (bilaga B) 1 α / 2 I praktike ovaligt att populatiosstadardavvikelse σ är käd! σ 4

Exempel Ett slumpmässigt urval (OSU) om 40 studeter vid Liköpigs uiversitet ger medelålder 21.2 år och stadardavvikelse 4.4 år. Bestäm ett itervall som med 95 procets säkerhet täcker de saa medelålder blad studerade vid Liköpigs uiversitet. 5

Ekelsidiga kofidesitervall för populatiosmedelvärde m.h.a. ormalfördelig Nedåt begräsat kofidesitervall: Uppåt begräsat kofidesitervall: σ µ > x z1 α σ µ < x + z1 α Exempel: Styrelse i e bostadsrättsföreig får i klagomål på att golvvärme i badrumme är för låg. Ma drar ett OSU om 35 badrum och mäter golvvärme där. Medeltemperature beräkas till 21 grader och stadardavvikelse till 1.6 grader. Eergimydighete rekommederar att golvvärme ska ligga på mist 20 grader för att ma ska udkomma problem med fuktskador. Föreligger risk för fuktskador i föreiges badrum? 6

Kofidesitervall för populatiosmedelvärde m.h.a. t- fördelig Krav: OSU där < 30. X måste vara ormalfördelad, me populatiosstadardavvikelse σ är okäd. Dubbelsidigt kofidesitervall med kofidesgrad 1 - α: x ± t 1;1 α / 2 Nedåt begräsat kofidesitervall med kofidesgrad 1 - α: µ > 1 x t 1; α Uppåt begräsat kofidesitervall med kofidesgrad 1 - α: µ < 1 x + t 1; α där t-värde hämtas frå t-fördeligstabell (bilaga B) s s s 7

t-fördelige t-fördelige aväds för att lösa likade typer av problem som ormalfördelige, me lämpar sig är variabel är ormalfördelad, stickprovet är relativt litet och populatiosstadardavvikelse är okäd. t-fördelige är precis som ormalfördelige symmetrisk. t-fördelige defiieras av atalet frihetsgrader, eller eklare uttryckt atalet oberoede bitar av iformatio. Atalet frihetsgrader bestäms av atalet observatioer () mius atalet skattade parametrar (exempelvis µ). E viktig egeskap hos t-fördelige är att de ärmar sig (kovergerar mot) ormalfördelige är atalet frihetsgrader ökar. E valig tumregel är att betrakta t-fördelige som approximativt ormalfördelad om stickprovet består av 30 eheter eller fler. Frihetsgrader 5 50 5000 8-5 -4-3 -2-1 0 1 2 3 4 5

Exempel Ett slumpmässigt urval (OSU) om 20 studeter vid Liköpigs uiversitet ger medelålder 21.2 år och stadardavvikelse 4.4 år. Atag att ålder är e ormalfördelad variabel. Bestäm ett itervall som med 95 procets säkerhet täcker de saa medelålder blad studerade vid Liköpigs uiversitet. 9

Kofidesitervall för populatiosadel med hjälp av ormalfördelig Krav: OSU där p(1-p) > 5 Dubbelsidigt kofidesitervall för populatiosadele π: ( p) p 1 p ± z1 α / 2 där värdet på z hämtas ur ormalfördeligstabelle (Appedix B) Nedåt begräsat kofidesitervall: π > p z 1 α p ( 1 p) Uppåt begräsat kofidesitervall: π < p + z 1 α p ( 1 p) 10

Exempel I e hälsoekät tillfrågades 100 slumpmässigt utvalda aställda vid ett stort företag om huruvida ma regelbudet motioerar eller ej. Svar erhölls frå 84 aställda och av dessa svarade 65 ja. Bestäm ett 95-procetigt kofidesitervall för adele av de aställda vid det stora företaget som regelbudet motioerar. 11

Hypotesprövig Vi ställer upp två motsatta hypoteser Nollhypotese (de vi ite tror på och hoppas på att kua förkasta) Alterativhypotese/mothypotese (de vi tror på; om vi ka förkasta ollhypotese har vi stöd för alterativhypotese) Vi udersöker om det är troligt att få värdet på vårt stickprovsmedelvärde (exempelvis) om ollhypotese är sa. Är det troligt ka vi ite förkasta ollhypotese. Är det ej troligt ka vi förkasta ollhypotese. Exempel: I ett OSU omfattade 40 persoer blad medlemmara i ett politiskt parti i e regio är medelålder 42.3 år och stadardavvikelse 7.1 år. Testa på 5% sigifikasivå om medelålder blad medlemmara i partiet uderstiger 45 år. 12

Hypotesprövig om populatiosmedelvärde Steg 1: Formulera hypoteser och välj sigifikasivå H 0 : µ = µ 0 Nollhypotes H a : µ > µ 0 H a : µ < µ 0 Tre sorters mothypoteser. Valet av ekelsidig eller dubbelsidig mothypotes bestäms av frågeställige H a : µ µ 0 α = sigifikasivå = riske att förkasta H0 trots att H 0 är sa Valiga värde på α: 5%, 1% eller 10% (jämför kofidesivå 95%, 99% eller 90%) 13

Hypotesprövig om populatiosmedelvärde Steg 2: Bestäm testvariabel z = x µ σ / z väljs vid > 30, eller < 30 om ormalfördelat X samt käd varias t väljs vid < 30 om ormalfördelat X samt okäd varias Steg 3: Ska vi tro på H 0 eller H a? Udersök om testvariabel faller i acceptasområde (förkasta ej H 0 ) eller i kritiskt område (förkasta H 0 ) Om H a : µ < µ 0 ligger det kritiska området till väster om det kritiska värdet z α resp. t -1;α Om H a : µ > µ 0 ligger det kritiska området till höger om det kritiska värdet t 1-α resp. t -1;1-α Om H a : µ µ 0 har vi kritiska område både till väster och höger om de kritiska värdea som är z α/2 resp. t -1;α/2 samt z 1-α/2 resp. t -1;1-α/2 Steg 4: Dra slutsats 0 t = x µ 0 s / 14

Hypotesprövig för populatiosadel Krav: OSU där p(1-p) > 5 Steg 1: Formulera hypoteser och välj sigifikasivå H 0 : π = π 0 H a : π > π 0 H a : π < π 0 H a : π π 0 Steg 2: Bestäm testvariabel z = π p π 0 ( 1 π ) 0 0 15

Hypotesprövig för populatiosadel Steg 3: Ska vi tro på H 0 eller H a? Om H a : π < π 0 ligger det kritiska området till väster om det kritiska värdet z α Om H a : π > π 0 ligger det kritiska området till höger om det kritiska värdet z 1-α Om H a : π π 0 har vi kritiska område både till väster och höger om de kritiska värdea som är z α/2 respektive z 1-α/2 Steg 4: Dra slutsats 16

Exempel I e hälsoekät tillfrågades 100 slumpmässigt utvalda aställda vid ett stort företag om huruvida ma regelbudet motioerar eller ej. Svar erhölls frå 84 aställda och av dessa svarade 65 ja. Tidigare erfarehet har visat att 80% motioerar. Udersök om det på 5% sigifikasivå fis belägg för påståedet att adele regelbuda motioärer blad de aställda vid företaget skiljer sig frå 80%. 17

Ska vi tro på H0 eller Ha? p-värdesmetode p-värde = saolikhete för att vår testvariabel ska ata ett värde som det vi observerat eller äu lägre ifrå μ 0 sett i de riktig som mothypotese pekar, givet att H 0 är sa. Om p-värdet är litet är H 0 osaolik: vi är då mer beäga att tro på H a Beslutsregel: om p-värdet < sigifikasivå α förkastas H 0 Vid dubbelsidig mothypotes beräkas p-värdet som saolikhete frå tabelle * 2 Exempel: I e hälsoekät tillfrågades 100 slumpmässigt utvalda aställda vid ett stort företag om huruvida ma regelbudet motioerar eller ej. Svar erhölls frå 84 aställda och av dessa svarade 65 ja. Udersök om det på 5% sigifikasivå fis belägg för påståedet att adele regelbuda motioärer blad de aställda vid företaget skiljer sig frå 85% geom att beräka testets p-värde. 18

Relatio mella hypotesprövig och kofidesitervall Om µ 0 (för adelar π 0 ) igår i itervallet ka H 0 ej förkastas. Vid H a : µ < µ 0 (för adelar H a : π < π 0 ) udersöker vi om µ 0 (π 0 ) igår i ett uppåt begräsat kofidesitervall Vid H a : µ > µ 0 (för adelar H a : π > π 0 ) udersöker vi om µ 0 (π 0 ) igår i ett edåt begräsat kofidesitervall Vid H a : µ µ 0 (för adelar H a : π π 0 ) udersöker vi om µ 0 (π 0 ) igår i ett dubbelsidigt kofidesitervall 19

Feltyper och styrka Typ I-fel: Att förkasta H 0 fast H 0 faktiskt är sa Typ II-fel: Att ite förkasta H 0 fast H a faktiskt är sa Sigifikasivå = α: saolikhete (riske) för typ I-fel Beslut baserat på stickprov Saig om populatioe H0 sa H a sa Förkasta H0 Typ I-fel Korrekt beslut Acceptera H0 Korrekt beslut Typ II-fel Det råder ett motsatsförhållade mella riske för Typ I-fel och riske för Typ II-fel: miskar vi sigifikasivå (= riske för Typ I-fel) ökar riske för Typ II-fel. Iom samhällsveteskapera brukar ma ase att α = 0.05, 0.01 eller 0.10 ger e bra avvägig mella typera av fel. 20