Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl. 09.00-13.00



Relevanta dokument
Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

Föreläsning G04: Surveymetodik

Lösningsförslag

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Tentamen i matematisk statistik

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Kompletterande kurslitteratur om serier

Enkel slumpvandring. Sven Erick Alm. 9 april 2002 (modifierad 8 mars 2006) 2 Apan och stupet Passagesannolikheter Passagetider...

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

TMS136: Dataanalys och statistik Tentamen med lösningar

Grundläggande matematisk statistik

F10 ESTIMATION (NCT )

Borel-Cantellis sats och stora talens lag

4.2.3 Normalfördelningen

Föreläsning G70 Statistik A

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Föreläsning G70 Statistik A

1. Test av anpassning.

Datorövning 2 Fördelningar inom säkerhetsanalys

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

(a) om vi kan välja helt fritt? (b) om vi vill ha minst en fisk av varje art? (c) om vi vill ha precis 3 olika arter?

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Tentamen i Flervariabelanalys F/TM, MVE035

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Applikationen kan endast användas av enskilda användare med förtroenderapportering.

MS-A0409 Grundkurs i diskret matematik I

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Datorövning 2 Fördelningar inom säkerhetsanalys

a) Beräkna E (W ). (2 p)

θx θ 1 om 0 x 1 f(x) = 0 annars

Jag läser kursen på. Halvfart Helfart

Matematisk statistik TMS063 Tentamen

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

2. Konfidensintervall för skillnaden mellan två proportioner.

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Lösningsförslag till tentamen i 732G71 Statistik B,

Tentamen i matematisk statistik

Introduktion till statistik för statsvetare

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Funktionsteori Datorlaboration 1

Tentamen i Kunskapsbaserade system, 5p, Data 3

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

För att minimera de negativa hälsokonsekvenserna av tunnelluft finns i dagsläget tre metoder;

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Jag läser kursen på. Halvfart Helfart

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

a utsöndring b upptagning c matspjälkning d cirkulation

Formelblad Sannolikhetsteori 1

Lycka till! I(X i t) 1 om A 0 annars I(A) =

ESBILAC. mjölkersättning för hundvalpar BRUKSANVISNING.

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

Multiplikationsprincipen

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

KMR. mjölkersättning för kattungar BRUKSANVISNING.

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

================================================

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Avd. Matematisk statistik

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

Artificiell intelligens Probabilistisk logik

Tentamen i Matematisk statistik för V2 den 28 maj 2010

Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

TENTAMEN Datum: 16 okt 09

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

Utvärdering av tidigarelagd start av prismätningar i nya radio- och TV-butiker

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

KONSEKVENSANALYS 1 (5) INDIVID ALT ORGANISATION (markera vad bedömningen avser)

2004 Rune Norberg. Måste elimineras! Hur då? Kapitel 9. Variation Olika typer av data Rune Norberg. Kapitel 9

Markanvisningsavtal för och försäljning av fastigheten Gesällen 25

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

S0005M V18, Föreläsning 10

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

TENTAMEN I MATEMATISK STATISTIK

Transkript:

0.01.007 Tetame i Statistik, STA A13 Deltetame, 5p 0 jauari 007, kl. 09.00-13.00 Tillåta hjälpmedel: Bifogad formel- och tabellsamlig (skall retureras) samt miiräkare. Asvarig lärare: Haah Hall Övrigt: Varje uppgift ka ge ma 10p. Lösigar skall utasvårighet kua följas. Iförda beteckigar skall förklaras. För betyget Godkäd krävs mist 30 p och för Väl godkäd krävs 45 p. Uppgift 1 a) Vad är e så kallad 0/1 slumpvariabel? Beskriv med hjälp av ett eempel. ( poäg) b) Vad blir vätevärdet av e s.k. 0/1 slumpvariabel? Gör ett bevis, dvs. E( X ) =... (3 poäg) c) Ett slumpmässigt urval av 1100 studet (på uiversitetsivå) frågades om deras alkoholvaor; 775 svarade att de 'dricker för att bli berusad' mist e gåg om måade. Om vi låt p = = πˆ beskriver adele som har svarat de 'dricker för att bli berusad' mist e gåg om måade i stickprovet, vilke fördelig beskriver sampligfördelige av p? Vad har sampligfördelige för p för medelvärdet och stadardavvikelse? Gör ett bevis, dvs. E ( p) = E( ) =.... och Var ( p) = Var( ) =... Tips: Vad har för fördelig? (5 poäg) Uppgift Vid e viss kurs satt Camilla på föreläsigar och blev lite uttråkat, ho bestämde sig att kasta ett (och samma) myt 10 000 gåger; ho fick 5 067 'kroor'. Om mytet var balaserad, saolikhete att få 'kroa' är lika med 0,5. Fis det tillräckligt med bevis för att Camilla ka misstäka mytet ger för måga 'kroor' för att vara balaserad? För att svara på fråga, ta fram saolikhete att ett balaserat myt ger 5 067 eller fler 'kroor' vid 10 000 kast. Vad är di slutsats? (10 poäg) 1

0.01.007 Uppgift 3 Kaffe gör upp e stor del av eport frå måga uläder. När kaffe priser är höga, vill kaffe odlare ofta hugga ed mer skog för att odla mer kaffe. Följade tabell visar världsmarkadspris på kaffe och adele skog som har gått över till kaffeodligslad i Idoisia över ett 5års period. Pris (cets per pud) 9 40 54 55 7 Förlorad skog (procet) 0,49 1,59 1,69 1,8 3,10 a) Udersök data. Rita i observatioera i ett spridigsdiagram och kommetera. ( poäg) b) Beräka korrelatioskoefficiete. ( poäg) c) Apassa med mista kvadratmetode Y= a + b och tolka resultatet i ord. Vad säjer kostater a och b? Rita äve i lije i ditt spridigsdiagram. (3 poäg) d) Är kaffepris e bra sätt att estimera adele förlorade skog? (3 poäg) Uppgift 4 Ett slumpmässigt urval (OSU metod) av studeter som har pluggat e viss kurs det seaste året vid ett visst Sveskt uiversitet (ett stort atal studeter!) fick svara på e ekät agåede studievaor. Resultatet av urvalet av 5 studeter visade att e studet har övat i geomsitt 80 miuter per vecka på, med e stadardavvikelse på 35 miuter. a) Ta fram ett 95%-igt kofidesitervall för geomsittstide e studet har övar på per vecka. (6 poäg) b) Är det sat att 95% av studetera har e övigstid i som ligger iom itervallet som du tog fram i del (a). Förklara dit svar. (4 poäg) Uppgift 5 Ett markadsudersökigsföretag ska skatta de saa adele täkbara köpare av e viss produkt. Ma tror att dea adel ka ligga rut 10%, me ma vill mäta med e felmargial på högst 5%. Hur stort stickprov måste ma ha? Ata att kofidesivå är 90%. (10 poäg)

0.01.007 Uppgift 6 Ett viktmiskigsmedel hävdar att de lyckas får de som är överviktiga att gå ed i vikt om de aväder medle i mist 7 dagar. Vid ett urval blad överviktiga idivider har behadlige lyckades för 70% av dem som deltog. Atag att hypotese som testats är: H 0 : π = 0, 5 mot H 1 : π > 0, 5, där π beskriver adele överviktiga idivider (i populatioe) som går ed i vikt. Sigifikasivå är 5%. Det visade sig att p-värdet blev 0,04. Formulera följade begrepp, dels med hjälp av ova eempel och dels geom de formella defiitioe: a) Sigifikasivå b) Styrka c) p-värdet d) Ka vi förkasta hypotese? (4 poäg) ( poäg vardera) 3

0.01.007 Tips till lösigar a. ( poäg) Om ma har e variabel som bara ka ata två värde, te. variabel iehav av körkort, kodas de valige ja =1 och ej =0. E såda variabel kallas ofta dikotom, biär eller (med dea kodig) 0/1 variabel. E 0/1-varibel är e variabel som kodas med två möjliga värde, ämlige värdea 0 och 1. S.k. 0/1 variabler beskriver atalet som har e viss egeskap, variabel får värdet 1 om de har de öskade egeskap, 0 aars. Te. Resultat av e teta: Godkäd eller uderkäd Låt variabel Z = 'resultat av teta', z får värdet '1' om resultatet är godkäd, '0' aars. Slumpvariable som beskriver resultatet av teta, Z, är e sk. 0/1 variabel. b. (3 poäg) Medelvärdet av e variabel i populatioe, dvs. vätevärdet är μ = summa av alla obs i populatioe / atalet i populatioe = N Ma ka se vätevärdet av e sk. 0/1 variabel som ett specialfall, eftersom är ma tar fram medelvärdet i populatioe, vätevärdet, blir summa av alla obs e summa av 0:or och 1:or, dvs. 0+0+0+1+0+1+1 mm..., som är lika med atalet 1:or i populatioe. Då är vätevärdet lika med: atal ettor i populatioe / atalet i populatioe dvs. X/N i populatioe, eller de skattas med / frå ett stickprov, där X=Atal ettor i populatioe och =Atal ettor i stickprovet. X/N, /, kallas för e 'proportio' eller adel, och beskrivs i populatioe med pi, π, och skattas frå stickprovet med πˆ = p. Ma ka också se π som saolikhete att välja e idivid med de öskad X egeskap: P ( X = 1) = N MAO. Medelvärdet för e 0/1 variabel beskrivs som adele (proportioe) ettor i materialet. = Atalettor X π = = N = Adele ettor i populatioe; N N Atalettor och skattas med πˆ = p = = = = Adele ettor i stickprovet. 4

0.01.007 Te. Om vid e teta 50 av 100 blir godkäda, då är z = Z = 50, där Z är atalet 'ettor'. Vätevärdet i vårt eempel blir (proportioe godkäda vid teta): Z 50 dvs. i populatioe, π = = = 0, 5. N 100 Vi söker vätevärdet av e 0/1 variabel, te. Vi söker E(X) och vi vet att det är detsamma som π. Bevis: X E ( X ) = μ = P( ) = 0 P( X = 0) + 1 P( X = 1) = P( X = 1) = = π N Alterativ: E( X ) = P( ) = 0(1 π ) + 1( π ) = π c. (5 poäg) Ett slumpmässigt urval av 1100 studet (på uiversitetsivå) frågades om deras alkoholvaor; 775 svarade att de 'dricker för att bli berusad' mist e gåg om måade. Adele som har svarat de 'dricker för att bli berusad' mist e gåg om 775 måade i stickprovet beskrivs med: ˆ π = p = = = 0, 70 1100 Där är Biomial fördelad (de uppfylla alla kriterier), ~ Bi( = 1100, ˆ π = p = 0,70), E ( ) = π och Var ( ) = π (1 π ) ka approimeras till ormalfördelig, eftersom tumregel är uppfylld med god margial, dvs. det blir e bra approimatio, π och ( 1 π ) > 5. Då gäller det äve att p är ormalfördelad, dvs. sampligfördelig för p är ormalfördelad, med följade medelvärde och stadardavvikelse: Vi söker vätevärdet av p: De skattas med ˆ π = 0, 70 1 π E ( p) = E( ) = E( ) = = π Vi söker stadardavvikelse av p: 1 Var p) = Var( ) = Var( ) = π (1 π ) ( π (1 π ) = p(1 p) 0,7(0,3) De skattas med Var ˆ ( p) = = = 0,000189 = 0,0138 1100 5

0.01.007 Uppgift (10 poäg) X = Atal kroor vid kast av mytet. Kriterier till biomialfördelig är uppfyllda. X är biomialfördelad med parametrar = 10 000 och π = 0, 5. X ~ Bi( = 10000, π = 0,5) Iformatioe frå uppgifte: = 5 067 vid 10 000 kast. Vi söker: P( X 5067) Saolikhetsfördelig för X ka approimeras frå Biomial till Normal. Tumregel är uppfylld med god margial, dvs. det blir e bra approimatio: π och ( 1 π ) > 5 Dvs. X ~ appron( μ, σ ) med: μ = π = 10000 (0,5) = 5000 σ = π (1 π ) = 10000(0,5) = 500 = 50 Eftersom vi gör e approimatio av e diskretfördelig (Biomial) med e som är kotiuerlig (ormal), måste vi aväda oss av halv-korrektioe, då söker vi: X μ 5066,5 5000 P( X 5066,5) = P( Z ) = P( Z ) = P( Z 1,33) = P( Z 1.33) σ 50 = 0,0918 Med hjälp av stadardiserig och Z~N(0,1) tabell. Uta halv-korrektioe, söker vi: X μ 5067 5000 P( X 5067) = P( Z ) = P( Z ) = P( Z 1,34) = 0,0901 σ 50 Det fis bevis mot ett balaserat myt, me det är ite helt starkt. Det är cirka 9% chas att få ett sådat resultat eller ågotig äu mer etremt ä det som förvätades är ma kastar ett myt 10 000 gåger. E saolikhet på 5% skulle ha varit starkt bevis, 1% mycket starkt bevis. 6

0.01.007 Uppgift 3 X: Pris (cets per pud) Y: Förlorad skog (procet) y y 9 0,49 14,1 841 0,401 40 1,59 63,6 1600,581 54 1,69 91,6 916,8561 55 1,8 100,1 305 3,314 7 3,10 3, 5184 9,61 = 50 y = 8,69 y = 49,37 = 13566 y = 18,55 a) ( poäg) Spridigsdiagram. Kommetera: Ju högre pris, ju mer örkar procettalet av förlorad skog (i sitt). Starkt positivt sambad; me få observatioer (e observatio ka vara avgörade). b) ( poäg) Korrelatioskoefficiete, r: r = ( y) y ( ( ) )( y ( y ) ) r = 5(49,37) 50(8,69) = 0,955 5(13566) 50 5(18,5467) 8,69 ( )( ) De ager både riktige (positiv) och styrka i det lijära sambadet (dvs.de är stark). r är ett grovt mått, och bör tolkas försiktigt! c) (3 poäg) Apassa med mista kvadratmetode Y= a + b Här ska ma skriva ed formel som aväds och dia beräkigar. a = y b = -0,976 Iterceptet a visar hur mycket det förvätade värdet på y kommer att vara om är lika med oll. ( ( ) y) y b = = 0,0543 Riktigskoefficiete b visar hur mycket det förvätade värdet på y ökar om ökar med e ehet. Rita i lije i spridigsdiagramme Y = -0,976 + 0,0543X y 7

0.01.007 d) (3 poäg) Kommetarer på Kaffepris som ett metod att estimera adele förlorade skog: Det fis bara 5 observatioer, vi kua udersöka ett större datamaterial. b är kaske e dålig skattig på hur pris påverkar adele förlorad skog, sambadet är kaske e slump, och miskig förklaras av adra saker. Vi kua utföra e multiple regressio och ta häsy till flera faktorer som ka påverka adele förlorad skog. Korrelatioskoefficiete, r, tyder på e stark lijärt sambad. Determiatioskoefficiete, r, är ett bättre mått och ager hur stor adel av de totala variatioe för de beroede variabel, Y, som förklaras av det lijära sambadet med de oberoede variabel, X. MAO. Det är ett mått på hur bra X förklarar Y. r = 0,955 = 0,91. Me det fis adra faktorer som förklarar ädrige i förlorad skog i Idoisia, me pris, i vårt stickprov, förklarar det mesta. Uppgift 4 a) (6 poäg) X = Övigstid per vecka för e studet i Ata X är fördelad mycket lik e ormalfördelig, då, eligt CGS, är stickprovsmedelvärde också mycket lik e ormalfördelig äve för relativ små stickprov, vi har =5. MAO. Eftersom stickprovsmedelvärde är (appro) ormalfördelat ka vi beräka ett kofidesitervall: skattig ± felmargial s Vi aväder oss av formel: ± t, kostate t aväds då populatiosstadardavvikelse,σ, är okäd. t 5 1= 4;5% =,06 s 35 ± t = 80 ±,06 = 80 ± 14,4 = [65,6;94,4] 5 Tolkig: Med 95% säkerhet ligger geomsittstide e studet har övat på per vecka, μ, mella 65,6 och 94,4 miuter. b) (4 poäg) Nej. Itervallet i upp 4a är itervallet för populatiosmedelvärdet: Om vi atar att övigstid är ågorluda ormalfördelad ka vi säga att ugefär 95% av studeter har e övigstid som ligger i itervallet: μ ± 1. 96. σ Itervallet för populatiosmedelvärdet är mycket kortare ä itervallet för studeter. 8

0.01.007 Notera: Om det var eakt ormalfördelad (me det är ite möjligt i vårt eempel varför?) då skulle eakt 95% av studetera har e övigstid mella μ ± 1. 96σ. Uppgift 5 (10 poäg) Skattig ± felmargial Här gäller ett 90%-igt kofidesitervall för populatiosadele, där vi tror adele ligger rut 10%. P ( Z > z) = 0,1, då är z = 1,645. P ˆ = p = 0,1 p(1 p) 0,1(1 0,1) Felmargial = z = 1,645 = 0,05 Lösa ut (skrev ed dia beräkigar). Ett slumpmässigt stickprov på mist =98 studeter behövs för att uppfylla kravet i fråga. Uppgift 6 (a-c poäg vardera) a) Sigifikasivå, α = P( Typ I fel ) = P( förkasta H0 H0 sa ) Te. P(Förkasta H0 π = 0, 5 och ata att det är π > 0, 5, me i verklighet är det π = 0, 5 som gäller.) b) β = P( Typ II fel ) = P( ej förkasta H0 H0 falsk ) Testets styrka, dvs. att fatta ett bra beslut, är saolikhete att vi med testets hjälp lyckas förkasta ollhypotese då de är falsk. Det är 1 - β, som är samma som: P( förkasta H0 H0 falsk ) Te. Testet lyckades bevisa att det är faktisk π > 0, 5. c) p-värdet = P(att få det värdet vi fick, eller ågotig som talar mer för H1, dvs. äu mer etremt, givit att H0 är sa) P-värdet är 0.04, dvs. 4% chas att få det resultat dem fick i stickprovet eller ågotig äu högre, givit att det är faktisk π = 0,5. d) (4 poäg) Vi ka förkasta ollhypotese eftersom p-värdet är midre ä sigifikasivå. 0,04 < 0,05 dvs. p-värdet < sigifikasivå, H0 förkastas. 9