0.01.007 Tetame i Statistik, STA A13 Deltetame, 5p 0 jauari 007, kl. 09.00-13.00 Tillåta hjälpmedel: Bifogad formel- och tabellsamlig (skall retureras) samt miiräkare. Asvarig lärare: Haah Hall Övrigt: Varje uppgift ka ge ma 10p. Lösigar skall utasvårighet kua följas. Iförda beteckigar skall förklaras. För betyget Godkäd krävs mist 30 p och för Väl godkäd krävs 45 p. Uppgift 1 a) Vad är e så kallad 0/1 slumpvariabel? Beskriv med hjälp av ett eempel. ( poäg) b) Vad blir vätevärdet av e s.k. 0/1 slumpvariabel? Gör ett bevis, dvs. E( X ) =... (3 poäg) c) Ett slumpmässigt urval av 1100 studet (på uiversitetsivå) frågades om deras alkoholvaor; 775 svarade att de 'dricker för att bli berusad' mist e gåg om måade. Om vi låt p = = πˆ beskriver adele som har svarat de 'dricker för att bli berusad' mist e gåg om måade i stickprovet, vilke fördelig beskriver sampligfördelige av p? Vad har sampligfördelige för p för medelvärdet och stadardavvikelse? Gör ett bevis, dvs. E ( p) = E( ) =.... och Var ( p) = Var( ) =... Tips: Vad har för fördelig? (5 poäg) Uppgift Vid e viss kurs satt Camilla på föreläsigar och blev lite uttråkat, ho bestämde sig att kasta ett (och samma) myt 10 000 gåger; ho fick 5 067 'kroor'. Om mytet var balaserad, saolikhete att få 'kroa' är lika med 0,5. Fis det tillräckligt med bevis för att Camilla ka misstäka mytet ger för måga 'kroor' för att vara balaserad? För att svara på fråga, ta fram saolikhete att ett balaserat myt ger 5 067 eller fler 'kroor' vid 10 000 kast. Vad är di slutsats? (10 poäg) 1
0.01.007 Uppgift 3 Kaffe gör upp e stor del av eport frå måga uläder. När kaffe priser är höga, vill kaffe odlare ofta hugga ed mer skog för att odla mer kaffe. Följade tabell visar världsmarkadspris på kaffe och adele skog som har gått över till kaffeodligslad i Idoisia över ett 5års period. Pris (cets per pud) 9 40 54 55 7 Förlorad skog (procet) 0,49 1,59 1,69 1,8 3,10 a) Udersök data. Rita i observatioera i ett spridigsdiagram och kommetera. ( poäg) b) Beräka korrelatioskoefficiete. ( poäg) c) Apassa med mista kvadratmetode Y= a + b och tolka resultatet i ord. Vad säjer kostater a och b? Rita äve i lije i ditt spridigsdiagram. (3 poäg) d) Är kaffepris e bra sätt att estimera adele förlorade skog? (3 poäg) Uppgift 4 Ett slumpmässigt urval (OSU metod) av studeter som har pluggat e viss kurs det seaste året vid ett visst Sveskt uiversitet (ett stort atal studeter!) fick svara på e ekät agåede studievaor. Resultatet av urvalet av 5 studeter visade att e studet har övat i geomsitt 80 miuter per vecka på, med e stadardavvikelse på 35 miuter. a) Ta fram ett 95%-igt kofidesitervall för geomsittstide e studet har övar på per vecka. (6 poäg) b) Är det sat att 95% av studetera har e övigstid i som ligger iom itervallet som du tog fram i del (a). Förklara dit svar. (4 poäg) Uppgift 5 Ett markadsudersökigsföretag ska skatta de saa adele täkbara köpare av e viss produkt. Ma tror att dea adel ka ligga rut 10%, me ma vill mäta med e felmargial på högst 5%. Hur stort stickprov måste ma ha? Ata att kofidesivå är 90%. (10 poäg)
0.01.007 Uppgift 6 Ett viktmiskigsmedel hävdar att de lyckas får de som är överviktiga att gå ed i vikt om de aväder medle i mist 7 dagar. Vid ett urval blad överviktiga idivider har behadlige lyckades för 70% av dem som deltog. Atag att hypotese som testats är: H 0 : π = 0, 5 mot H 1 : π > 0, 5, där π beskriver adele överviktiga idivider (i populatioe) som går ed i vikt. Sigifikasivå är 5%. Det visade sig att p-värdet blev 0,04. Formulera följade begrepp, dels med hjälp av ova eempel och dels geom de formella defiitioe: a) Sigifikasivå b) Styrka c) p-värdet d) Ka vi förkasta hypotese? (4 poäg) ( poäg vardera) 3
0.01.007 Tips till lösigar a. ( poäg) Om ma har e variabel som bara ka ata två värde, te. variabel iehav av körkort, kodas de valige ja =1 och ej =0. E såda variabel kallas ofta dikotom, biär eller (med dea kodig) 0/1 variabel. E 0/1-varibel är e variabel som kodas med två möjliga värde, ämlige värdea 0 och 1. S.k. 0/1 variabler beskriver atalet som har e viss egeskap, variabel får värdet 1 om de har de öskade egeskap, 0 aars. Te. Resultat av e teta: Godkäd eller uderkäd Låt variabel Z = 'resultat av teta', z får värdet '1' om resultatet är godkäd, '0' aars. Slumpvariable som beskriver resultatet av teta, Z, är e sk. 0/1 variabel. b. (3 poäg) Medelvärdet av e variabel i populatioe, dvs. vätevärdet är μ = summa av alla obs i populatioe / atalet i populatioe = N Ma ka se vätevärdet av e sk. 0/1 variabel som ett specialfall, eftersom är ma tar fram medelvärdet i populatioe, vätevärdet, blir summa av alla obs e summa av 0:or och 1:or, dvs. 0+0+0+1+0+1+1 mm..., som är lika med atalet 1:or i populatioe. Då är vätevärdet lika med: atal ettor i populatioe / atalet i populatioe dvs. X/N i populatioe, eller de skattas med / frå ett stickprov, där X=Atal ettor i populatioe och =Atal ettor i stickprovet. X/N, /, kallas för e 'proportio' eller adel, och beskrivs i populatioe med pi, π, och skattas frå stickprovet med πˆ = p. Ma ka också se π som saolikhete att välja e idivid med de öskad X egeskap: P ( X = 1) = N MAO. Medelvärdet för e 0/1 variabel beskrivs som adele (proportioe) ettor i materialet. = Atalettor X π = = N = Adele ettor i populatioe; N N Atalettor och skattas med πˆ = p = = = = Adele ettor i stickprovet. 4
0.01.007 Te. Om vid e teta 50 av 100 blir godkäda, då är z = Z = 50, där Z är atalet 'ettor'. Vätevärdet i vårt eempel blir (proportioe godkäda vid teta): Z 50 dvs. i populatioe, π = = = 0, 5. N 100 Vi söker vätevärdet av e 0/1 variabel, te. Vi söker E(X) och vi vet att det är detsamma som π. Bevis: X E ( X ) = μ = P( ) = 0 P( X = 0) + 1 P( X = 1) = P( X = 1) = = π N Alterativ: E( X ) = P( ) = 0(1 π ) + 1( π ) = π c. (5 poäg) Ett slumpmässigt urval av 1100 studet (på uiversitetsivå) frågades om deras alkoholvaor; 775 svarade att de 'dricker för att bli berusad' mist e gåg om måade. Adele som har svarat de 'dricker för att bli berusad' mist e gåg om 775 måade i stickprovet beskrivs med: ˆ π = p = = = 0, 70 1100 Där är Biomial fördelad (de uppfylla alla kriterier), ~ Bi( = 1100, ˆ π = p = 0,70), E ( ) = π och Var ( ) = π (1 π ) ka approimeras till ormalfördelig, eftersom tumregel är uppfylld med god margial, dvs. det blir e bra approimatio, π och ( 1 π ) > 5. Då gäller det äve att p är ormalfördelad, dvs. sampligfördelig för p är ormalfördelad, med följade medelvärde och stadardavvikelse: Vi söker vätevärdet av p: De skattas med ˆ π = 0, 70 1 π E ( p) = E( ) = E( ) = = π Vi söker stadardavvikelse av p: 1 Var p) = Var( ) = Var( ) = π (1 π ) ( π (1 π ) = p(1 p) 0,7(0,3) De skattas med Var ˆ ( p) = = = 0,000189 = 0,0138 1100 5
0.01.007 Uppgift (10 poäg) X = Atal kroor vid kast av mytet. Kriterier till biomialfördelig är uppfyllda. X är biomialfördelad med parametrar = 10 000 och π = 0, 5. X ~ Bi( = 10000, π = 0,5) Iformatioe frå uppgifte: = 5 067 vid 10 000 kast. Vi söker: P( X 5067) Saolikhetsfördelig för X ka approimeras frå Biomial till Normal. Tumregel är uppfylld med god margial, dvs. det blir e bra approimatio: π och ( 1 π ) > 5 Dvs. X ~ appron( μ, σ ) med: μ = π = 10000 (0,5) = 5000 σ = π (1 π ) = 10000(0,5) = 500 = 50 Eftersom vi gör e approimatio av e diskretfördelig (Biomial) med e som är kotiuerlig (ormal), måste vi aväda oss av halv-korrektioe, då söker vi: X μ 5066,5 5000 P( X 5066,5) = P( Z ) = P( Z ) = P( Z 1,33) = P( Z 1.33) σ 50 = 0,0918 Med hjälp av stadardiserig och Z~N(0,1) tabell. Uta halv-korrektioe, söker vi: X μ 5067 5000 P( X 5067) = P( Z ) = P( Z ) = P( Z 1,34) = 0,0901 σ 50 Det fis bevis mot ett balaserat myt, me det är ite helt starkt. Det är cirka 9% chas att få ett sådat resultat eller ågotig äu mer etremt ä det som förvätades är ma kastar ett myt 10 000 gåger. E saolikhet på 5% skulle ha varit starkt bevis, 1% mycket starkt bevis. 6
0.01.007 Uppgift 3 X: Pris (cets per pud) Y: Förlorad skog (procet) y y 9 0,49 14,1 841 0,401 40 1,59 63,6 1600,581 54 1,69 91,6 916,8561 55 1,8 100,1 305 3,314 7 3,10 3, 5184 9,61 = 50 y = 8,69 y = 49,37 = 13566 y = 18,55 a) ( poäg) Spridigsdiagram. Kommetera: Ju högre pris, ju mer örkar procettalet av förlorad skog (i sitt). Starkt positivt sambad; me få observatioer (e observatio ka vara avgörade). b) ( poäg) Korrelatioskoefficiete, r: r = ( y) y ( ( ) )( y ( y ) ) r = 5(49,37) 50(8,69) = 0,955 5(13566) 50 5(18,5467) 8,69 ( )( ) De ager både riktige (positiv) och styrka i det lijära sambadet (dvs.de är stark). r är ett grovt mått, och bör tolkas försiktigt! c) (3 poäg) Apassa med mista kvadratmetode Y= a + b Här ska ma skriva ed formel som aväds och dia beräkigar. a = y b = -0,976 Iterceptet a visar hur mycket det förvätade värdet på y kommer att vara om är lika med oll. ( ( ) y) y b = = 0,0543 Riktigskoefficiete b visar hur mycket det förvätade värdet på y ökar om ökar med e ehet. Rita i lije i spridigsdiagramme Y = -0,976 + 0,0543X y 7
0.01.007 d) (3 poäg) Kommetarer på Kaffepris som ett metod att estimera adele förlorade skog: Det fis bara 5 observatioer, vi kua udersöka ett större datamaterial. b är kaske e dålig skattig på hur pris påverkar adele förlorad skog, sambadet är kaske e slump, och miskig förklaras av adra saker. Vi kua utföra e multiple regressio och ta häsy till flera faktorer som ka påverka adele förlorad skog. Korrelatioskoefficiete, r, tyder på e stark lijärt sambad. Determiatioskoefficiete, r, är ett bättre mått och ager hur stor adel av de totala variatioe för de beroede variabel, Y, som förklaras av det lijära sambadet med de oberoede variabel, X. MAO. Det är ett mått på hur bra X förklarar Y. r = 0,955 = 0,91. Me det fis adra faktorer som förklarar ädrige i förlorad skog i Idoisia, me pris, i vårt stickprov, förklarar det mesta. Uppgift 4 a) (6 poäg) X = Övigstid per vecka för e studet i Ata X är fördelad mycket lik e ormalfördelig, då, eligt CGS, är stickprovsmedelvärde också mycket lik e ormalfördelig äve för relativ små stickprov, vi har =5. MAO. Eftersom stickprovsmedelvärde är (appro) ormalfördelat ka vi beräka ett kofidesitervall: skattig ± felmargial s Vi aväder oss av formel: ± t, kostate t aväds då populatiosstadardavvikelse,σ, är okäd. t 5 1= 4;5% =,06 s 35 ± t = 80 ±,06 = 80 ± 14,4 = [65,6;94,4] 5 Tolkig: Med 95% säkerhet ligger geomsittstide e studet har övat på per vecka, μ, mella 65,6 och 94,4 miuter. b) (4 poäg) Nej. Itervallet i upp 4a är itervallet för populatiosmedelvärdet: Om vi atar att övigstid är ågorluda ormalfördelad ka vi säga att ugefär 95% av studeter har e övigstid som ligger i itervallet: μ ± 1. 96. σ Itervallet för populatiosmedelvärdet är mycket kortare ä itervallet för studeter. 8
0.01.007 Notera: Om det var eakt ormalfördelad (me det är ite möjligt i vårt eempel varför?) då skulle eakt 95% av studetera har e övigstid mella μ ± 1. 96σ. Uppgift 5 (10 poäg) Skattig ± felmargial Här gäller ett 90%-igt kofidesitervall för populatiosadele, där vi tror adele ligger rut 10%. P ( Z > z) = 0,1, då är z = 1,645. P ˆ = p = 0,1 p(1 p) 0,1(1 0,1) Felmargial = z = 1,645 = 0,05 Lösa ut (skrev ed dia beräkigar). Ett slumpmässigt stickprov på mist =98 studeter behövs för att uppfylla kravet i fråga. Uppgift 6 (a-c poäg vardera) a) Sigifikasivå, α = P( Typ I fel ) = P( förkasta H0 H0 sa ) Te. P(Förkasta H0 π = 0, 5 och ata att det är π > 0, 5, me i verklighet är det π = 0, 5 som gäller.) b) β = P( Typ II fel ) = P( ej förkasta H0 H0 falsk ) Testets styrka, dvs. att fatta ett bra beslut, är saolikhete att vi med testets hjälp lyckas förkasta ollhypotese då de är falsk. Det är 1 - β, som är samma som: P( förkasta H0 H0 falsk ) Te. Testet lyckades bevisa att det är faktisk π > 0, 5. c) p-värdet = P(att få det värdet vi fick, eller ågotig som talar mer för H1, dvs. äu mer etremt, givit att H0 är sa) P-värdet är 0.04, dvs. 4% chas att få det resultat dem fick i stickprovet eller ågotig äu högre, givit att det är faktisk π = 0,5. d) (4 poäg) Vi ka förkasta ollhypotese eftersom p-värdet är midre ä sigifikasivå. 0,04 < 0,05 dvs. p-värdet < sigifikasivå, H0 förkastas. 9