Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 6 april 004, klockan 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling (med approimationsschema) och tabellsamling (dessa skall returneras). Egen miniräknare. Ansvarig lärare: Catrin Bergkvist, telefon 700 16 7 Övrigt: För att få maimala 10 poäng på en uppgift krävs att antaganden och motiveringar noga anges samt att lösningen även i övrigt är så utförlig att den utan svårighet kan följas! För betyget Godkänd krävs minst 40 poäng, för betyget Väl Godkänd krävs minst 60 poäng. Uppgift 1 Man har slumpmässigt valt ut 300 stycken av alla studenterna som studerar vid Karlstads Universitet. Där finns 10 000 studenter vid Karlstads universitet. De har fått ange hur många gånger de har rest utomlands det senaste året. Resultatet framgår av tabellen nedan: Antal resor 0 1 3 4 5 Frekvens (antal pers.) 90 100 30 50 0 10 a. Illustrerar materialet med hjälp av ett lämpligt diagram. b. Beräkna stickprovsmedelvärdet. c. Beräkna stickprovsstandardavvikelsen. d. Hur kan vi bedöma hur bra stickprovsmedelvärdet skattar den sanna population parametern (dvs. medelvärdet av antal resor utomlands bland samtliga studenter)? För att svara på frågan beskriv med ord (räkna inte!) en lämplig statistisk metod som vi kan använda oss av. Använd orden punktskattning och intervallskattning. Uppgift År 003 genomfördes en slumpmässig urvalsundersökning bland 100 läkare i Sverige. Bland annat ställdes en fråga kring månadslön. Resultatet, uppdelat på kön, framgår av tabellen nedan: Månadslön (i 1000:-) Antal män Antal kvinnor 10-0 0 5 0-30 5 15 30-40 10 15 40-50 0 10 50-60 15 5 a. Gör en kumulativ frekvenspolygon som visar månadslön för båda män och kvinnor (använd grafisk papper). b. Utifrån kumulativ frekvenspolygon ange kvartilerna för månadslön (Q1, Q och Q3) bland manliga och kvinnliga läkare. c. Jämför fördelningen av årslönen för läkarna med avseende på kön, genom att rita upp en boplot. Vad kan man dra för slutsats utifrån diagrammet? Var som vanligt noga med att ange all information som behövs när man redovisar ett diagram! Uppgift 3 En kurs i statistik ges vid fyra tillfällen per år. Fördelningen för antal sökande till en av de fyra kurserna antas vara Poissonfördelad med ett väntevärde på 50. Vi kan anta att antal sökande är oberoende. a) Ange den approimativa fördelningen för antal studenter som läser kursen under tio läsår (dvs. summan av fyrtio kurser). b) Formulera den centrala gränsvärdessatsen. c) Beräkna den approimativa sannolikheten att mer än 00 studenter läser kursen under tio läsår.
Uppgift 4 En maskin består av tre delar; A, B respektive C. Dessa är felfria med sannolikheterna P(A)0.9, P(B)0.85 respektive P(C)0.95. Funktionsdugligheten hos de tre maskindelarna antas oberoende av varandra. a) Bestäm sannolikheten att maskinen fungerar, om det krävs att alla delarna fungerar för att maskinen skall fungera. b) Bestäm sannolikheten att maskinen fungerar, om det räcker med att en del fungerar för att maskinen skall fungera. c) Beräkna P(A fungerar C fungerar). Uppgift 5 Sverige har fått klagomål på att vårt badvatten inte håller en EU-godkänd nivå. EU-kontrollanterna hävdar att det är en alltför hög halt av fosfater (dvs. mer än 17 mmol/l). Vid 30 mätningar av fosfathalten i en viss sjö erhålls följande värden; 450 7100, där X-fosfathalten (mmol/l) vid en mätning. OBS! Vi kan inte anta att X är normalfördelad. a) Beräkna ett approimativt 95 % konfidensintervall för den sanna fosfathalten i sjön. b) Tolka konfidensintervallet. Finns det fog för EU:s kritik? Uppgift 6 Vikten hos ägg, från Svenska ägg AB, anses följa en normalfördelning med väntevärdet 1 gram och standardavvikelse gram. Vikten hos ägg från Megaägg AB, anses följa en normalfördelning med väntevärde 15 gram och standardavvikelse 3 gram. a) Beräkna väntevärdet för den sammanlagda vikten av 1 ägg från Megaägg AB respektive Svenska ägg AB. b) Beräkna variansen för den sammanlagda vikten av 1 ägg från Megaägg AB respektive Svenska ägg AB. c) Beräkna sannolikheten att den sammanlagda vikten av 1 ägg från Megaägg AB väger mer än 1 ägg från Svenska ägg AB. Uppgift 7 En kemiststudent vill jämföra två olika metoder (A respektive B) att mäta Ph-värdet. Skillnaden mellan värdena blev; Sjö nr 1 3 4 5 6 7 8 A-B 0.1-0. 0. -0.3 0. -0.3-0. 0.3 Mätningarna mellan sjöarna var oberoende och normalfördelade. Beräkna ett 99 % konfidensintervall för medelvärdet av skillnaden (A-B) och besvara frågan ifall det fanns någon skillnad mellan metoderna. Uppgift 8 En fackförening hävdar att tre av fem studenter som avslutade sina studier i systemvetenskap år 00 hade lyckats få en anställning inom de första 6 månader. Karlstads Universitet vill undersöka hur det ser ut för KAU studenter i arbetsmarknaden. En undersökning genomfördes bland studenter i systemvetenskap som gick ut från KAU år 00; av 100 studenter det var 70 som sa att de hade en anställning inom de första 6 månader. Kan vi dra slutsatsen att det finns större möjlighet att hitta arbete bland studenter i systemvetenskap som går ut vid KAU jämfört med fackförenings påstående? Genomför ett statistiskt test med signifikansnivån 5%. Redovisa allt som bör redovisas när man genomför ett statistiskt test (formulera hypoteserna, definiera testvariabel, formulera beslutsregel etc.)!
STA A10 tentamen 04046, lösningar Uppgift 1 a. Ett stolpdiagram s f n 440 300 b. Stickprovsmedelvärdet 1. 47 c. Stickprovsstandardavvikelsen ( f) 440 f 140 n 300 n 1 99 s s 1.41 d. [Läs bok: K.9] 1.99 f f f 0 90 0 0 1 100 100 100 30 60 10 3 50 150 450 4 0 80 30 5 10 50 50 Summa Σf Σf440 Σf 140 Uppgift X: Månadslön (i 1000:-) f män Kumf män f kvinnor Kumf kvinnor 10-0 0 0 5 5 0-30 5 5 15 0 30-40 10 15 15 35 40-50 0 35 10 45 50-60 15 50 5 50 a. En kumulativ frekvenspolygon (en linje för män och en linje för kvinnor). [Läs bok: s. 41] b. Utifrån kumulativ frekvenspolygon kan man läsa av (dvs. ungefär) kvartilerna för månadslön bland: Män: Q1 37 500, Q 45 000, Q3 51 500 Kvinnor: Q1 5 000, Q 33 500, Q3 4 500 c. En boplot (en för män och en för kvinnor). Kommenterar. [Läs bok: s. 15] Män: min 0 000, ma 60 000 Kvinnor: min 10 000, ma 60 000 Uppgift 3 X-antal sökande till statistikklassen 40 40 a) X är approimativt normalfördelad, med µ 50 000 och σ 50 000. b) Summan av oberoende och likafördelade stokastiska variabler är approimativt normalfördelade. X µ 00.5 000 c) P( X > 00) 1 P( < ) 1 P( Z < 4.48) 11 0 σ 000 i 1 i 1
Uppgift 4 M-maskinen fungerar P M P A B C P A P B P C a) ( ) ( ) ( ) ( ) ( ) 0.9 0.85 0.95 0. 7675 * * * * * * b) P( M ) 1 P( A B C ) 1 P( A ) P( B ) P( C ) 1 0.1 0.15 0.05 0. 9995 c) P ( A C) P( A) 0. 9 z 1.96 450, ty A och C är oberoende. Uppgift 5 X-fosfathalten (mmol/l) vid en viss sjö. CGS ger att X är approimativt normalfördelad. ( ) 1 1 450 s 7100 n 1 n 30 1 30 n 30 350 9 450 350 / 9 s I ± µ z ± 1.96 [ 15 ± 1.4] [ 13.7;16.4] n 30 30 Vi kan med stor sannolikhet (95%) hävda att sjön uppfyller EU:s normer. Det finns därmed inte fog för kritiken, åtminstone inte när det gäller den sjön. Uppgift 6 X vikten hos ett ägg från Svenska ägg AB X N( 1,) Y vikten hos ett ägg från Megaägg AB Y N( 15,3) 1 a) E X E[ X ] 1*1 144 i 1 E Yi E[ Y ] 1*15 180 1 b) V X [ ] 1* i V X 48 1 V Y [ ] 1*3 i V Y 108 1 1 1 1 c) P X < Y P X Y < 0 i 1 i 1 i 1 i 1 P 1 X i 1 1 Y ( E[ X ] E[ Y ]) i 1 ( V ( X ) + V ( Y ) 0 < ( 144 180) 48 + 108 P ( Z <.88) 0. 998
Uppgift 7 1 s n 1 n 8 t 0.995 I µ 0. (8 1) 3.50 0.44 ( ) n 1 ( 0.) 0.44 7 8 s : ± t n [ 0.05 ± 0.308] [ 0.333;0.83] 0.06 Eftersom 0 ingår i intervallet så kan vi inte påvisa någon skillnad mellan metoderna.
Uppgift 8 [Tests concerning proportions: Läs boken: s.360] 3 π 0,6 5 Det är proportionen av studenter som avslutade sina studier i systemvetenskap år 00 och hade lyckats få en anställning inom de första 6 månader. KAU har gjort en undersökning bland n100 studenter. 1. Formulera hypoteserna H 0 : Det vi försöker motbevisa. Fackförenings påståendet angående studenter. Null hypotesen är att det finns ingen skillnad mellan KAU studenter och andra studenter. H 1 : Alternativ hypotes. Vi misstänker att KAU studenter har större möjligheter att få jobb dvs. mer än 60% av studenterna fick jobb. H : π 0,6 0 H 1 : π > 0,6 Det är en ensidigt test (höger sidan).. Signifikansnivån α 0,05 dvs. 5% 3. Definiera testvariabeln Tumregel uppfylld: nπ > 5 och Z är N(0,1). n( 1π ) > 5 X Bin(60;0,5) kan approimera till normalfördelningen eftersom p π p 0,6 CGS gäller: z eakt normalfördelad, π (1 π ) 0,6(0,4) n n 4. Formulera beslutsregel P ( Z > z) 0.05 z1 α 0. 95 1,645 {Från N(0,1) tabellen} Beslutsregel: Om testvariabeln (z) ligger i det kritiska området då förkastar vi H 0 och godtar H 1, om testvariabeln (z) ligger utanför det kritiska området vi säger att det finns inte tillräckligt med bevis för att förkasta H 0. Dvs. Om z>1,645 förkasta H 0, annars inte förkasta H 0 Illustrerar med ett diagram som visar där vi kan och kan inte förkasta H 0. 5. Genomför en undersökning och fatta ett beslut angående H 0 En undersökning genomfördes bland studenter i systemvetenskap som gick ut från KAU år 00; av 100 studenter det var 70 som sa att de hade en anställning inom de första 6 månader. 70 p 0,7 n 100 p 0,6 0,7 0,6 Testvariabel: z, 04 0,6(0,4) 0,6(0,4) n 100 Det ligger i höger svansen, vi kan förkasta nollhypotesen. På 5% signifikansnivån, vi kan förkasta H 0 och godtar H 1. Vi har, med 95% säkerhet, lyckats bevisa att KAU studenter som avslutade sina studier i systemvetenskap år 00 hade större möjlighet att få en anställning inom de första 6 månader jämfört med fackförenings påstående.