Tentamen i Matematisk statistik Kurskod S0001M

Relevanta dokument
Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Ämneskod-linje S0001M. Tentamensdatum Poäng totalt för del 2 30 (3 uppgifter) Skrivtid

Tentamen i Matematisk statistik Kurskod S0001M

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys).

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

Kompletterande kursmaterial till kursen Matematisk statistik.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i Matematisk statistik Kurskod S0001M

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Kursboken Vännman: Matematisk statistik Kompletterande kursmaterial till kursen Matematisk statistik (formelblad och kompendiet Regressionsanalys.

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

LABORATION 3 - Regressionsanalys

Föreläsning G60 Statistiska metoder

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Uppgift a b c d e Vet inte Poäng

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

F3 Introduktion Stickprov

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

TENTAMEN I STATISTIKENS GRUNDER 2

0 om x < 0, F X (x) = c x. 1 om x 2.

Tentamen i Dataanalys och statistik för I den 28 okt 2015

(a) Avgör om A och B är beroende händelser. (5 p) (b) Bestäm sannolikheten att A inträffat givet att någon av händelserna A och B inträffat.

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

TENTAMEN I STATISTIKENS GRUNDER 2

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Stockholms Universitet Statistiska institutionen Termeh Shafie

4 Diskret stokastisk variabel

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Avd. Matematisk statistik

Lufttorkat trä Ugnstorkat trä

Avd. Matematisk statistik

TENTAMEN Datum: 14 feb 2011

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Avd. Matematisk statistik

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Avd. Matematisk statistik

Uppgift 2) Datum: 23 okt TENTAMEN I MATEMATIK OCH MATEMATISK STATISTIK, kurskod 6H3000

, s a. , s b. personer från Alingsås och n b

Föreläsning 12, FMSF45 Hypotesprövning

2. Test av hypotes rörande medianen i en population.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Obligatorisk uppgift, del 1

Matematisk statistik LKT325 Tentamen med lösningar

Uppgift 1. f(x) = 2x om 0 x 1

FACIT: Tentamen L9MA30, LGMA30

Lycka till!

Föreläsningsanteckningar till kapitel 8, del 2

Transkript:

Tentamen i Matematisk statistik Kurskod S1M Poäng totalt för del 1: 5 9 uppgifter) Tentamensdatum 18-6- Poäng totalt för del : 3 3 uppgifter) Skrivtid 9. 14. Lärare: Niklas Grip Jourhavande lärare: Niklas Grip Tel: 9-49 3 9 Examinator: Mykola Shykula Tillåtna hjälpmedel: Räknedosa utan möjligheter till kontakt med omvärlden eller läsning av sparade dokument), Kursboken Vännman: Matematisk statistik. I kursboken får anteckningar och post-it lappar finnas, men inte lösta exempel. Kompendium om regressionsanalys Formelblad Tabeller Tentamen består av två delar. På den första delen del 1), som är obligatorisk för att kunna bli godkänd, behöver enbart svar lämnas in, men om korta lösningar bifogas så finns det vid gränsfall möjlighet att få delpoäng på en uppgift. Delpoäng ges i första hand om en uppgift i stort sett behandlats korrekt men slarvfel begåtts. Om kortfattade lösningar ej bifogas så finns inga möjligheter att få delpoäng på en uppgift. För godkänt krävs minst 17 poäng på del 1. Svaren för del 1 ska fyllas i på det blad som bifogas tentamen. Det ifyllda svarsbladet skall läggas först om du lämnar in även lösningar och bifogas oavsett om du lämnat in lösningar eller ej. OBS! Om inte det ifyllda svarsbladet lämnas in bedöms tentamen som underkänd. På den andra delen del ), som gäller tentamen för överbetyg, ska fullständiga lösningar lämnas in. Tänk på att redovisa dina lösningar på ett klart och tydligt sätt och motivera resonemangen. Vid bedömningen av lösningarna läggs stor vikt vid hur lösningarna är motiverade och redovisade. För betyg 4 krävs godkänt på del 1 samt minst 13 poäng på del. För betyg 5 krävs godkänt på del 1 samt minst 3 poäng på del. OBS! Det går inte att kompensera underkänt på del 1 av tentamen med poäng från del. Ange på tentamensomslaget om du har lämnat in lösningar på del genom att kryssa för de sista tre uppgifterna. Om du plussar för överbetyg så skriv detta på tentamensomslaget. LYCKA TILL! 1 14)

Tentamen i Matematisk statistik, S1M, del 1 18-6- 1. Luleåstudenten Lisa hoppas få sova ut till klockan 1 dagen efter en statistiktenta. Från tidigare erfarenheter uppskattar hon att det finns tre möjliga saker som skulle kunna väcka henne före det. Hon uppskattar sannolikheten för dessa händelser som följer. 7 % sannolikhet att dörrklockan ringer före klockan 1. 8 % sannolikhet att telefonen ringer före klockan 1. 9 % sannolikhet att katten väcker henne före klockan 1. Antag att detta är oberoende händelser. Vad blir då sannolikheten att Lisa väcks före klockan 1 nästa morgon? p). I ett stort lager på en glassfabrik innehåller 4 % av glassarna nötter. 36 % av glassarna på lagret är glasstrutar och 3 % av glasstrutarna innehåller nötter. Om en slumpartat vald glass från lagret innehåller nötter, vad är då sannolikheten att den är en glasstrut? p) 3. En vanlig sexsidig tärning kastas 17 gånger. a) Vad är sannolikheten att den första ettan kommer vid det sjuttonde kastet? 1 p) b) Vad är sannolikheten att minst tre av de 17 kasten blir en etta? Använd ej tabell. p) 4. I det gemytliga grevskapet Midsomer i England har antalet mord befunnits vara Poissonfördelat med i genomsnitt 6 mord per 1- veckorsperiod. Vad är sannolikheten att en vikarierande poliskonstapel får högst mord att utreda under sina 1 veckor i Midsomer? p) 5. Som ett test av sanningshalten i talesättet en bild säger mer än 1 ord fick 41 slumpmässigt valda personer betrakta en bild under 6 minuter och beskriva den i ord så utförligt som möjligt. För varje person räknades antalet ord. De 41 insamlade värdena betraktades som oberoende observationer på en stokastisk variabel som med försumbara approximationsfel) kan antas normalfördelad. Stickprovets standardavvikelse var 37 ord och dess medelvärde var 118 ord. a) Finns det fog att hävda att det förväntade antalet ord som en person behöver för att beskriva bilden är mer än 1 ord? Utför ett hypotestest på 1 % signifikansnivå och besvara frågan med JA eller NEJ. Ange även observerat värde på testvariabeln samt den kritiska gräns som testvariabeln jämfördes mot. 3 p) 14)

Tentamen i Matematisk statistik, S1M, del 1 18-6- b) Beräkna den undre gränsen för ett 99 % konfidensintervall för det genomsnittliga antal ord som en person behöver för att beskriva bilden. 1 p) 6. En stokastisk variabel ξ har frekvensfunktionen { 11 fx) = x1 om 1 x 1, annars. a) Bestäm väntevärdet för ξ. 1 p) b) Bestäm variansen för ξ. 1 p) 7. En tillverkare i skidbranschen gör en omfattande testserie för att jämföra olika typer av glidpreparering av längdskidor. För varje skidpar gör en erfaren skidåkare glidtester med start från stillastående i fartställning vid en utmärkt punkt på ett backkrön. Man mäter elektroniskt tiden för passage mellan två punkter längre ned i backen. Av de uppmätta tiderna för respektive skidpar används den femte kortaste och femte längsta för en intervallskattning [ξ5), ξ16)] av median-glidtiden mellan de två kontrollpunkterna. Räkna ut konfidensgraden för denna intervallskattning. p) 8. Några studenter mäter handledernas omkrets på 18 kvinnor och 18 män för en laboration i statistik. De mäter på båda handlederna och noterar vilken sida som är dominerande till exemper höger sida för högerhänta). a) Figur 1 visar två diagram. Ett av dessa jämför kvinnor mot män för icke dominerande sida. Det andra jämför dominerande mot icke dominerande sida för kvinnor. Vilket av diagrammen a) eller b)) jämför dominerande mot icke dominerande sida? 1 p) Omkrets cm) 19 18 17 16 15 14 Omkrets cm) 18 16 14 13 4 6 8 1 1 14 16 18 a) 1 4 6 8 1 1 14 16 18 b) Figur 1: Ett av dessa diagram jämför kvinnor mot män för icke dominerande sida. Det andra jämför dominerande mot icke dominerande sida för kvinnor. 3 14)

99 Tentamen 9 i Matematisk statistik, S1M, del 1 18-6- Percent 5 Normal Probability Plot Versus Fits b) Studenterna vill jämföra dominerande mot icke dominerande sida för kvinnor. Med beteckning x k för omkretsen på dominerande -1 1 sida och y k för omkretsen på icke dominerande sida - så beräknas 1 differenserna - -1 z k = x k y k för 1 k = 1,,..., 18. Stickprovens medelvärden Standardized och standardavvikelser Residual är Standardized Residual 1 3 4 Fitted Value 5 Frequency 8 6 4 x =15,66, Histogram y =15,56, z =,1, s x =1,447, s y =1,447, s z =,169. Under antaganden om normalfördelning och oberoende, 1 beräkna ett 95 % konfidensintervall för förväntade skillnaden mellan dominerande och icke dominerande sida för kvinnor. Ange intervallets nedre gräns i svarsbladet. -1 1 p) c) Studenterna vill även göra en hypotesprövning, och ställer därför - upp följande nolllhypotes och mothypotes: - -1 1 H : Det finns Standardized ingen genomsnittlig Residual skillnad mellan dominerandeobservation Order och icke dominerande sida för kvinnor. Enligt sied H 1 34 : Det I Regressionsanalbskompenediet finns en genomsnittlig skillnad så mellan har vi dominerande och icke dominerande sida för kvinnor. Ej balkong X =): E Y) X 1458 16, 46X 8 1 1 1 4 1 6 1 8 4 6 8 Finns det på 5 % signifikansnivå underlag för att dra slutsatsen Balkong att Xdet =1): finnseen Ygenomsnittlig ) ) skillnad 1 mellan 3) X1dominerande 113 9.16 och X1 Tbedlig skillnaed icke dominerande i lutning utan sida at för behöva kvinnor? plota Svaraupp JA eller något. NEJ. Efekten av balkong verkar alltså h tbedligt beroenede Tips: Utnyttja av btan. resultatet För test i b). på signiikansnivå 5 % meed edirektmetoeden 1 p) ör hbpotesern H : och H`1 : 3 9. a) 3En student vill använda så backward konstaterar ellimination vi för att hitta lämpliga variabler för en modell för lägenhetspriser. Studenten 3 börjar och linjerna med 9 olika har olika variabler. lutning. Regressionsanalys med Minitab för ett stickprov på 31 lägenheter ger då bland annat följande., vilket ger at 1. Term Coef SE Coef T-Value P-Value VIF Constant 1543 334 4,6, Avgift -,56,85 -,9,38 37,73 Rum -316 538 -,59,563 97,77 Kvm 4, 8,9 1,45,16 16,15 Våning -,6 63, -,33,746 5, Balkong1-47 415 -,98,338 7,16 Avgift*Balkong,34,311,75,461 85,97 Rum*Balkong 33 59,51,613 199,87 Kvm*Balkong -11, 31, -,36,74 36,73 Våning*Balkong 19,8 71,9,7,786 7,3 Standardized Residual 1 1 1 4 P,14,5 6 Versus Order Uppgift a), backward elimination med 5 % signifikansnivå: Välj utifrån detta vilken variabel som studenten först bör plocka bort Tar bort från modellen. Våning*Balkong. 1 p). Term Coef SE Coef T-Value P-Value VIF Constant 155 36 4,75, Avgift -,69,76 -,97,341 36,77 Rum -317 57 -,6,553 97,76 Kvm 41,9 8,3 1,48,153 16,14 Våning -5,5 9,8 -,18,855 1,18 Balkong1-4 45 -,99,334 7,13 Avgift*Balkong,5,99,84,41 8,91 Rum*Balkong 34 577,53,64 199,85 Kvm*Balkong -11, 3,5 -,37,716 36,7 H ör Tar bort Våning 4 14)

Tentamen i Matematisk statistik, S1M, del 1 18-6- b) Efter att ha eliminerat alla utom två variabler görs en ny regressionsanalys samt Predict-kommandot i Minitab, vilket bland annat ger följande resultat med de två kvarvarande variablerna omdöpta till X 1 och X samt vissa siffervärden dolda). Coefficients Term Coef SE Coef T-Value P-Value VIF Constant 11 169 7,17, Kvm X 1,88,85 7,33, 1,7 Avgift*Balkong,1517,4 3,61,1 1,7 X Prediction for Pris Variable Setting Kvm X 1 a 49 Avgift*Balkong b 1676 X Fit SE Fit 95% CI 95% PI 486,99 79,5711 34,; 649,99) 176,73; 311,6) Ange den undre gränsen för ett 95 % konfidensintervall för effekten av X 1 -variabeln på priset. p) c) Använd Minitab-resultaten i b) för att ange den övre och undre gränsen för ett intervall som med 95 % säkerhet innehåller priset för en ny vald lägenhet med X 1 = a och X = b. p) Slut på del 1. Glöm inte att bifoga svarsbladet med tentan! 5 14)

Tentamen i Matematisk statistik, S1M, del 1 18-6- Tabell med svar till del 1 Lägg detta blad först i tentamen Namn:................................................................... Personnummer:.......................................................... Sannolikheter anges som ett tal mellan och 1 i decimalform om inget annat anges. Fråga Svar Poäng 1 Sannolikhet två decimaler), Sannolikhet två decimaler),45 3 a Sannolikhet tre decimaler),9 1 b Sannolikhet fyra decimaler),5565 4 Sannolikhet två decimaler),1 eller,14) 5 a Kritisk gräns tre decimaler),43 1 Värdet på testvariabeln tre decimaler),67 1 Mer än 1 ord? JA/NEJ) JA 1 b Undre gräns avrunda till heltal) 998 1 6 a Väntevärde en decimal). 1 b Varians exakt eller fyra decimaler) 11 13,986 1 7 Sannolikhet tre decimaler),988 8 a a eller b a 1 b Undre gräns tre decimaler) -,8 1 c Skillnad dom/icke dom sida? JA/NEJ) NEJ 1 9 a Variabelnamn Våning*balkong 1 b Undre gräns två decimaler) 15,4 c Undre gräns två decimaler) 176,7 Övre gräns två decimaler) 311,6 Totalt antal poäng 5 6 14)

Tentamen i Matematisk statistik, S1M, del 18-6- Till uppgifterna på del krävs fullständiga lösningar. 1. a) Fem stolar står längs långsidan av ett bord. Fem personer A E sätter sig slumpmässigt på stolarna. Vad är sannolikheten att A och B hamnar bredvid varandra? 5 p) b) Fem stolar står längs långsidan av ett bord. Fem personer A E sätter sig slumpmässigt på stolarna. Vad är sannolikheten att A, B och C hamnar bredvid varandra? Till exempel ABC, ACB eller annan ordning.) 5 p) 11. Ett bryggeri tappar upp must i halvlitersflaskor med en maskin för vilken en noggrann undersökning har visat att antalet deciliter must i en slumpvis vald flaska kan betraktas som en observation på en normalfördelad stokastisk variabel med standardavvikelse,5 deciliter och okänt) väntevärde µ. Man vill justera maskinen till ett väntevärde µ som ger sannolikhet, 5 att en slumpvis vald flaska innehåller mindre än 5 dl must. a) Räkna ut µ med fyra decimalers noggrannhet. p) b) För att säkerställa att maskinen är rätt kalibrerad vill bryggerichefen med jämna mellanrum göra en noggrann mätning av innehåller i n flaskor och justera maskinen om de uppmätta volymerna talar för att det verkliga väntevärdet µ är mindre än det önskade väntevärdet µ. En hypotestest med högst 1 % signifikansnivå föreslås. Dessutom vill bryggerichefen att testets styrka skall vara minst 99 % i µ = µ, deciliter. Formulera tydligt nollhypotes, mothypotes, vilken test som utförs, gör lämpliga antaganden om oberoende samt räkna ut värden på n och kritisk gräns enligt bryggerichefens önskemål. 8 p) 1. En lärare och examinator för en nystartad universitetskurs är nyfiken på hur svårighetsgraden på kursen och tentan blev. För motsvarande kurs på några andra universitet fann läraren att 67 % av studenterna klarat sin första tenta de senaste åren. Vid första tentatillfället för den nystartade kursen var det 58 studenter av 75 skrivande som klarade tentan. Detta är ett betydligt mindre underlag än vad som fanns tillgängligt för de andra universiteten, men läraren vill använda det för att uttala sig om hur stor andel av en tänkt större grupp studenter som skulle ha klarat tentan om de deltagit vid detta första kurstillfälle. Gör ett hypotestest för att undersöka om man med felrisk högst 5 % kan hävda att mer än 67 % av en större grupp studenter skulle ha klarat samma tenta. Formulera tydligt dina slutsatser så att en person som inte har läst statistik kan förstå. Tips: Här kan direktmetoden vara lämplig. 1 p) 7 14)

Tentamen i Matematisk statistik, S1M, del 18-6- Lösningsförslag Det som följer är bara lösnngsförslag. Det finns som regel flera olika sätt att lösa en uppgift, så det är inget måste att följa dessa lösningsförslag om man tycker att en annan lösning känns enklare eller mer naturlig och den ger samma svar. 1. Kalla händelserna A, B och C med P A) =,7, P B) =,8 och P C) =,9. Eftersom händelserna kan antas vara oberoende så fås att P A B C) =1 P A C B C C C ) = 1 P A C ) P B C ) P C C ) Svar:, =1,93,9,91,18. Att svara,6+,7+,8 =,4 ger poäng, ty det förutsätter disjunkta händelser, och dels kan de ej vara disjunkta eftersom de är oberoende enligt en av lektionsuppgifterna) och dels faller det på sin egen orimlighet. Disjunkta händelser skulle till exempel innebära att om dörrklockan ringer före klockan 1 så är det fysikaliskt omöjligt för telefonen att ringa före klockan 1.). För en slumpartat vald glass inför vi händelserna N: Glassen innehåller nötter. S: Glassen är en glasstrut. Givet är att P N) =,4, P S) =,36 och P N S) =,3. Då följer att P S N) = P S) P N S) =,36,3 =,18 och P S N) = P S N) P N) =,18,4 =,45. Svar:,45 3. a) ) 5 16 6 1 6.91 b) Låt ξ vara antalet ettor. Då är ξ Bin 17; 6) 1 och P ξ 3) =1 P ξ ) =1 17 ) 1 6) 5 6) 17 + 17 1 ) 1 6) 1 5 6) 16 + 17 ) 1 6) 5 6 1,4435 =,5565. Svar:,5565 Skulle någon försöka sig på en approximativ lösning med tabellvärde så ger approximationen ξ Bin 17;,15) att P ξ 3) = 1 P ξ ) 1,5198 =,48 ) 15 ) 8 14)

Tentamen i Matematisk statistik, S1M, del 18-6- och approximationen ξ Bin 17;,) ger att P ξ 3) = 1 P ξ ) 1,396 =,694, vilket i båda fallen är dåliga approximationer. För binomialfördelning bör alltså tabellen användas bara om man har tabellvärde för exakt rätt sannolikhet.) 4. Låt ξ vara antalet mord under de givna 1 veckorna. Det är givet att ξ Po6). Enligt formelbladet är då Eξ) = V ξ) = 6. Eftersom 6 > 15 så kan vi ej använda Poisson-tabellen, men enligt Figur 6.6 på sidan 17 i läroboken så gäller approximativt att ξ N6, 6). Detta ger att ) ξ 6 6 P ξ ) =P Φ 1,18) = 1 Φ1,18) 6 6 1,881 =,119. Alternativa lösningar Skulle någon prova halvkorrigering så ger det ) ξ 6,5 6 P ξ,5) =P Φ 1,8) = 1 Φ1,8) 6 6 1,8599 =,141. Uträkning med Matlab) utan att approximera med normalfördelning ger svaret,1387. Svar:,1 eller,14 5. Låt ξ k vara antalet ord som person nummer k behöver för att beskriva bilden, k = 1,, 3,..., 41. Medelvärdet för dessa är ξ Nµ,σ/ 41). a) För det förväntade antalet ord µ som en person behöver för att beskriva bilden så har vi hypoteser H : µ = 1 H 1 : µ > 1 Eftersom endast stickprovets standardavvikelse är känd så används testvariabeln τ = ξ 1 σ / 41, τ t4) om H är sann. H kommer att förkastas om x 1 s/ > k, där den kritiska gränsen 41 för signifikansnivå 1 % skall väljas så att ) ξ 1,1 = P σ / 41 > k H k = t,1 4),43. för det givna stickprovet har vi x = 118, s = 37 och testvariabel x 1 s/,6697 > k. 41 På 1 % signifikansnivå kan vi alltså förkasta H och dra slutsatsen att en person i genomsnitt behöver mer än 1 ord för att beskriva bilden. 9 14)

Tentamen i Matematisk statistik, S1M, del 18-6- b) Ett 99 % konfidensintervall för µ är I = [x a,x + a] med a = t,5 4) 37 41,74 37 41 19,971. Detta ger I=[998, 1 58]. 6. a) Eξ) = 11 1 xfx) dx = 1 x11 dx = 11 Svar: Eξ) = b) V ξ) = x Eξ)) fx) dx = 11 Svar: V ξ) = 11 13,986. 1 1 x1 dx = 11 [ ] x 1 1 1 =. 1 [ ] x 13 1 13 1 7. Här har teckenintervall använts för att uppskatta median-glidtiden mellan de två kontrollpunkterna. Låt ξ k vara glidtiden för mätning nummer k med k = 1,,...,. Vi förutsätter att variablerna är oberoende och har samma median m, det vill säga P ξ k m) =.5, k = 1,, 3,,. Låt ξ1), ξ),..., ξ) vara variablerna ξ k sorterade i växande ordning. Det valda konfidensintervallet är då I = [ξ5), ζ16)]. Låt α vara antalet ξ k m och låt β vara antalet ξ k m. De har båda binomialfördelning α,β Bin;,5). Alltså är P m I) = 1 P m I) = 1 P m < ξ5)) m > ξ16))) = 1 P m < ξ5)) P m > ξ16)) = 1 P α 4) P β 4) 4 ) = 1.5 k.5 k k k= 4 ) = 1.5,988. k k= Konfidensgraden blir alltså 98,8 %. Man hade förstås lika gärna kunnat läsa av ur tabell att P α 4) = P β 4),59, vilket ger sannolikhet 1,59 =,988.) 8. a) Då man jämför dominerande mot icke dominerande sida så bör det finnas ett mycket tydligt beroende mellan dessa två mätvärden för varje enskild person korrelationskoefficient nära 1, starkt kopplat till kroppslängd), samtidigt som man kan förvänta sig att se tydliga variationer mellan paren, precis som i Figur 1 b). Svar: b b) Under antaganden om normalfördelning och oberoende som sammanfattat för stickprov i par på sid 16 i läroboken så blir ett 95 % konfidensintervall för genomsnittlig skillnad mellan dominerande och icke dominerande sida för kvinnor I = [z a, z+a] med a = t,5 18 1) s z,11,169. 18 18 Avrundning utåt) till två decimalers noggranhet ger Svar: -,8 I = [,8;,8]. 1 14)

Tentamen i Matematisk statistik, S1M, del 18-6- c) Eftersom vi har dubbelsidig mothypotes och signifikansnivå som matchar konfidensgraden i b) det vill säga,5 = 1,95) så är enklaste lösningen att konstatera att eftersom ingår i intervallet I i b) så kan vi inte förkasta H på 5 % signifikansnivå. Svar: NEJ 9. a) Den variabel som har högst P-värde bör tas bort först. Svar: Våning*balkong b) Enligt uppgift a) var det 31 lägenheter i stickprovet. Formel 47) på sidan 4 i Regressionsanalyskompendiet ger då intervallgränserna,88 ± t,5 31 3),85,88 ±,48,85. Skulle någon välja fel antal frihetsgrader och tabellvärde t,5/ 31 ) = t,5 9) =,45 så blir undre gränsen 15.5175 15,5.) Svar: Undre gräns,88,48,85 = 15,43 15,4. c) Det är prognosintervallet som söks, och dess övre gräns 311,6 kan avläsas i Minitab-utskriften. Där kan även avläsas att intervallets mittpunkt är m def = 486,99. Undre gränsen blir därför m 311,6 m) = 176,7. Svar: Det sökta prognosintervallet är [176,7; 311,6]. Lösningsförslag del 1. a) De gynsamma utfallen har åtta olika möjliga placeringar av A och B: AB, AB, AB, AB, BA, BA, BA, BA. För varje sådan placering kan C, D och E placeras ut på 3 1 = 6 olika sätt. Alltså totalt g = 8 6 gynnsamma utfall och på vanligt vis m = 5 4 3 1 = 1 möjliga utfall. Alltså sannolikhet g m = 8 6 1 = 5, det vill säga 4 % sannolikhet. b) De gynsamma utfallen har nu 3 6 = 18 olika möjliga placeringar av A och B: ABC, ABC, ABC, CAB, CAB, CAB, BCA, BCA, BCA, ACB, ACB, ACB, BAC, BAC, BAC, CBA, CBA, CBA. För varje sådan placering kan D och E placeras ut på 1 = olika sätt. Alltså totalt g = 18 = 36 gynnsamma utfall och som tidigare m = 5 4 3 1 = 1 möjliga utfall. Alltså sannolikhet g m = 36 6 1 = 3 1, det vill säga 3 % sannolikhet. 11 14)

Tentamen i Matematisk statistik, S1M, del 18-6- 11. a) Låt ξ vara mängden must i en slumpvis vald flaska. Vi har då ξ Nµ,,5) där vi vill välja µ så att P ξ < 5) =, 5. Vi har då att η def = ξ µ,5 N,1) och vill alltså välja µ så att ξ µ, 5 =P ξ < 5) = P,5 < 5 µ ) = P η < 5 µ ),5,5 =P η > 5 µ ) = P η > µ ) 5.,5,5 Tabellen på sidan 31 i läroboken ger då att µ 5,5 3,896 µ 3,896,5 + 5 5,1945. b) Vi har ett stickprov ξ i Nµ,,5) för i = 1,,..., n. Under antagande att variablerna är oberoende så blir medelvärdet ξ N µ,,5 ). n Vi har hypoteser H : µ = 5,1945, H 1 : µ < 5,1945. Hypotestesten går till så att för ett givet kritiskt värde k så förkastas H om det observerade stickprovets medelvärde x < k. Det gäller att välja n och k så att testet får signifikansnivå,1 =P ξ < k ) H = P ξ < k µ = 5,1945 ) ξ 5,1945 =P,5/ n < k 5,1945 ),5/ n µ = 5,1945 =P η < k 5,1945 ),5/ n η N,1) =P η > 5,1945 k ),5/ n η N,1) och styrka,99 =P ξ < k µ = µ, ) ξ 5,1745 =P,5/ n < k 5,1745 ),5/ n µ = 5,1745,99 =P ζ < k 5,1745 ),5/ n ζ N,1),1 =P ζ > k 5,1745 ),5/ n ζ N,1). 1 14)

Tentamen i Matematisk statistik, S1M, del 18-6- De båda villkoren kombinerade ger { 5,1945 k,5/ n = λ,1 k 5,1745,5/ n = λ,1 { 5,1945 k = k 5,1745 k 5,1745,5/ n = λ,1 { 5,1945 + 5,1745 = k n =,5λ,1 k 5,1745 { k = 5,1845 n,5,363 5,1845 5,1745 11,63. För att få signifikansnivå högst 1 % och styrka minst 99 % så avrundas n 135,9 till närmast större 1 heltal, det vill säga k = 5,1845 och n = 136. 1. Här kan direktmetoden användas. Låt p vara andelen av alla studenter som skulle ha klarat samma tenta. För ett stickprov med 75 studenter, låt ξ vara antalet av dessa som klarar tentan. Det är rimligt att anta att tentaresultatet för olika studenter är statistiskt oberoende, så att ξ Bin75, p). Vi vill testa följande hypoteser: H : p =,67 H 1 : p >,67 Med direktmetoden och observerat stickprov x = 58 beräknar vi α = P ξ 58 H ) = P ξ 58 ξ Bin75;,67)). För ξ Bin75;,67) har vi Eξ) = 75,67 = 5,5 och V ξ) = 75,67 1,67) = 16,585. Eftersom 75,67 1,67) = 16,585 > 1 så ger Figur 6.6 på sidan 17 i läroboken att vi kan approximera med normalfördelning: α P ξ 58 ξ N5,5; ) 16,585) =1 P ξ 58 ξ N5,5; ) 16,585) ξ 5,5 58 5,5 =1 P ξ N5,5; ) 16,585) 16,585 16,585 ) 58 5,5 =1 Φ 1 Φ 1,9) 1,9713 =,87. 16,585 Eftersom vi har enkelsidig mothypotes så skall α jämföras mot signifikansnivån 5 %, och eftersom,87 <,5 så kan H förkastas på 5 % signifikansnivå. 1 Kan till exempel inses om man skissar upp frekvensfunktionen för ξ för µ = 5,1745 och för µ = 5,1945 och skuggar signifikansnivå respektive styrka i figuren, samt funderar över hur dessa ändras om n ökar så att standardavvikelsen för ξ minskar. 13 14)

Tentamen i Matematisk statistik, S1M, del 18-6- Alternativa approximationer Man kan lika gärna först skriva α = 1 P ξ 57) och sedan approximera med normalfördelning, vilket ger α 1 Φ 1,66) 1,9515 =,485. En tredje variant är att även använda halvkorrektion α =1 P ξ 57) 1 P ξ 57.5 ξ N5,5; ) 16,585) 1 Φ 1,78) 1,965 =,375. Vilket är den bästa av de tre approximationerna uträkning i Matlab utan normalfördelningsapproximation ger sannolikhet,3455). I alla tre fallen blir dock resultatet av hypotesprövningen detsamma. Svar: Även för större studentgrupper kan man med felrisk signifikansnivå) 5 % hävda att mer än 67 % hade klarat den aktuella tentan. 14 14)