Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl 08.15-13.15



Relevanta dokument
Tentamen i Statistik, STA A13 (4 poäng) Lördag 11 november 2006, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 27 mars 2004, kl

Statistisk undersökningsmetodik (Pol. kand.)

Avd. Matematisk statistik

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Lektion 1: Fördelningar och deskriptiv analys

Tentamen i Matematisk statistik Kurskod S0001M

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

TENTAMEN KVANTITATIV METOD (100205)

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen MVE265 Matematisk statistik för V,

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

Resultatet läggs in i ladok senast 13 juni 2014.

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Uppgift 1. Deskripitiv statistik. Lön

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Diskussionsproblem för Statistik för ingenjörer

ÖVNINGSUPPGIFTER KAPITEL 9

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Statistik och epidemiologi T5

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

Tentamen i Matematisk statistik, LKT325,

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Statistik Lars Valter

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Tentamen i Matematisk statistik Kurskod S0001M

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 13 november 2004, kl

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

Tentamen i Matematisk statistik Kurskod S0001M

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Storräkneövning: Sannolikhetslära

Datorlaboration 2 Konfidensintervall & hypotesprövning

DATORÖVNING 4: DISKRETA

Summor av slumpvariabler

Läs noggrant informationen nedan innan du börjar skriva tentamen

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Statistik för Brandingenjörer. Laboration 1

Beskriv hur du, utan att räkna alla pärlor, kan göra en god uppskattning av hur många pärlor som finns av respektive färg. 2/0/0

Industriell matematik och statistik, LMA /14

Tentamen i Statistik, STA A10 samt STA A13 9p 24 augusti 2005, kl

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Övningssamling Internationella ekonomprogrammet Moment 1

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

1. Frekvensfunktionen nedan är given. (3p)

36 poäng. Lägsta poäng för Godkänd 70 % av totalpoängen vilket motsvarar 25 poäng. Varje fråga är värd 2 poäng inga halva poäng delas ut.

Statistiska undersökningar

RödGrön-spelet Av: Jonas Hall. Högstadiet. Tid: minuter beroende på variant Material: TI-82/83/84 samt tärningar

Lär lätt! Statistik - Kompendium

Sänkningen av parasitnivåerna i blodet

Lär lätt! Statistik - Kompendium

Statistik 1 för biologer, logopeder och psykologer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

Linjär regressionsanalys. Wieland Wermke

Uppgift 2 Betrakta vädret under en följd av dagar som en Markovkedja med de enda möjliga tillstånden. 0 = solig dag och 1 = regnig dag

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Tal Räknelagar Prioriteringsregler

Räkna med variation - Digitala uppgifter Studiematerial i sannolikhetslära och statistisk inferens. Lena Zetterqvist och Johan Lindström

Tentamen för kursen Statististik för naturvetare 16 januari

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Föreläsning 7 och 8: Regressionsanalys

Lärare 2. Lärare 1 Binomial och normalfördelning Fel i statistiska undersökningar Att tolka undersökningar Falska samband Jämföra i tid och rum

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 24 april 2004, kl

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Gaussiska primtal. Christer Kiselman. Institut Mittag-Leffler & Uppsala universitet

6-3 Statistikgranskning. Namn:

Matematisk statistik KTH. Formelsamling i matematisk statistik

Matematisk statistik KTH. Formel- och tabellsamling i matematisk statistik

STÄNG AV FÖNSTER. Regler FLAGGSPECTRUM I FLAGGSPECTRUM II FLAGGSPECTRUM III FLAGGSPECTRUM STJÄRNSPEL

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 4 mars 2006, kl

MVE051/MSG Föreläsning 7

Sannolihhet. och statistik. Vad är möjligt och vad är inte möjligt? Kommer tåget fram i tid? Blir det regn imorgon? Vi bedömer ständigt risker eller

Vara kommun Grundskoleundersökning 2014 Totalrapport. Föräldrar

TNSL11 Kvantitativ Logistik

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Hemtjänsten Svarsfrekvens 77 av 130 utdelade = 60 %

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Avd. Matematisk statistik

Transkript:

Tentamen i Statistik, STA A och STA A13 (9 poäng) Onsdag 1 november 00, Kl 0.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen miniräknare. Ansvarig lärare: Hannah Hall, telefon 00 - (0)5 700 113 Övrigt: För att få maximala poäng på en uppgift krävs att antaganden och motiveringar noga anges samt att lösningen även i övrigt är så utförlig att den utan svårighet kan följas. För betyget Godkänd krävs minst 0 poäng, för betyget Väl Godkänd krävs minst 0 poäng. Uppgift 1 9 35 77 7 7 95 3 79 77 9 9 7 57 1 77 1 5 a) Illustrera ovanstående data i ett stam-blad diagram. b) Beräkna medianen. c) Beräkna kvartilavståndet. d) Illustrera materialet i ett boxplot (lådagram). e) Utifrån dina diagram, blir medelvärdet större eller mindre än medianen? (a-e poäng vardera) Uppgift En gång om dagen på ett visst kärnkraftverk genomförs ett byte av en radioaktiv detalj, varvid en nödsituation kan uppstå. Att en nödsituation uppstår är dock mycket ovanligt, sannolikheten för det är endast 0,00. Man använder för säkerhets skull ändå ett larmsystem för att övervaka bytet. Om en nödsituation råder så går larmet med sannolikheten 0,9. Om en nödsituation inte råder så går larmet med sannolikheten 0,0. Vad är sannolikheten för att det faktiskt råder en nödsituation när larmet går? Kommentera. ( poäng)

Uppgift 3 Fyra variabler X1, X, X3 och X presenterades i följande histogram: 1 Frequency Frequency 0 0 X1 X Frequency Frequency 0 0 X3 X Samma variabler presenterades också i en boxplot diagram (lådagram), men etiketten om variabelns namn fattas. Para ihop boxplot diagrammen A, B, C och D med respektive variabel. ( poäng) 0 A B C D

Följande boxplot diagram visar fördelningen av en viss variabel delat på fem olika grupper. Jämför och kommentera på fördelningarna av de fem olika grupper (1-5). ( poäng) Uppgift Till varje del uppgift (a-e) ange och motivera fördelningen för X i följande exempel. Glöm inte att ange värdet på parametrarna. a) Hannah tar 5 lotter i ett lotteri. Lotteriet har totalt 0 lotter varav stycken är vinstlotter. Låt X beteckna antal vinstlotter som Hannah erhåller. b) En viss process i en dator som körs en gång per sekund dygnet runt åstadkommer att datorn havererar med sannolikheten 1 på en miljon. Låt X beteckna antalet haverier per månad (30 dagar). c) En revolver med plats för skott har laddats med åtta tomhylsor och två skarpa skott, slumpmässigt placerade. Man vill beräkna hur sannolikt det är att ett skott går av när man trycker fyra gånger på avtryckaren (X betecknar antal skott). d) Sannolikheten att ett flygplan av en viss typ kraschar under en flygning är 0,0001. Under ett år görs 7 000 flygningar med den aktuella flygplanstypen. Låt X beteckna antal flygplaner som kraschar ett visst år. e) Kristoffer går upp på en tentamen utan att han har pluggat innan! Han har tur, varje fråga består av sex kryssalternativ, varav ett är rätt. Totalt är det 0 frågor. Låt X beteckna antal korrekta svar Kristoffer har på sin tentamen, då han bara gissar på varje fråga. (a-e poäng vardera)

Uppgift 5 SCB har fått ett uppdrag att skatta medelåldern och proportionen med en viss egenskap i en mycket stor population. För att kunna genomföra detta så tog man ett slumpmässigt stickprov som består av 00 personer. Medelåldern för dessa beräknades till 50 år och standardavvikelsen till 5 år. Man noterade också att bland personerna i stickprovet var 0 över 55 år. Tänk att du är anställd hos SCB och du har fått följande uppgifter angående detta uppdrag: a) Skatta medelåldern i populationen med ett 95% konfidensintervall. b) Skatta andelen personer över 55 år i populationen med ett 95% konfidensintervall. Uppgift ( poäng) Antag att livslängden för glödlampor producerade av ett visst företag är en normalfördelad slump variabel med väntevärdet µ och standardavvikelsen σ = 00 timmar. Vi vill pröva nollhypotesen µ = 00 mot hypotesen µ > 00 med hjälp av ett stickprov som består av 0 individer och signifikansnivån 5%. a) Genomför hypotestestning om stickprovets medelvärdet x = 10. b) Förklara innebörden av begreppen typ I fel och typ II fel i anslutning till detta exempel. Uppgift 7 För två variabler X och Y har vi följande datamaterial: Y X 3 9 5 1 5 1 19 a) Skissa observationerna på X och Y i en graf. ( poäng)

b) Beräkna med hjälp av minsta kvadrat metoden (least square method) interceptet a och regressionskoefficienten b. c) Använd dina beräkningar i (b) för att beräkna residualspridningen (standard error of estimate). d) Beräkna determinationskoefficienten r, och tolka den. Uppgift ( poäng) En doktorand från statsvetenskap vill komplettera sin avhandling med en empirisk studie. För att denna studie skall genomföras tar han ett stickprov som består av n personer som skall intervjuas. Anta att sannolikheten att en slumpmässigt vald person befinner sig hemma vid första kontakttillfället är 0.. a) Vad är sannolikheten att högst 1 personer befinner sig hemma vid första kontakttillfället om n = 0. b) Vad är sannolikheten att högst 1 personer befinner sig hemma vid första kontakttillfället om n = 0. ( poäng)

Lösning Uppgift 1 a) Stam-blad diagram. Frequency Stem & Leaf 1 Extremes (=<35) 1. 5. 7. 9 7 7. 7779. 113 3 9. 5 b) Medianen: Q c) Kvartilavståndet: Q d) Boxplot (lådagram) Placering i ordnat + 1 data: L 5 = =, 5 Placering i ordnat + 1 data: L 50 = = 1, 5 Placering i ordnat 3( + 1) data: L 75 = = 1, 75 Kvartilavståndet Q = Q3-Q1 Extremobservationer ligger under: Q1 1,5Q Eller över: Q3 + 1,5Q Q1 ligger mellan obs och7 Q 1 = + 0,5( ) =,5 Q ligger mellan obs 1 och 13 77 + 77 Q = = 77 Q3 ligger mellan obs 1 och 19 Q3 = 3 + 0,75( 3) = 3,75 Q = 3,75 -,5 = 19,5,5 1,5(19,5) = 35,5 3,75 + 1,5(19,5) = 11,5 Det finns en extrem observation med värde 35. Minsta värdet 35 (om man bortser från extrema observationer är det ) Max värdet 9

0.00 90.00 0.00 70.00 0.00 50.00 0.00 5 30.00 VAR00007 e) Utifrån diagrammen (stam-blad och boxplot) ser man att fördelningen är negativ skev, då är medelvärdet mindre än medianen. Uppgift Från uppgiften får vi följande information: A = nödsituation råder)= 0,00 ~A) = 1 - A) = 1-0,00 = 0,99 B = Larmet går I A = nödsituation) = 0,9 B = Larmet går I ~A = nödsituation inte råder) = 0,0 Vi söker: Sannolikheten för att det faktiskt råder en nödsituation när larmet går, dvs. A = nödsitation råder I B = Larmet går) Från sannolikhetsteori vet vi: P ( A B) = Då måste vi beräkna AB) och B). AB) B) Från sannolikhetsteori vet vi: P ( B A) = AB) A) Då kan vi ta fram AB): P ( AB) = A) B A) = 0,00(0,9) = 0, 0019 Från sannolikhetsteori vet vi: P ( B) = BA) + B ~ A)

Vi vet att AB) = BA). Men vi måste tar fram B~A): B ~ A) Vi vet att: P ( B ~ A) =, ~ A) då är: P ( B ~ A) = ~ A) B ~ A) = 0,99(0,0) = 0, 079 P ( B) = BA) + B ~ A) = 0,0019 + 0,079 = 0,01 AB) 0,0019 Svaret är: P ( A B) = = = 0, 0391 B) 0,01 Dvs. % chans att det faktiskt råder en nödsituation när larmet går! Uppgift 3 Utgår ifrån fördelningen i histogramet och jämför detta med boxploterna, tänk på spridning, gruppering, medianen, skevhet mm. X1 = C X = D X3 = A X = B Kommentera på de enskillda grupper (tex. spridning, skevhet och central tendensen) och jämför alla fem grupper (tex. störst/ minst spridning, lika/olika skevhet, central tendensen, spridning).

Uppgift a) Man gör ett försök och väljer slumpmässigt 5 lotter, n=5. Det finns totalt 0 lottar i lotteriet, N=0, av dessa är vinstlotter (dvs. har S den önskad egenskap), S=. Andelen vinstlotter är π = = = 0, N 0 X betecknar antal vinstlotter Hannah erhåller. X är en diskretslumpvariabel. I varje delförsök en lott ger vinst eller ej. Delförsökerna är beroende av varandra, dvs. lotterna väljs utan återläggning. X följer en hypergeometrisk fördelning, X ~ Hyp(N=0,n=5, S=) b) X betecknar antalet haverier per månad (30 dagar), dvs. här kan man anta att det finns ingen övre gräns på antalet haverier, det är tiden som är begränsad till en månad (se fotnot **). X är en diskretslumpvariabel. På en månad körs processen: n = 0(sek)*0(min)*(tim)*30(dagar) = 59 000 gånger Varje gång processen körs är sannolikheten för haveri 1 π = = 0,000001 00000 Det genomsnittliga antalet haverier per vecka är alltså: μ = n π = 59000 * 0,000001 =,59 X följer en Poissonfördelning, X ~ Po( μ =, 59 ) **Här kan man se på svaret som en approximation till slumpvariabel X som är Binomialfördelad (eftersom π är liten och n stor), X räknar antalet haverier under en månad, dvs. X är begränsad till antal gånger processen körs, 1 n= 9 000, där sannolikheten för haverie är π = = 0,000001. 00000

c) Man gör ett försök och trycker fyra gånger på avtryckaren av en revolver, n=. Det finns totalt plats för skott i revolvern, N=, av dessa har laddats med ett skott (den önskad egenskap), S=. Andelen med skott är S π = = = 0, N X betecknar antal skott när man trycker gånger på avtryckaren. X är en diskretslumpvariabel. I varje delförsök, tryckning av avtryckaren, resulterar med en skott eller ingenting. Delförsökerna är beroende av varandra, dvs. det finns ingen återläggning av skott. X följer en hypergeometrisk fördelning, X ~ Hyp(N=, n=, S=) d) X betecknar antalet flygplaner som kraschar ett visst år, dvs. det finns ingen övre gräns på antalet krashcar, det är tiden som är begränsad till ett år. (Se fotnot**). X är en diskretslumpvariabel. Sannolikheten att ett flygplan av en viss typ kraschar under en flygning är π =0,0001, under ett år görs n=7000 flygningar. Det genomsnittliga antalet kraschar per år är: μ perår = antalflygningar sannolikhetenförkrash = 7000 0,0001 = 0,7 X följer en Poissonfördelning, X ~ Po( μ = 0, 7 ) **Här kan man se på svaret som en approximation till slumpvariabel X som är Binomialfördelad (eftersom π är liten och n stor), X räknar antalet krashar, som kan vara max antal flygningar som är n = 7 000 under ett år, där sannolikheten för krash är π = 0, 0001. e) Man gör ett försök och går upp på en tenta med 0 frågor, n=0. I varje delförsök, när man svarar på en fråga, får man antligen rätt eller fel. Sannolikheten att välja ut rätt svar på ett slumpmässigt sätt är antalrätt 1 π = = = 0,17, och är densamma vid varje fråga. antalalternativ Sannolikheten att svara rätt på en fråga är oberoende av tidiagre gissningar, dvs. delförsöken är oberoende av varandra. X betecknar antal korrekta svar Kristoffer har på sin tentamen, då han bara gissar på varje fråga. X är en diskretslumpvariabel. 1 X följer en Binomialfördelning, X ~ Bin(n=0, π = = 0, 17 )

Uppgift 5 a) n = 00, x = 50 och s=5. 50 ± 1,9.(5/0) 50 ±.5 (7,55, 5,5) b) p=0/00=0,55 0,55±1,9. 0,55.0,5/ 00 0,55±0,0 (0,50, 0,59) Uppgift a) H 0 :µ=00 H 1 :µ>00 Z=10-00/(00/)=5 Z från tabellen = 1, 5 >1, vi förkastar H 0. b) se boken. Uppgift 7 a) Y=a+b.X b=1,71 a=1,5 b) residuals: 0.9375-0.73150-1.1500 1.37500-1.715 0.905 0.59375 S Y.X =1,3. c) R =0,93.

Uppgift a) X: antal personer som befinner sig hemma vid första kontakttillfället. n=0, p=0, X är Bin(0, 0,) n*p 5 n*(1-p) 5 X är appox. N(0, ) X 1)=(X-µ)/σ (1-0)/) = Z -15,5) = 0 b) X: antal personer som befinner sig hemma vid första kontakttillfället. n=0, p=0,. X är Bin(0, 0,) X 1)=0,930 (från tabellen).