Grundläggande statistik med regressionsanalys Ladokkod: TT131A 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-05-28 Tid: 14-18 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen. Totalt antal poäng på tentamen: För att få respektive betyg krävs: För betyget 5 krävs 40 p För betyget 4 krävs 30 p För betyget 3 krävs 20 p 50 p Allmänna anvisningar: Om du anser att någon uppgift är oklar eller att information saknas: Gör egna antaganden och ange tydligt motiven för dessa i inledningen av ditt svar. Skriv tydligt och strukturerat. Svar som är svåra att följa eller läsa ger 0 p. Alla svar ska motiveras. Om inte annat anges i uppgiften ska alltså beräkningar som ligger till grund för svar alltid visas. Skriv i möjligaste mån dina svar i själva tentan i anslutning till respektive uppgift hellre än på lösblad. Nästkommande tentamenstillfälle: Se www.hb.se/ih Student Tentamen Rättningstiden är i normalfall tre veckor, annars är det detta datum som gäller: Viktigt! Glöm inte att skriva namn på alla blad du lämnar in. Lycka till! Ansvarig lärare: Björn Lantz Telefonnummer: 0768-606024
Uppgift 1 (5p) Ett stickprov med n = 5 uppvisar följande värden för en viss variabel: 16, 14, 12, 16, 12. Beräkna a) Medelvärde b) Standardavvikelse c) Snedhet d) Genomsnittlig absolutavvikelse e) Variationsvidd
Uppgift 2 (5p) En mycket riskfylld aktivitet i en viss industriell process lyckas med sannolikheten 0,08. a) Anta att aktiviteten upprepas tills ett lyckande har uppnåtts. I. Vad är det förväntade antalet upprepningar? II. Vad är sannolikheten att processen kommer att upprepas 10 gånger?(avrunda svaret till 4 decimaler.) b) Anta att aktiviteten upprepas tills tre lyckanden har uppnåtts. I. Vad är det förväntade antalet upprepningar? II. Vad är sannolikheten att processen kommer att upprepas 10 gånger? (Avrunda svaret till 4 decimaler.)
Uppgift 3 (5p) Kvalitetskontroll för en viss kemisk produkt utförs genom ett test som visar antingen grönt eller rött. Sannolikheten för att produkten ska vara defekt är 0,02. Testet ger rätt utfall (d.v.s. rött om produkten är defekt, eller grönt om den inte är defekt) med sannolikheten 0,8. Vad är sannoliheten att en slumpmässigt vald produkt verkligen är defekt om testet visar rött? (Avrunda svaret till 4 decimaler.)
Uppgift 4 (5p) Anta att en viss automatiserad process kraschar i genomsnitt 2 gånger per timme. Krascherna inträffar enligt ett slumpmässigt mönster. a) Vad är sannolikheten att det är mer än 20 minuter mellan två krascher? b) Vad är sannolikheten att det är mindre än 40 minuter mellan två krascher? c) Om det redan har gått 15 minuter sedan föregående krasch, vad är sannolikheten att det är mindre än 40 minuter till nästa krasch?
Uppgift 5 (5p) Anta att X~B(3, 1/9). Vilken fördelning kommer Y att följa om Y = mx där a) m = 1? b) m är ett stort tal? Endast svar krävs, motivering behövs inte.
Uppgift 6 (5p) Stickprovsdata från två olika populationer föreligger enligt tabellen nedan. Testa först om varianserna är signifikant olika, och sedan om medelvärdena är signifikant olika. Använd signifikansnivån α = 0,05 i båda fallen. Population 1 Population 2 Stickprovsmedelvärde 22,2 25,4 Stickprovsstorlek 13 13 Stickprovsstandardavvikelse 4,6 8,5
Uppgift 7 (5p) I en undersökning tillfrågades 120 slumpmässigt utvalda personer om vilken av de tre lokala kandidaterna till posten som kommunalråd de föredrog. 35 personer föredrog kandidat nr 1, 32 personer föredrog kandidat nr 2, och 53 personer föredrog kandidat nr 3. Kan man därav dra slutsatsen att de tre kandidaterna har olika stöd i opinionen? Använd signifikansnivån α = 0,05.
Uppgift 8 (5p) Ett opinionsundersökningsföretag tillfrågade 800 personer om deras inställning till regeringens senaste budgetförslag. 376 uppgav att de var positiva. a) Kan man därav dra slutsatsen att andelen positiva i hela populationen understiger 0,5? Använd signifikansnivån α = 0,05. b) Beräkna och tolka ett 95 % konfidensintervall för den sanna andelen positiva personer i populationen.
Uppgift 9 (5p) En mätbar resultatvariabel (kallad Y) för en viss process kan teoretiskt sett antas utvecklas sig linjärt över tid så länge processen är aktiv. För de fem första veckorna som processen har varit aktiv har variabelvärdena 1,4, 1,7, 1,8, 2,0 samt 2,5 uppmätts. Din uppgift är att göra en regressionsanalys som visar hur Y är linjärt beroende av tiden. Visa alla beräkningar. a) Skatta den sanna regressionslinjens koefficienter b) Beräkna och gör en tolkning av korrelationen
Uppgift 10 (5p) Bilden nedan visar en Excel-output från en ensidig variansanalys. a) Ska nollhypotesen att alla tre grupperna har samma medelvärde förkastas? Motivera ditt svar! b) Använd Tukeys test med signifikansnivån α = 0,05 för att jämföra medelvärdena. Observera att MKv i svensk Excel är samma sak som MS i engelska versionen.