UMEÅ UNIVERSITET Institutionen för matematisk statistisk Statistiska metoder, poäng TENTAMEN -8 Per Arnqvist TENTAMEN I MATEMATISK STATISTIK Statistiska metoder, poäng Tillåtna hjälpmedel: Kursboken med tillhörande formelblad samt utdelat blad om variansanalys. Det är tillåtet att ha skrivit skrivit egna anteckningar i boken, formelbladet och på variansanalyspapperet. Miniräknare Studenterna för behålla tentamensuppgifterna. Skrivtid:.., Östra paviljongen sal 6 Betygsgränser: Maximal poäng är. För betyget godkänd krävs poäng och för betyget väl godkänd krävs 8 poäng. LYCKA TILL! Att gå vilse är ett sätt att lära sig hitta Swahili-ordspråk
. Man vill jämföra två populationer map deras medellöner. Två stickprov ur respektive population samlas in och följande data erhölls (från Minitab): Variable N Mean Median TrMean StDev SE Mean Population 8 899 9 86 Population 3 996 6 67 387 7 Testa H : att populationerna har samma medelvärde mot H a : att populationerna har olika medelvärde på % signifikansnivå.. Man vill undersöka om mycket små barn kan se skillnad på mamma och andra främmande kvinnors ansikten. I en undersökning i USA filmade man st sex veckor gamla barns beteende. Kamerorna registrerade den tid varje barn betraktade ett ansikte. Som framgår av nedstående data tycks barnen i genomsnitt betraktat mammans ansikte längre än de främmande ansiktena. Frågan som nu följer är då givetvis: är tidsskillnaden signifikant? Resultat : Mammans ansikte Mv = sek standardavvikelse = sek Främmandes ansikte Mv = 7 sek standardavvikelse = 3 sek Ställ upp nollhypotes och mothypotes och testa om skillnaden i medelvärde är signifikant på %. 3. Om man köper mjöl på stormarknad blir det ofta billigare ju mer man köper. Här har jag angett mjölpriset per kilo för lite olika mjölvikter Mjölvikt (kg) 8 6 Pris per kg i kr 6. 6..77.88.6.33 a) Rita priset per kg mot mjölvikt i ett spridningsdiagram. b) Beräkna korrelationskoefficienten. c) Bestäm determinationskoefficienten. d) Beräkna regressionslinjen y = a + b x om det är vikt som är den variabel som förklarar priset, och rita in den i ditt spridningsdiagram. e) Bestäm residualspridningen. f) Testa om lutningen är skild ifrån. g) Bestäm vad en kilos mjölpåse skulle kosta om man handlat mjöl i 3 kg förpackning. h) Och vad var det nu som inte var bra om gjorde en sådan bestämning
. I ett storstadsområde påstås det att bland de småföretag som finns så är / kvinnliga småföretagare. En grupp elever skall göra ett examensarbete för att bla ta reda på hur de kvinnliga företagsledarna upplever sin situation. De ringer därför upp femtio slumpmässigt utvalda företagsledare i området. Man observerar att åtta av dessa femtio uppringda är kvinnor. Kan man med hjälp av detta resultat hävda att det är mindre än / kvinnliga företagsledare i storstadsområdet? Testa detta påstående och redogör för de antaganden som du gör.. Vid kvicksilverundersökning av gäddor i en insjö har man bestämt kvicksilverhalten i fångade gäddor. Resultat (mg/kg):.8.6.9.8...7... Antag att kvicksilverhalten i gäddorna är normalfördelad med en sann varians som är., och att gäddorna har blivit slumpmässigt utvalda a) Gör ett 9%-igt konfidensintervall för medelkvicksilverhalten, µ, bland gäddorna i insjön. b) Kan man på signifikansnivån % förkasta N.H. µ =. mot A.H.: µ.? 6. Datorer och framförallt statistikprogram är oftast utrustat med något som kallas för slumptalsgeneratorer. Dessa kan man utnyttja till att skapa sig observationer som följer någon viss fördelning, t ex normalfördelning. Nu vill man testa en slumptalsgenerator som påstås ge N(,) observationer. Man tar därför ett stickprov på observationer, klassindelar materialet samt räknar antalet som faller i respektive intervall. Resultat Intervall Antal (-, -.96) observationer (-.96, -.6) observationer (-.6,.) observationer (.,.6) 8 observationer (.6,.96) observationer (.96, ) observationer a) Bestäm det förväntade antalet observationer i varje intervall. Tips: utnyttja normlfördelningstabellen. b) Testa N.H att generatorn ger N(,) slumptal.
7. Följande variansanalysutskrift tillsammans med tillhörande bilder är gjord. Kommentera resultat och bilder samt ange vilka slutsatser som man kan göra. One-way ANOVA: RES versus BEH Source DF SS MS F P RES 8,6,3,8,7 Error,,6 Total 3 33,7 S =,6 R-Sq =,38% R-Sq(adj) = 7,% Individual 9% CIs For Mean Based on Pooled StDev Level N Mean StDev --------+---------+---------+---------+- LE,97,63 (------*------) Uni,8,876 (--------*-------) Xi,8,993 (---------*---------) --------+---------+---------+---------+-,, 3,, Pooled StDev =,6 Tukey 9% Simultaneous Confidence Intervals All Pairwise Comparisons among Levels of C Individual confidence level = 98,6% BEH = LE subtracted from: C Lower Center Upper ------+---------+---------+---------+--- Uni,,78 3,6 (------*------) Xi -,,87,96 (------*-------) ------+---------+---------+---------+---,,,, BEH = Uni subtracted from: C Lower Center Upper ------+---------+---------+---------+--- Xi -3,8 -,67 -,9 (-------*-------) ------+---------+---------+---------+---,,,,
Individual Value Plot of RES vs BEH 7 6 C 3 - LE Uni C Xi Test for Equal Variances for BEH Bartlett's Test LE Test Statistic 3,67 P-Value,9 Levene's Test Test Statistic,9 P-Value,3 BEH Uni Xi,,,,, 3, 9% Bonferroni Confidence Intervals for StDevs 3,
Probability Plot of RESIDUALS Normal Percent 99 9 9 8 7 6 3 Mean,89E-7 StDev,6 N AD,76 P-Value,3 - -3 - RESI 3 Plots for RES Percent Normal Probability Plot of the s 99 9 s Versus the Fitted Values -,,, Fitted Value, 3, Histogram of the s s Versus the Order of the Data 6 Frequency 8 3 Observation Order 3