MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Fredagen den 4 e mars 2016 Ten 1, 9 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas tentamen) Ansvarig lärare. Lars Bohlin 0730-452937 Poäng Totalt 40 Betygsgränser: G 20 VG 30 Generella uppmaningar: Redovisa dina lösningar i en form som gör det enkelt att följa din tankegång. Motivera alla väsentliga steg i beräkningar, ange alla antaganden du gör och förutsättningar du utnyttjar. Numrera bladen och sortera dem i ordning.
Nedan visas ett urval av frågorna i en enkätundersökning om miljöanpassad offentlig upphandling. 25. Vilket är det största hindret för miljöanpassad upphandling i er organisation? Källa: miljöanpassad offentlig upphandling. Naturvårdsverkets rapport 5445 januari, 2005. (En av frågorna är aningen omarbetad)
1. 6 poäng Utifrån enkätfrågorna på föregående sida skapas variablerna F5, F10, F25 och F29. I samtliga variabler kodas svaret vet ej som missing dvs på samma sätt som de som ej besvarat frågan. a) Ange och motivera skaltyp för var och en av variablerna. (2p) b) Antag att man vill undersöka om det finns något samband mellan myndighetens inköpsvolym och hur ofta som man ställer miljökrav vid sina upphandlingar. Föreslå en lämplig testmetod. Ange vilka variabler som används och hur hypoteserna bör formuleras. Förklara kort hur testet utförs. (2 p) c) Antag att man vill undersöka om det finns något samband mellan om kommunens upphandlingsansvarige har genomgått en utbildning i miljöanpassad upphandling och vilket hinder för miljöanpassad upphandling som upplevs störst. Föreslå en lämplig testmetod. Ange vilka variabler som används och hur hypoteserna bör formuleras. Förklara kort hur testet utförs. (2 p) 2. 2 poäng a) b) c) d) a) Vilken / vilka av ovanstående fördelningar är symmetriska. b) Vilken / vilka av ovanstående fördelningar är positivt skev. c) Vilken / vilka av ovanstående fördelningar är negativt skev. 3. 4 poäng Ett urval av 7 stycken fotbollstränare har följande åldrar; 22, 25, 26, 34, 43, 45, 63 Beräkna följande mått: a) Median b) Medelvärde c) Varians d) Standardavvikelse
4 3 poäng Förklara följande begrepp: a) Heteroskedasticitet b) Stratifierat urval c) bekvämlighetsurval 5. 7 poäng En glastillverkare har utvecklat två förslag till nya glass sorter och väljer ut en testpanel om 12 personer för att utvärdera vilken sort som är populärast. Personerna i testpanelen får sätta betyg på glassarna på skalan 1 till 5 där 5 är bäst och 1 är sämst. Resultatet redovisas i tabellen nedan: Glass A Glass B 1 4 3 2 3 2 3 5 2 4 3 1 5 4 5 6 2 3 7 4 3 8 5 2 9 2 3 10 4 3 11 4 2 12 5 1 a) Ange två tester som kan vara lämpliga för att testa om det finns en skillnad i popularitet mellan de båda glass sorterna i hela populationen. b) Utför de båda tester du föreslagit i a) frågan. I båda fallen ska du ange nollhypotes och mothypotes, ange vilken teststatistika du använder och vad den har för kritiskt värde i det här fallet samt beräkna värdet på teststatistikan och redogör för vilka slutsatser vi kan dra från denna test. Använd 5 % signifikansnivå.
6. 4 poäng Antag följande sannolikheter: P(A) = 0,4 P(B) = 0,6 P(C) = 0,5 Och följande betingade sannolikheter: P(A B) = 0,4 P(A C) = 0,24 P(B A) = 0,6 P(B C) = 0,24 P(C A) = 0,3 P(C B) = 0,2 a) Är A och B beroende händelser? Motivera ditt svar b) Är A och C beroende händelser? Motivera ditt svar c) Beräkna sannolikheten att båda A och B inträffar, d.v.s. P(A och B). d) Beräkna sannolikheten att åtminstone en av A och B inträffar, d.v.s. P(A eller B). 7. 3 poäng Antag att innehållet sill mätt i gram per burk från ett visst märke är normalfördelat med medelvärdet 420 gram och standardavvikelsen 5 gram. a) Vad är sannolikheten att en slumpmässigt vald burk innehåller mindre än 420 gram? b) Vad är sannolikheten att en slumpmässigt vald burk innehåller mindre än 417 gram? c) Vad är sannolikheten att ett slumpmässigt urval om 4 burkar har ett medelvärde som är mindre än 417 gram? 8. 2 poäng Tabellen nedan anger pris och kvantitet av tre olika matvaror vid två olika tidpunkter. Period 1 Period 2 pris kvantitet Pris kvantitet korv 23 150 25 140 köttbullar 26 50 25 90 fiskbullar 24 100 30 70 a) Beräkna ett sammanräknat index över prisförändringen med Laspayres metod b) Beräkna ett sammanräknat index över prisförändringen med Paasches metod
9. 9 poäng Den här uppgiften är baserad på datasetet med 373 snabbmatsrestauranger tillhörande kedjorna Wendys, Burger King, King Fried Chicken och Roy Rogers, son ni använt i laborationerna. Variabelförteckning: emp hrsopen income BK KFC RR antal anställda på restaurangen antal timmars öppettid per dag Medianhushållets inkomst i det postnummerområde där restaurangen ligger, dollar Dummyvariabel som tar värdet 1 om Burger King Dummyvariabel som tar värdet 1 om King Fried Chicken Dummyvariabel som tar värdet 1 om Roy Rogers (Restaurangerna som tillhör Wendys har alltså noll på alla tre dummyvariablerna) Källa till datamaterialet: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, 391-401. Besvara frågorna nedan med hjälp av datautskrifterna på nästa sida. a) (5p) Rapportera och tolka regressionskoefficienterna och deras p-värden från båda modellerna. Använd 5 % signifikansnivå. b) (1p) Tolka den justerade förklaringsgraden i båda modellerna c) (1p) Beräkna ett 95 % konfidensintervall för skillnaden i antal anställda mellan King Fried Chicken och Wendys. d) (2p) Beräkna det predikterade värdet enligt modell 2 på antal anställda i en Wendys restaurang som har öppet 12 timmar per dag och ligger i ett postnummerområde med medianinkomsten 50 000 dollar.
Modell 1 Modell 2