Statistiska institutionen VT 2012 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas in senast 16/2 kl 16.30. Sent inkomna uppgifter behandlas inte. Ofullständiga uppgifter behandlas inte. Rapporten kommer att bedömas både vad gäller innehållet och formen. Det är viktigt att rapporten är välskriven och innehåller alla delar. Tänk er att målgruppen har samma statistikkunskaper som era kurskamrater. Texten ska vara tydlig och alla påståenden ska vara välmotiverade. Det innebär att alla relevanta beräkningar ska visas. Även SAS-kod och SAS-utskrifter ska bifogas och kommenteras. Se till att besvara alla frågor i uppgiften. Använd ett tydligt, kort och koncist språk och gör inga irrelevanta utsvävningar. Avsluta med en sammanfattning och egen re ektion. Rapporten får vara max 8 sidor inklusive bilagor. Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan) Rapporten är välstrukturerad. Se t.ex. mall för inlämningsuppgifter "Att skriva en rapport" som nns på kurshemsidan för Statistikens grunder 1
Alla frågor som nns i uppgiftstexten är besvarade Svaren är välmotiverade Alla relevanta formler, gurer, tabeller och SAS-kod nns med Ev. gurer och tabeller är tydliga och numrerade alt. försedda med beskrivande text Rapporten är anpassad till målgruppen Språket är korrekt Sammanfattning inklusive re ektioner nns med Om rapporten har brister ges en chans att åtgärda dessa inom en vecka efter att den rättats. 2
Problem A Många processer har egenskapen att de antar ett av två möjliga tillstånd. Ett exempel är arbetsstatus hos en person där tillstånden är "har arbete" respektive "är arbetslös" (se diskussionen i "Statistikens grunder", kap. 5.4.1). Andra exempel är betjäningssystem där tillstånden är att "någon betjänas" respektive "ingen betjänas" och en maskin med tillstånden "fungerar" respektive "inte fungerar". Låt A och B vara två tillstånd och Y A och Y B vara tiderna som processen tillbringar i respektive tillstånd. Antag att Y A och Y B är exponentialfördelade stokastiska variabler med parametrarna A och B och att Y A och Y B är stokastiskt oberoende av varandra. a) Är antagandena ovan rimliga som en modell över arbetsstatus hos en person? b) Låt beteckna andelen tid processen be nner sig i tillstånd A under en cykel. Vid en upprepning av processen kan P = Y A Y A + Y B betraktas som en observation på. Bestäm sannolikhetsfördelningen för P under förutsättning att A = B. Tips: I kapitel 6 lärde vi oss några metoder för att bestämma sannolikhetsfördelningen för en variabel som är en funktion av andra variabler, se till exempel ex. 6.8 och 6.9. Är resultatet beroende av valet av värde på parametrarna? Tolka resultatet. Rita gur. c) Simulera ett observerat värde på P i en cykel av processen med A = B. Simulera först ett värde på Y A och ett värde på Y B, skapa sedan en ny variabel P = Y A = (Y A + Y B ) : Upprepa simuleringen ett lämpligt antal gånger. Klassindela observationerna av P och rita gur. 3
d) Använd ett 2 test (som ni lärde er på kursen Statistikens grunder eller motsvarande kurs) för att avgöra om den simulerade fördelningen för P stämmer överens med den teoretiska fördelningen. Använd klassindelningen från uppgift c). e) Simulera fördelningen för P på motsvarande sätt som i uppgift c) men nu med olika värden på A och B. Diskutera resultaten. f) Antag att processen studeras efter n cykler. Andelen tid som processen be nner sig i tillstånd A kan nu bestämmas på två sätt: i) ett observerat värde på P beräknas efter varje cykel så att n observationer erhålles; medelvärdet av dessa observationer används som som uppskattning av. ii) låt X A och X B vara sammanlagda tiden processen be nner sig i tillstånden A respektive B och använd X A =(X A +X B ) som uppskattning av. Diskutera eventuella likheter och skillnader mellan dessa två sätt att uppskatta : 4
Problem B En modell för förändringar i priset på en aktie bygger på att information om företaget kommer till marknaden vid slumpmässiga tidpunkter. Om informationen är positiv ökar priset på aktien med en enhet, medan om informationen är negativ, minskar priser med en enhet. Antag att det är lika stor sannolikhet att informationen är positiv som att den är negativ och att informationen vid en tidpunkt är oberoende av informationen vid alla andra tidpunkter. a) Låt Y n beteckna prisförändringen när information om företaget kommit till marknaden vid n tillfällen. Bestäm först sannolikhetsfördelningen för Y 1 dvs prisförändringen efter ett informationstillfälle. Bestäm sedan sannolikhetsfördelningen för Y n då n = 2; n = 3; n = 4 och n = 5; dvs prisförändringen efter två, tre, fyra respektive fem informationstillfällen. b) Bestäm förväntat värde och varians för Y n. c) Standardisera fördelningarna i a) genom att subtrahera förväntat värde och dividera med standardavvikelse. d) Simulera standardiserade fördelningar för n = 5; 20 och 80 genom att simulera den studerade processen. Generera först n stycken slumptal som antar värdena -1 respektive 1 med samma sannolikhet och summera dessa slumptal. Standardisera sedan de simulerade observationerna genom att subtrahera teoretiskt förväntat värde och dividera med teoretisk standardavvikelse (enligt uppgift b)). Upprepa simuleringen ett lämpligt antal gånger. e) Använd ett 2 test (som ni lärde er på kursen Statistikens grunder eller motsvarande kurs) för att avgöra om den simulerade fördelningen för n = 5 stämmer överens med den teoretiska fördelningen. f) Vad händer med den standardiserade fördelningen då n ökar? Ge formella argument för era påståenden. 5
Problem C Antag att varje person i en population har ett högsta belopp de kan tänka sig att betala för en viss vara, ett s.k. willingness to pay, WTP. Antag vidare att de personer som deltar i en auktion där man har möjlighet att ge endast ett bud, ger sitt WTP som bud. Den budgivare som ger det högsta budet vinner auktionen och betalar det givna budet för varan. a) Bestäm sannolikhetsfördelningen för varans pris om WTP har en likformig fördelning i intervallet [0; 100] då n slumpmässigt valda personer deltar i budgivningen för n = 1; n = 2; n = 3; n = 4 och n = 5. b) Bestäm förväntat värde och varians för fördelningarna i uppgift a). c) Använd transformationsmetoden för att bestämma täthetsfunktionerna för de standardiserade variablerna Z (n) = Y (n) E Y (n) qv ; Y (n) där Y (n) betecknar varans pris då n slumpmässigt valda personer deltar i budgivningen. d) Simulera standardiserade fördelningar för n = 5; 20 och 80 genom att simulera den studerade processen. Generera n stycken bud och välj ut det högsta budet bland dessa. Standardisera sedan de simulerade observationerna genom att subtrahera teoretiskt förväntat värde och dividera med teoretisk standardavvikelse (enligt uppgift b)). Upprepa simuleringen ett lämpligt antal gånger. Klassindela de standardiserade observationerna, använd klassgränserna 2:5; 1:25; 0:5; 0 och 0:5. Rita ett histogram. 6
e) Använd ett 2 test (som ni lärde er på kursen Statistikens grunder eller motsvarande kurs) för att avgöra om den simulerade fördelningen för n = 5 stämmer överens med den teoretiska fördelningen. Tips: För den stokastiska variabeln Z (5) gäller P 5:9160 Z (5) 2:5 0:02580, P 2:5 Z (5) 1:25 0:09685, P 1:25 Z (5) 0:5 0:13578, P 0:5 Z (5) 0 0:14344, P 0 Z (5) 0:5 0:20106, P 0:5 Z (5) 1 0:274 51, P 1 Z (5) 1:1834 0:122 68: f) Vad händer med den standardiserade fördelningen då n ökar? Ge formella argument för era påståenden. 7