Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl 14.00-19.00 Tillåtna hjälpmedel: Bifogad formelsamling, tabellsamling (dessa skall returneras). Miniräknare. Ansvarig lärare: Jari Appelgren, tel 054 700 1839 Övrigt: För att få maximala 10 poäng på en uppgift krävs att antaganden och motiveringar noga anges samt att lösningen även i övrigt är så utförlig att den utan svårighet kan följas. För betyget Godkänd krävs minst 30 poäng, för betyget Väl Godkänd krävs minst 45 poäng. Uppgift 1 Skräpmail är vanligt förekommande e-post. Den vanligaste gruppen av skräppmail handlar om produkter till försäljning följt av finansiella råd. Gruppen produkter står för 21% av alla skräpmail och finansiella för 16,2%. För att hindra skräpmail kan man köpa blockningstjänster. En populär blockningstjänst blockerar 95% av alla mail som är skräpmail. Tyvärr är inte tjänsterna perfekta eftersom de bland annat använder nyckelord så 5% av alla riktiga fastnar också i filtret för denna blockningstjänst. En vanlig e-post adress får ungefär 70% skräpmail under en slumpmässigt vald dag. Beräkna följande; a) Sannolikheten att få ett skräpmail som handlar om något annat än produkter eller finansiella råd. b) Proportionen av alla e-post som skickas till adressen som är både skräpmail och blockeras. c) Sannolikheten att riktigt e-post kommer igenom blockningstjänsten (kommer fram alltså). d) Vilken proportion av alla e-post som kommer fram är riktiga e-post?
Uppgift 2 Ett internationellt företag har bestämt sig för att erbjuda en exklusiv ledarutbildning till en mindre grupp av sina anställda. Ledning lovar att den ska vara öppen för alla som anses lämpliga (uppfyller vissa kriterier) och erbjudas till en så balanserad grupp som möjligt när det gäller ålder, kön, mm. 40 anställda fick erbjudandet att gå denna kompetensutveckling, varav 18 var kvinnor och 22 var män. Vilket någorlunda följde proportionerna för könen för sökande som var 42% kvinnor och 58% män. Åldersfördelningen bland de sökande var 52% över 35 år och 48% var 35 eller yngre. När urvalet blev klart så blev de som var äldre besvikna och ansåg att de inte alls hade tagit hänsyn till åldersfördelningen. Bara 14 av de utvalda var från den äldre gruppen. Antag att vi tar slumpmässigt ut 40 personer ur alla möjliga sökande (som är tillräckligt stor population). Ge en fullständig analys för att se om den äldre gruppen har blivit missgynnad jämfört med den yngre gruppen. Använd α = 0,05. Uppgift 3 En undersökning har gjorts av franchise företag för att undersöka om exklusiva rätt till geografiskt område påverkar möjligheten för företagen att överleva i genomsnitt. 170 slumpmässigt valda nya franchise företag undersöktes. Nedan finns resultatet av undersökning: Exklusivt område Överlevde Ja Nej Totalt Ja 108 15 123 Nej 34 13 47 Totalt 142 28 170 Två variabler finns i tabellen; - Överlevde företaget längre än 1 år, med svarsalternativen Ja eller Nej. - Hade företaget rätt till ett exklusivt område i sitt kontrakt, med svarsalternativen Ja eller Nej. Utför ett lämpligt hypotestest med samtliga steg för att avgöra om exklusivt område påverkar möjligheten för nya franchiseföretag att överleva. Använd signifikansnivån 5%.
Uppgift 4 Fakturorna under ett år för ett företag följer ungefär en normalfördelning med väntevärde 32000 och en standardavvikelse på 2000 kr. Självklart finns det några som avviker men de är relativt få. a) Beräkna sannolikheten att en slumpmässigt vald faktura är på 35000 eller mer. b) Under en vanlig dag skickas fyra fakturor ut. Beräkna sannolikheten att det genomsnittliga värdet på fakturorna av en slumpmässigt vald dag överstiger 30000 kr. c) Om totala värdet på fakturorna under en dag översteg 140000 kr, skulle detta vara oväntat mycket? Motivera tydligt med hänvisning till tidigare uträknade sannolikheter. Uppgift 5 Antag att vi har en slumpvariabel X som följer denna sannolikhetsfördelning; x 0 1 2 3 4 P(X = x) 0,15 0,20 0,30 0,20 0,15 a) Slumpvariabeln X, är den diskret eller kontinuerlig? b) Vilket väntevärde har slumpvariabeln X? Förklara vad värdet innebär. c) Om standardavvikelsen för denna fördelning är 1,26, vad är sannolikheten att vi får ett värde som är mer värdet k? Där värdet k är lika med µ + σ. d) Vi bestämmer oss för att slumpmässigt välja fem gånger ur fördelningen och räkna antalet gånger som vi fick ett värde som var större än k. Beräkna sannolikheten att vi får som minst en som var större än k.
Uppgift 6 Vid en undersökning angående personers inkomst så fann man att medelinkomsten var 24 000 kr samt att det var en standardavvikelse på ca 3 500 kr. a) Bilda ett intervall där ungefär 95 % av observationerna finns i ett intervall. Använd empiriska regeln till hjälp. b) Vi vill göra ett nytt slumpmässigt urval ur samma population, och vill skatta populationsmedelvärdet med en osäkerhet på max 500 kr (felmarginalen). Vi vill vara 90 % säkra. Bestäm hur stort urval vi behöver ha för att klara detta om vi använder samma spridning som förra undersökningen gav.