Tentamen i statistik för STA A13, 1-10 poäng Deltentamen II, 5p Lördag 9 juni 2007 kl

Relevanta dokument
Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

θx θ 1 om 0 x 1 f(x) = 0 annars

4.2.3 Normalfördelningen

Föreläsning G04: Surveymetodik

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

Föreläsning G70 Statistik A

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

F10 ESTIMATION (NCT )

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Grundläggande matematisk statistik

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

a) Beräkna E (W ). (2 p)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Introduktion till statistik för statsvetare

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Föreläsning 2: Punktskattningar

TMS136: Dataanalys och statistik Tentamen med lösningar

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

S0005M V18, Föreläsning 10

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Lycka till! I(X i t) 1 om A 0 annars I(A) =

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

1. Test av anpassning.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

Jag läser kursen på. Halvfart Helfart

Datorövning 2 Fördelningar inom säkerhetsanalys

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

LÖSNINGAR TILL. Räkningar: (z i z) 2 = , Δ = z = 1 n. n 1. Konfidensintervall:

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Avd. Matematisk statistik

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Formelblad Sannolikhetsteori 1

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

2. Konfidensintervall för skillnaden mellan två proportioner.

F6 Uppskattning. Statistikens grunder 2 dagtid. Beteckningar, symboler, notation. Grekiskt-romerskt

Vid mer än 30 frihetsgrader approximeras t-fördelningen med N(0; 1). Konfidensintervallet blir då

Uppsala Universitet Matematiska institutionen Matematisk Statistik. Formel- och tabellsamling. Sannolikhetsteori och Statistik

Tentamen i Matematisk statistik för V2 den 28 maj 2010

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del II

Datorövning 2 Fördelningar inom säkerhetsanalys

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004 TEN kl

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

FORMELSAMLING MATEMATISK STATISTIK, FMS601. Fördelning Väntevärde Varians. p x (1 p) n x x = 0, 1,..., n np np(1 p) ) x = 0, 1,..., n np.

Tentamen Metod C vid Uppsala universitet, , kl

Matematisk statistik TMS063 Tentamen

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

================================================

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 3.5hp

TAMS79: Föreläsning 9 Approximationer och stokastiska processer

Borel-Cantellis sats och stora talens lag

Sannolikhetsteori FORMELSAMLING MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00. Kap 2: Sannolikhetsteorins grunder

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

Jag läser kursen på. Halvfart Helfart

Z-Testet. Idè. Repetition normalfördelning. rdelning. Testvariabel z

Tentamentsskrivning: Tillämpad Statistik 1MS026 1

Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning och exempel, del II

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

P (A) = k A P (A ) = 1 P (A) P (A B) P (B) P (M i ) = 1 P (A) P (X = k) = p X (k) p X (k) = 1 P (A B) p X (k)

Föreläsning G70 Statistik A

Sannolikheter 0 < P < 1. Definition sannolikhet: Definition sannolikhet: En sannolikhet kan anta värden från 0 till 1

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Tentamen i matematisk statistik

Genomsnittligt sökdjup i binära sökträd

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

TENTAMEN I MATEMATISK STATISTIK

Tentamen i matematisk statistik

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Tentamen Metod C vid Uppsala universitet, , kl

Sannolikhetslära statistisk inferens F10 ESTIMATION (NCT )

Intervallskattningar, synonymt konfidensintervall eller statistiska osäkerhetsgränser

SAMMANFATTNING TAMS65

MA2018 Tillämpad Matematik III-Statistik, 7.5hp,

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Lösningsförslag

Id: statistik.tex :48:29Z joa

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

732G70 Statistik A. Föreläsningsunderlag skapad av Karl Wahlin Föreläsningsslides uppdaterade av Bertil Wegmann

Transkript:

Avdelige för atioalekoomi och Tetame i för STA A13, 1-10 poäg Deltetame II, 5p Lördag 9 jui 007 kl. 09.00-13.00 Tillåta hjälpmedel: Bifogad formel- och tabellsamlig (skall retureras) samt miiräkare. Asvarig lärare: Cecilia Håglad Övrigt: Varje uppgift ka ge max 10p. Lösigar skall uta svårighet kua följas. Iförda beteckigar skall förklaras. För betyget Godkäd krävs mist 30p och för Väl godkäd krävs mist 45p. Uppgift 1 Slumpvariabel är N(µ= 1 000; = 100). a) Skissa frekves-/saolikhetsfuktioe för variabel och markera vätevärde, media och stadardavvikelse i figure. b) Beräka saolikhete för att ligger utaför itervallet µ ±, samt rita e figur som illustrerar dea saolikhet. c) Vad är saolikhete för att ligger iom itervallet [950; 1 150]? Illustrera äve detta i e figur. d) För vilka symmetriska itervall av värde gäller att saolikhete att ett slumpmässigt -värde hamar iom själva itervallet är 0,90 respektive 0,99? Rita e (eller två) figur(er) och markera tydligt hur itervalle ligger. e) Beräka: -µ ) samt illustrera det aktuella området i e figur. För lösigar på uppgift 1, se separat fil. Uppgift Utgå frå samma ormalfördelade slumpvariabel,, som i uppgift 1. a) Om vi är fullstädigt isatta i vilke fördelig följer och gör ett slumpmässigt urval om =4 observatioer frå populatioe, vilke fördelig följer då stickprovsmedelvärdet? Glöm ite att age all relevat iformatio (bara fördeliges am räcker ite). Om är ormalfördelad är också ormalfördelad (se kompletterigsmaterialet till kapitel 8, uder Amärkig. Detta räcker dock ite som svar, uta vi måste ha med ormalfördeliges parametrar också. Vätevärdet E ( ) = µ är alltid samma som vätevärdet för, => µ = µ = 100, och stadardavvikelse för,, är alltid, vilket här 100 =. är N( µ = 1000, = 50 ). blir 50 4

Avdelige för atioalekoomi och b) Vad är saolikhete för att medelvärdet i stickprovet ligger utaför itervallet E ( ) ± V ( )? Eftersom är ormalfördelad precis som, är saolikhete för att skulle ligga utaför itervallet E ( ) ± V ( ) lika stor som att skulle ligga utaför itervallet E ( ) ± V ( ), d. v. s. utaför itervallet µ ±. Dea saolikhet har vi reda tagit fram i 1b och de är 0,3174. Om ma ite upptäcker likhete med 1b går det aturligtvis bra att i stället aväda resultatet i a och räka ut saolikhete att ligger utaför itervallet µ ± = 1000 ± 50, eller utaför itervallet (950; 1 050). 950 1000 µ 1050 µ 950 1050) = ) = 1 1 Z 1) 100 100 = [ Z < 1) 4 4 Z < 1)] = (0,8413 0,1587) = 1 0,686 = 0,3174 Uppgift 3 De förvirrade lärare Ztatistica tappar bort både vätevärde och stadardavvikelse för slumpvariabel frå uppgiftera ova. a) Atag att Ztatistica trots allt lyckas hålla i miet att variabel är ormalfördelad. Om ho i detta läge drar ett slumpmässigt stickprov om =4 observatioer frå populatioe och beräkar diverse itressata läges- och spridigsmått i stickprovet hur skulle ho därefter kua utyttja dea iformatio på bästa sätt för att försöka ta reda på ugefär hur stort vätevärdet för är? Hitta på siffror i lämplig storleksordig sut föruft räcker! för att illustrera di redogörelse ytterligare och förklara också i ord vad Ztatistica faktiskt skulle kua säga beträffade vätevärdet för. Om Ztatistica beräkar medelvärde och stadardavvikelse i stickprovet, ka ho seda utyttja kuskape om att de uderliggade populatioe är ormalfördelad och ta fram ett kofidetiella för vätevärdet μ. Specifikt: När Ztatistica drar ett litet urval frå e ormalfördelad populatio med µ okäd stadardavvikelse vet ho att s följer e t-fördelig med (-1=3) frihetsgrader. Ett (exempelvis) 95%-igt kofidesitervall för μ ka då beräkas som: (3) s s x ± t0,975 = x ± 3,18 4

Avdelige för atioalekoomi och Om vi u hittar på ågorluda realistiska värde, t. ex. att stickprovsmedelvärdet blir 98 och stickprovsstadardavvikelse 54, får vi 54 itervallet 98 ± 3,18 = (896,14; 1067,86) Ztatistica ka u påstå att Med 95% säkerhet ligger vätevärdet för mella 896 och 1068. b) De förvirrade lärare Ztatistica är u om möjligt äu mer förvirrad. Ho kommer ite ihåg ågotig om slumpvariabel (mer ä att det är just e slumpvariabel!). Kom med e välmotiverad, utförlig beskrivig på hur Ztatistica i detta läge skulle kua gå tillväga för att få e riktigt hygglig uppfattig om hur stort vätevärdet för är. Hitta på siffror i lämplig storleksordig sut föruft + relevata ämeskuskaper krävs för att illustrera di redogörelse ytterligare och förklara också i ord vad Ztatistica faktiskt skulle kua säga beträffade vätevärdet för. Om vi har e slumpvariabel som vi ite vet ågotig om, är det e god idé för Ztatistica att dra ett stort slumpmässigt stickprov ur populatioe. Eftersom ho vet att stickprovsmedelvärdet är e vätevärdesriktig skattig av vätevärdet µ, ka ho ekelt göra e puktskattig av vätevärdet. Me detta ger ju bara ett värde, som Ztatistica ite alls vet hur ära saige det ligger. Här ka ho därför med fördel utyttja de Cetrala gräsvärdessatse, CGS. CGS säger att E summa av oberoede slumpvariabler frå samma fördelig följer ugefär e ormalfördelig, om atalet variabler som igår i summa bara är tillräckligt stort. Eftersom Ztatistica är väl påläst, vet ho vidare att ett stickprovsmedelvärde är just e 1 3 summa av slumpvariabler, = + + +... +, och att vi dividerar respektive observatio med sakar betydelse för forme på fördelige. 1 3 Om u = + + +... + är ugefär ormalfördelad och Ztatistica vet (eller slår upp i formelsamlige) att vätevärde och stadardavvikelse för är µ respektive ka ho äve se att ho ka beräka ett 100(1-α)%-igt kofidesitervall för µ som x ± z Fast hur gör ho med de okäda stadardavvikelse? Jo, eftersom Ztatistica tog ett stort stickprov, om t. ex. =100 observatioer, ka ho skatta med stickprovsstadardavvikelse s och säga att: Med cirka 95% (exempelvis) säkerhet ligger vätevärdet µ iom itervallet s s x ± z0,975 = x ± 1,96. 10 α

Avdelige för atioalekoomi och Om vi hittar på att vi fått ett stickprovsmedelvärde på 1 006. och e stickprovsstadardavvikelse på 48.3 får vi: 48,3 1006, ± 1,96 = (996,733, 1015,6668) och vi ka säga att Med ca 95% 10 säkerhet ligger vätevärdet µ mella 996,7 och 1015,7.. c) Hur påverkas resoemaget/beräkigara i b om Ztatistica plötsligt slås av isikte att vi söker vätevärdet i e ädlig populatio? Om populatioe vi pratar om är ädlig, ka Ztatistica för det första börja med att kostatera att de aldrig ka vara exakt ormalfördelad, eftersom ormalfördelige defiitiosmässigt ite är ädlig. Om det gäller e lite ädlig populatio ka ho självfallet udersöka hela populatioe och beräka det saa vätevärdet µ. Fast så ekelt är ju sälla fallet! Däremot är det ju så, att ju midre populatioe är, desto större adel kommer Ztatistica att ha udersökt med si stickprovsstorlek på =100. Det iebär vidare att ett kofidesitervall med samma bredd som ova, d. v. s. ca 0, kommer att ha e mycket högre kofidesgrad ä 95%. Aalogt kommer ett 95%-igt kofidesitervall att bli mycket smalare ä 0 eheter, eftersom vi udersökt e större adel av populatioe. Detta beror på att variase för vår variabel, stickprovsmedelvärdet, kommer att miska ju större adel av populatioe vi udersöker. N Beräkigsmässigt dyker detta upp i ädlighetskorrektioe,. N 1 Ztatistica behöver därför reda på hur stor populatioe är. Säg t. ex. att populatiosstorleke N=300. I så fall ka vi ta fram ett ugefär 95%-igt kofidesitervall för µ som s N 48,3 300 100 x ± 1,96 = 1006, ± 1,96 ger (998,457; 1013,943) N 1 10 300 1 Med ca 95% säkerhet ligger vätevärdet µ mella 998,4 och 1014,0 och vi har u fått ett ågot sävare itervall. Sammafattigsvis är det itressat att otera hur kofidesitervalles bredd påverkas av vad vi vet om slumpvariabels fördelig, stickprovsstorlek och huruvida populatioe är ädlig eller ite. Det bredaste itervallet fick vi i a, me då skall vi också ha i åtake att vi bara hade fyra observatioer!

Avdelige för atioalekoomi och Uppgift 4 E tillverkare av mp3-spelare garaterar att det är högst 10% av has produkter som är defekta. E skeptisk iköpsasvarig gör e mycket oggra urvalsprocedur och plockar ut 75 spelare som ka betraktas som slumpmässigt valda ur tillverkares produktio. Om det är 13 eller fler defekta mp3-spelare blad dessa, så aser iköpare att ha kuat visa att spelara är av sämre kvalitet ä vad tillverkare påstår, och plaerar att kofrotera tillverkare med detta. a) Sätt upp hypotesera för testet som de iköpsasvarige gör. H 0 : Adele defekta mp3-spelare π 0,10 H 1 : Adele defekta mp3-spelare π > 0,10 b) Förklara dels i allmäa termer och dels i termer av vårt exempel vad typ- I-fel respektive typ-ii-fel är. Ett typ-i-fel är att förkasta ollhypotese trots att de är sa. Här skulle det motsvara att de iköpsasvarige får 13 eller fler defekta spelare i urvalet och drar slutsatse att mer ä 10% av mp3-spelara är defekta, trots att så ite är fallet. Relaterat till typ-i-fel är sigifikasivå α, som är typ- I-fel). Ett typ-ii-fel är att ite förkasta ollhypotese är mothypotese är sa. I vårt fall att de iköpsasvarige ite får åtmistoe 13 defekta mp3-spelare i urvalet, trots att adele defekta spelare är högre ä 10%. Relaterat till typ- II-fel är β, typ-ii-fel). 1- β kallas för styrka och är saolikhete att förkasta de falska ollhypotese givet e viss mothypotes. c) Beräka testets sigifikasivå. Glöm ite halvkorrektioe! Sigifikasivå α är typ-i-fel). α=mist 13 defekta mp3-spelare i urvalet π = 0,10). Tillverkare påstår att adele defekta spelare är högst 10% och vi vill försöka visa att de är högre. Det värde vi räkar på i ollhypotese måste då vara det högsta värdet i tillverkares itervall, d. v. s. 0,10. Tillverkare har ju idirekt påstått att det i alla fall ite är mer ä 10% defekta mp3- spelare i urvalet. Vi iför Atal defekta mp3-spelare i ett slumpmässigt urval om 75 spelare. E mp3-spelare är atige defekt eller ite. Saolikhete att e slumpmässigt vald spelare är defekt är π och de är samma för alla spelare i urvalet. Vidare: om vi har e mycket stor populatio av mp3-spelare ka vi ata att de 75 valda spelara är oberoede av varadra. => är Bi(=75 och π=0,10) är ollhypotese är sa. => α= 13 är Bi(=75 och π=0,10)) = 1-1)

Avdelige för atioalekoomi och Eftersom vi ite har tabellvärde för som är större ä 50 och ogära vill sitta och räka för had kotrollerar vi om vi ka approximera. Både π och (1-π) är större ä 5 (7,5 respektive 6,5) så det går bra. => är approx N(µ=π=7,5 = (π(1-π))= 6,75). α = 1 + 0,5 är appr. N( µ = 7,5; = 6,75)) = µ 1 + 0,5 7,5 ) = 6,75 Z 1,9 ) = 1 0,976 = 0,074 Ag. halvkorrektio: Eftersom biomialfördelige bara ka ata heltalsvärde meda ormalfördelige är kotiuerlig och ka ata alla värde, måste vi dela upp värdeitervallet mella 1 och 13. Vi halvkorrigerar, vilket motsvarar att täka sig att värde mella 1 och 1,5 hör till 1 och att värde mella 1,5 och 13 hör till 13. d) Ata det i själva verket är 0 % defekta eheter i partiet. Beräka uder dea förutsättig testets styrka. Glöm ite halvkorrektioe! Styrka är saolikhete att förkasta ollhypotese givet att mothypotese är sa, d. v. s. 13 π=0,0). Tumreglera för ormalapproximatio är fortfarade uppfyllda, π=15 och (1-π)=60. Uppställige i övrigt blir precis som ova, det som skiljer är att vi u får ett ytt vätevärde och e y stadardavvikelse. är approx N(µ=π=15 = (π(1-π))= 1). Styrka = 1 1 + 0,5 är appr. N( µ = 15; = 1)) = µ 1 + 0,5 15 ) = 1 Z 0,7 ) = 0,358 = 0,764 e) Vid stickprovskotrolle visade det sig vara 1 defekta eheter. Beräka testets p-värde. Glöm ite halvkorrektioe! Ett tests p-värde är saolikhete att få det observerade resultatet eller äu extremare, givet att ollhypotese är sa. P-värdet ka därför sägas vara de observerade, eller faktiska sigifikasivå om ma täker sig att ma skulle förkasta ollhypotese direkt. => P-värdet = 1 π 0,10) = 1-11 π 0,10) α = 8 + 0,5 är appr. N( µ = 7,5; = 6,75)) = µ 11+ 0,5 7,5 ) = 6,75 Z 1,54 ) = 0,938 = 0,0618 Här är det e god idé att staa upp ett slag och reflektera. Eligt vad iköpsasvarige bestämde frå börja, skulle ha klaga hos tillverkare om 13 eller fler mp3-spelare i urvalet var defekta. Detta skulle då ge e sigifikasivå på kappt 3%, att jämföras med p-värdet på drygt 6%.

Avdelige för atioalekoomi och Slutsatse blir här att ite förkasta ollhypotese, d. v. s. att avstå frå att klaga hos tillverkare. På 3% sigifikasivå ka vi ite påstå att adele defekta mp3-spelare överstiger 10%. Me, fråga är om detta är det föruftigaste att göra? E risk på drygt 6% - visserlige högre ä vad iköpare frå börja bestämt sig för att acceptera är de oacceptabelt hög egetlige? Detta ka bara de iköpsasvarige själv svara på. Det viktiga i sådaa här situatioer är att ma ite bara mekaiskt jämför p-värdet med sigifikasivå, uta att ma aktivt tar ställig till hur stor risk ma är villig att ta att felaktigt förkasta ollhypotese äve efter att själva stickprovsförfaradet har geomförts. Det är ite sälla som t. ex. forskare hoppar direkt på p-värdet är ma geomför olika studier, och seda klassificerar udersökiges resultat utifrå dessa observerade sigifikasivåer. Uppgift 5 Cetrala gräsvärdessatse, CGS, är mycket viktig iom statistisk teori. Age i vilka av uppgiftera 1-4 ova ma ka dra ytta av CGS och på vilket sätt ma utyttjar satse. För de uppgifter där CGS ite behöver avädas, ge e kort motiverig till varför satse i dessa fall är överflödig/irrelevat. De Cetrala gräsvärdessatse formulerade vi i uppgift 3 ova. Nu gäller det att se var de har aväts, och var de ite har aväts. Första gåge vi var tvuga att utyttja CGS för att kua lösa uppgifte, var i 3b. Vi visste att vi hade e slumpvariabel, me igetig mer. Vi behövde därför CGS, så att vi med hjälp av ett tillräckligt stort stickprov kude ata att stickprovsmedelvärdet blev approximativt ormalfördelat. Därefter kude vi beräka ett kofidesitervall som valigt. Vi hade alltså ite kuat beräka kofidesitervallet på det sätt vi gjorde uta att stödja oss mot CGS. I 3c, som är e variat på 3b, aväder vi e variat av CGS. Vi har ett tillräckligt stort stickprov, och behöver bara justera för att vi har e ädlig populatio. I övrigt stöjder vi oss mot CGS. Uppgift 4 har e biomialfördelad slumpvariabel, som reda i sig själv är e summa av alla lyckade oberoede delförsök uder samma förutsättigar. Detta iebär, att är atalet variabler i summa är tillräckligt stort, ka vi approximera variabel till e ormalfördelig. Dock: här är det ite bara att räka atalet variabler som igår i summa. Vi behöver också ta häsy till π, saolikhete för att ett eskilt delförsök skall lyckas. Ju lägre frå 0,5 π är, desto större atal delförsök behövs för att kompesera för att e såda fördelig är väldigt skev. Äve om biomialfördelige bara ka ata heltalsvärde, är de ju faktiskt helt symmetrisk för π=0,5, vilket gör att det då också krävs väsetlige färre observatioer för att ormalapproximatioe skall bli bra.

Avdelige för atioalekoomi och Övriga uppgifter då? Uppgift 1 behadlar e ekel ormalfördelad slumpvariabel => CGS är helt överflödig. Uppgift hadlar om att vi beräkar medelvärdet av ett atal ormalfördelade slumpvariabler. Detta medelvärdet kommer då också alltid att vara ormalfördelat (se Amärkig på adra sida i det kompletterade kompediematerialet som hör till kapitel 8) och eftersom vi käer till populatiosstadardavvikelse ka vi äve räka ormalfördelat. I uppgift 3a har vi fortfarade medelvärdet av ett atal ormalfördelade variabler, som då också är ormalfördelat. Detta iebär att CGS ite är aktuell (CGS har ju bara ågo poäg om de ursprugliga populatioe ite är ormalfördelad). Det som i stället häder, är att vi ite käer till populatiosstadardavvikelse och att vi därför utyttjar t-fördelige. Detta har dock igetig med CGS att göra. Uppgift 6 E pedagog vill udersöka hur läshastighete Y (ord/miut) påverkas av ålder (år). Ho utför därför ett experimet där ho låter 11 slumpmässigt valda bar på e skola göra ett läshastighetsprov. Resultatet blev y 110 100 130 10 150 130 140 150 185 180 155 x 10 11 11 1 1 13 13 13 14 15 15 För att beskriva det aktuella sambadet avser ho aväda e lijär regressiosmodell. a) Ta fram e skattig av de lijära regressiosmodelle. Vi aväder modelle y = a + bx, där xy x y 11*19945 139*1550 b = = x ( x) 11*1783 139 1550 13,5103*139 a = y bx = 9,810 11 => y = 9,81 + 13,51x. 13,5103 Modelle ger alltså e rät lije med ett itercept på ca -30 och e riktigskoefficiet på +13,5.

Avdelige för atioalekoomi och b) Rita ett diagram över observatioera och regressioslije. Sambad mella läshastighet och ålder Läshastighet (ord/miut) 00 180 160 140 10 100 80 60 40 0 0 9 10 11 1 13 14 15 16 Ålder (år) Här är förvisso ite lije iritad, me det går ädå att se att puktera ligger spridda på ett sådat vis att ett lijär modell ger e gaska bra beskrivig av sambadet mella läshastighet och ålder. c) Beräka korrelatioskoefficiete och förklarigsgrade / determiatioskoefficiete. r = r xy x ( 0,6785 x x) y = 11*19945 139*1550 11*1783 139 0,837 d) Tolka regressioskoefficiete b i ord, och förklara vad som här ka utläsas av förklarigsgrade / determiatioskoefficiete. Att regressioskoefficiete b=13,5 iebär att läshastighete mätt i atal ord per miut ökar med i geomsitt 13,5 ord för varje år äldre som bare blir, givet det udersökta åldersitervallet i de udersökta populatioe. Vad som är viktigt här, är att ite aväda modelle utaför det udersökta åldersitervallet. Vi ser t. ex. att ett yfött bar eligt modelle skulle ha e egativ läshastighet, på -30 ord/miut. Detta är självfallet helt orimligt. Förklarigsgrade, eller determiatioskoefficiete mäter hur stor adel av variatioe i läshastighet som ka häföras till variatioe i ålder, d. v. s att bare är olika gamla. I de här modelle ser vi att 68% av deras förbättrade läsförmåga verkar kua förklaras av att bare blir äldre (och har huit öva mer). Resterade ka 3% alltså ases bero dels på e idividuell variatio, dels på förklarigsvariabler som ite fis med i modelle.