1 Mätdata och statistik

Relevanta dokument
Föreläsning G60 Statistiska metoder

Statistik 1 för biologer, logopeder och psykologer

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning G70 Statistik A

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Lektionsanteckningar 11-12: Normalfördelningen

Matematisk statistik 9hp Föreläsning 2: Slumpvariabel

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

4 Diskret stokastisk variabel

Föreläsning 2, Matematisk statistik för M

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Introduktion till sannolikhetslära. Människor talar om sannolikheter :

Monte Carlo-metoder. Bild från Monte Carlo

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

Slumpförsök för åk 1-3

Föreläsning 2, FMSF45 Slumpvariabel

Sannolikhetsbegreppet

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Matematisk statistik - Slumpens matematik

Stokastiska signaler. Mediesignaler

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

1.1 Diskret (Sannolikhets-)fördelning

F2 SANNOLIKHETSLÄRA (NCT )

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

Extramaterial till Matematik X

Övning 1. Vad du ska kunna efter denna övning. Problem, nivå A

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Något om sannolikheter, slumpvariabler och slumpmässiga urval

TMS136. Föreläsning 4

Grundläggande matematisk statistik

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Statistikens grunder HT, dagtid Statistiska institutionen

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Föreläsning 7: Punktskattningar

9. Konfidensintervall vid normalfördelning

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

Lotto. Singla slant. Vanliga missuppfattningar vad gäller slumpen. Slumpen och hur vi uppfattar den - med och utan tärning

2 Dataanalys och beskrivande statistik

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Kap 3: Diskreta fördelningar

Kap 2: Några grundläggande begrepp

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Inlämningsuppgift-VT lösningar

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Kort om mätosäkerhet

Fördelningsfunktionen för en kontinuerlig stokastisk variabel. Täthetsfunktionen för en kontinuerlig och en diskret stokastisk variabel.

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

Föreläsning 7: Punktskattningar

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Föreläsning 3. Sannolikhetsfördelningar

Föreläsning 1: Introduktion

Tryckfel i K. Vännman, Matematisk Statistik, upplaga 2:13

F3 Introduktion Stickprov

Introduktion till statistik för statsvetare

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Övning 1 Sannolikhetsteorins grunder

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

Fysikexperiment, 7.5 hp 1

Forskningsmetodik 2006 lektion 2

Vetenskaplig metod och statistik

Samplingfördelningar 1

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Statistiska begrepp och metoder som används i Successivprincipen

Föreläsning G60 Statistiska metoder

Aktiviteten, (Vad är mina chanser?), parvis, alla har allt material,

4.1 Grundläggande sannolikhetslära

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Grundläggande matematisk statistik

Datorövning 1: Fördelningar

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning G70, 732G01 Statistik A

Summor av slumpvariabler

Exempel för diskreta och kontinuerliga stokastiska variabler

Stora talens lag eller det jämnar ut sig

TAMS79: Föreläsning 1 Grundläggande begrepp

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik

Föreläsning 1: Introduktion

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Stat. teori gk, ht 2006, JW F7 STOKASTISKA VARIABLER (NCT 5.7) Ordlista till NCT

Transkript:

Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt svar skulle vi behöva ange vikten för varje bebis som fötts hittills under mänsklighetens historia. Statistik handlar i mångt och mycket om att ge förenklade svar på denna typ av frågor, men ändå ge en bra beskrivning av verkligheten. Den första förenkling som måste göras i exemplet ovan är att inte försöka ange vikten på alla bebisar. Vi väljer i stället på måfå ut ett fåtal. Detta urval kallas för ett stickprov. Från ett stickprov på tio bebisar så kan man tänka sig att vi får ut följande data (angivet i gram): 34 340 2638 353 320 3 33 222 288 3038. Ett sätt att besvara vår fråga vore nu att säga: En nyfödd bebis väger 34, 340, 2638, 353, 320, 3, 33, 222, 288 eller 3038 gram. Detta är ett mycket förenklat svar på en svår fråga. Ett betydligt mer kortfattat (och på flera sätt bättre) sätt att svara är genom att ta (det aritmetiska) medelvärdet av våra mätdata: Medelvärdet av n olika värden x, x 2, x 3,..., x n, x n ges av x = n n k= x k = x + x 2 +... + x n + x n. n I vårt exempel blir detta värde 37 gram. Vårt svar på frågan blir då: En nyfödd bebis väger i genomsnitt 37 gram. Svaret vi har angivit är inte jättebra. Faktum är att vissa data i vårt stickprov avviker med över 700 gram. Att mätdata avviker från medelvärdet är ingenting vi kommer ifrån, men vad vi kan försöka göra är att försöka beräkna hur stora avvikelser vi bör förvänta oss. Ett vanligt mått på avvikelsernas storlek är den så kallade standardavvikelsen: Standardavvikelsen av n olika värden x, x 2, x 3,..., x n, x n med medelvärde x ges av σ = n (x k x) n 2. I vårt exempel blir standardavvikelsen 370 gram. Det svar vi nu får på frågan är: En nyfödd bebis väger i genomsnitt 37 gram, med en standardavvikelse på 370 gram. k=

Är vårt svar bra? Det enda måttet på detta är om det duger för att göra förutsägelser om verkligheten. Vi måste alltså gå ut och väga fler bebisar. Om vi går ut och väger tio bebisar till så kanske vi får mätdata: 3686 3242 3656 407 353 45 3350 3723 3453 327. De flesta bebisar i detta stickprov verkar avvika ganska mycket från vår förutsägelse. Detta tyder på att vi behöver göra en noggrannare undersökning, exempelvis med ett större stickprov.. Beräkna medelvärde och standardavvikelse för nedanstående värden. a) 7 55 00 24 4 2 54 6 53. b) 5, 2 42, 3 4, 2 45, 54 47, 50 44, 08 5, 8 46, 73. c) 2, 3 0, 0 2, 46 0, 2 0, 45 0, 83 0, 4 0, 03 0, 76 0, 22. 2 Slump och sannolikhet Ibland saknar vi en bra modell för att kunna förutsäga resultatet av ett experiment. I ett sådant läge kan vi betrakta experimentet som slumpmässigt. Resultatet av att utföra ett slumpmässigt experiment kallas för ett utfall. Exempel. Om vi rullar en vanlig sexsidig tärning med numrerade sidor så är de möjliga utfallen, 2, 3, 4, 5 och 6. Exempel. Ett mynt har två sidor. Vi kan kalla dessa för kung respektive krona. Om vi singlar två mynt samtidigt så finns fyra möjliga utfall: Första myntet visar kung, andra myntet visar kung. Första myntet visar kung, andra myntet visar krona. Första myntet visar krona, andra myntet visar kung. Första myntet visar krona, andra myntet visar krona. En samling av ett eller flera utfall kallas för en händelse. De utfall som ingår i en viss händelse kallas gynnsamma för händelsen. Exempel. En möjlig händelse då vi singlar två mynt är att precis ett av mynten visar kung. Genom att titta på vår lista ser vi att denna händelse har två gynnsamma utfall. Exempel. En annan möjlig händelse när vi singlar två mynt är minst ett av mynten visar kung. Denna händelse har tre gynnsamma utfall. Exempel. Vi rullar en sexsidig tärning 00 gånger. Det finns sex olika utfall. Det kan vara intressant att undersöka hur vanliga de olika utfallen är. Antalet gånger som ett utfall (eller en händelse) förekommer kallas för frekvensen av detta. Ett möjligt resultat är: Utfall 2 3 4 5 6 Frekvens 6 4 6 7 7 20 Ett annat mått på förekomsten av ett visst utfall är relativ frekvens, vilket är frekvensen dividerat med antalet upprepningar. I exemplet med en tärning får vi Utfall 2 3 4 5 6 Relativ frekvens 0,6 0,4 0,6 0,7 0,7 0,20 2

Utfallet av ett slumpmässigt experiment kan beskrivas med hjälp av sannolikheter. Varje möjlig händelse tilldelas ett tal som kallas för sannolikheten att händelsen inträffar. Om sannolikheten ska var en bra beskrivning av verkligheten bör det väljas så att den är ungefär lika med den relativa frekvensen av händelsen då försöket upprepas ett stort antal gånger. I vissa situationer är valet av sannolikheter mycket svårt, och i vissa situationer kan det verka så uppenbart att vi kanske inte ens tänker på det. Exempel. Om vi rullar en välgjord tärning många gånger så förväntar vi oss att alla utfall ska vara lika vanligt förekommande. Sannolikheten gör varje utfall väljs då till 6 0, 67. Detta verkar stämma ganska bra med vad vi såg då vi rullade tärningen 00 gånger. Om vi rullar den 000000 gånger så kan vi istället få Utfall 2 3 4 5 6 Relativ frekvens 0,664 0,663 0,666 0,666 0,670 0,672 Vi verkar alltså ha gjort ett rimlilgt val av våra sannolikheter. Två olika händelser kallas för uteslutande om de inte kan inträffa samtidigt. En viktig egenskap hos sannolikheter är att de är additiva i följande mening: om vi har två olika händelser A och B som är uteslutande och har sannolikheter P (A) respektive P (B) så ges sannolikheten för att Aeller B inträffar av P (A eller B) = P (A) + P (B). Exempel. Rulla en rätning och betrakta händelsen tärningen visar tre eller fyra prickar. Denna händelse består av utfallen tärningen visar tre prickar och tärningen visar fyra prickar. Dessa utfall är uteslutande och därför är sannolikheten för händelsen tärningen visar tre eller fyra prickar lika med 6 + 6 = 3. 2. Vi singlar tre mynt. a) Beskriv alla möjliga utfall. b) Beräkna sannolikheten för händelserna att få tre, två, en respektive inga kronor. c) Addera sannolikheterna från föregående uppgift. Fundera över vad resultatet betyder. 3. Vi singlar två mynt. Men det ena myntet är lite felgjort och har därför sannolikheten att visa kung. 3 a) Beräkna sannolikheterna för vart och ett av de möjliga utfallen. b) Addera sannolikheterna från föregående uppgift. Fundera över vad resultatet betyder. c) Hur stor är sannolikheten att få precis en kung? 4. En pirat låter förbipasserande spela följande spel: Spelaren kan satsa på 0, eller 2. Därefter rullar piraten två tärningar. Om spelaren satsade på rätt antal prickar får han tillbaka 0 gånger insatsen för 0 prickar, 20 gånger insatsen för prickar och 40 gånger insatsen för 2 prickar. a) Beräkna sannolikheten att få 0, respektive 2 prickar. b) Vilket antal prickar är mest fördelaktigt att satsa på? c) Antag att piraten fuskar. Sannolikheten att hans tärningar visar en etta är tre gånger så stor som för vart och ett av de övriga antalen prickar. Gör om beräkningarna ovan. Är det möjligt att på lång sikt vinna spelet mot piraten? 3

5. I ett tv-program ingick följande moment: På scenen fanns tre dörrar. Bakom en av dörrarna fanns en bil. Bakom de andra två fanns några getter. En tävlande fick välja en dörr. Därefter öppnade programledaren en av de dörrar som den tävlande inte valt (bakom den öppnade dörren fanns bara getter). Den tävlande fick därefter valet att stå fast vid sitt tidigare val, eller att byta dörr. Hur bör man gå till väga för att maximera sin vinstchans? 3 Sannolikhetsfördelningar Det är vanligt att dela upp alla möjliga utfall i olika händelser och sedan göra en grafisk representation av sannolikheterna för dessa händelser. Nedan ses sådana representationer för sannolikheterna att få ett visst totalt antal prickar då vi rullar, 2 respektive 0 tärningar: Figur : Sannolikhetsfördelning med avseende på antal prickar för en tärning. Figur 2: Sannolikhetsfördelning med avseende på antal prickar för två tärningar. När vi på detta sätt anger alla sannolikheter på en gång så talar vi ofta om en sannolikhetsfördelning. De sannolikhetsfördelningar vi får när vi rullar tärningar är så kallade diskreta fördelningar. Det betyder att mellan två möjliga utfall eller händelser så finns det alltid omöjliga händelser eller utfall. Vi kommer exempelvis aldrig att få 7 3 prickar när vi rullar tre tärningar. Om vi återgår till exemplet med födelsevikter så är situationen annorlunda. Tänkbara värden ligger kanske här mellan 000 gram och 6000 gram, men framför allt så är alla värden däremellan också möjliga. En sådan sannolikhetsfördelning kallas kontinuerlig. 4

Figur 3: Sannolikhetsfördelning med avseende på antal prickar för tio tärningar. Vill vi beskriva detta experiment med en sannolikhetsfördelning så görs detta med hjälp av en så kallad täthetsfunktion. I fallet med födelsevikter är den så kallade normalfördelningen en lämplig beskrivning: f(x) = σ (x µ) 2 2π e 2σ 2. Figur 4: Normalfördelningen. Här är µ och σ två tal som beror på vilket konkret problem vi har för oss. Tolkningen av dessa är att om vi tar ett tillräckligt stort stickprov från vår fördelning så kommer stickprovets medelvärde och standardavvikelse att vara ungefär lika med µ respektive σ. I exemplet med födelsevikter så är lämpliga värden för µ och σ ungefär 3400 gram respektive 400 gram. När vi har en kontinuerlig sannolikhetsfördelning så bestämmer vi sannolikheten för en händelse inte genom att summera sannolikheter för olika utfall, utan genom att integrera täthetsfunktionen. Mer specifikt så ges sannolikheten att ett värde ur en normalfördelning ligger mellan värdena a och b av integralen σ 2π b a e (x µ)2 2σ 2 dx. Observera att denna integral inte kan beräknas med hjälp av elementära funktioner. Den måste alltså lösas numeriskt. 6. Baserat på tidigare information: Hur stor är sannolikheten att ett nyfött barn väger mellan 3000 gram och 4000 gram? Mer än 4000 gram? 5

7. Den berömda IQ-skalan för mänsklig individuell intelligens beskrivs av en normalfördelning med medelvärde µ=00 och standardavvikelse σ=5. Vad är sannolikheten att en slumpvis utvald person har IQ mellan 80 och 20? Mer än 40? Mindre än 60? Vad är sannolikheten att ha IQ mindre än 0? Facit. a) x 60, 3, σ 36, 3. b) x 46, 30, σ 3, 87. c) x 0, 4, σ, 05. 2. a) De åtta möjliga utfallen är (Krona, Krona, Krona) (Krona, Krona, Kung) (Krona, Kung, Krona) (Krona, Kung, Kung) (Kung, Krona, Krona) (Kung, Krona, Kung) (Kung, Kung, Krona) (Kung, Kung, Kung). b) Sannolikheterna är 8, 3 8, 3 8 respektive 8. c) Summan av sannolikheterna är. Detta betyder att om vi utför vårt experiment så är sannolikheten att vi får något av de möjliga utfallen, dvs. 00 %. 3. a) Sannolikheterna anges i tabellen nedan. Krona 4 Krona 2 Kung b) Sannolikheterna summerar återigen till. c) Sannolikheten ges av 2 + 2 = 4 Kung 2 4. a) Sannolikheterna är 2, 8 respektive 36. b) eller 2 prickar. c) Med fusktärningar blir motsvarande sannolikheter 3 omöjligt att på lång sikt vinna mot piraten. 64, 32 respektive 64. Det är nu 5. Genom att hålla fast vid sitt val är sannolikheten att vinna 3. Genom att byta är sannolikheten att vinna 2 3. 6. Sannolikheterna är ungefär 77,5 % respektive 6,7 %. 7. Sannolikheterna är, i den ordning de nämns i texten, ungefär 8,8 %, 0,38 %, 0,38 % respektive, 3 0. 6