Något om sannolikheter, slumpvariabler och slumpmässiga urval

Storlek: px
Starta visningen från sidan:

Download "Något om sannolikheter, slumpvariabler och slumpmässiga urval"

Transkript

1 LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Stig Danielsson Något om sannolikheter, slumpvariabler och slumpmässiga urval 1. Inledning Observerade data innehåller ofta någon form av information om en företeelse som man vill studera. Vill man t.ex. belysa trafikolyckor och deras uppkomst, samlar man förutom antalet olyckor in en mängd information om olycksförarna, fordonen, vägen, väderförhållanden etc. Bl.a. vill man kanske belysa sambandet mellan antal olyckor och fordonens hastigheter samt kanske trafikmängden. Sådana analyser kan göras rent deskriptivt med olika tabeller och diagram, men ofta syftar man litet längre och vill uttala sig mera generellt. Det är då man kan se uttalanden av typen: "hastigheterna har en statistiskt säkerställd påverkan på antalet olyckor", "en sänkning av hastigheterna med 1 km i timmen leder till en statistiskt säkerställd minskning av antalet dödolyckor med mellan a och b stycken per år". Förutom sådana uttalanden ser man ofta också sådana som har med "felmarginal" att göra: "ökningen av antalet dödsolyckor sedan förra året ligger inom den statistiska felmarginalen". Bakom utsagor av denna typ döljer sig någon statistisk modell (eller population) som man uttalar sig om, och man har då också mer eller mindre tydligt anammat ett begrepp som kallas sannolikhet.. Vad är sannolikhet? Sannolikhet är ett väldefinierat matematiskt begrepp, men det skulle föra alldeles för långt att gå in i dessa detaljer. Vi nöjer oss därför med vissa intuitiva resonemang. Grunden för sannolikheter är att man studerar företeelser, som kan resultera i olika utfall och att man inte säkert kan förutsäga vilket utfall som kommer att inträffa. Om vi t.ex. kastar en tärning, så vet vi att en, två, tre, fyra, fem eller sex prickar kommer upp när vi kastar den, men vi kan inte säkert förutsäga resultatet i ett enskilt kast. Däremot är vi kanske beredda att säga att alla sex utfallen är lika sannolika (om tärningen är symmetrisk). Förutom att den företeelse man studerar skall kunna resultera i flera utfall, kräver vi också något mera för att prata om sannolikheter, nämligen att den situation man studerar i princip skall kunna upprepas ett godtyckligt antal gånger under samma yttre betingelser. Detta är något som uppenbart bör vara uppfyllt vid kast av en tärning. Skälet till upprepbarhet är, att man vill definiera sannolikheter så att de "liknar" motsvarande relativa frekvenser. Med "liknar" menar vi dels att sannolikheter och relativa frekvenser skall ha samma matematiska egenskaper, men också att en explicit modell för sannolikheter är till praktisk nytta, bara om sannolikheterna och relativa frekvenserna är rimligt lika varandra. Om vi t.ex. orkar kasta en symmetrisk tärning säg 6000 gånger, är vi väl alla beredda på att sätta en slant på att frekvensen ettor, tvåor etc. alla ligger nära 1000, och att de relativa frekvenserna ligger mycket nära 1/6. En rimlig modell är då att sannolikheterna för etta, tvåa etc. alla sätts till 1/6. 1

2 Vad skall vi då kräva för egenskaper hos en sannolikhet för en händelse? Beteckna händelsen med A och skriv sannolikheten som P(A). Eftersom alla relativa frekvenser måste ligga mellan 0 och 1, kräver vi förstås också att 0 P ( A) 1. Vidare gäller ju för en händelse som säkert inträffar (t.ex. att man vid tärningskast får en etta eller en tvåa eller...eller en sexa) att relativa frekvensen är 1, och då kräver vi även detta för sannolikheter. Med motsvarande motivering får en omöjlig händelse sannolikheten 0. Man brukar också postulera ytterligare ett par matematiska krav för att definiera sannolikheten för en händelse, men vi hoppar över detta här. Nu räcker det ju inte att bara postulera egenskaperna hos sannolikheter, utan i praktiken måste man också ange sannolikheterna explicit (utom möjligen att vissa parametrar är okända). Detta kan ibland göras med teoretiska argument, men ofta är det observerade data som ligger till grund för modellvalen (t.ex. att man kan stödja sig på relativa frekvenser). Datas roll återkommer vi till nedan och tar här upp ett så enkelt experiment att det bör vara lätt att sätta upp en sannolikhetsmodell. Exempel. Kast med mynt. Antag att man har en enkrona som man kastar slumpmässigt på ett bord och noterar vilken sida som kommer upp (krona eller klave). De flesta skulle nog vara beredda att ansätta modellen P(krona) = P(klave) = 1/, och denna modell är förstås den rimliga om myntet kan anses vara symmetriskt. Antag nu att vi inte har en vanlig enkrona, utan myntet kan ev. vara manipulerat. Den modell vi då kan ansätta är bara P( krona) p och därmed P( klave) 1 p, och det enda vi kan säga om parametern p är att den ligger mellan 0 och 1. För att komma längre måste vi kasta myntet ett antal gånger och uppskatta p med relativa frekvensen för krona. Antag att vi har två symmetriska enkronor som vi kastar samtidigt och observerar vilka sidor som kommer upp. De tre möjliga utfallen är två st. krona, två st. klave resp. en klave och en krona. Eftersom vi kastar symmetriska mynt bör väl de tre utfallen vara lika sannolika, dvs vi ansätter sannolikheten 1/3 för vardera utfallet? Om vi genomför ett antal kast med de två mynten, kommer vi snart bli varse att relativa frekvenserna inte alls ligger kring 1/3, utan i stället kring 1/4, 1/4 resp. 1/ (det sista värdet för utfallet en krona och en klave). Med litet eftertanke inser vi att detta är teoretiskt korrekt, eftersom utfallet en krona och en klave kan uppkomma på två olika sätt från de två mynten. De utfall som har lika sannolikheter är följande fyra, där vi skriver ut resultaten på mynt 1 resp. mynt : (kr, kr), (kl, kl), (kr, kl) och (kl, kr) De två sista resulterar båda i en klave och en krona, och därför får denna händelse sannolikheten 1/. Vi skall inte gå djupare in på ren sannolikhetslära utan nöjer oss här med dessa ganska intuitiva resonemang. I stället skall vi något djupare behandla den situation som är mera praktiskt användbar, nämligen att de möjliga utfallen består av reella tal eller att man intresserar sig bara för beskrivningar som är reella tal. Vi kan anknyta till kastet med två mynt ovan, där vi har skrivit upp fyra (lika sannolika) utfall på de två mynten. Alternativt skulle vi kunna ha nöjt oss med att notera t.ex. antalet krona, som ju har de möjliga värdena 0, 1 eller. Troligen är denna beskrivning av försöket till fyllest för de flesta ändamål, och man säger då att man studerar en slumpvariabel (i detta fall antalet krona).

3 3. Slumpvariabler och sannolikhetsfördelningar Vi utgår nu ifrån att vi studerar en slumpmässig företeelse (kallas ibland för slumpmässigt försök) i den dubbla betydelse som vi diskuterade ovan. Vi är bara intresserade av utfall som kan formuleras i reella tal, och då säger vi att vi studerar en slumpvariabel (ibland används ordet stokastisk variabel) X. Denna slumpvariabel bör vanligen ha flera möjliga utfall x, eftersom vi betraktar slumpmässiga företeelser. Vi håller oss här till konventionen att en slumpvariabel betecknas med stor bokstav, medan en slumpvariabels möjliga värden (utfallen) betecknas med liten bokstav. De möjliga värdena x kan ibland vara diskret många och ibland alla värden i ett intervall (eller kanske t.o.m. alla reella tal). Oavsett typen av möjliga värden på X, måste vi på något sätt ange en s.k. sannolikhetsfördelning för att specificera vår modell. Om de möjliga värdena är diskreta så är situationen enkel i den meningen, att man i princip kan ange sannolikheten för varje enskilt värde. Självfallet måste man då se till att summan av dessa sannolikheter är 1. Om de möjliga värdena utgör ett helt intervall, kan man inte specificera en sannolikhet för varje enskilt värde. I stället brukar man definiera en s.k. sannolikhetstäthet (eller frekvensfunktion) för X, som gör det möjligt att beräkna sannolikheter att utfallen hamnar inom olika delintervall. En sådan sannolikhet definieras som arean under täthetsfunktionen begränsad till det aktuella intervallet. Hela arean under täthetsfunktionen måste förstås vara 1. Det resonemang vi nu har genomfört känns förmodligen ganska teoretiskt och abstrakt, varför vi genast skall exemplifiera med två av de vanligaste sannolikhetsfördelningarna. Binomialfördelningen är ett exempel på en diskret fördelning, där de möjliga värdena är ändligt många. Vi går tillbaka till exemplet med kast av två mynt och låter X vara antalet krona som 1 1 erhålls. Vi har kommit fram till att P ( X 0) P( X ), medan P ( X 1). 4 Detta är ett exempel på en binomialfördelning och vi noterar att summan av sannolikheterna är 1, dvs P ( X x) 1. x 0 Litet mera generellt kan vi betrakta en situation, där man upprepar ett försök n gånger oberoende av varandra. Varje gång noterar vi om en viss händelse A inträffar eller inte (t.ex. om vi får krona eller inte på ett mynt). Vi intresserar oss bara för antalet gånger A inträffar och betecknar detta antal med slumpvariabeln X. De möjliga värdena på X är 0, 1,..., n, och man kan visa att X har sannolikhetsfördelningen n! x n x P( X x) p (1 p) för x 0,1,..., n. x!( n x)! Det är kanske litet svårt att inse detta, men det är däremot ganska lätt att se att 1 myntexemplet är ett specialfall med n och p. 3

4 Frequency Normalfördelningen. De observationer som vi har i många datamaterial kan ofta ses som oberoende mätningar på någon slumpmässig företeelse. T.ex. vill man studera kvävehalten i en sjö och tar därför ett antal prover över sjön och mäter provernas kvävehalter. Om man sedan gör ett histogram över mätningarna, ser man ofta att histogrammet är relativt symmetriskt med en tydlig topp, en s.k. "klockkurva". Den s.k. normalfördelningen har typiskt ett sådant utseende, och skulle därför kunna vara en rimlig modell för observationerna. Vi skall inte djupare gå in på fördelningen, men för den intresserade kan vi ange sannolikhetstätheten för en slumpvariabel X som är normalfördelad: 1 1 ( x ) f ( x) e ; x Här är populationens medelvärde (väntevärde) och populationens standardavvikelse. I exemplet ovan skall vi tolka detta så, att är den verkliga kvävehalten i sjön (som vi är ute efter att uppskatta med hjälp av mätningarna). Ett viktigt specialfall har vi när väntevärdet är 0 och standardavvikelsen är 1. För denna fördelning finns tabeller, som visar sannolikheten att en observation hamnar t.ex. till höger om ett givet värde z. Denna sannolikhet är då arean till höger om z under sannolikhetstätheten för normalfördelningen (se någon lämplig tabell). T.ex. är sannolikheten att hamna till höger om 0 exakt 50%, medan sannolikheten är 15.9% att hamna till höger om 1. Vi kan illustrera normalfördelningen genom att simulera data i Minitab. Nedan finns ett histogram med anpassad normalfördelningskurva för 60 observationer som är normalfördelade med väntevärde 0 och standardavvikelse 1: Histogram of C1, with Normal Curve ,0-1,5-1,0-0,5 0,0 0,5 1,0 1,5,0,5 C1 Med 60 observationer får inte histogrammet någon självklar klockform, trots att observationerna kommer från en "riktig" normalfördelning. Däremot har man en hyggligt symmetrisk fördelning och väsentligt flera observationer i mitten än ute i svansarna. Slutligen ett teoretiskt besvärligt resultat att visa men praktiskt mycket viktigt: Om man har oberoende observationer på en slumpvariabel X och bildar medelvärdet av 4

5 observationerna, dvs X, så gäller att detta medelvärde är approximativt normalfördelat bara antalet observationer n är stort. Och detta gäller oavsett vilken fördelning X har från början!. Normalfördelningen blir därför mycket användbar i många praktiska sammanhang som vi kommer att se senare. 4. Slumpmässiga urval Vi har hittills litet löst pratat om oberoende observationer, slumpmässiga mätvärden och populationer. Det är nu dags att något förtydliga dessa begrepp. Population kan beteckna något mycket konkret och något ganska vagt. Om man ser på en mätsituation (t.ex. att få grepp över kvävehalten i en sjö), så är ju populationen i någon mening alla tänkbara observationer som kan göras, och den måste då ses som oändligt stor. Det rimliga sättet att beskriva denna population är att säga att observationerna är oberoende mätningar på någon slumpvariabel X, och man försöker att finna en rimlig sannolikhetsfördelning för denna slumpvariabel. Ett intressant mått på fördelningen är väntevärdet (populationsmedelvärdet), som man ofta vill skatta och dessutom vill man ange osäkerheten i skattningen. En population kan också vara högst konkret, t.ex. bestå av alla individer i Sverige. Man säger då att man har en ändlig population. Det kan vara av intresse att få kännedom om någon parameter i populationen, t.ex. andelen individer som vill att vi skall gå med i EMU. I princip skulle vi kunna ta reda på detta genom att tillfråga alla i populationen, men i praktiken skattar man andelen genom att ta ett slumpmässigt urval och mäta andelen EMU-sympatisörer i detta. Självfallet kan vi då inte vara säkra på att observera den sanna andelen i populationen, utan i olika urval kommer andelen att variera en del. Denna variation kommer vi att kunna kvantifiera och hantera med statistiska metoder och sannolikhetsteoretiska argument. Men man bör observera att vi här inte antar att vi har observationer på någon slumpvariabel, utan det är själva sättet att göra urvalet som skapar slumpmässigheten i resultaten. Slumpmässiga urval ur en ändlig population kan göras på många sätt. Vi begränsar oss här till s.k. OSU, obundet slumpmässigt urval (enkelt slumpmässigt urval). Man väljer då sitt urval helt på måfå, dvs så att alla individer har samma sannolikhet att komma med i urvalet. Om dragningen görs med återläggning blir de n observationerna oberoende av varandra. Detta gäller inte om dragningen görs utan återläggning, eftersom en redan dragen individ inte kan dras igen. Om populationen är stor kan dock dragning utan återläggning ses som dragning med återläggning, och man kan utnyttja samma typ av statistiska metoder, som när man har oberoende observationer på en slumpvaraiabel. Vi avslutar detta avsnitt med ett enkelt exempel att öva på. Antag att vi har en ändlig population bestående av 5 element, och att mätvärdena på en variabel är, 4,, 6, 10. Vi gör ett enkelt slumpmässigt urval utan återläggning av individer och noterar deras variabelvärden. Hur många olika urval kan vi dra? Skriv upp alla och beräkna urvalsmedelvärdena. Beräkna fördelningen för de olika medeltalen (den s.k. samplingfördelningen) och notera hur pass stor variation vi kan räkna med. Beräkna också medelvärdet för alla urvalsmedeltal och notera att det är lika med populationsmedelvärdet. Och detta är inte en slump, utan man kan teoretiskt visa att urvalsmedeltalet i snitt alltid blir lika med populationsmedelvärdet (oavsett att enskilda urvalsmedelvärden varierar kraftigt). Praktiskt innebär detta att om man i sitt 5

6 urval använder medeltalet som uppskattning av populationsmedelvärdet, så har man en skattningsmetod som är vettig i den meningen, att den i snitt kan förväntas ge skattningar som träffar rätt. Även när man gör dragningen med återläggning erhålls motsvarande resultat. Det är lätt att genomföra motsvarande beräkningar som ovan och konstatera detta faktum. 5. Statistisk slutledning (inferens) Vi har flera gånger nämnt att vi med hjälp av observationer skall skatta t.ex. ett medelvärde eller en andel i en population. Det praktiska intresset att göra detta är lätt att föreställa sig, men hur hänger detta ihop med den sannolikhetslära som vi har antytt behovet av? Antag att vi har en slumpvariabel X med en viss fördelning, t.ex. normalfördelning. Om alla parametrar är kända i fördelningen kan vi då beräkna alla efterfrågade sannolikheter. Om vi gör oberoende observationer på X, kan vi också med sannolikhetsteorin uttala oss om dessa observationer, t.ex. säga med vilken sannolikhet medelvärdet hamnar i ett visst intervall. I praktiken har vi dock oftast ett omvänt problem. Vi har observationer på en slumpvariabel som kanske är normalfördelad, men vi vet inte dess väntevärde, dvs populationsmedelvärdet. Med hjälp av observationerna vill vi skatta t.ex. genom att beräkna observationernas medelvärde. Som vi har sett i enkla exempel har dock skattningen en variation beroende på vilka observationer man råkar ha fått. Men nu kommer sannolikhetsläran till hjälp. Variationen kan uttryckas i sannolikhetstermer, och det blir möjligt att kvantifiera säkerheten/osäkerheten i den beräknade skattningen. När vi har klarat detta har vi genomfört en statistisk slutledning om parametern. 6. Grundläggande teoretiska resultat för stickprov Vi behandlar nu den teoretiskt enklaste situationen, nämligen att vi har gjort n oberoende observationer på en slumpvariabel X. Sådana data kan man ibland ha genom att man gjort oberoende mätningar av någon "företeelse", eller att man har gjort ett slumpmässigt urval ur en stor population. För att förenkla beskrivningen säger man att man i sådana situationer har ett stickprov. Vanligen vill vi dra slutsatser till väntevärdet (populationsmedelvärdet) eller ibland till en populationsandel P, dvs den andel i populationen som har en viss egenskap (P kan också i en oändlig population tolkas som sannolikheten att en slumpmässigt vald individ har egenskapen i fråga). En sådan andel kan också tolkas som ett medelvärde, nämligen medelvärdet av en variabel som antar värdet 1 för den aktuella egenskapen och värdet 0 i övrigt. Vi kan därför nöja oss med att fortsättningsvis behandla väntevärden. Den ganska självklara skattningen av är ju stickprovets medelvärde. Med resonemang liknande det i föregående avsnitt kan man övertyga sig om, att denna skattning i genomsnitt träffar rätt, och detta brukar formuleras som att stickprovsmedelvärdet är en väntevärdesriktig skattning av. Hur pass säker/osäker är nu skattningen? Vi måste då studera spridningen, dvs standardavvikelsen för skattningen. Intuitivt känner vi väl på oss att medelvärdet av 6

7 många observationer borde vara mycket säkrare än medelvärdet av några få, och detta är också något man matematiskt kan visa. Det gäller att standardavvikelsen för ett stickprovsmedelvärde är, där är populationens standardavvikelse. En n observation har alltså standardavvikelsen, medelvärdet av 4 observationer har standaravvikelsen, etc. Standardavvikelsen avtar alltså med roten ur antalet observationer, och med ett mycket stort antal observationer har vi nästan ingen spridning alls i medelvärdet, dvs medelvärdet blir nästan exakt lika med! Detta kan sägas vara grunden till all statistisk metodik, nämligen att medelvärdesbildning gör att man kan få stabila skattningar. Ytterligare ett teoretiskt resultat måste lyftas fram. I resonemanget ovan om standardavvikelsen för ett medelvärde ingick populationsstandardavvikelsen. Denna är normalt inte känd, utan behöver skattas från stickprovet. Vi använder då naturligen stickprovsstandardavvikelsen s. Man kan visa att detta är en vettig skattning, i den meningen att s är en väntevärdesriktig skattning av. Och här har vi förklaringen till att man använder nämnaren n - 1 i stickprovsvariansen. Man behöver nämligen den nämnaren för att skattningen skall bli väntevärdesriktig! 7

8 7. Övningar 7.1 I stort sett föds lika många pojkar som flickor i Sverige sett över varje år. Betrakta en slumpmässigt vald fyrabarnsfamilj. a) Hur många flickor bör man vänta sig att familjen har? b) Vilken är sannolikheten att familjen har bara flickor? c) Vilken är sannolikheten att familjen har två flickor och två pojkar? d) Beräkna sannolikhetsfördelningen för antalet flickor. 7. Ett lotteri har 100 lotter, varav 10 ger vinst. a) Drag en lott på måfå. Vilken är sannolikheten för att få en nitlott? b) Om man tar fem lotter på måfå, vilken är då sannolikheten att man får bara nitlotter? c) Dragning som i b) men beräkna nu sannolikheten att man får exakt en vinstlott. 7.3 Betrakta en slumpvariabel Z som är normalfördelad med väntevärde 0 och standardavvikelse 1, vilket brukar benämnas att den är standardiserat normalfördelad. Beräkna genom att använda tabell: a) P ( Z 0.43) b) P ( Z 1.96) c) P ( 0. Z 1.8) d) P ( Z 0.33) 7.4 Betrakta en slumpvariabel X som är normalfördelad med väntevärde och standardavvikelse Man kan visa att en sådan variabel alltid kan göras standardiserat normalfördelad med transformationen Z X. Antag nu att X har väntevärdet 10 och standardavvikelsen. Beräkna a) P ( X 10) b) P ( X 13) c) P ( 11 X 13) 7.5 Antag att vi har tagit 186 vattenprover ur en sjö och mätt halten av ett giftigt ämne. Antag vidare att denna halt i genomsnitt bör vara 0.6 och med standardavvikelsen Vilken är (den approximativa) sannolikheten att medelvärdet hos de 186 vattenproven överstiger värdet 0.7? 7.6 I en tillverkningsprocess under kontroll räknar man med att 90% av alla tillverkade enheter är helt felfria. Vid en kvalitetskontroll undersöker man 10 enheter valda på måfå ur en dagsproduktion. Bestäm sannolikheten att högst 85% av dessa enheter är helt felfria om processen är under kontroll. 7.7 Vikten hos en viss typ av äpple kan antas vara normalfördelad med genomsnittsvikt 10 g och med standardavvikelse 10g. Äpplena packas i korgar och man lägger i äpplen till dess vågen visar kg eller mer. Hur stor är sannolikheten att en korg innehåller högst 16 stycken äpplen? 8

9 Svar: 7.1 a) st. b) 1/16. c) 6/16. d) 1/16, 4/16, 6/16, 4/16, 1/ a) 0.9. b). c) a) 33.4%. b) 97.5%. c) 38.5%. d) 37.1%. 7.4 a) 50%. b) 6.7%. c) 4.% % % 7.7.3%. 9

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data

Läs mer

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Kapitel 4 Sannolikhetsfördelningar Sid 79-14 Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Slumpvariabel En variabel för vilken slumpen bestämmer utfallet. Slantsingling, tärningskast,

Läs mer

Samplingfördelningar 1

Samplingfördelningar 1 Samplingfördelningar 1 Parametrar och statistikor En parameter är en konstant som karakteriserar en population eller en modell. Exempel: Populationsmedelvärdet Parametern p i binomialfördelningen 2 Vi

Läs mer

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 4. Kapitel 5, sid Stickprovsteori Föreläsning 4 Kapitel 5, sid 127-152 Stickprovsteori 2 Agenda Stickprovsteori Väntevärdesriktiga skattningar Samplingfördelningar Stora talens lag, Centrala gränsvärdessatsen 3 Statistisk inferens Population:

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

4 Diskret stokastisk variabel

4 Diskret stokastisk variabel 4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Föreläsning 7. Statistikens grunder.

Föreläsning 7. Statistikens grunder. Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

1 Mätdata och statistik

1 Mätdata och statistik Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt

Läs mer

Några extra övningsuppgifter i Statistisk teori

Några extra övningsuppgifter i Statistisk teori Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,

Läs mer

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel Finansiell Statistik (GN, 7,5 hp,, VT 009) Föreläsning Diskreta (LLL Kap 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS,

Läs mer

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17 1/17 F8 Skattningar Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 14/2 2013 Inledande exempel: kullager Antag att diametern på kullager av en viss typ är normalfördelad N(µ,

Läs mer

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)

Läs mer

Kap 3: Diskreta fördelningar

Kap 3: Diskreta fördelningar Kap 3: Diskreta fördelningar Sannolikhetsfördelningar Slumpvariabler Fördelningsfunktion Diskreta fördelningar Likformiga fördelningen Binomialfördelningen Hypergeometriska fördelningen Poisson fördelningen

Läs mer

4.1 Grundläggande sannolikhetslära

4.1 Grundläggande sannolikhetslära 4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser osv. Sannolikhet är ett tal mellan

Läs mer

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ Inledning till statistikteorin Skattningar och konfidensintervall för μ och σ Punktskattningar Stickprov från en population - - - Vi vill undersöka bollhavet men får bara göra det genom att ta en boll

Läs mer

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES-

DATORÖVNING 6: CENTRALA GRÄNSVÄRDES- DATORÖVNING 6: CENTRALA GRÄNSVÄRDES- SATSEN OCH FELMARGINALER I denna datorövning ska du använda Minitab för att empiriskt studera hur den centrala gränsvärdessatsen fungerar, samt empiriskt utvärdera

Läs mer

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar Föreläsning 3 Kapitel 4, sid 79-124 Sannolikhetsfördelningar 2 Agenda Slumpvariabel Sannolikhetsfördelning 3 Slumpvariabel (Stokastisk variabel) En variabel som beror av slumpen Ex: Tärningskast, längden

Läs mer

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen Kap 6: Normalfördelningen Normalfördelningen Normalfördelningen som approximation till binomialfördelningen σ μ 1 Sats 6 A Om vi ändrar läge och/eller skala på en normalfördelning så har vi fortfarande

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska

Läs mer

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler

Finansiell statistik, vt-05. Slumpvariabler, stokastiska variabler. Stokastiska variabler. F4 Diskreta variabler Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-05 F4 Diskreta variabler Slumpvariabler, stokastiska variabler Stokastiska variabler diskreta variabler kontinuerliga

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare "Det finns inget så praktiskt som en bra teori" November 2011 Repetition Vad vi gjort hitills Vi har börjat med att studera olika typer av mätningar och sedan successivt tagit fram olika beskrivande mått

Läs mer

FÖRELÄSNING 7:

FÖRELÄSNING 7: FÖRELÄSNING 7: 2016-05-10 LÄRANDEMÅL Normalfördelningen Standardnormalfördelning Centrala gränsvärdessatsen Konfidensintervall Konfidensnivå Konfidensintervall för väntevärdet då variansen är känd Samla

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska

Läs mer

Mer om slumpvariabler

Mer om slumpvariabler 1/20 Mer om slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/2 2013 2/20 Dagens föreläsning Diskreta slumpvariabler Vilket kretskort ska man välja? Väntevärde

Läs mer

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3 Laboration 2 Fördelningar och simulering Introduktion 2014-02-06 Syftet med laborationen är dels

Läs mer

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 5. Kapitel 6, sid Inferens om en population Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population 2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik David Bolin Chalmers University of Technology April 7, 2014 Projektuppgift Projektet går ut på att genomföra ett statistiskt försök och analysera resultaten.

Läs mer

Föreläsning G70 Statistik A

Föreläsning G70 Statistik A Föreläsning 2 732G70 Statistik A Introduktion till sannolikhetslära Sannolikhetslära: område inom statistiken där vi studerar experiment vars utfall beror av slumpen Sannolikhet: numeriskt värde (mellan

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 5 Statistiska metoder 1 Dagens föreläsning o Konfidensintervall För andelar För medelvärden Vid jämförelser o Den statistiska felmarginalen o Stickprovsstorlek 2 Introduktion När man beräknar

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

TMS136. Föreläsning 7

TMS136. Föreläsning 7 TMS136 Föreläsning 7 Stickprov När vi pysslar med statistik handlar det ofta om att baserat på stickprovsinformation göra utlåtanden om den population stickprovet är draget ifrån Situationen skulle kunna

Läs mer

Sannolikhetsbegreppet

Sannolikhetsbegreppet Kapitel 3 Sannolikhetsbegreppet Betrakta följande försök: Ett symmetriskt mynt kastas 100 gånger och antalet krona observeras. Antal kast 10 20 30 40 50 60 70 80 90 100 Antal krona 6 12 16 21 25 30 34

Läs mer

TMS136. Föreläsning 10

TMS136. Föreläsning 10 TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis

Läs mer

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4) Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative

Läs mer

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer

Läs mer

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2 Finansiell Statistik (GN, 7,5 hp, HT 008) Föreläsning Diskreta sannolikhetsfördelningar (LLL kap. 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

Föreläsning 1: Introduktion

Föreläsning 1: Introduktion Föreläsning 1: Introduktion Matematisk statistik David Bolin Chalmers University of Technology March 22, 2014 Lärare och kurslitteratur David Bolin: Rum: E-mail: Fredrik Boulund: Rum: E-mail: Kursansvarig,

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

1.1 Diskret (Sannolikhets-)fördelning

1.1 Diskret (Sannolikhets-)fördelning Föreläsning III. Diskret (Sannolikhets-)fördelning Med diskret menas i matematik, att något antar ett ändligt antal värden eller uppräkneligt oändligt med värden e.vis {, 2, 3,...}. Med fördelning menas

Läs mer

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen Sannolikhetslära och inferens II Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen 1 Statistikor och samplingfördelningar I Kapitel 6 studerades metoder för att bestämma sannolikhetsfördelningen

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN): Lunds tekniska högskola Matematikcentrum Matematisk statistik Matematisk statistik AK för ekosystemteknik, FMSF75 OH-bilder 2018-09-19 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Läs mer

Diskussionsproblem för Statistik för ingenjörer

Diskussionsproblem för Statistik för ingenjörer Diskussionsproblem för Statistik för ingenjörer Måns Thulin thulin@math.uu.se Senast uppdaterad 20 februari 2013 Diskussionsproblem till Lektion 3 1. En projektledare i ett byggföretaget ska undersöka

Läs mer

Föreläsning 7: Punktskattningar

Föreläsning 7: Punktskattningar Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology September 21, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6. Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, 28-4-6 EXEMPEL (max och min): Ett instrument består av tre komponenter.

Läs mer

F2 SANNOLIKHETSLÄRA (NCT )

F2 SANNOLIKHETSLÄRA (NCT ) Stat. teori gk, ht 2006, JW F2 SANNOLIKHETSLÄRA (NCT 4.1-4.2) Ordlista till NCT Random experiment Outcome Sample space Event Set Subset Union Intersection Complement Mutually exclusive Collectively exhaustive

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) SF1901: Sannolikhetslära och statistik Föreläsning 9. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 21.02.2012 Jan Grandell & Timo Koski () Matematisk statistik 21.02.2012

Läs mer

DATORÖVNING 2: STATISTISK INFERENS.

DATORÖVNING 2: STATISTISK INFERENS. DATORÖVNING 2: STATISTISK INFERENS. START Logga in och starta Minitab. Se till att du kan skriva Minitab-kommandon direkt i Session-fönstret (se föregående datorövning). CENTRALA GRÄNSVÄRDESSATSEN Enligt

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P.

F6 STOKASTISKA VARIABLER (NCT ) Används som modell i situation av följande slag: Slh för A är densamma varje gång, P(A) = P. Stat. teori gk, ht 2006, JW F6 STOKASTISKA VARIABLER (NCT 5.4-5.6) Binomialfördelningen Används som modell i situation av följande slag: Ett slumpförsök upprepas n gånger (oberoende upprepningar). Varje

Läs mer

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning? När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns

Läs mer

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN): Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF50: Matematisk statistik för L och V OH-bilder på föreläsning 7, 2017-11-20 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

Studietyper, inferens och konfidensintervall

Studietyper, inferens och konfidensintervall Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär

Läs mer

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tid: Måndagen den 2015-06-01, 8.30-12.30. Examinator och Jour: Olle Nerman, tel. 7723565, rum 3056, MV, Chalmers. Hjälpmedel: Valfri

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten

Läs mer

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29) LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 (2015-04-22) OCH INFÖR ÖVNING 7 (2015-04-29) Aktuella avsnitt i boken: Kap 61 65 Lektionens mål: Du ska

Läs mer

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar Sannolikhetslära och inferens II Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar 1 Diskreta slumpvariabler En slumpvariabel tilldelar tal till samtliga utfall i ett slumpförsök. Vi

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Kap 2: Några grundläggande begrepp

Kap 2: Några grundläggande begrepp Kap 2: Några grundläggande begrepp Varför sannolikhetslära är viktigt? Vad menar vi med sannolikhetslära? Träddiagram? Vad är den klassiska, empiriska och subjektiva sannolikheten? Vad menar vi med de

Läs mer

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik Jörgen Säve-Söderbergh Information om kursen Kom ihåg att

Läs mer

TMS136. Föreläsning 1

TMS136. Föreläsning 1 TMS136 Föreläsning 1 Varför? Om vi gör mätningar vill vi kunna modellera och kvantifiera de osäkerheter som obönhörligen finns Om vi handlar med värdepapper vill kunna modellera och kvantifiera de risker

Läs mer

Föreläsning 12: Repetition

Föreläsning 12: Repetition Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse

Läs mer

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski SF1901: Sannolikhetslära och statistik Föreläsning 10. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski 18.02.2016 Jan Grandell & Timo Koski Matematisk statistik 18.02.2016

Läs mer

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse

Läs mer

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamen MVE301 Sannolikhet, statistik och risk Tentamen MVE301 Sannolikhet, statistik och risk 2017-08-15 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Olof Elias, telefon: 031-7725325 Hjälpmedel: Valfri

Läs mer

Sannolikhetslära. 19 februari 2009. Vad är sannolikheten att vinna om jag köper en lott?

Sannolikhetslära. 19 februari 2009. Vad är sannolikheten att vinna om jag köper en lott? Sannolikhetslära 19 februari 009 Vad är en sannolikhet? I vardagen: Vad är sannolikheten att vinna om jag köper en lott? Borde jag ta paraply med mig till jobbet idag? Vad är sannolikheten att det kommer

Läs mer

Statistikens grunder HT, dagtid Statistiska institutionen

Statistikens grunder HT, dagtid Statistiska institutionen Statistikens grunder 1 2013 HT, dagtid Statistiska institutionen Orsak och verkan N Kap 2 forts. Annat ord: kausalitet Något av det viktigaste för varje vetenskap. Varför? Orsakssamband ger oss möjlighet

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare Stockholms universitet November 2011 Data på annat sätt - I Stolpdiagram Data på annat sätt - II Histogram För kvalitativa data som nominal- och ordinaldata infördes stapeldiagram. För kvantitativa data

Läs mer

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift Exempel: Väljarbarometern Föreläsning 1: Introduktion Matematisk statistik Det som typiskt karakteriserar ett statistiskt problem är att vi har en stor grupp (population) som vi vill analysera. Vi kan

Läs mer

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter

1 Stora talens lag. Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT Teori. 1.2 Uppgifter Lunds universitet Matematikcentrum Matematisk statistik Laboration 2 Matematisk statistik allmän kurs, MASA01:A, HT-15 Syftet med denna laboration är att du skall bli förtrogen med två viktiga områden

Läs mer

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4 LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, 216-4-6 OCH INFÖR ÖVNING 4 Övningens mål: Du ska förstå begreppet slumpvariabel och skilja

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-08-22 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Jourhavande lärare: Mykola

Läs mer

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära Martin Singull Matematisk statistik Matematiska institutionen TAMS65 - Mål Kursens övergripande mål är att ge

Läs mer

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 3 Matematisk statistik AK för CDIFysiker, FMS012/MASB03, HT15 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Föreläsning 1: Introduktion

Föreläsning 1: Introduktion Föreläsning 1: Introduktion Matematisk statistik Chalmers University of Technology Mars 23, 2015 Lärare och kurslitteratur : Rum: E-mail: Anders Hildeman: Rum: E-mail: Kursansvarig och föreläsare H3018

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 9

ÖVNINGSUPPGIFTER KAPITEL 9 ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar

Läs mer

TMS136. Föreläsning 4

TMS136. Föreläsning 4 TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,

Läs mer

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 2 Statistik; teori och tillämpning i biologi 1 Normalfördelning Samplingfördelningar och CGS Fördelning för en stickprovsstatistika (t.ex. medelvärde) kallas samplingfördelning. I teorin är

Läs mer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 25..26 Jan Grandell & Timo Koski Matematisk statistik 25..26 / 44 Stokastiska

Läs mer

Övning 1 Sannolikhetsteorins grunder

Övning 1 Sannolikhetsteorins grunder Övning 1 Sannolikhetsteorins grunder Två händelser A och B är disjunkta om {A B} =, det vill säga att snittet inte innehåller några element. Om vi har en mängd händelser A 1, A 2, A 3,..., A n, vilka är

Läs mer

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik Statistik Statistik betyder ungefär sifferkunskap om staten Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information. Verkligheten

Läs mer

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer Tabell- och formelsamling A4 Grundläggande Statistik A8 Statistik för ekonomer Observera att inga anteckningar får finnas i formelsamlingen vid tentamenstillfället Thommy Perlinger 17 september 2015 Innehåll

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 7 15 november 2017 1 / 28 Lite om kontrollskrivning och laborationer Kontrollskrivningen omfattar Kap. 1 5 i boken, alltså Föreläsning

Läs mer

F9 Konfidensintervall

F9 Konfidensintervall 1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att

Läs mer

Demonstration av laboration 2, SF1901

Demonstration av laboration 2, SF1901 KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion

Läs mer

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Anna Lindgren 25 november 2015 Anna Lindgren anna@maths.lth.se FMSF20 F8: Statistikteori 1/17 Matematisk statistik slumpens matematik

Läs mer