Födelsedagsparadoxen. HIV test. Laplaces röda och svarta kort. Exempel från föreläsningar i Matematisk Statistik och

Relevanta dokument
Födelsedagsparadoxen. HIV test. Laplaces röda och svarta kort. Exempel från föreläsningar i Matematisk Statistik och Bioinformatik, 2014

Exempel från föreläsningar i Matematisk Statistik

Föreläsning 12, FMSF45 Hypotesprövning

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

TMS136. Föreläsning 13

Föreläsning 5. Kapitel 6, sid Inferens om en population

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Extrauppgifter - Statistik

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Matematisk statistik för D, I, Π och Fysiker

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

FÖRELÄSNING 8:

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Föreläsningsanteckningar till kapitel 9, del 2

Extrauppgifter i matematisk statistik

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Thomas Önskog 28/

Hur skriver man statistikavsnittet i en ansökan?

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Jämförelse av två populationer

Tentamen MVE302 Sannolikhet och statistik

Matematisk statistik för B, K, N, BME och Kemister

4 Diskret stokastisk variabel

1 Mätdata och statistik

F3 Introduktion Stickprov

Lösningar till tentamen i Matematisk Statistik, 5p

Föreläsningsanteckningar till kapitel 8, del 2

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Tentamen MVE301 Sannolikhet, statistik och risk

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

F9 Konfidensintervall

Föreläsning 11: Mer om jämförelser och inferens

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

MVE051/MSG Föreläsning 7

Föreläsning G60 Statistiska metoder

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 5: Hypotesprövningar

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Matematisk statistik för B, K, N, BME och Kemister

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Föreläsning 12: Linjär regression

Föreläsning 12: Regression

Matematisk statistik för B, K, N, BME och Kemister

7.5 Experiment with a single factor having more than two levels

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

Kapitel 7 Samplingfördelningar och Centrala gränsvärdessatsen

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

TMS136. Föreläsning 10

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 12: Repetition

Föreläsning G60 Statistiska metoder

Uppgift a b c d e Vet inte Poäng

8 Inferens om väntevärdet (och variansen) av en fördelning

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

F9 SAMPLINGFÖRDELNINGAR (NCT

Föreläsning 7: Punktskattningar

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamen MVE301 Sannolikhet, statistik och risk

Avd. Matematisk statistik

9. Konfidensintervall vid normalfördelning

Tentamen MVE302 Sannolikhet och statistik

F10 Problemlösning och mer om konfidensintervall

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

TAMS65 - Föreläsning 6 Hypotesprövning

Kurskod: TAIU06 MATEMATISK STATISTIK Provkod: TENA 31 May 2016, 8:00-12:00. English Version

Lösningsförslag till Matematisk statistik LKT325 Tentamen

Lektionsanteckningar 11-12: Normalfördelningen

TENTAMEN I STATISTIKENS GRUNDER 2

Tentamen MVE301 Sannolikhet, statistik och risk

Diskussionsproblem för Statistik för ingenjörer

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall) Jan Grandell & Timo Koski

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

SF1901: Sannolikhetslära och statistik. Statistik: Intervallskattning (konfidensintervall)

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Matematisk statistik för D, I, Π och Fysiker

Tentamen i matematisk statistik

Föreläsning G60 Statistiska metoder

1 Bakgrund DATORÖVNING 3 MATEMATISK STATISTIK FÖR E FMSF Något om Radon och Radonmätningar. 1.2 Statistisk modell

Blandade problem från elektro- och datateknik

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Transkript:

Födelsedagsparadoxen Exempel från föreläsningar i Matematisk Statistik och Bioinformatik, 2012 Antag att k slumpmässigt utvalda individer samlas i ett rum. Vad är sannolikheten att åtminstone två av individerna har samma födelsedag? Laplaces röda och svarta kort Antag att vi har tre kort. Ett är rött på båda sidorna, ett är svart på båda sidorna och ett är rött på ena och svart på andra sidan. Vi väljer ett kort slumpmässigt utan att titta och placerar det på ett bord. Om kortet är rött på ovansidan vad är då sannolikheten att den andra sidan också är röd? HIV test Enzyme immunoassay (EIA) tests are used to screen blood specimens for the presence of antibodies to HIV. Antibodies indicate the presence of the virus. The test is quite accurate but is not always correct. Test positive Test negative Antibodies present 0.9985 0.0015 Antibodies absent 0.0060 0.9940 Suppose that 1% of a large population carries antibodies to HIV in their blood. a) What is the probability that the test is positive for a randomly selected individual? b) What is the probability that one individual have antibodies in his/her blood given that the test shows positive results. 1

Monty Hall paradoxen I TV showen Let s make a deal, ledd av Monty Hall, fick en tävlande välja mellan tre luckor. Bakom en av luckorna finns en bil medan de resterande två innehåller getter. När tävlanden valt sin lycka öppnar Monty en av de övriga dörrarna och visar en get. Vald dörr Vilken av de två stängda dörrarna ska den tävlande välja för att maximera sannolikheten för att vinna bilen? St. Petersburg paradoxen På ett kasino kan följande rättvisa spel spelas: En pott börjar på 1 krona. Därefter singlas en slant, vid klave fördubblas potten. Vid krona avslutas spelet ochspelaren vinner det som finns i potten. Hur mycket är rimligt att betala för att vara med och spela? Ett företag ska köpa in komponenter till ett system. Man kan välja mellan typ I (part om 30 st) eller typ II (parti om 100 st). Livslängden antas vara expoentialfördelade där väntevärdet är 1.6 för typ I och 0.55 för typ II. Då en komponent går sönder byts den genast ut mot en ny. Vilket parti för att sannolikheten för drift i 50 tidsenheter ska vara så stor som möjligt? En doktorand i matematisk statistik är på väg till jobbet och ska åka spårvagn mellan Redbergsplatsen och Chalmers. På denna sträckan går två spårvagnar, 6:an och 8:an. Doktoranden anländer till hållplatsen slumpmässigt. Låt X vara tiden tills en spårvagn från linje 6 kommer och Y vara tiden till en spårvagn från linje 8 kommer. Antag att både X och Y är likformigt föredelade mellan 0 och 10 samt att X och Y är oberoende. Låt Z vara tiden tills en spårvagn från någon av linjerna kommer. 2

a) Beräkna fördelningen för Z. b) Beräkna den förväntade tiden doktoranden får vänta vid hållplatsen. c) Hur mycket längre blir den förväntade tiden doktoranden får vänta om linje 8 är indragen så att endast spårvagnar från linje 6 går? Exempel: Läkemedel Mängden läkemedel i bloden hos 15 patienter har uppmätts. 5.14, 6.43, 5.83, 5.40, 6.92, 4.36, 6.29, 3.66, 5.83, 7.18, 5.29, 4.42, 7.83, 4.99, 4.90 Mätningarna antas vara oberoende och normalfördelade med parametrar μ och σ 2. 1. Beräkna ett konfidensintervall för väntevärdet μ givet att σ=1.25. Konfidensgraden ska vara 95%. 2. Beräkna ett konfidensintervall för väntevärdet μ givet att σ 2 är okänd. Konfidensgraden ska vara 95%. 3. Är antagandet om σ=1.25 rimligt? Exempel: Cyanid Vi har samlat in 72 prov av en förorenad jordmån (400g var) som vi har torkat och analyserat för cyanid. Medelcyanidnivån i vårt stickprov är x = 116 mg/kg och standardavvikelsen s = 80 mg/kg. Beräkna ett konfidensintervall för mängden cyanid i jordmånen. Är den högre än 100 mg/kg? Använd 90% konfidensgrad. 3

Exempel: Färg Medeltorktiden för en typ av färg är 12 minuter. En ny tillsats testas för att se om den förkortar torktiden. 16 ytor målas och medelvärdet av torktiden oberveras till x = 11.1 och stickprovsvariansen till s 2 = 0.36. Bilda ett uppåt begränsat kondensintervall för den nya medeltorktiden med kondensgrad 0.99 under antagande om normalfördelning. Exempel: Opinionsundersökning I en politisk opinionsundersökning har man tillfrågat 2000 personer om partisympatier. 1087 svarar att de stöder regeringen, resten oppositionen. Har regeringen majoritet bland väljarkåren? 1. Undersök med ett dubbelsidigt konfidensintervall. 2. Undersök med ett nedåt begränsat konfidensintervall. Konfidensgrad 0.95. Exempel: Agent Orange Riskabelt höga halter av dioxinet 2,3,7,8 TCDD i blodet och fettvävnaden har observerats hos vietnamveteraner på grund av exponering för avlövningsmedlet Agent Orange. I en studie har man mätt mängden TCDD i blodplasma och fettvävnad hos tolv veteraner. TCDD nivå, TCDD nivå, Veteran fettvävnad plasma 1 4.9 2.5 2 59 5.9 31 3.1 3 4.4 2.1 4 6.9 3.5 5 7.0 3.1 6 4.2 1.8 TCDD nivå, TCDD nivå, Veteran fettvävnad plasma 7 10.0 6.0 8 55 5.5 30 3.0 9 41.0 36.0 10 4.4 4.7 11 7.0 6.9 12 2.9 3.3 Kan vi från den här studien visa att det finns en systematisk skillnad mellan nivåer av TCDD i fettvävnad och blodplasma? Konfidensgrad 98%. Lämpligt normalfördelningsantagande får göras. Exempel: ph I en experimentell process för vattenrening måste man kontrollera att vattnet inte blir för surt eller basiskt (d.v.s. håller ett neutralt ph på 7). Processen genomförs tolv gånger och ph värdet observeras varje gång. 8.25, 8.01, 6.41, 7.49, 8.29, 6.64, 8.11, 6.85, 8.05, 8.39, 906 9.06, 71 7.1 Antag att värdena är observationer från en normalfördelning med parametrar μ och σ 2. 1. Vad kan vi säga om det verkliga ph värdet i vattnet? 2. Kan vi med ett test kontrollera om processen misslyckades med att hålla ett neutral ph på 7? 4

Exempel: Balanserat mynt Vi vill undersöka om ett mynt är balanserat, d.v.s., att sannolikheten att få krona är 0.5. Vi genomför därför 10 slantsinglingar och beslutar att myntet är obalanserat om minst 9 av slantsinglingarna ger samma resultat. 1. Ställ upp nollhypotes och mothypotes. Vad har testet för nivå? 2. Beräkna styrkefunktionen. Exempel: Potatischips En fabrikant av potatischips påstår att innehållet i en typ av chipspåsar väger i genomsnitt minst 300 gram. För att kontrollera detta vägdes 16 påsar varvid man fick ett medelvärde på 295 gram. Anta att vikten kan anses vara normalfördelad med en standardavvikelse på 15 gram. 1. Testa om fabrikantens påstående är korrekt. Signifikansnivån ska vara 5%. 2. Beräkna styrkan för en vikt på 290 gram. Exempel: Töjning av tyg Ett mellanlager av foder används mer och mer för att stödja yttre materiallager och för att förbättra form och fall hos olika klädtyper. Följande data på töjning uppmättes för tyg från hög (H) och låg (L) kvalité. H: 1.2 0.9 0.7 1.0 1.7 1.7 1.1 0.9 1.7 1.9 1.3 2.1 1.6 1.8 1.4 1.3 1.9 1.6 0.8 2.0 1.7 1.6 2.3 2.0 L: 1.6 1.2 1.1 2.1 1.5 1.3 1.0 2.6 Vi vill veta om det råder någon skillnad i töjbarhet mellan de båda kvaliteterna. Gör ett test på nivå 0.05. Normalfördelning för antas. 1. Standardavvikelserna för de två stickproven är σ H =0.4 och σ L =0.5. 2. Standardavvikelserna är olika och okända. 3. Standardavvikelserna antas vara lika men okända. Exempel: EEG EEG används för att mäta elektrisk aktivitet i hjärnan. Ett försök utfördes på 20 kanadensiska fångar för att undersöka om isolering har en effekt på hjärnaktiviteten. De 20 fångarna delades slumpmässigt i två lika stora grupper där individer från den ena gruppen isolerades medan individerna i den andra grupper fick vara kvar i sina egna celler. Försöket varade i sju dagar. Ej isolerade (x i ) Isolerade (y i ) 10.7 9.6 10.7 10.4 10.4 9.7 10.9 10.3 10.5 9.2 10.3 9.3 9.6 9.9 11.1 9.5 11.2 9.0 10.4 10.9 (frekvens av alpha vågor) Ej isolerade Isolerade 5

Exempel: Durra Durra är en viktig gröda var kvalitet och utseende påverkas av pigment i fruktämnet. Korsning mellan två arter av durra har gjorts för att producera plantor med röda frön. Plantorna med röda frön har sedan självkorsats. Teoretiskt sett ska röda, gula och vita frön förekomma i förhållandena 9:3:4. Följande data registrerades hos 368 självkorsade plantor: Föfä Fröfärg Röd Gul Vit Observerad frekvens 195 73 100 Kan vi bekräfta den teoretiska fördelningen (Mendelsk nedärvning) eller stämmer inte vår teori? Signifikansnivå 0.05. Exempel: Elektronrör För att bestämma livslängden hos elektronrör används en exponetialfördelning med väntevärde μ=1/λ. Livslängden (y) för 50 elektronrör observerades: Observerad Kategori frekvens 0 y<20 14 20 y<40 18 40 y<60 7 60 y<80 6 80 y 5 1. Antag att μ=25. Testa med hjälp av ett χ 2 test om modellantagandet stämmer. 2. Uppskatta μ från datan och testa med hjälp av ett χ 2 test om modellantagandet stämmer. Exempel: Kalcium och blodtryck Man misstänker att mängden kalcium i blodplättar kan vara kopplat till blodtrycket. I en studie valdes 38 personer med normal blodtryck ut. För varje person mättes kalciumnivå (y i ) och blodtryck (x i ). Finns det ett linjärt samband? Individ Kalcium (y i ) Blodtryck (x i ) 1 95 84 2 112 109 3 122 96 4 88 98 5 87 92 6 104 87 7 90 86 8 110 93 9 100 103 10 122 95 11 126 101 12 102 90 13 122 100 Individ Kalcium (y i ) Blodtryck (x i ) 14 96 87 15 135 109 16 130 97 17 127 100 18 125 112 19 103 84 20 112 93 21 120 100 22 107 91 23 107 92 24 112 93 25 93 87 26 80 105 Individ Kalcium (y i ) Blodtryck (x i ) 27 88 87 28 86 78 29 107 90 30 78 87 31 88 82 32 121 97 33 125 99 34 130 94 35 107 95 36 115 100 37 110 90 38 126 108 Life is good for only two things: doing mathematics and teaching it. Siméon Denis Poisson 1781 1840 6