Födelsedagsparadoxen. HIV test. Laplaces röda och svarta kort. Exempel från föreläsningar i Matematisk Statistik och Bioinformatik, 2014



Relevanta dokument
Födelsedagsparadoxen. HIV test. Laplaces röda och svarta kort. Exempel från föreläsningar i Matematisk Statistik och

Exempel från föreläsningar i Matematisk Statistik

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsningsanteckningar till kapitel 9, del 2

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning 12, FMSF45 Hypotesprövning

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

TMS136. Föreläsning 13

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

F3 Introduktion Stickprov

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Föreläsning 12: Repetition

Hur skriver man statistikavsnittet i en ansökan?

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 4 oktober 2016

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Jämförelse av två populationer

FÖRELÄSNING 8:

TAMS65 - Föreläsning 6 Hypotesprövning

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

8 Inferens om väntevärdet (och variansen) av en fördelning

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning 5: Hypotesprövningar

Extrauppgifter - Statistik

TAMS65 - Föreläsning 6 Hypotesprövning

Föreläsning G60 Statistiska metoder

Föreläsning 12: Regression

TENTAMEN I MATEMATISK STATISTIK

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

1 10 e 1 10 x dx = e 1 10 T = p = P(ξ < 3) = 1 e P(η 2) = 1 P(η = 0) P(η = 1) = 1 (1 p) 7 7p(1 p) 6 0.

Extrauppgifter i matematisk statistik

TENTAMEN I STATISTIKENS GRUNDER 2

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Laboration 4: Hypotesprövning och styrkefunktion

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

, s a. , s b. personer från Alingsås och n b

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

7.5 Experiment with a single factor having more than two levels

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Tentamen i Matematisk statistik Kurskod S0001M

Konfidensintervall, Hypotestest

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel, del II

Matematisk statistik för D, I, Π och Fysiker

Blandade problem från elektro- och datateknik

Matematisk statistik för B, K, N, BME och Kemister

Medicinsk statistik II

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Laboration 2 Inferens S0005M VT18

Föreläsning 7: Punktskattningar

Stockholms Universitet Statistiska institutionen Termeh Shafie

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

σ 12 = 3.81± σ n = 0.12 n = = 0.12

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

F9 Konfidensintervall

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Tentamen i Matematisk statistik Kurskod S0001M

4 Diskret stokastisk variabel

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Uppgift a b c d e Vet inte Poäng

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

2. Test av hypotes rörande medianen i en population.

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Lösningar till tentamen i Matematisk Statistik, 5p

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Kapitel 10 Hypotesprövning

Tentamen i Matematisk statistik Kurskod S0001M

Gamla tentauppgifter i kursen Statistik och sannolikhetslära (LMA120)

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Uppgift a b c d e Vet inte Poäng

Tentamen i matematisk statistik

Examinationsuppgifter del 2

Föreläsning G60 Statistiska metoder

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Thomas Önskog 28/

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Diskussionsproblem för Statistik för ingenjörer

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

F9 SAMPLINGFÖRDELNINGAR (NCT

Hur man tolkar statistiska resultat

Statistik 1 för biologer, logopeder och psykologer

Laboration 2 Inferens S0005M VT16

Transkript:

Födelsedagsparadoxen Exempel från föreläsningar i Matematisk Statistik och Bioinformatik, 2014 Antag att k slumpmässigt utvalda individer samlas i ett rum. Vad är sannolikheten att åtminstone två av individerna har samma födelsedag? Laplaces röda och svarta kort Antag att vi har tre kort. Ett är rött på båda sidorna, ett är svart på båda sidorna och ett är rött på ena och svart på andra sidan. Vi väljer ett kort slumpmässigt utan att titta och placerar det på ett bord. Om kortet är rött på ovansidan vad är då sannolikheten att den andra sidan också är röd? HIV test Enzyme immunoassay (EIA) tests are used to screen blood specimens for the presence of antibodies to HIV. Antibodies indicate the presence of the virus. The test is quite accurate but is not always correct. Test positive Test negative Antibodies present 0.9985 0.0015 Antibodies absent 0.0060 0.9940 Suppose that 1% of a large population carries antibodies to HIV in their blood. a) What is the probability that the test is positive for a randomly selected individual? b) What is the probability that one individual have antibodies in his/her blood given that the test shows positive results. 1

Monty Hall paradoxen I TV showen Let s make a deal, ledd av Monty Hall, fick en tävlande välja mellan tre luckor. Bakom en av luckorna finns en bil medan de resterande två innehåller getter. När tävlanden valt sin lycka öppnar Monty en av de övriga dörrarna och visar en get. Vald dörr Vilken av de två stängda dörrarna ska den tävlande välja för att maximera sannolikheten för att vinna bilen? St. Petersburg paradoxen På ett kasino kan följande rättvisa spel spelas: En pott börjar på 1 krona. Därefter singlas en slant, vid klave fördubblas potten. Vid krona avslutas spelet och spelaren vinner det som finns i potten. Hur mycket är rimligt att betala för att vara med och spela? Ett företag ska köpa in komponenter till ett system. Man kan välja mellan typ I (part om 30 st) eller typ II (parti om 100 st). Livslängden antas vara expoentialfördelade där väntevärdet är 1.6 för typ I och 0.55 för typ II. Då en komponent går sönder byts den genast ut mot en ny. Vilket parti för att sannolikheten för drift i 50 tidsenheter ska vara så stor som möjligt? En doktorand i matematisk statistik är på väg till jobbet och ska åka spårvagn mellan Redbergsplatsen och Chalmers. På denna sträckan går två spårvagnar, 6:an och 8:an. Doktoranden anländer till hållplatsen slumpmässigt. Låt X vara tiden tills en spårvagn från linje 6 kommer och Y vara tiden till en spårvagn från linje 8 kommer. Antag att både X och Y är likformigt föredelade mellan 0 och 10 samt att X och Y är oberoende. Låt Z vara tiden tills en spårvagn från någon av linjerna kommer. 2

a) Beräkna fördelningen för Z. b) Beräkna den förväntade tiden doktoranden får vänta vid hållplatsen. c) Hur mycket längre blir den förväntade tiden doktoranden får vänta om linje 8 är indragen så att endast spårvagnar från linje 6 går? Exempel: Läkemedel Mängden läkemedel i bloden hos 15 patienter har uppmätts. 5.14, 6.43, 5.83, 5.40, 6.92, 4.36, 6.29, 3.66, 5.83, 7.18, 5.29, 4.42, 7.83, 4.99, 4.90 Mätningarna antas vara oberoende och normalfördelade med parametrar μ och σ 2. 1. Beräkna ett konfidensintervall för väntevärdet μ givet att σ=1.25. Konfidensgraden ska vara 95%. 2. Beräkna ett konfidensintervall för väntevärdet μ givet att σ 2 är okänd. Konfidensgraden ska vara 95%. 3. Är antagandet om σ=1.25 rimligt? Exempel: Cyanid Vi har samlat in 72 prov av en förorenad jordmån (400g var) som vi har torkat och analyserat för cyanid. Medelcyanidnivån i vårt stickprov är x = 116 mg/kg och standardavvikelsen s = 80 mg/kg. Beräkna ett konfidensintervall för mängden cyanid i jordmånen. Är den högre än 100 mg/kg? Använd 90% konfidensgrad. 3

Exempel: Färg Medeltorktiden för en typ av färg är 12 minuter. En ny tillsats testas för att se om den förkortar torktiden. 16 ytor målas och medelvärdet av torktiden oberveras till x = 11.1 och stickprovsvariansen till s 2 = 0.36. Bilda ett uppåt begränsat kondensintervall för den nya medeltorktiden med kondensgrad 0.99 under antagande om normalfördelning. Exempel: Opinionsundersökning I en politisk opinionsundersökning har man tillfrågat 2000 personer om partisympatier. 1087 svarar att de stöder regeringen, resten oppositionen. Har regeringen majoritet bland väljarkåren? 1. Undersök med ett dubbelsidigt konfidensintervall. 2. Undersök med ett nedåt begränsat konfidensintervall. Konfidensgrad 0.95. Exempel: Agent Orange Riskabelt höga halter av dioxinet 2,3,7,8 TCDD i blodet och fettvävnaden har observerats hos vietnamveteraner på grund av exponering för avlövningsmedlet Agent Orange. I en studie har man mätt mängden TCDD i blodplasma och fettvävnad hos tolv veteraner. TCDD nivå, TCDD nivå, Veteran fettvävnad plasma 1 4.9 2.5 2 5.9 3.1 3 4.4 2.1 4 6.9 3.5 5 7.0 3.1 6 4.2 1.8 TCDD nivå, TCDD nivå, Veteran fettvävnad plasma 7 10.0 6.0 8 5.5 3.0 9 41.0 36.0 10 4.4 4.7 11 7.0 6.9 12 2.9 3.3 Kan vi från den här studien visa att det finns en systematisk skillnad mellan nivåer av TCDD i fettvävnad och blodplasma? Konfidensgrad 98%. Lämpligt normalfördelningsantagande får göras. Exempel: ph I en experimentell process för vattenrening måste man kontrollera att vattnet inte blir för surt eller basiskt (d.v.s. håller ett neutralt ph på 7). Processen genomförs tolv gånger och ph värdet observeras varje gång. 8.25, 8.01, 6.41, 7.49, 8.29, 6.64, 8.11, 6.85, 8.05, 8.39, 9.06, 7.1 Antag att värdena är observationer från en normalfördelning med parametrar μ och σ 2. 1. Vad kan vi säga om det verkliga ph värdet i vattnet? 2. Kan vi med ett test kontrollera om processen misslyckades med att hålla ett neutral ph på 7? 4

Exempel: Balanserat mynt Vi vill undersöka om ett mynt är balanserat, d.v.s., att sannolikheten att få krona är 0.5. Vi genomför därför 10 slantsinglingar och beslutar att myntet är obalanserat om minst 9 av slantsinglingarna ger samma resultat. 1. Ställ upp nollhypotes och mothypotes. Vad har testet för nivå? 2. Beräkna styrkefunktionen. Exempel: Potatischips En fabrikant av potatischips påstår att innehållet i en typ av chipspåsar väger i genomsnitt minst 300 gram. För att kontrollera detta vägdes 16 påsar varvid man fick ett medelvärde på 295 gram. Anta att vikten kan anses vara normalfördelad med en standardavvikelse på 15 gram. 1. Testa om fabrikantens påstående är korrekt. Signifikansnivån ska vara 5%. 2. Beräkna styrkan för en vikt på 290 gram. Exempel: Värmeljus En tillverkare av värmeljus påstår att brinntiden är 240 minuter. I ett test genomfört av en välkänd konsumenttidning ifrågasattes påståendet och en statistisk undersökning genomfördes där brinntiden studerades. Ett stickprov av 15 värmeljus valdes ut och brinntiden observerades. Stickprovsmedelvärdet beräknades till x 231. Brinntiden hos värmeljusen kan antas vara oberoende och normalfördelade med känd varians 171. a) Formulera lämpliga hypoteser och fördelningsantaganden. Genomför därefter ett enkelsidigt test för att testa om brinntiden är kortare än 240 minuter. Signifikansnivån ska vara 5%. b) Beräkna p värdet för testet i (a). c) Vad har testet i (a) för styrka om den sanna brinntiden är 235 minuter? Exempel: Töjning av tyg Ett mellanlager av foder används mer och mer för att stödja yttre materiallager och för att förbättra form och fall hos olika klädtyper. Följande data på töjning uppmättes för tyg från hög (H) och låg (L) kvalité. H: 1.2 0.9 0.7 1.0 1.7 1.7 1.1 0.9 1.7 1.9 1.3 2.1 1.6 1.8 1.4 1.3 1.9 1.6 0.8 2.0 1.7 1.6 2.3 2.0 L: 1.6 1.2 1.1 2.1 1.5 1.3 1.0 2.6 Vi vill veta om det råder någon skillnad i töjbarhet mellan de båda kvaliteterna. Gör ett test på nivå 0.05. Normalfördelning för antas. 1. Standardavvikelserna för de två stickproven är σ H =0.4 och σ L =0.5. 2. Standardavvikelserna är olika och okända. 3. Standardavvikelserna antas vara lika men okända. 5

Exempel: EEG EEG används för att mäta elektrisk aktivitet i hjärnan. Ett försök utfördes på 20 kanadensiska fångar för att undersöka om isolering har en effekt på hjärnaktiviteten. De 20 fångarna delades slumpmässigt i två lika stora grupper där individer från den ena gruppen isolerades medan individerna i den andra grupper fick vara kvar i sina egna celler. Försöket varade i sju dagar. Ej isolerade (x i ) Isolerade (y i ) 10.7 9.6 10.7 10.4 10.4 9.7 10.9 10.3 10.5 9.2 10.3 9.3 9.6 9.9 11.1 9.5 11.2 9.0 10.4 10.9 (frekvens av alpha vågor) Ej isolerade Isolerade Exempel: Durra Durra är en viktig gröda var kvalitet och utseende påverkas av pigment i fruktämnet. Korsning mellan två arter av durra har gjorts för att producera plantor med röda frön. Plantorna med röda frön har sedan självkorsats. Teoretiskt sett ska röda, gula och vita frön förekomma i förhållandena 9:3:4. Följande data registrerades hos 368 självkorsade plantor: Fröfärg Röd Gul Vit Observerad frekvens 195 73 100 Kan vi bekräfta den teoretiska fördelningen (Mendelsk nedärvning) eller stämmer inte vår teori? Signifikansnivå 0.05. Exempel: Elektronrör För att bestämma livslängden hos elektronrör används en exponetialfördelning med väntevärde μ=1/λ. Livslängden (y) för 50 elektronrör observerades: Exempel: Kalcium och blodtryck Man misstänker att mängden kalcium i blodplättar kan vara kopplat till blodtrycket. I en studie valdes 38 personer med normal blodtryck ut. För varje person mättes kalciumnivå (y i ) och blodtryck (x i ). Finns det ett linjärt samband? Observerad Kategori frekvens 0 y<20 14 20 y<40 18 40 y<60 7 60 y<80 6 80 y 5 Individ Kalcium (y i ) Blodtryck (x i ) 1 95 84 2 112 109 3 122 96 4 88 98 5 87 92 6 104 87 7 90 86 Individ Kalcium (y i ) Blodtryck (x i ) 14 96 87 15 135 109 16 130 97 17 127 100 18 125 112 19 103 84 20 112 93 Individ Kalcium (y i ) Blodtryck (x i ) 27 88 87 28 86 78 29 107 90 30 78 87 31 88 82 32 121 97 33 125 99 1. Antag att μ=25. Testa med hjälp av ett χ 2 test om modellantagandet stämmer. 2. Uppskatta μ från datan och testa med hjälp av ett χ 2 test om modellantagandet stämmer. 8 110 93 9 100 103 10 122 95 11 126 101 12 102 90 13 122 100 21 120 100 22 107 91 23 107 92 24 112 93 25 93 87 26 80 105 34 130 94 35 107 95 36 115 100 37 110 90 38 126 108 6

Life is good for only two things: doing mathematics and teaching it. Siméon Denis Poisson 1781 1840 7