Diskussionsproblem för Statistik för ingenjörer

Relevanta dokument
Diskussionsproblem för Statistik för ingenjörer

F10 Problemlösning och mer om konfidensintervall

Mer om konfidensintervall + repetition

F9 Konfidensintervall

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

F13 Regression och problemlösning

Föreläsning 7. Statistikens grunder.

Problemlösning. Måns Thulin. Uppsala universitet Statistik för ingenjörer 30/ /16

Summor av slumpvariabler

Mer om slumpvariabler

Föreläsning 12: Regression

Föreläsning 11: Mer om jämförelser och inferens

Uppgift 1. f(x) = 2x om 0 x 1

Lektionsanteckningar 11-12: Normalfördelningen

Repetitionsföreläsning

Tentamen i Matematisk statistik Kurskod S0001M

Formel- och tabellsamling i matematisk statistik

LINKÖPINGS UNIVERSITET TENTA 92MA31, 92MA37, 93MA31, 93MA37 / STN 2 9GMA05 / STN 1

Introduktion till statistik för statsvetare

F11 Två stickprov. Måns Thulin. Uppsala universitet Statistik för ingenjörer 26/ /11

I den här datorövningen ser vi hur R kan utnyttjas för att kontrollera modellantaganden och beräkna konfidensintervall.

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Tentamen i Matematisk statistik Kurskod S0001M

Några extra övningsuppgifter i Statistisk teori

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Föreläsningsanteckningar till kapitel 8, del 2

FÖRELÄSNING 8:

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning G60 Statistiska metoder

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Två parametrar: µ (väntevärdet) och σ (standardavvikelsen) µ bestämmer normalfördelningens läge

Tillåtna hjälpmedel: Räknedosa. Formel- och tabellsamling i matematisk statistik.

FÖRELÄSNING 7:

9. Konfidensintervall vid normalfördelning

Avd. Matematisk statistik

Föreläsning 12: Linjär regression

0 om x < 0, F X (x) = c x. 1 om x 2.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 7: Punktskattningar

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Tentamen i Matematisk statistik Kurskod S0001M

(b) Bestäm sannolikheten att minst tre tåg är försenade under högst tre dagar en given vecka.

10. Konfidensintervall vid två oberoende stickprov

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Samplingfördelningar 1

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Tentamen i Matematisk statistik Kurskod S0001M

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Matematisk statistik för B, K, N, BME och Kemister

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

Uppgift 1 a) En kontinuerlig stokastisk variabel X har fördelningsfunktion

F3 Introduktion Stickprov

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Tentamen i Matematisk statistik Kurskod S0001M

TMS136. Föreläsning 4

bli bekant med summor av stokastiska variabler.

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar

Grundläggande matematisk statistik

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Matematisk statistik för B, K, N, BME och Kemister

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid 1

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Statistik 1 för biologer, logopeder och psykologer

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Föreläsning 12, FMSF45 Hypotesprövning

Avd. Matematisk statistik

TENTAMEN I STATISTIKENS GRUNDER 2

Repetition och förberedelse. Sannolikhet och sta.s.k (1MS005)

Uppgift a b c d e Vet inte Poäng

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

LMA201/LMA521: Faktorförsök

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018

Gamla tentauppgifter i kursen Statistik och sannolikhetslära (LMA120)

Stokastiska Processer och ARIMA. Patrik Zetterberg. 19 december 2012

TENTAMEN I MATEMATIK MED MATEMATISK STATISTIK HF1004, TEN

Sannolikheten för att barnet skall få blodgrupp A0 A0 1/2 AA 1 AB 1/2 Övriga 0

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

histogram över 1000 observerade väntetider minuter 0.06 f(x) täthetsfkn x väntetid

4 Diskret stokastisk variabel

Enkel och multipel linjär regression

STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson,

Forskningsmetodik 2006 lektion 2

Matematisk statistik TMS064/TMS063 Tentamen

FORMELSAMLING HT-18 MATEMATISK STATISTIK FÖR B, K, N, BME OCH KEMISTER; FMSF70 & MASB02. Sannolikhetsteori. Beskrivning av data

Föreläsning 7: Punktskattningar

Blandade problem från elektro- och datateknik

Transkript:

Diskussionsproblem för Statistik för ingenjörer Måns Thulin thulin@math.uu.se Senast uppdaterad 20 februari 2013 Diskussionsproblem till Lektion 3 1. En projektledare i ett byggföretaget ska undersöka vad företagets 20 medarbetare tycker om ett förslag till nya säkerhetsföreskrifter. Bland medarbetarna är 12 stycken positivt inställda till de nya föreskrifterna, medan 8 stycken är negativt inställda. Undersökningen genomförs genom att projektledaren väljer ut två medarbetare för intervju. (a) Vad är sannolikheten att båda är negativt inställda till föreskrifterna? (b) Vad är sannolikheten att en är negativt inställd och en är positivt inställd? Ledning: svaret är inte 0.253! 2. En grupp elektroingenjörer funderar på vilket av två olika system för att skicka digitala signaler som de ska använda. En signal består antingen av en 0:a eller en 1:a. På grund av slumpmässigt brus i kommunikationskanalen så tas den skickade siffran ibland emot fel, så att en skickad 0:a tas emot som en 1:a, och vice versa. Man vet att P( En skickad 0:a tas emot som en 1:a ) = P( En skickad 1:a tas emot som en 0:a ) = 0.05 samt att varje ny signal är oberoende av föregående signaler. Det ena systemet går ut på att man skickar en enda kopia av varje signal. Det andra systemet går ut på att man skickar tre kopior av varje signal (alltså antingen 111 eller 000) och sedan kontrollerar vilken siffra som mottagaren fick flest gånger. Om mottagaren tar emot signalföljderna 111, 011, 110 eller 101 så tolkas det alltså som att man tagit emot en 1:a. (a) Vad är sannolikheten att en skickad 1:a tolkas som en 1:a, för respektive system? (b) Ingenjörerna vill skicka ett ord bestående av tre signaler. Vad är sannolikheten att rätt ord kommer fram, för respektive system? (c) Vilka för- och nackdelar har de två systemen? 1

Diskussionsproblem till Lektion 4 3. Vid ett vindkraftverk så har man observerat att den genomsnittliga vindhastigheten under en timme beskrivs av fördelningsfunktionen F (x) = 1 e x2 /120, x 0. Något förenklat så antar vi att vindkraftverket producerar el en given timme om den genomsnittliga vindhastigheten under timmen ligger mellan 3 och 25 m/s. (a) Vad är sannolikheten att vindkraftverket producerar el en given timme? (b) Vad är sannolikheten att vindkraftverket kan producera el minst 20 timmar under ett givet dygn? Ledning: antag att den genomsnittliga vindhastigheten olika timmar är oberoende. Kan du lösa problemet utan det antagandet? 4. Längs en 13 m lång vägg på ett lager har ett släp av längden 5 m parkerats. (a) Låt X beteckna hur mycket plats som finns kvar längs väggen bakom släpet. Är X kontinuerlig eller diskret? Vilka är de möjliga värdena på X? För vilka värden på X får ytterligare ett släp av samma längd plats längs väggen (antingen bakom eller framför det första släpet)? Ledning: att rita en bild kan underlätta. (b) Om det första släpet har parkerats längs väggen helt på måfå, hur stor är sannolikheten att ytterligare ett släp av samma längd får plats? 2

Diskussionsproblem till Lektion 5 5. I hissarna på Ångströmlaboratoriet står högst 8 personer eller 630 kg. Personvikten i kg hos en slumpvis uttagen person är normalfördelad. Gör antaganden om väntevärde och varians för fördelningen och beräkna utifrån detta sannolikheten att 8 personer överbelastar hissen genom att tillsammans väga mer än 630 kg. 6. Man upprepar ett försök 100 oberoende gånger och räknar antalet gånger det lyckas. Antag att sannolikheten att försöket lyckas är 2/10. Låt Y vara antalet lyckade försök. (a) Beräkna P(Y 18) med hjälp av binomialfördelningen. (b) Om man låter X i vara 1 om försök i lyckas och 0 om det inte lyckas så är X i Bin(1, 2/10). Genom kafferastegenskapen får vi att Y = X 1 +X 2 +...+X 100, dvs att Y kan skrivas som en summa av slumpvariabler. Utnyttja detta genom att använda centrala gränsvärdessatsen för att räkna ut P(Y 18) och jämför svaret med det i (a). (c) Ett lite klurigare (?) valfritt extraproblem: eftersom Y är en diskret slumpvariabler så gäller det att P(Y 18) = P(Y 18.5). Prova att använda 18.5 istället för 18 i beräkningarna i (b). Blev approximationen av sannolikheten bättre än den i (b)? Om ja, varför? 3

Diskussionsproblem till Lektion 6 7. Två frågor om att presentera och samla in data: (a) Ett större företag vill undersöka vad en genomsnittlig anställd har i lön. De har kommit på tre sätt att göra detta: antingen med medelvärdet av alla anställdas löner, med medianen eller med typvärdet (den vanligaste lönen). Vilket av dessa sätt skulle du välja? (b) Ingenjörerna Inga och Ingvar ska undersöka elasticiteten hos två olika konstfibrer, A och B. Först gör Inga 20 mätningar för fiber A. Hon skriver ner resultaten för hand och för sedan in dem i datorn. Så fort Inga är klar gör Ingvar 10 mätningar för fiber B, med samma mätinstrument som Inga. Han skriver inte ner dem för hand utan för in dem i datorn direkt. Slutligen jämför de medelvärdena för de båda fibrerna. Vilka dolda felkällor kan tänkas finnas i deras undersökning? Hur skulle de kunnat förbättra experimentet? Exempel på en möjlig felkälla: om de hade använt olika mätinstrument för sina mätningar kunde skillnader mellan mätinstrumenten, exempelvis systematiska mätfel, orsaka problem. 8. I en undersökning av bostadspriserna i Uppsala fann man att de genomsnittliga priserna (mätt med medelvärden) gått ner i alla stadsdelar jämfört med förra året. Samtidigt fann man att det genomsnittliga priset i hela Uppsala gått upp. Hur är det möjligt? 4

Diskussionsproblem till Lektion 7 9. (a) Ingenjören Inge fann för ett datamaterial om 17 observationer av livslängder hos en ny typ av komponenter medelvärdet x = 3.2 tidsenheter. Två konfidensintervall för väntevärdet beräknades och han erhöll [2.4, 4.0] respektive [2.1, 4.3]. Vilket konfidensintervall motsvarar 95 % respektive 99 % konfidensgrad? (b) Ingenjören Ingrid försöker tolka Inges konfidensintervall. Målet med de nya komponenterna var att den genomsnittliga livslängden skulle överstiga 2.2 tidsenheter. Diskutera huruvida målet har uppnåtts. (c) Figurerna nedan illustrerar vikterna för 30 exemplar av den nya typen av komponenter. Ingenjören Inger tror att vikterna är N(µ, σ 2 )-fördelade. Vilket/vilka av värdena 5, 10, 20 och 50 är rimligt för σ? Histogram Lådagram Antal 0 2 4 6 8 30 40 50 60 70 20 30 40 50 60 70 80 10. Man misstänker att ett nytt mätinstrument A ofta ger högre mätvärden än gammalt instrument B. Man gör 80 provmätningar för att undersöka detta. För 80 testsituationer görs en mätning med A och en med B. Vid 52 av mätningarna ger A ett högre mätvärde. Om x i är mätning i med instrument A och y i är mätning i med instrument B så kan man bilda differensen z i = x i y i för att studera skillnaden mellan instrumenten. Man finner då z = 0.1 och s z = 0.52. Mätresultaten kan antas vara normalfördelade. (a) Beräkna ett 95 % konfidensintervall för hur ofta instrument A ger högre mätvärden än instrument B. (b) Beräkna ett 95 % konfidensintervall för hur stor skillnaden i väntevärden är mellan de två instrumenten. (c) Skulle du utifrån resultaten i (a) och (b) säga att instrument A ger högre mätvärden än instrument B? 5

y y y Diskussionsproblem till Lektion 8 11. Man har två oberoende stickprov, dels från en slumpvariabel X som är exponentialfördelad med väntevärde 2a, dels från en slumpvariabel Y som är exponentialfördelad med väntevärde 3a. Parametern a är okänd och får skattas från data, där följande gäller: Stickprov 1: Storlek n 1 = 60, medelvärde x = 4.30 Stickprov 2: Storlek n 2 = 80, medelvärde ȳ = 5.76 För att skatta a föreslås â 1 = ȳ x eller â 2 = ( x + ȳ)/5. (a) Visa att de föreslagna skattningarna är väntevärdesriktiga. (b) Beräkna skattningarnas varians. (c) Vilken av skattningarna bör man använda? 12. I figuren nedan visas tre datamaterial, vart och ett bestående av talpar (x i, y i ). Man har med dator genomfört regressionsanalys och anpassat modellen y i = α + βx i, i = 1,..., 30 men slarvat i bokföringen och är osäker på vilka resultat som hör till vilka datamaterial. Resultaten redovisas nedan och de tre modellerna benämnes A, B, resp. C. Para ihop rätt modell med rätt figur. ˆα ˆβ R 2 A 0.13 0.13 0.02 B 0.16 0.99 0.771 C 0.20 0.28 0.36 Datamaterial 1 Datamaterial 2 Datamaterial 3 2 1 0 1 2 1.5 1.0 0.5 0.0 0.5 1.0 1.5 0.5 0.0 0.5 1.0 1.5 2 1 0 1 2 x 3 2 1 0 1 2 x 3 2 1 0 1 x 6