Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

Storlek: px
Starta visningen från sidan:

Download "Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014)."

Transkript

1 UPPSALA UNIVERSITET Matematik för språkteknologer (5LN445) Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014). 9 Sannolikhet Detta kapitel behandlar grundläggande begrepp i sannolikhetsteori: enkel sannolikhet, betingad sannolikhet, lagen om total sannolikhet och Bayes lag. 9.1 Enkel sannolikhet Den klassiska sannolikhetsteorin, som började utvecklas på 1600-talet, har sitt ursprung i tillämpningar på hasardspel. De frågor som man ville ha svar på var av typen Är det gynnsamt (skulle man vinna i längden) att, vid jämna odds, slå vad om att man vid fyra kast med en tärning får minst en sexa? Detta specifika problem kallas även för De Mérés problem. 1 Fråga: Hur du skulle intuitivt svara på frågan? Hur skulle du kunna gå tillväga för att lösa problemet? Sannolikhet och relativ frekvens Låt oss försöka att lösa detta problem empiriskt. I Figur 1 ser vi utdatan från ett program som kastar fyra tärningar åt oss och håller koll på antalet i sammanhanget gynnsamma utfall, dvs. antalet gånger där man kastat minst en sexa vid fyra kast. Programmet skriver även ut den relativa frekvensen av de gynnsamma utfallen: andelen som de gynnsamma utfallen har bland alla utfall. Som vi ser så ligger denna andel på 60% efter tio försök. Sannolikhetsteorin utvecklades för att man ville kunna förutsäga framtiden baserat på empiriska erfarenheter. Det hela bygger på antagandet att den relativa frekvensen av en given händelse (såsom att kasta minst en sexa vid fyra kast) så småningom stabiliseras kring ett värde. Detta värde kallas för händelsens sannolikhet. 1 Efter Antoine Gombaud ( ), som kallades Chevalier de Méré (även om han inte var riddare). 1

2 Försök Tärningskast Gynsamma Rel. frekvens Figur 1: Experiment utifrån De Mérés problem Sannolikheten för en händelse A skrivs P(A). Det gäller att 0 P(A) 1. P(A) = 0 innebär att händelse aldrig inträffar och P(A) = 1 att den alltid inträffar. (Figur 1 visar att sannolikheten för ett gynnsamt utfall ligger någonstans mellan aldrig och alltid.) Det är viktigt att förstå att en händelses sannolikhet kan inte observeras; det kan bara skattas. (I det experiment som vi körde i Figur 1 observerade vi relativa frekvenser, inte sannolikheter.) Skattning kommer vi tillbaka till i nästa kapitel, som handlar om statistik. Fråga: Är skattningen efter tio försök i Figur 1 pålitlig? Utfall, händelser och sannolikhet För att lösa De Mérés problem med hjälp av sannolikhetsteorin börjar vi med en förenklad fråga: Är det gynnsamt att, vid jämna odds, slå vad om att man vid ett kast med en tärning får en sexa? Svaret på denna fråga är lätt. När man kastar en tärning finns det sex möjliga utfall: Tärningen kan visa en etta, en tvåa, en trea, en fyra, en femma eller en sexa. Mängden av alla möjliga utfall kallas för utfallsrum och betecknas med den grekiska bokstaven Ω. I det här fallet har vi alltså Ω = {1, 2, 3, 4, 5, 6} Vid jämna odds finns det alltså bara ett gynnsamt utfall (man kastar en sexa), men fem stycken ogynnsamma utfall (man kastar något annat). Det är alltså inte gynnsamt att slå vad om att man får en sexa. 2

3 Fråga: Hur måste man argumentera om man istället är intresserad i frågan om det är gynnsamt att slå vad om att man vid ett kast med en tärning får ett jämt tal? Om man istället är intresserad av händelsen man kastar ett jämt tal så finns det tre gynnsamma utfall: en tvåa, en fyra och en sexa. Det föregående exempel illustrerar skillnaden mellan begreppen utfall och händelse: Varje kast med tärningen kommer att ge exakt ett tal som utfall; men vissa relevanta händelser, t.ex. talet är jämnt ({2, 4, 6}) och talet är större än 3 ({4, 5, 6}), kan bara beskrivas som kombinationer av sådana utfall. Allmänt definierar man därför en händelse som en mängd utfall. En händelse är därför en delmängd till utfallsrummet. Och hela utfallsrummet utgör den händelse som alltid inträffar. Sannolikheten för en händelse A kan räknas ut på detta sätt, om alla utfall är lika sannolika: antal utfall som leder till A P(A) = = A antal möjliga utfall Ω (Kom ihåg att notationen X betecknar kardinaliteten eller storleken hos X.) T.ex. vid tärningskast (med vanliga typen av tärning): P(talet är jämnt) = P({2, 4, 6}) = {2, 4, 6} / {1, 2, 3, 4, 5, 6} = 3/6 = 0,5. P(talet är inte 5) = P({1, 2, 3, 4, 6}) = {1, 2, 3, 4, 6} / {1, 2, 3, 4, 5, 6} = 5/6 0,833. P(talet är inte 7) = P({1, 2, 3, 4, 5, 6}) = {1, 2, 3, 4, 5, 6} / {1, 2, 3, 4, 5, 6} = 6/6 = 1. P(talet är 7) = P( ) = / {1, 2, 3, 4, 5, 6} = 0/6 = 0. Fråga: Vad för sorts händelser är och Ω? Den tomma mängden representerar omöjlighet : Det finns inget som helst utfall som kan leda till denna händelse; dess sannolikhet är 0. Den fullständiga mängden representerar nödvändighet : Alla möjliga utfall leder till denna händelse; dess sannolikhet är 1. Nu kan vi gå tillbaka till De Mérés problem. Fråga: Vilket utfallsrum får man för De Mérés problem? Vilken storlek har detta rum? Vilken händelse är man intresserad av? Hur stor är sannolikheten för den händelsen? 3

4 Ω A Figur 2: Diagrammet visar att A c = Ω \ A = Ω Ω A. Det nya utfallsrummet består av alla följder (tupler) av fyra tärningskast. Detta utfallsrum har kardinalitet 6 4 = Alltså: Ω = En typ av händelser innehåller bara en bestämd sekvens av tärningskast, t.ex. {(1, 2, 3, 4)}, P({(1, 2, 3, 4)}) = 1/1296. Händelsen som är aktuell i De Mérés fall är den att få en följd som innehåller minst en sexa. Men det är inte så lätt att räkna ut sannolikheten för denna händelse... En ganska dum metod vore att gå igenom alla följder (tupler) av fyra tärningskast och räkna hur många som innehåller minst en sexa, men det skulle vara ganska jobbigt och vi skulle riskera att räkna fel. Vi kan dessbättre tänka på ett smartare sätt för att räkna ut antalet utfall som leder till händelsen minst en sexa! Ett begrepp som är mycket användbart i samband med De Mérés problem är begreppet komplementhändelse. Med komplementhändelsen till en händelse A menas händelsen att A inte inträffar. Eftersom varje händelse är en mängd är komplementhändelsen till A helt enkelt komplementmängden till A, relativt till universum Ω. Det är inte svårt att se att sannolikheten för komplementhändelsen till en händelse A är På samma sätt får man P(A) = 1 P(A c ). P(A c ) = 1 P(A) Fråga: Kan du bevisa detta? Mängden A c kan skrivas som Ω \ A. Enligt definitionen av sannolikhet gäller då att P(A c Ω \ A ) = P(Ω \ A) = Ω När man ritar ett Venn-diagram som i Figur 2 ser man att Ω \ A = Ω Ω A. Men eftersom A Ω har man Ω A = A. Med detta: P(A c Ω \ A Ω Ω A Ω A ) = = = Ω Ω Ω = Ω Ω A Ω = 1 P(A) 4

5 Det som gör begreppet komplementhändelsen användbart i samband med De Mérés problem är att det är mycket lättare att räkna ut storleken på komplementhändelsen till minst en sexa på fyra kast än händelsen själv. Fråga: Vad är komplementhändelsen, hur stor är respektive mängd och hur sannolikt är komplementhändelsen? Komplementhändelsen är ingen sexa på fyra kast ; dess storlek är 5 4 = 625; och sannolikheten för komplementhändelsen är då 625/1296 = 48, 2%. Med detta vet vi alltså att sannolikheten att få minst en sexa på fyra kast (vilket är komplementhändelsen till komplementhändelsen, så att säga) är P(A) = 1 P(A c ) = , 8% 1296 Detta betyder att man har större chans att vinna än att förlora när man slår vad om att man vid fyra kast med en tärning får minst en sexa. Sammanfattning, begrepp En typ av försök, t.ex. ett tärningskast, ger ett utfall, t.ex. 4. En typ av försök har ett utfallsrum (Ω), t.ex. för tärningskast, Ω = {1, 2, 3, 4, 5, 6}, som är mängden av möjliga utfall. En händelse kan inträffa genom olika utfall, och definieras som en delmängd av Ω. T.ex. händelsen att ett tärningskast ger ett udda tal, som blir A = {1, 3, 5}. En händelse A inträffar på så sätt att ett försök ger ett utfall u och u A. Ω utgör därför den händelse som alltid inträffar och utgör den händelse som aldrig inträffar. Komplementhändelsen till händelsen A: A c = Ω \ A. T.ex. Händelsen att ett tärningskast ger 5: A = {5}. Händelsen att ett tärningskast ger ett annat tal än 5: A c = {1, 2, 3, 4, 6}. Sannolikheter, där A är en händelse: 0 P(A) 1 P(A) = A Ω P(A c ) = 1 P(A) 5

6 9.2 Betingad sannolikhet En mycket användbar generalisering av begreppet sannolikhet är begreppet betingad sannolikhet. Den betingade sannolikheten för händelsen A givet händelsen B är A B P(A B) = B För att se att denna definition är en generalisering av vår tidigare definition av sannolikhet kan man notera att man får den vanliga (enkla) sannolikheten genom att sätta B = Ω: A Ω P(A Ω) = = A Ω Ω = P(A) Sammanhanget mellan enkel sannolikhet och betingad sannolikhet kan beskrivas så att man zoomar in på en delmängd av händelserna, nämligen dem som är förenliga med B. Dessa händelser blir det nya utfallsrummet. Detta illustreras i följande exempel. Ett bigram är en sekvens av två ord. En korpus på engelska meningar med sammanlagt ord innehåller 35 förekomster av bigram som slutar på ordet amok. Fråga: Låt P(amok) vara sannolikheten för händelsen att man läser ordet amok när man läser ett ord i en engelsk text. Hur skulle du kunna använda dig av korpusen för att skatta P(amok)? Man skulle kunna skatta sannolikheten genom att anta att den motsvarar den relativa frekvensen av bigram som slutar på amok i korpusen. (Detta utgår ifrån att amok inte är det första ordet i korpusen.) På det sättet får man ett värde P(amok) = 35/ ,000035%. Nu får du lite ny information: Korpusen innehåller 8,500 förekomster av bigram som börjar på run och 15 förekomster av bigrammet run amok. Fråga: Hur skulle du kunna använda denna information för att skatta sannolikheten att se ordet amok när du har just sett ordet run? Låt oss beteckna sannolikheten för att se amok efter run med P(amok run). Då gäller P(amok run) = 15/ ,18%. Det är alltså betydligt mera sannolikt att få amok efter run än att få amok i godtyckliga kontexter. Två händelser A och B kallas oberoende om P(A B) = P(A). Detta betyder att den betingade sannolikheten för A givet B inte är större än den enkla sannolikheten för A; händelsen B händer har ingen påverkan på A. 6

7 A B Figur 3: Venn-diagram för A B. Fråga: Hur räknar man ut P(A B)? Vad gäller när A och B är beroende? Genom att titta på Venn-diagrammet för A B (Figur 3) är det lätt att se att P(A B) = P(A) P(B A) = P(A B) P(B) = P(B A) Alternativt, utgå från definitionerna av enkel och betingad sannolikhet: A B P(A B) P(B) = B B A B A B = = P(A B) = P(B A) P(A) = A Ω Ω A Ω Om nu A och B är oberoende gäller P(A B) = P(A), så P(A B) = P(A) P(B) 7

8 9.3 Lagen om total sannolikhet Två händelser A och B kallas disjunkta om A B =. Fråga: Hur räknar man ut P(A B)? Vad gäller när A och B är disjunkta? Genom att använda oss av räknereglerna för kardinalitet får vi A B P(A B) = Ω = A Ω + B A B = P(A) + P(B) P(A B) Ω Ω Om nu A och B är disjunkta gäller P(A B) = 0 och P(A B) = P(A) + P(B). Fråga: I en fabrik tillverkas 40% av enheterna vid maskin 1 och 60% vid maskin 2. Maskinerna tillverkar en viss andel defekta enheter; denna andel är 2% för maskin 1 och 5% för maskin 2. Hur stor är sannolikheten att en slumpmässigt vald enhet är defekt? Låt oss beteckna händelsen att en enhet tillverkas vid maskin 1 med M 1 och händelsen att en enhet tillverkas vid maskin 2 med M 2. Låt oss beteckna händelsen att en enhet är defekt med A. Eftersom varje enhet tillverkas av någon maskin kan vi skriva P(A) = P(A (M 1 M 2 )) = P((A M 1 ) (A M 2 )) Eftersom varje enhet tillverkas antingen vid maskin 1 eller vid maskin 2 är M 1 och M 2 disjunkta händelser. Därför är även A M 1 och A M 2 disjunkta och vi får P(A) = P((A M 1 ) (A M 2 )) = P(A M 1 ) + P(A M 2 ) Genom att använda formlerna för P(A M 1 ) och P(A M 2 ) kan vi skriva P(A) = P(A M 1 ) + P(A M 2 ) = P(M 1 ) P(A M 1 ) + P(M 2 ) P(A M 2 ) Och nu är det bara att stoppa in värdena ur uppgiften: P(A) = P(M 1 ) P(A M 1 ) + P(M 2 ) P(A M 2 ) = 0,4 0,02 + 0,6 0,05 = 0,038 Sannolikheten att en slumpmässigt vald enhet är defekt är alltså 3,8%. Principen som vi använde oss av för att lösa denna uppgift kallas för lagen om total sannolikhet. Den lyder: Låt A och B vara händelser så att A B = Ω och A B =. Då gäller följande formel för varje händelse X : P(X ) = P(A) P(X A) + P(B) P(X B) 8

9 9.4 Bayes lag Bayes lag låter en vända på en betingad sannolikhet. Den kan fattas i följande formel där A och B är godtyckliga händelser: P(B A) = P(A B)P(B) P(A) Fråga: Hur kan vi härleda Bayes lag från formeln för att beräkna sannolikheten för snittet av två händelser (P(A B))? P(A B) = P(A) P(B A) = P(A B) P(B) P(B A) = P(A B) P(B) P(A) Bayes lag är användbar eftersom det finns många situationer där vi är intresserade i P(B A) men bara har tillgång till P(A B). Ett exempel är medicinsk diagnos. Läkare vill gärna veta P(influensa feber), men det är mycket enklare att skatta P(feber influensa). Bayes lag låter en använda denna information för att dra slutsatser om den information man egentligen är intresserad av. Här är ett annat exempel: Fråga: Kom ihåg fabriken från förra frågan. En kund påträffar en defekt enhet. Hur stor är sannolikheten att den har tillverkats vid maskin 2? Vi är intresserade av sannolikheten P(M 2 A). Enligt Bayes lag gäller: P(M 2 A) = P(A M 2) P(M 2 ) P(A) 0,05 0,60 = 0,789 0,038 Sannolikheten att den felaktiga enheten tillverkats vid maskin 2 är alltså ungefär 78,9%. 9

10 10 Statistik Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information (Wikipedia). Statistiska inslag spelar en allt större roll inom datorlingvistik och språkteknologi. Exempel: Inom korpuslingvistiken tar man fram statistik om ord, ordklasser och konstruktioner för att t.ex. beskriva språkhistoriska förlopp, dra slutsatser om sociologiska förhållanden eller identifiera författare. System för ordklasstaggning och parsning använder sig av statistik om hur frekvent ordklasser eller dependensrelationer är i korpusar för att kunna förutsäga ordklasser eller dependensrelationer för nya meningar. Statistik används även i samband med utvärdering och jämförelse av språkteknologiska system. På den här kursen tar vi upp grundläggande statistiska begrepp såsom stickprov, skattning och hypotestestning. Ett grundläggande problem inom statistiken är att man i praktiken sällan kan göra observationer på en stor grupp. Istället utgår man från ett stickprov, dvs. ett urval. På basen av detta stickprov försöker man sedan dra slutsatser om hela populationen. Fråga: Vilka kriterier bör användas när man gör ett urval? 10.1 Deskriptiv statistik Deskriptiv statistik handlar om att sammanfatta och presentera data. I detta sammanhang används olika mått, tabeller och diagram Centralmått Centralmått anger en punkt kring vilken datan är centrerad. Här tar vi upp två olika centralmått: medelvärde och median. Medelvärdet (genomsnitt) är summan av alla värden delat med antalet värden. Om vi ska räkna ut medelvärdet för n värden x 1,..., x n får vi medelvärdet x genom formeln x = x x n n = n i=1 x i n Figur 4 visar resultatet av en undersökning där man tagit upp kroppslängden och skostorleken hos 8 individer. Vi kommer att använda denna undersökning som löpande 10

11 Kroppslängd Skostorlek Figur 4: En undersökning om kroppslängd och skostorlek. exempel i detta avsnitt. Medelvärdet för kroppslängden i denna undersökning är = 179,75 8 Medianen är värdet på den mittersta observationen i ett datamaterial som är ordnat från det minsta värdet till det största (i rangordning). Ifall det finns ett jämt antal observationer tar man det värdet som ligger halvvägs mellan de två mellersta observationerna. I vårt exempelundersökning är medianen för kroppslängden 181,5. Fråga: Kan du tänka dig typer av undersökningar där det inte är meningsfullt att räkna ut medianen? Mått där det inte finns någon inbördes rangordning, t.ex. ögonfärg Spridningsmått Spridningsmått anger hur utspridd datan är. Här tar vi upp två olika spridningsmått: standardavvikelse och percentiler. Standardavvikelsen i en datamängd visar hur mycket de observerade värdena skiljer sig från medelvärdet. En låg standardavvikelse är ett tecken på att de observerade värdena är alla nära medelvärdet; en hög standardavvikelse innebär att de är väldigt utspridda. Standardavvikelsen beräknas enligt formeln: s = 1 n 1 n (x i x) 2 i=1 11

12 p gånger krona Figur 5: Sannolikheten p att få x gånger krona när man singlar slant 100 gånger. Standardavvikelsen har samma dimension som observationerna. I vårt exempel, där man mäter kroppslängd, är alltså standardavvikelsen också en längd. Dess värde är 6,553. Percentiler är ett sätt att dela in data. En percentil betecknar ett värde x så att en viss procentsats av observationerna är lägre än x. Den 10:e percentilen till exempel är det värdet x som har egenskapen att 10% av observationerna är lägre än x och 90% är högre. Den 50:e percentilen är alltså lika med medianen. I vårt exempel är den 10:e percentilen 172,0 och den 90:e percentilen 185, Hypotesprövning Antag att vi singlat slant 100 gånger och fått krona 44 gånger och klave 56 gånger. Har vi anledning att misstänka att slanten är manipulerad? Fråga: Vad säger din intuition? När vi singlar en omanipulerad slant förväntar vi oss att få krona i ungefär hälften av fallen, dvs. 50 gånger av 100. Om differensen mellan det förväntade och det observerade antalet gånger är liten, så ligger det nära till hands att tro att det bara rör sig om en slumpmässig avvikelse och att myntet kan mycket väl vara helt okej. Om differensen däremot är stor, så kan vi anta att myntet är manipulerad. Frågan är vilka differenser som skall anses som stora och vilka som små. Figur 5 visar sannolikheten p(x) för att få exakt x gånger krona när man singlar en 12

13 omanipulerad slant 100 gånger. (Kurvan är beräknad med hjälp av den s.k. binomialfördelningen.) Man kan se att sannolikheten att få exakt 50 gånger krona är ungefär 8%, och att sannolikheten att få 40 eller 60 gånger krona är ungefär 1%. De två punkterade linjerna i Figur 5 begränsar en intervall mellan 40 gånger krona och 60 gånger krona. Intervallen är vald så att sannolikheten att hamna i den är 95%, och att sannolikheten att hamna utanför den är bara 5%. Sannolikheten att observera en avvikelse på mer än ±10 från medelvärdet 50 gånger krona är alltså mycket liten. Om vi ändå observerar en så pass stor differens, så kommer vi att anta att myntet är manipulerat. I vårt konkreta fall ligger det observerade värdet (44 gånger krona) innanför toleransgränsen på 95%. Detta tolkar vi som att vi inte har någon anledning att misstänka fusk Den generella metoden En enkel beskrivning av den generella metoden för hypotesprövning är följande: 1. Bestäm nollhypotesen. I vårt exempel ovan är nollhypotesen att sannolikheten för att få krona (eller klave) är 1/2. 2. Bestäm vilka värden vi kan förvänta oss om nollhypotesen är sann. I exemplet hade vi förväntat oss värdena i Figur Jämför dessa värden med det faktiska utfallet. I exemplet fick vi 44 gånger krona. Differensen från det förväntade medelvärdet 50 är alltså = 6. Man ställer sedan frågan: Under antagandet att nollhypotesen är sann, vad är sannolikheten (p-värdet) för att få så pass stora (eller större) differenser? 4. Om differenserna mellan utfall och förväntan är små behåll nollhypotesen; annars förkasta den. Det har utvecklats en praxis att bara förkasta nollhypotesen vid p-värden som är lägre än 0,05, dvs. bara om sannolikheten att nollhypotesen kan förklara datan är mindre än 5%. Sådana resultat kallas statistiskt signifikanta En specifik metod: Chi-kvadrat-test (överkurs) Vi kommer nu att titta på en specifik metod för hypotesprövning, det så kallade chikvadrat-testet. Detta test kan tillämpas på data som kan skrivas in i en 2 2-matris. Ett exempel för sådan data visas i Figur 6a. Tabellen visar hur många av studenterna på en viss kurs regelbundet deltagit i undervisningen och hur många blev godkända på kursen. Det vi vill veta är om det finns något samband mellan dessa två variabler. 13

14 P(deltagit) = 31/ P(godkänd) = 33/ godkänd ej godkänd totalt deltagit ej deltagit totalt (a) observerad P(deltagit godkänd) = P(deltagit) P(godkänd) deltagit godkänd = deltagit godkänd deltagit godkänd = deltagit godkänd = = 18, 94 (b) sannolikheter och förväntade värden enligt nollhypotesen (händelserna oberoende) godkänd ej godkänd totalt deltagit 18,94 12, ej deltagit 14,06 8, totalt (c) förväntade värden utifrån (b), alla fyra cellerna Figur 6: Sammanhang mellan deltagande i föreläsningar och betyg. 14

15 Steg 1: Formulera nollhypotesen mellan deltagande och betyg. Vår nollhypotes är: Det finns inte något samband Steg 2: Beräkna vad som kan förväntas om nollhypotesen vore sann Tabellen i Figur 6 visar observationer relaterade till två händelser och deras komplementhändelser: har deltagit i undervisningen och blev godkänd på provet. Om nollhypotesen vore sann borde vi enligt definitionen av oberoende händelser kunna räkna ut de olika värdena i tabellen genom att använda formler som t.ex. P(deltagit godkänd) = P(deltagit) P(godkänd) Vi kan använda denna information för att räkna ut förväntade värden för de olika cellerna. Enligt definitionen av sannolikhet vet vi t.ex. att: deltagit godkänd = deltagit När vi nu multiplicerar med på båda sidor får vi godkänd deltagit godkänd deltagit godkänd = Det förväntade värdet för cellen deltagit/godkänd är alltså produkten av alla studenter som deltagit och alla studenter som blev godkända, delad i. Med detta får vi tabellen i Figur 6c. Steg 3: Jämför det faktiska med det förväntade utfallet För varje cell i de två tabellerna räknar man ut differensen mellan det faktiska utfallet och det förväntade utfallet med hjälp av följande formel: (observerad förväntad) 2 förväntad Till slut lägger man ihop alla dessa differenser till ett värde χ 2. I vårt fall: χ 2 (25 18,94)2 (6 12,06)2 (8 14,06)2 (15 8,94)2 = ,94 12,06 14,06 8,94 = 11,704 Varje värde på χ 2 motsvarar ett visst p-värde, dvs. en viss sannolikhet att en så pass stor differens från det förväntade utfallet är förenligt med nollhypotesen. Några utvalda värden visas i Figur 7. Steg 4: Fatta ett beslut Enligt Figur 7 är sannolikheten att observera de observerade differenserna mindre än 1%. Detta är betydligt lägre än de 5% som vi brukar kräva. Därför så förkastar vi nollhypotesen och accepterar mothypotesen: Att det finns ett samband mellan deltagandet på undervisningen och kursbetyget. 15

16 χ 2 0,004 0,02 0,06 0,15 0,46 1,07 1,64 2,71 3,84 6,64 p 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,01 Figur 7: Sammanhang mellan χ 2 -värdet och p-värdet. 16

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann Marco Kuhlmann Detta kapitel behandlar grundläggande begrepp i sannolikhetsteori: enkel sannolikhet, betingad sannolikhet, lagen om total sannolikhet och Bayes lag. 1 Enkel sannolikhet Den klassiska sannolikhetsteorin,

Läs mer

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar.

händelsen som alltid inträffar. Den tomma mängden representerar händelsen som aldrig inträffar. Marco Kuhlmann Detta är en kompakt sammanfattning av momentet sannolikhetslära som ingår i kurserna Matematik 1b och 1c på gymnasiet. 1 Grundläggande begrepp 1.01 När vi singlar slant eller kastar tärning

Läs mer

Kombinatorik och sannolikhetslära

Kombinatorik och sannolikhetslära Grunder i matematik och logik (2018) Kombinatorik och sannolikhetslära Marco Kuhlmann Sannolikhetslära Detta avsnitt är för det mesta en kompakt sammanfattning av momentet sannolikhetslära som ingår i

Läs mer

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori, 1 Föreläsning I, Mängdlära och elementär sannolikhetsteori, LMA201, LMA521 1.1 Mängd (Kapitel 1) En (oordnad) mängd A är en uppsättning av element. En sådan mängd kan innehålla ändligt eller oändlligt

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Grundbegrepp, axiomsystem, betingad sannolikhet, oberoende händelser, total sannolikhet, Bayes sats Uwe Menzel uwe.menzel@slu.se 23 augusti 2017 Slumpförsök Ett försök

Läs mer

Matematisk statistik - Slumpens matematik

Matematisk statistik - Slumpens matematik Matematisk Statistik Matematisk statistik är slumpens matematik. Började som en beskrivning av spel, chansen att få olika utfall. Brevväxling mellan Fermat och Pascal 1654. Modern matematisk statistik

Läs mer

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann Marco Kuhlmann Detta är en kompakt sammanfattning av momentet sannolikhetslära som ingår i kurserna Matematik 1b och 1c på gymnasiet. I slutet av dokumentet hittar du uppgifter med vilka du kan testa om

Läs mer

Statistikens grunder HT, dagtid Statistiska institutionen

Statistikens grunder HT, dagtid Statistiska institutionen Statistikens grunder 1 2013 HT, dagtid Statistiska institutionen Orsak och verkan N Kap 2 forts. Annat ord: kausalitet Något av det viktigaste för varje vetenskap. Varför? Orsakssamband ger oss möjlighet

Läs mer

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik Statistik Statistik betyder ungefär sifferkunskap om staten Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information. Verkligheten

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data

Läs mer

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse

Utfall, Utfallsrummet, Händelse. Sannolikhet och statistik. Utfall, Utfallsrummet, Händelse. Utfall, Utfallsrummet, Händelse Utfall, Utfallsrummet, Händelse Sannolikhet och statistik Sannolikhetsteorins grunder HT 2008 Uwe.Menzel@math.uu.se http://www.math.uu.se/ uwe/ Denition 2.1 Resultatet av ett slumpmässigt försök kallas

Läs mer

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5

1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt , 2.5 1 Föreläsning I, Vecka I: 5/11-11/11 MatStat: Kap 1, avsnitt 2.1-2.2, 2.5 Introduktion till kursen. Grundläggande sannolikhetslära. Mängdlära, händelser, sannolikhetsmått Händelse följer samma räkneregler

Läs mer

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik Jörgen Säve-Söderbergh Information om kursen Kom ihåg att

Läs mer

Matematisk statistik 9hp för: C,D,I, Pi

Matematisk statistik 9hp för: C,D,I, Pi Matematisk statistik 9hp för: C,D,I, Pi Föreläsning 1, Sannolikhet Stas Volkov September 12, 2017 Stanislav Volkov s.volkov@maths.lth.se FMSF45 F1: Sannolikhet 1/27 Tillämpningar Praktiska detaljer Matematisk

Läs mer

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF1901: Sannolikhetslära och statistik Föreläsning 1. Jan Grandell & Timo Koski 01.09.2008 Jan Grandell & Timo Koski () Matematisk statistik 01.09.2008 1 / 48 Inledning Vi ska först ge några exempel på

Läs mer

F2 SANNOLIKHETSLÄRA (NCT )

F2 SANNOLIKHETSLÄRA (NCT ) Stat. teori gk, ht 2006, JW F2 SANNOLIKHETSLÄRA (NCT 4.1-4.2) Ordlista till NCT Random experiment Outcome Sample space Event Set Subset Union Intersection Complement Mutually exclusive Collectively exhaustive

Läs mer

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog

Kolmogorovs Axiomsystem Kolmogorovs Axiomsystem Varje händelse A tilldelas ett tal : slh att A inträar Sannolikheten måste uppfylla vissa krav: Kolmog Slumpvariabel (Stokastisk variabel) Resultat av ett slumpförsök - utgången kann inte kontrolleras Sannolikhet och statistik Sannolikhetsteorins grunder VT 2009 Resultatet kan inte förutspås, men vi vet

Läs mer

TAMS79: Föreläsning 1 Grundläggande begrepp

TAMS79: Föreläsning 1 Grundläggande begrepp TMS79: Föreläsning 1 Grundläggande begrepp Johan Thim 31 oktober 2018 1.1 Begrepp Ett slumpförsök är ett försök där resultatet ej kan förutsägas deterministiskt. Slumpförsöket har olika möjliga utfall.

Läs mer

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14

Sannolikhetsteori. Måns Thulin. Uppsala universitet Statistik för ingenjörer 23/ /14 1/14 Sannolikhetsteori Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 23/1 2013 2/14 Dagens föreläsning Relativa frekvenser Matematik för händelser Definition av sannolikhet

Läs mer

Föreläsning 1, Matematisk statistik Π + E

Föreläsning 1, Matematisk statistik Π + E Introduktion Sannolikhetsteori Beroende Föreläsning 1, Matematisk statistik Π + E Sören Vang Andersen 4 november 2014 Sören Vang Andersen - sva@maths.lth.se FMS012 F1 1/26 Introduktion Sannolikhetsteori

Läs mer

TMS136. Föreläsning 2

TMS136. Föreläsning 2 TMS136 Föreläsning 2 Slumpförsök Med slumpförsök (random experiment) menar vi försök som upprepade gånger utförs på samma sätt men som kan få olika utfall Enkla exempel är slantsingling och tärningskast

Läs mer

Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet

Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet Matematisk statistik 9 hp för I, Pi, C, D och fysiker Föreläsning 1: Introduktion och Sannolikhet Anna Lindgren 30+31 augusti 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F1: Sannolikhet 1/27 Praktiska

Läs mer

Sannolikhetsbegreppet

Sannolikhetsbegreppet Kapitel 3 Sannolikhetsbegreppet Betrakta följande försök: Ett symmetriskt mynt kastas 100 gånger och antalet krona observeras. Antal kast 10 20 30 40 50 60 70 80 90 100 Antal krona 6 12 16 21 25 30 34

Läs mer

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07 Föreläsningsmanus i matematisk statistik för lantmätare, vecka 2 HT07 Bengt Ringnér August 31, 2007 1 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Händelser och sannolikheter

Läs mer

Kap 2: Några grundläggande begrepp

Kap 2: Några grundläggande begrepp Kap 2: Några grundläggande begrepp Varför sannolikhetslära är viktigt? Vad menar vi med sannolikhetslära? Träddiagram? Vad är den klassiska, empiriska och subjektiva sannolikheten? Vad menar vi med de

Läs mer

Introduktion till sannolikhetslära. Människor talar om sannolikheter :

Introduktion till sannolikhetslära. Människor talar om sannolikheter : F9 Introduktion till sannolikhetslära Introduktion till sannolikhetslära Människor talar om sannolikheter : Sannolikheten att få sju rätt på Lotto Sannolikheten att få stege på en pokerhand Sannolikheten

Läs mer

3 Grundläggande sannolikhetsteori

3 Grundläggande sannolikhetsteori 3 Grundläggande sannolikhetsteori Ämnet sannolikhetsteori har sin grund i studier av hasardspel utförda under 1500- och 1600-talen av bland andra Gerolamo Cardano, Pierre de Fermat och Blaise Pascal. Mycket

Läs mer

Föreläsning 1: Introduktion

Föreläsning 1: Introduktion Föreläsning 1: Introduktion Matematisk statistik David Bolin Chalmers University of Technology March 22, 2014 Lärare och kurslitteratur David Bolin: Rum: E-mail: Fredrik Boulund: Rum: E-mail: Kursansvarig,

Läs mer

Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19

Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19 Matematisk Statistik och Disktret Matematik, MVE051/MSG810, VT19 Nancy Abdallah Chalmers - Göteborgs Universitet March 25, 2019 1 / 36 1. Inledning till sannolikhetsteori 2. Sannolikhetslagar 2 / 36 Lärare

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift Exempel: Väljarbarometern Föreläsning 1: Introduktion Matematisk statistik Det som typiskt karakteriserar ett statistiskt problem är att vi har en stor grupp (population) som vi vill analysera. Vi kan

Läs mer

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori

Föreläsning 2. Kapitel 3, sid Sannolikhetsteori Föreläsning 2 Kapitel 3, sid 47-78 Sannolikhetsteori 2 Agenda Mängdlära Kombinatorik Sannolikhetslära 3 Mängdlära Används för att hantera sannolikheter Viktig byggsten inom matematik och logik Utfallsrummet,

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

TMS136. Föreläsning 1

TMS136. Föreläsning 1 TMS136 Föreläsning 1 Varför? Om vi gör mätningar vill vi kunna modellera och kvantifiera de osäkerheter som obönhörligen finns Om vi handlar med värdepapper vill kunna modellera och kvantifiera de risker

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

Föreläsning 1, Matematisk statistik för M

Föreläsning 1, Matematisk statistik för M Föreläsning 1, Matematisk statistik för M Erik Lindström 23 mars 2015 Erik Lindström - erikl@maths.lth.se FMS035 F1 1/30 Tillämpningar Praktiska detaljer Matematisk statistik slumpens matematik Sannolikhetsteori:

Läs mer

Föreläsning 1: Introduktion

Föreläsning 1: Introduktion Föreläsning 1: Introduktion Matematisk statistik Chalmers University of Technology Mars 23, 2015 Lärare och kurslitteratur : Rum: E-mail: Anders Hildeman: Rum: E-mail: Kursansvarig och föreläsare H3018

Läs mer

1 Mätdata och statistik

1 Mätdata och statistik Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt

Läs mer

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument) Kursens upplägg v40 - inledande föreläsningar och börja skriva PM 19/12 - deadline PM till examinatorn 15/1- PM examinationer, grupp 1 18/1 - Forskningsetik, riktlinjer uppsatsarbetet 10/3 - deadline uppsats

Läs mer

13.1 Matematisk statistik

13.1 Matematisk statistik 13.1 Matematisk statistik 13.1.1 Grundläggande begrepp I den här föreläsningen kommer vi att definiera och exemplifiera ett antal begrepp som sedan kommer att följa oss genom hela kursen. Det är därför

Läs mer

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende Jan Grandell & Timo Koski 21.01.2016 Jan Grandell & Timo Koski Matematisk statistik 21.01.2016 1 / 39 Lärandemål Betingad

Läs mer

Föreläsning 1: Introduktion

Föreläsning 1: Introduktion Föreläsning 1: Introduktion Matematisk statistik Chalmers University of Technology August 29, 2016 Lärare : Rum: E-mail: Anders Hildeman: Rum: E-mail: Sandra Eriksson Barman: Rum: E-mail: Kursansvarig

Läs mer

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E Innehåll I. Grundläggande begrepp II. Deskriptiv statistik (sid 53 i E) III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser 1 II. Beskrivande statistik,

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF1901: Sannolikhetslära och statistik Föreläsning 1. Jan Grandell & Timo Koski 19.01.2016 Jan Grandell & Timo Koski Matematisk statistik 19.01.2016 1 / 65 Många tänker på tabeller 1 när de hör ordet statistik.

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 3 4 november 2016 1 / 28 Idag Förra gången Stokastiska variabler (Kap. 3.2) Diskret stokastisk variabel (Kap. 3.3 3.4) Kontinuerlig stokastisk

Läs mer

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende Jan Grandell & Timo Koski 14.01.2013 Jan Grandell & Timo Koski () Matematisk statistik 14.01.2013 1 / 25 Repetition:

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

TMS136. Föreläsning 2

TMS136. Föreläsning 2 TMS136 Föreläsning 2 Sannolikheter För en händelse E skriver vi sannolikheten att E inträffar som P(E) För en händelse E skriver vi sannolikheten att E inte inträffar som P(E ) Exempel Låt E vara händelsen

Läs mer

MVE051/MSG Föreläsning 7

MVE051/MSG Föreläsning 7 MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 22 december, 2016 Examinatorer: Kerstin Wiklander och Erik Broman.

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Vad är statistik?

Läs mer

2 Dataanalys och beskrivande statistik

2 Dataanalys och beskrivande statistik 2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att

Läs mer

Sannolikhetslära. 19 februari 2009. Vad är sannolikheten att vinna om jag köper en lott?

Sannolikhetslära. 19 februari 2009. Vad är sannolikheten att vinna om jag köper en lott? Sannolikhetslära 19 februari 009 Vad är en sannolikhet? I vardagen: Vad är sannolikheten att vinna om jag köper en lott? Borde jag ta paraply med mig till jobbet idag? Vad är sannolikheten att det kommer

Läs mer

Föreläsning 1. Grundläggande begrepp

Föreläsning 1. Grundläggande begrepp Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 1 Sannolikhetsteori (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-08-31 Tid:

Läs mer

TMS136. Föreläsning 1

TMS136. Föreläsning 1 TMS136 Föreläsning 1 Varför? Om vi gör mätningar vill vi modellera och kvantifiera de osäkerheter som obönhörligen finns Om vi handlar med värdepapper vill vi modellera och kvantifiera de risker som finns

Läs mer

(N) och mängden av heltal (Z); objekten i en mängd behöver dock inte vara tal. De objekt som ingår i en mängd kallas för mängdens element.

(N) och mängden av heltal (Z); objekten i en mängd behöver dock inte vara tal. De objekt som ingår i en mängd kallas för mängdens element. Grunder i matematik och logik (2017) Mängdlära Marco Kuhlmann 1 Grundläggande begrepp Mängder och element 2.01 En mängd är en samling objekt. Två standardexempel är mängden av naturliga tal (N) och mängden

Läs mer

Slumpförsök för åk 1-3

Slumpförsök för åk 1-3 Modul: Sannolikhet och statistik Del 3: Att utmana elevers resonemang om slump Slumpförsök för åk 1-3 Cecilia Kilhamn, Göteborgs Universitet Andreas Eckert, Linnéuniversitetet I följande text beskrivs

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 7 Statistiska metoder 1 Dagens föreläsning o Hypotesprövning för två populationer Populationsandelar Populationsmedelvärden Parvisa observationer Relation mellan hypotesprövning och konfidensintervall

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek

Läs mer

1.1 Diskret (Sannolikhets-)fördelning

1.1 Diskret (Sannolikhets-)fördelning Föreläsning III. Diskret (Sannolikhets-)fördelning Med diskret menas i matematik, att något antar ett ändligt antal värden eller uppräkneligt oändligt med värden e.vis {, 2, 3,...}. Med fördelning menas

Läs mer

Övning 1 Sannolikhetsteorins grunder

Övning 1 Sannolikhetsteorins grunder Övning 1 Sannolikhetsteorins grunder Två händelser A och B är disjunkta om {A B} =, det vill säga att snittet inte innehåller några element. Om vi har en mängd händelser A 1, A 2, A 3,..., A n, vilka är

Läs mer

FÖRELÄSNING 3:

FÖRELÄSNING 3: FÖRELÄSNING 3: 26-4-3 LÄRANDEMÅL Fördelningsfunktion Empirisk fördelningsfunktion Likformig fördelning Bernoullifördelning Binomialfördelning Varför alla dessa fördelningar? Samla in data Sammanställ data

Läs mer

En typisk medianmorot

En typisk medianmorot Karin Landtblom En typisk medianmorot I artikeln Läget? Tja det beror på variablerna! i Nämnaren 1:1 beskrivs en del av problematiken kring lägesmått och variabler med några vanliga missförstånd som lätt

Läs mer

S0007M Statistik2: Slumpmodeller och inferens. Inge Söderkvist

S0007M Statistik2: Slumpmodeller och inferens. Inge Söderkvist Föreläsning 1 4.1 Slumpässighet 4.2 Sannolikhetsmodeller Viktiga grundbegrepp Slumpmässig (eng: random) Ett fenomen är slumpmässigt om individuella resultat är osäkra, men resultat alltid förekommer med

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Grundbegrepp, axiomsystem, betingad sannolikhet, oberoende händelser, total sannolikhet, Bayes sats Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de

Läs mer

Föreläsning G70, 732G01 Statistik A

Föreläsning G70, 732G01 Statistik A Föreläsning 3 732G70, 732G01 Statistik A Introduktion till sannolikhetslära Sannolikhetslära: område inom statistiken där vi studerar experiment vars utfall beror av slumpen Sannolikhet: numeriskt värde

Läs mer

Uppsala universitet Institutionen för lingvistik och filologi. Grundbegrepp: Mängder och element Delmängder

Uppsala universitet Institutionen för lingvistik och filologi. Grundbegrepp: Mängder och element Delmängder Mängder Joakim Nivre Uppsala universitet Institutionen för lingvistik och filologi Översikt Grundbegrepp: Mängder och element Delmängder Operationer på mängder: Union och snitt Differens och komplement

Läs mer

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH GRUNDLÄGGANDE SANNOLIKHETSTEORI, STATISTIK BETINGADE SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 2 GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGADE SANNOLIKHETER, OBEROENDE HÄNDELSER Tatjana Pavlenko 30 augusti, 2016 SANNOLIKHETSGRUNDER (REPETITION) Slumpförsöket

Läs mer

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov

Statistisk slutledning (statistisk inferens): Sannolikhetslära: GRUNDLÄGGANDE SANNOLIKHETSLÄRA. Med utgångspunkt från ett stickprov OSÄKERHET Sannolikhetslära: Om det i ett område finns 32 % med universitetsexamen, vad är sannolikheten att ett stickprov kommer att innehålla 31-33 % med universitetsexamen? Om medelåldern i en population

Läs mer

Introföreläsning i S0001M, Matematisk statistik LP3 VT18

Introföreläsning i S0001M, Matematisk statistik LP3 VT18 föreläsning i S0001M, Matematisk statistik LP3 VT18 Luleå tekniska universitet 15 januari 2018 Gruppindelning och lärare Gruppindelning Grupp A - Datateknik, Väg- och vatten (Mykola) Grupp B - Ind. ekonomi,

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Slumpförsök Repetitionsföreläsning Föreläsning 15 Sannolikhet och Statistik 5 hp Med händelser A B... avses delmängder av ett utfallsrum. Slumpförsök = utfallsrummet + ett sannolikhetsmått P. Fredrik Jonsson

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIK GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 2 GRUNDLÄGGANDE SANNOLIKHETSTEORI, BETINGAD SANNOLIKHETER, OBEROENDE HÄNDELSER Tatjana Pavlenko 26 mars, 2015 SANNOLIKHETSGRUNDER (REPETITION) Slumpförsöket

Läs mer

Stora talens lag eller det jämnar ut sig

Stora talens lag eller det jämnar ut sig Stora talens lag eller det jämnar ut sig kvensen för krona förändras när vi kastar allt fler gånger. Valda inställningar på räknaren Genom att trycka på så kan man göra ett antal inställningar på sin räknare.

Läs mer

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende

SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende SF1901: Sannolikhetslära och statistik Föreläsning 2. Betingad sannolikhet & Oberoende Jan Grandell & Timo Koski 21.01.2015 Jan Grandell & Timo Koski () Matematisk statistik 21.01.2015 1 / 1 Repetition:

Läs mer

4 Diskret stokastisk variabel

4 Diskret stokastisk variabel 4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används

Läs mer

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt. Stat. teori gk, vt 006, JW F0 ICKE-PARAMETRISKA TEST (NCT 13.1, 13.3-13.4) Or dlista till NCT Nonparametric Sign test Rank Teckentest Icke-parametrisk Teckentest Rang Teckentestet är formellt ingenting

Läs mer

Uppgifter 6: Kombinatorik och sannolikhetsteori

Uppgifter 6: Kombinatorik och sannolikhetsteori Grunder i matematik och logik (2017) Uppgifter 6: Kombinatorik och sannolikhetsteori Marco Kuhlmann Kombinatorik Nivå A 6.01 En meny består av tre förrätter, fem huvudrätter och två efterrätter. På hur

Läs mer

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab Repetition: Gnuer i (o)skyddade områden χ 2 -metoder, med koppling till binomialfördelning och genetik. Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 Endast 2 av de 13 observationerna

Läs mer

Reliability analysis in engineering applications

Reliability analysis in engineering applications Reliability analysis in engineering applications Fredrik Carlsson Sannolikhetsteorins grunder Fördelningar och stokastiska variabler Extremvärdesfördelningar Simulering Structural Engineering - Lund University

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Slump och slumptal Analys Boxplot Konfidensintervall Experiment och test Kamratgranskning Kursmeddelanden Analys Om laborationer: alla labbar

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 1 Sannolikhetslära (LLL Kap 5) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course,

Läs mer

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018 SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 14-15 PASSNING AV FÖRDELNING: χ 2 -METODER. Tatjana Pavlenko 14 maj 2018 PLAN FÖR DAGENS FÖRELÄSNING Icke-parametriska metoder. (Kap. 13.10) Det

Läs mer

Finansiell statistik, vt-05. Sannolikhetslära. Mängder En mängd är en samling element (objekt) 1, 2,, F2 Sannolikhetsteori. koppling till verkligheten

Finansiell statistik, vt-05. Sannolikhetslära. Mängder En mängd är en samling element (objekt) 1, 2,, F2 Sannolikhetsteori. koppling till verkligheten Johan, Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-05 F2 Sannolikhetsteori Sannolikhetslära koppling till verkligheten mängdlära räkna med sannolikheter definitioner

Läs mer

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar

Läs mer

Lektion 1: Fördelningar och deskriptiv analys

Lektion 1: Fördelningar och deskriptiv analys Density Lektion 1: Fördelningar och deskriptiv analys 1.,3 Uniform; Lower=1; Upper=6,3,2,2,1,, 1 2 3 X 4 6 7 Figuren ovan visar täthetsfunktionen för en likformig fördelning. Kurvan antar värdet.2 över

Läs mer

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018

SF1922/SF1923: SANNOLIKHETSTEORI OCH DISKRETA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 23 mars, 2018 SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 3 DISKRETA STOKASTISKA VARIABLER Tatjana Pavlenko 23 mars, 2018 PLAN FÖR DAGENSFÖRELÄSNING Repetition av betingade sannolikheter, användbara satser

Läs mer

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Kamratgranskning Analys Exempel: exekveringstid Hur analysera data? Hur vet man om man kan lita på skillnader och mönster som man observerar?

Läs mer

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski SF1901: SANNOLIKHETSLÄRA OCH STATISTIK FÖRELÄSNING 12. MER HYPOTESPRÖVNING. χ 2 -TEST Jan Grandell & Timo Koski 25.02.2016 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 1 / 46 INNEHÅLL Hypotesprövning

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

EXAMINATION KVANTITATIV METOD vt-11 (110204)

EXAMINATION KVANTITATIV METOD vt-11 (110204) ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

Föreläsning G70 Statistik A

Föreläsning G70 Statistik A Föreläsning 2 732G70 Statistik A Introduktion till sannolikhetslära Sannolikhetslära: område inom statistiken där vi studerar experiment vars utfall beror av slumpen Sannolikhet: numeriskt värde (mellan

Läs mer