Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014).

Save this PDF as:
 WORD  PNG  TXT  JPG

Storlek: px
Starta visningen från sidan:

Download "Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014)."

Transkript

1 UPPSALA UNIVERSITET Matematik för språkteknologer (5LN445) Institutionen för lingvistik och filologi VT 2014 (Marco Kuhlmann 2013, tillägg och redaktion Mats Dahllöf 2014). 9 Sannolikhet Detta kapitel behandlar grundläggande begrepp i sannolikhetsteori: enkel sannolikhet, betingad sannolikhet, lagen om total sannolikhet och Bayes lag. 9.1 Enkel sannolikhet Den klassiska sannolikhetsteorin, som började utvecklas på 1600-talet, har sitt ursprung i tillämpningar på hasardspel. De frågor som man ville ha svar på var av typen Är det gynnsamt (skulle man vinna i längden) att, vid jämna odds, slå vad om att man vid fyra kast med en tärning får minst en sexa? Detta specifika problem kallas även för De Mérés problem. 1 Fråga: Hur du skulle intuitivt svara på frågan? Hur skulle du kunna gå tillväga för att lösa problemet? Sannolikhet och relativ frekvens Låt oss försöka att lösa detta problem empiriskt. I Figur 1 ser vi utdatan från ett program som kastar fyra tärningar åt oss och håller koll på antalet i sammanhanget gynnsamma utfall, dvs. antalet gånger där man kastat minst en sexa vid fyra kast. Programmet skriver även ut den relativa frekvensen av de gynnsamma utfallen: andelen som de gynnsamma utfallen har bland alla utfall. Som vi ser så ligger denna andel på 60% efter tio försök. Sannolikhetsteorin utvecklades för att man ville kunna förutsäga framtiden baserat på empiriska erfarenheter. Det hela bygger på antagandet att den relativa frekvensen av en given händelse (såsom att kasta minst en sexa vid fyra kast) så småningom stabiliseras kring ett värde. Detta värde kallas för händelsens sannolikhet. 1 Efter Antoine Gombaud ( ), som kallades Chevalier de Méré (även om han inte var riddare). 1

2 Försök Tärningskast Gynsamma Rel. frekvens Figur 1: Experiment utifrån De Mérés problem Sannolikheten för en händelse A skrivs P(A). Det gäller att 0 P(A) 1. P(A) = 0 innebär att händelse aldrig inträffar och P(A) = 1 att den alltid inträffar. (Figur 1 visar att sannolikheten för ett gynnsamt utfall ligger någonstans mellan aldrig och alltid.) Det är viktigt att förstå att en händelses sannolikhet kan inte observeras; det kan bara skattas. (I det experiment som vi körde i Figur 1 observerade vi relativa frekvenser, inte sannolikheter.) Skattning kommer vi tillbaka till i nästa kapitel, som handlar om statistik. Fråga: Är skattningen efter tio försök i Figur 1 pålitlig? Utfall, händelser och sannolikhet För att lösa De Mérés problem med hjälp av sannolikhetsteorin börjar vi med en förenklad fråga: Är det gynnsamt att, vid jämna odds, slå vad om att man vid ett kast med en tärning får en sexa? Svaret på denna fråga är lätt. När man kastar en tärning finns det sex möjliga utfall: Tärningen kan visa en etta, en tvåa, en trea, en fyra, en femma eller en sexa. Mängden av alla möjliga utfall kallas för utfallsrum och betecknas med den grekiska bokstaven Ω. I det här fallet har vi alltså Ω = {1, 2, 3, 4, 5, 6} Vid jämna odds finns det alltså bara ett gynnsamt utfall (man kastar en sexa), men fem stycken ogynnsamma utfall (man kastar något annat). Det är alltså inte gynnsamt att slå vad om att man får en sexa. 2

3 Fråga: Hur måste man argumentera om man istället är intresserad i frågan om det är gynnsamt att slå vad om att man vid ett kast med en tärning får ett jämt tal? Om man istället är intresserad av händelsen man kastar ett jämt tal så finns det tre gynnsamma utfall: en tvåa, en fyra och en sexa. Det föregående exempel illustrerar skillnaden mellan begreppen utfall och händelse: Varje kast med tärningen kommer att ge exakt ett tal som utfall; men vissa relevanta händelser, t.ex. talet är jämnt ({2, 4, 6}) och talet är större än 3 ({4, 5, 6}), kan bara beskrivas som kombinationer av sådana utfall. Allmänt definierar man därför en händelse som en mängd utfall. En händelse är därför en delmängd till utfallsrummet. Och hela utfallsrummet utgör den händelse som alltid inträffar. Sannolikheten för en händelse A kan räknas ut på detta sätt, om alla utfall är lika sannolika: antal utfall som leder till A P(A) = = A antal möjliga utfall Ω (Kom ihåg att notationen X betecknar kardinaliteten eller storleken hos X.) T.ex. vid tärningskast (med vanliga typen av tärning): P(talet är jämnt) = P({2, 4, 6}) = {2, 4, 6} / {1, 2, 3, 4, 5, 6} = 3/6 = 0,5. P(talet är inte 5) = P({1, 2, 3, 4, 6}) = {1, 2, 3, 4, 6} / {1, 2, 3, 4, 5, 6} = 5/6 0,833. P(talet är inte 7) = P({1, 2, 3, 4, 5, 6}) = {1, 2, 3, 4, 5, 6} / {1, 2, 3, 4, 5, 6} = 6/6 = 1. P(talet är 7) = P( ) = / {1, 2, 3, 4, 5, 6} = 0/6 = 0. Fråga: Vad för sorts händelser är och Ω? Den tomma mängden representerar omöjlighet : Det finns inget som helst utfall som kan leda till denna händelse; dess sannolikhet är 0. Den fullständiga mängden representerar nödvändighet : Alla möjliga utfall leder till denna händelse; dess sannolikhet är 1. Nu kan vi gå tillbaka till De Mérés problem. Fråga: Vilket utfallsrum får man för De Mérés problem? Vilken storlek har detta rum? Vilken händelse är man intresserad av? Hur stor är sannolikheten för den händelsen? 3

4 Ω A Figur 2: Diagrammet visar att A c = Ω \ A = Ω Ω A. Det nya utfallsrummet består av alla följder (tupler) av fyra tärningskast. Detta utfallsrum har kardinalitet 6 4 = Alltså: Ω = En typ av händelser innehåller bara en bestämd sekvens av tärningskast, t.ex. {(1, 2, 3, 4)}, P({(1, 2, 3, 4)}) = 1/1296. Händelsen som är aktuell i De Mérés fall är den att få en följd som innehåller minst en sexa. Men det är inte så lätt att räkna ut sannolikheten för denna händelse... En ganska dum metod vore att gå igenom alla följder (tupler) av fyra tärningskast och räkna hur många som innehåller minst en sexa, men det skulle vara ganska jobbigt och vi skulle riskera att räkna fel. Vi kan dessbättre tänka på ett smartare sätt för att räkna ut antalet utfall som leder till händelsen minst en sexa! Ett begrepp som är mycket användbart i samband med De Mérés problem är begreppet komplementhändelse. Med komplementhändelsen till en händelse A menas händelsen att A inte inträffar. Eftersom varje händelse är en mängd är komplementhändelsen till A helt enkelt komplementmängden till A, relativt till universum Ω. Det är inte svårt att se att sannolikheten för komplementhändelsen till en händelse A är På samma sätt får man P(A) = 1 P(A c ). P(A c ) = 1 P(A) Fråga: Kan du bevisa detta? Mängden A c kan skrivas som Ω \ A. Enligt definitionen av sannolikhet gäller då att P(A c Ω \ A ) = P(Ω \ A) = Ω När man ritar ett Venn-diagram som i Figur 2 ser man att Ω \ A = Ω Ω A. Men eftersom A Ω har man Ω A = A. Med detta: P(A c Ω \ A Ω Ω A Ω A ) = = = Ω Ω Ω = Ω Ω A Ω = 1 P(A) 4

5 Det som gör begreppet komplementhändelsen användbart i samband med De Mérés problem är att det är mycket lättare att räkna ut storleken på komplementhändelsen till minst en sexa på fyra kast än händelsen själv. Fråga: Vad är komplementhändelsen, hur stor är respektive mängd och hur sannolikt är komplementhändelsen? Komplementhändelsen är ingen sexa på fyra kast ; dess storlek är 5 4 = 625; och sannolikheten för komplementhändelsen är då 625/1296 = 48, 2%. Med detta vet vi alltså att sannolikheten att få minst en sexa på fyra kast (vilket är komplementhändelsen till komplementhändelsen, så att säga) är P(A) = 1 P(A c ) = , 8% 1296 Detta betyder att man har större chans att vinna än att förlora när man slår vad om att man vid fyra kast med en tärning får minst en sexa. Sammanfattning, begrepp En typ av försök, t.ex. ett tärningskast, ger ett utfall, t.ex. 4. En typ av försök har ett utfallsrum (Ω), t.ex. för tärningskast, Ω = {1, 2, 3, 4, 5, 6}, som är mängden av möjliga utfall. En händelse kan inträffa genom olika utfall, och definieras som en delmängd av Ω. T.ex. händelsen att ett tärningskast ger ett udda tal, som blir A = {1, 3, 5}. En händelse A inträffar på så sätt att ett försök ger ett utfall u och u A. Ω utgör därför den händelse som alltid inträffar och utgör den händelse som aldrig inträffar. Komplementhändelsen till händelsen A: A c = Ω \ A. T.ex. Händelsen att ett tärningskast ger 5: A = {5}. Händelsen att ett tärningskast ger ett annat tal än 5: A c = {1, 2, 3, 4, 6}. Sannolikheter, där A är en händelse: 0 P(A) 1 P(A) = A Ω P(A c ) = 1 P(A) 5

6 9.2 Betingad sannolikhet En mycket användbar generalisering av begreppet sannolikhet är begreppet betingad sannolikhet. Den betingade sannolikheten för händelsen A givet händelsen B är A B P(A B) = B För att se att denna definition är en generalisering av vår tidigare definition av sannolikhet kan man notera att man får den vanliga (enkla) sannolikheten genom att sätta B = Ω: A Ω P(A Ω) = = A Ω Ω = P(A) Sammanhanget mellan enkel sannolikhet och betingad sannolikhet kan beskrivas så att man zoomar in på en delmängd av händelserna, nämligen dem som är förenliga med B. Dessa händelser blir det nya utfallsrummet. Detta illustreras i följande exempel. Ett bigram är en sekvens av två ord. En korpus på engelska meningar med sammanlagt ord innehåller 35 förekomster av bigram som slutar på ordet amok. Fråga: Låt P(amok) vara sannolikheten för händelsen att man läser ordet amok när man läser ett ord i en engelsk text. Hur skulle du kunna använda dig av korpusen för att skatta P(amok)? Man skulle kunna skatta sannolikheten genom att anta att den motsvarar den relativa frekvensen av bigram som slutar på amok i korpusen. (Detta utgår ifrån att amok inte är det första ordet i korpusen.) På det sättet får man ett värde P(amok) = 35/ ,000035%. Nu får du lite ny information: Korpusen innehåller 8,500 förekomster av bigram som börjar på run och 15 förekomster av bigrammet run amok. Fråga: Hur skulle du kunna använda denna information för att skatta sannolikheten att se ordet amok när du har just sett ordet run? Låt oss beteckna sannolikheten för att se amok efter run med P(amok run). Då gäller P(amok run) = 15/ ,18%. Det är alltså betydligt mera sannolikt att få amok efter run än att få amok i godtyckliga kontexter. Två händelser A och B kallas oberoende om P(A B) = P(A). Detta betyder att den betingade sannolikheten för A givet B inte är större än den enkla sannolikheten för A; händelsen B händer har ingen påverkan på A. 6

7 A B Figur 3: Venn-diagram för A B. Fråga: Hur räknar man ut P(A B)? Vad gäller när A och B är beroende? Genom att titta på Venn-diagrammet för A B (Figur 3) är det lätt att se att P(A B) = P(A) P(B A) = P(A B) P(B) = P(B A) Alternativt, utgå från definitionerna av enkel och betingad sannolikhet: A B P(A B) P(B) = B B A B A B = = P(A B) = P(B A) P(A) = A Ω Ω A Ω Om nu A och B är oberoende gäller P(A B) = P(A), så P(A B) = P(A) P(B) 7

8 9.3 Lagen om total sannolikhet Två händelser A och B kallas disjunkta om A B =. Fråga: Hur räknar man ut P(A B)? Vad gäller när A och B är disjunkta? Genom att använda oss av räknereglerna för kardinalitet får vi A B P(A B) = Ω = A Ω + B A B = P(A) + P(B) P(A B) Ω Ω Om nu A och B är disjunkta gäller P(A B) = 0 och P(A B) = P(A) + P(B). Fråga: I en fabrik tillverkas 40% av enheterna vid maskin 1 och 60% vid maskin 2. Maskinerna tillverkar en viss andel defekta enheter; denna andel är 2% för maskin 1 och 5% för maskin 2. Hur stor är sannolikheten att en slumpmässigt vald enhet är defekt? Låt oss beteckna händelsen att en enhet tillverkas vid maskin 1 med M 1 och händelsen att en enhet tillverkas vid maskin 2 med M 2. Låt oss beteckna händelsen att en enhet är defekt med A. Eftersom varje enhet tillverkas av någon maskin kan vi skriva P(A) = P(A (M 1 M 2 )) = P((A M 1 ) (A M 2 )) Eftersom varje enhet tillverkas antingen vid maskin 1 eller vid maskin 2 är M 1 och M 2 disjunkta händelser. Därför är även A M 1 och A M 2 disjunkta och vi får P(A) = P((A M 1 ) (A M 2 )) = P(A M 1 ) + P(A M 2 ) Genom att använda formlerna för P(A M 1 ) och P(A M 2 ) kan vi skriva P(A) = P(A M 1 ) + P(A M 2 ) = P(M 1 ) P(A M 1 ) + P(M 2 ) P(A M 2 ) Och nu är det bara att stoppa in värdena ur uppgiften: P(A) = P(M 1 ) P(A M 1 ) + P(M 2 ) P(A M 2 ) = 0,4 0,02 + 0,6 0,05 = 0,038 Sannolikheten att en slumpmässigt vald enhet är defekt är alltså 3,8%. Principen som vi använde oss av för att lösa denna uppgift kallas för lagen om total sannolikhet. Den lyder: Låt A och B vara händelser så att A B = Ω och A B =. Då gäller följande formel för varje händelse X : P(X ) = P(A) P(X A) + P(B) P(X B) 8

9 9.4 Bayes lag Bayes lag låter en vända på en betingad sannolikhet. Den kan fattas i följande formel där A och B är godtyckliga händelser: P(B A) = P(A B)P(B) P(A) Fråga: Hur kan vi härleda Bayes lag från formeln för att beräkna sannolikheten för snittet av två händelser (P(A B))? P(A B) = P(A) P(B A) = P(A B) P(B) P(B A) = P(A B) P(B) P(A) Bayes lag är användbar eftersom det finns många situationer där vi är intresserade i P(B A) men bara har tillgång till P(A B). Ett exempel är medicinsk diagnos. Läkare vill gärna veta P(influensa feber), men det är mycket enklare att skatta P(feber influensa). Bayes lag låter en använda denna information för att dra slutsatser om den information man egentligen är intresserad av. Här är ett annat exempel: Fråga: Kom ihåg fabriken från förra frågan. En kund påträffar en defekt enhet. Hur stor är sannolikheten att den har tillverkats vid maskin 2? Vi är intresserade av sannolikheten P(M 2 A). Enligt Bayes lag gäller: P(M 2 A) = P(A M 2) P(M 2 ) P(A) 0,05 0,60 = 0,789 0,038 Sannolikheten att den felaktiga enheten tillverkats vid maskin 2 är alltså ungefär 78,9%. 9

10 10 Statistik Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information (Wikipedia). Statistiska inslag spelar en allt större roll inom datorlingvistik och språkteknologi. Exempel: Inom korpuslingvistiken tar man fram statistik om ord, ordklasser och konstruktioner för att t.ex. beskriva språkhistoriska förlopp, dra slutsatser om sociologiska förhållanden eller identifiera författare. System för ordklasstaggning och parsning använder sig av statistik om hur frekvent ordklasser eller dependensrelationer är i korpusar för att kunna förutsäga ordklasser eller dependensrelationer för nya meningar. Statistik används även i samband med utvärdering och jämförelse av språkteknologiska system. På den här kursen tar vi upp grundläggande statistiska begrepp såsom stickprov, skattning och hypotestestning. Ett grundläggande problem inom statistiken är att man i praktiken sällan kan göra observationer på en stor grupp. Istället utgår man från ett stickprov, dvs. ett urval. På basen av detta stickprov försöker man sedan dra slutsatser om hela populationen. Fråga: Vilka kriterier bör användas när man gör ett urval? 10.1 Deskriptiv statistik Deskriptiv statistik handlar om att sammanfatta och presentera data. I detta sammanhang används olika mått, tabeller och diagram Centralmått Centralmått anger en punkt kring vilken datan är centrerad. Här tar vi upp två olika centralmått: medelvärde och median. Medelvärdet (genomsnitt) är summan av alla värden delat med antalet värden. Om vi ska räkna ut medelvärdet för n värden x 1,..., x n får vi medelvärdet x genom formeln x = x x n n = n i=1 x i n Figur 4 visar resultatet av en undersökning där man tagit upp kroppslängden och skostorleken hos 8 individer. Vi kommer att använda denna undersökning som löpande 10

11 Kroppslängd Skostorlek Figur 4: En undersökning om kroppslängd och skostorlek. exempel i detta avsnitt. Medelvärdet för kroppslängden i denna undersökning är = 179,75 8 Medianen är värdet på den mittersta observationen i ett datamaterial som är ordnat från det minsta värdet till det största (i rangordning). Ifall det finns ett jämt antal observationer tar man det värdet som ligger halvvägs mellan de två mellersta observationerna. I vårt exempelundersökning är medianen för kroppslängden 181,5. Fråga: Kan du tänka dig typer av undersökningar där det inte är meningsfullt att räkna ut medianen? Mått där det inte finns någon inbördes rangordning, t.ex. ögonfärg Spridningsmått Spridningsmått anger hur utspridd datan är. Här tar vi upp två olika spridningsmått: standardavvikelse och percentiler. Standardavvikelsen i en datamängd visar hur mycket de observerade värdena skiljer sig från medelvärdet. En låg standardavvikelse är ett tecken på att de observerade värdena är alla nära medelvärdet; en hög standardavvikelse innebär att de är väldigt utspridda. Standardavvikelsen beräknas enligt formeln: s = 1 n 1 n (x i x) 2 i=1 11

12 p gånger krona Figur 5: Sannolikheten p att få x gånger krona när man singlar slant 100 gånger. Standardavvikelsen har samma dimension som observationerna. I vårt exempel, där man mäter kroppslängd, är alltså standardavvikelsen också en längd. Dess värde är 6,553. Percentiler är ett sätt att dela in data. En percentil betecknar ett värde x så att en viss procentsats av observationerna är lägre än x. Den 10:e percentilen till exempel är det värdet x som har egenskapen att 10% av observationerna är lägre än x och 90% är högre. Den 50:e percentilen är alltså lika med medianen. I vårt exempel är den 10:e percentilen 172,0 och den 90:e percentilen 185, Hypotesprövning Antag att vi singlat slant 100 gånger och fått krona 44 gånger och klave 56 gånger. Har vi anledning att misstänka att slanten är manipulerad? Fråga: Vad säger din intuition? När vi singlar en omanipulerad slant förväntar vi oss att få krona i ungefär hälften av fallen, dvs. 50 gånger av 100. Om differensen mellan det förväntade och det observerade antalet gånger är liten, så ligger det nära till hands att tro att det bara rör sig om en slumpmässig avvikelse och att myntet kan mycket väl vara helt okej. Om differensen däremot är stor, så kan vi anta att myntet är manipulerad. Frågan är vilka differenser som skall anses som stora och vilka som små. Figur 5 visar sannolikheten p(x) för att få exakt x gånger krona när man singlar en 12

13 omanipulerad slant 100 gånger. (Kurvan är beräknad med hjälp av den s.k. binomialfördelningen.) Man kan se att sannolikheten att få exakt 50 gånger krona är ungefär 8%, och att sannolikheten att få 40 eller 60 gånger krona är ungefär 1%. De två punkterade linjerna i Figur 5 begränsar en intervall mellan 40 gånger krona och 60 gånger krona. Intervallen är vald så att sannolikheten att hamna i den är 95%, och att sannolikheten att hamna utanför den är bara 5%. Sannolikheten att observera en avvikelse på mer än ±10 från medelvärdet 50 gånger krona är alltså mycket liten. Om vi ändå observerar en så pass stor differens, så kommer vi att anta att myntet är manipulerat. I vårt konkreta fall ligger det observerade värdet (44 gånger krona) innanför toleransgränsen på 95%. Detta tolkar vi som att vi inte har någon anledning att misstänka fusk Den generella metoden En enkel beskrivning av den generella metoden för hypotesprövning är följande: 1. Bestäm nollhypotesen. I vårt exempel ovan är nollhypotesen att sannolikheten för att få krona (eller klave) är 1/2. 2. Bestäm vilka värden vi kan förvänta oss om nollhypotesen är sann. I exemplet hade vi förväntat oss värdena i Figur Jämför dessa värden med det faktiska utfallet. I exemplet fick vi 44 gånger krona. Differensen från det förväntade medelvärdet 50 är alltså = 6. Man ställer sedan frågan: Under antagandet att nollhypotesen är sann, vad är sannolikheten (p-värdet) för att få så pass stora (eller större) differenser? 4. Om differenserna mellan utfall och förväntan är små behåll nollhypotesen; annars förkasta den. Det har utvecklats en praxis att bara förkasta nollhypotesen vid p-värden som är lägre än 0,05, dvs. bara om sannolikheten att nollhypotesen kan förklara datan är mindre än 5%. Sådana resultat kallas statistiskt signifikanta En specifik metod: Chi-kvadrat-test (överkurs) Vi kommer nu att titta på en specifik metod för hypotesprövning, det så kallade chikvadrat-testet. Detta test kan tillämpas på data som kan skrivas in i en 2 2-matris. Ett exempel för sådan data visas i Figur 6a. Tabellen visar hur många av studenterna på en viss kurs regelbundet deltagit i undervisningen och hur många blev godkända på kursen. Det vi vill veta är om det finns något samband mellan dessa två variabler. 13

14 P(deltagit) = 31/ P(godkänd) = 33/ godkänd ej godkänd totalt deltagit ej deltagit totalt (a) observerad P(deltagit godkänd) = P(deltagit) P(godkänd) deltagit godkänd = deltagit godkänd deltagit godkänd = deltagit godkänd = = 18, 94 (b) sannolikheter och förväntade värden enligt nollhypotesen (händelserna oberoende) godkänd ej godkänd totalt deltagit 18,94 12, ej deltagit 14,06 8, totalt (c) förväntade värden utifrån (b), alla fyra cellerna Figur 6: Sammanhang mellan deltagande i föreläsningar och betyg. 14

15 Steg 1: Formulera nollhypotesen mellan deltagande och betyg. Vår nollhypotes är: Det finns inte något samband Steg 2: Beräkna vad som kan förväntas om nollhypotesen vore sann Tabellen i Figur 6 visar observationer relaterade till två händelser och deras komplementhändelser: har deltagit i undervisningen och blev godkänd på provet. Om nollhypotesen vore sann borde vi enligt definitionen av oberoende händelser kunna räkna ut de olika värdena i tabellen genom att använda formler som t.ex. P(deltagit godkänd) = P(deltagit) P(godkänd) Vi kan använda denna information för att räkna ut förväntade värden för de olika cellerna. Enligt definitionen av sannolikhet vet vi t.ex. att: deltagit godkänd = deltagit När vi nu multiplicerar med på båda sidor får vi godkänd deltagit godkänd deltagit godkänd = Det förväntade värdet för cellen deltagit/godkänd är alltså produkten av alla studenter som deltagit och alla studenter som blev godkända, delad i. Med detta får vi tabellen i Figur 6c. Steg 3: Jämför det faktiska med det förväntade utfallet För varje cell i de två tabellerna räknar man ut differensen mellan det faktiska utfallet och det förväntade utfallet med hjälp av följande formel: (observerad förväntad) 2 förväntad Till slut lägger man ihop alla dessa differenser till ett värde χ 2. I vårt fall: χ 2 (25 18,94)2 (6 12,06)2 (8 14,06)2 (15 8,94)2 = ,94 12,06 14,06 8,94 = 11,704 Varje värde på χ 2 motsvarar ett visst p-värde, dvs. en viss sannolikhet att en så pass stor differens från det förväntade utfallet är förenligt med nollhypotesen. Några utvalda värden visas i Figur 7. Steg 4: Fatta ett beslut Enligt Figur 7 är sannolikheten att observera de observerade differenserna mindre än 1%. Detta är betydligt lägre än de 5% som vi brukar kräva. Därför så förkastar vi nollhypotesen och accepterar mothypotesen: Att det finns ett samband mellan deltagandet på undervisningen och kursbetyget. 15

16 χ 2 0,004 0,02 0,06 0,15 0,46 1,07 1,64 2,71 3,84 6,64 p 0,95 0,90 0,80 0,70 0,50 0,30 0,20 0,10 0,05 0,01 Figur 7: Sammanhang mellan χ 2 -värdet och p-värdet. 16

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann

Sannolikhetslära. 1 Grundläggande begrepp. 2 Likformiga sannolikhetsfördelningar. Marco Kuhlmann Marco Kuhlmann Detta är en kompakt sammanfattning av momentet sannolikhetslära som ingår i kurserna Matematik 1b och 1c på gymnasiet. I slutet av dokumentet hittar du uppgifter med vilka du kan testa om

Läs mer

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik Statistik Statistik betyder ungefär sifferkunskap om staten Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information. Verkligheten

Läs mer

Föreläsning 1, Matematisk statistik för M

Föreläsning 1, Matematisk statistik för M Föreläsning 1, Matematisk statistik för M Erik Lindström 23 mars 2015 Erik Lindström - erikl@maths.lth.se FMS035 F1 1/30 Tillämpningar Praktiska detaljer Matematisk statistik slumpens matematik Sannolikhetsteori:

Läs mer

TMS136. Föreläsning 2

TMS136. Föreläsning 2 TMS136 Föreläsning 2 Sannolikheter För en händelse E skriver vi sannolikheten att E inträffar som P(E) För en händelse E skriver vi sannolikheten att E inte inträffar som P(E ) Exempel Låt E vara händelsen

Läs mer

2 Dataanalys och beskrivande statistik

2 Dataanalys och beskrivande statistik 2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Vad är statistik?

Läs mer

Sannolikhetslära. 19 februari 2009. Vad är sannolikheten att vinna om jag köper en lott?

Sannolikhetslära. 19 februari 2009. Vad är sannolikheten att vinna om jag köper en lott? Sannolikhetslära 19 februari 009 Vad är en sannolikhet? I vardagen: Vad är sannolikheten att vinna om jag köper en lott? Borde jag ta paraply med mig till jobbet idag? Vad är sannolikheten att det kommer

Läs mer

TMS136. Föreläsning 1

TMS136. Föreläsning 1 TMS136 Föreläsning 1 Varför? Om vi gör mätningar vill vi modellera och kvantifiera de osäkerheter som obönhörligen finns Om vi handlar med värdepapper vill vi modellera och kvantifiera de risker som finns

Läs mer

Lektion 1: Fördelningar och deskriptiv analys

Lektion 1: Fördelningar och deskriptiv analys Density Lektion 1: Fördelningar och deskriptiv analys 1.,3 Uniform; Lower=1; Upper=6,3,2,2,1,, 1 2 3 X 4 6 7 Figuren ovan visar täthetsfunktionen för en likformig fördelning. Kurvan antar värdet.2 över

Läs mer

EXAMINATION KVANTITATIV METOD vt-11 (110204)

EXAMINATION KVANTITATIV METOD vt-11 (110204) ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt

Läs mer

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015 SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 14 PASSNING AV FÖRDELNING: χ 2 -METODER. Tatjana Pavlenko 12 oktober 2015 PLAN FÖR DAGENS FÖRELÄSNING Icke-parametsriska metoder. (Kap. 13.10) Det grundläggande

Läs mer

Lotto. Singla slant. Vanliga missuppfattningar vad gäller slumpen. Slumpen och hur vi uppfattar den - med och utan tärning

Lotto. Singla slant. Vanliga missuppfattningar vad gäller slumpen. Slumpen och hur vi uppfattar den - med och utan tärning Slumpen och hur vi uppfattar den - med och utan tärning Ingemar Holgersson Högskolan Kristianstad grupper elever Gr, 7, 9 och. grupp lärarstudenter inriktning matematik Ca i varje grupp Gjord i Israel

Läs mer

Sannolikhetslära till pdf.notebook. May 04, 2012. Sannolikhetslära. Kristina.Wallin@kau.se

Sannolikhetslära till pdf.notebook. May 04, 2012. Sannolikhetslära. Kristina.Wallin@kau.se May 0, 0 Sannolikhetslära Kristina.Wallin@kau.se May 0, 0 Centralt innehåll Sannolikhet Åk Slumpmässiga händelser i experiment och spel. Åk 6 Sannolikhet, chans och risk grundat på observationer, experiment

Läs mer

Kompletterande lösningsförslag och ledningar, Matematik 3000 kurs B, kapitel 1

Kompletterande lösningsförslag och ledningar, Matematik 3000 kurs B, kapitel 1 Här presenteras förslag på lösningar och tips till många uppgifter i läroboken Matematik 3000 kurs B som vi hoppas kommer att vara till hjälp när du arbetar dig framåt i kursen. Vi har valt att inte göra

Läs mer

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 Tentamen i: Statistik A1, 15 hp Antal uppgifter: 6 Krav för G: 13 Lärare:

Läs mer

7-2 Sammansatta händelser.

7-2 Sammansatta händelser. Namn: 7-2 Sammansatta händelser. Inledning Du vet nu vad som menas med sannolikhet. Det lärde du dig i kapitlet om just sannolikhet. Nu skall du tränga lite djupare i sannolikhetens underbara värld och

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Analys av korstabeller 2 Innehåll 1 Analys av korstabeller 2 Korstabeller Vi har tidigare under kursen redan bekantat oss med korstabeller. I en korstabell redovisar man fördelningen på två

Läs mer

7-1 Sannolikhet. Namn:.

7-1 Sannolikhet. Namn:. 7-1 Sannolikhet. Namn:. Inledning Du har säkert hört ordet sannolikhet förut. Hur sannolikt är det att få 13 rätt på tipset eller 7 rätt på lotto? I detta kapitel skall du lära dig vad sannolikhet är för

Läs mer

Valfritt läromedel för kurs Matematik B Exempel: Räkna med Vux B, Gleerups förlag. Tag kontakt med examinator om du har frågor

Valfritt läromedel för kurs Matematik B Exempel: Räkna med Vux B, Gleerups förlag. Tag kontakt med examinator om du har frågor Våren 010 PRÖVNINGSANVISNINGAR Prövning i Matematik B Kurskod MA 10 Gymnasiepoäng 50 Läromedel Prov Muntligt prov Valfritt läromedel för kurs Matematik B Exempel: Räkna med Vux B, Gleerups förlag Skriftligt

Läs mer

SF1901: Övningshäfte

SF1901: Övningshäfte SF1901: Övningshäfte 5 september 2013 Uppgifterna under rubriken Övning kommer att gås igenom under övningstillfällena. Uppgifterna under rubriken Hemtal är starkt rekommenderade och motsvarar nivån på

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.

Läs mer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-05-29 Tid:

Läs mer

Algebra & Ekvationer. Svar: Sammanfattning Matematik 2

Algebra & Ekvationer. Svar: Sammanfattning Matematik 2 Algebra & Ekvationer Algebra & Ekvationer Parenteser En parentes När man multiplicerar en term med en parentes måste man multiplicera båda talen i parentesen. Förenkla uttrycket 42 9. 42 9 4 2 4 9 8 36

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15 Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 6 april 004, klockan 08.15-13.15 Tillåtna hjälpmedel: Bifogad

Läs mer

Fö relä sning 1, Kö system 2015

Fö relä sning 1, Kö system 2015 Fö relä sning 1, Kö system 2015 Här följer en kort sammanfattning av det viktigaste i Föreläsning 1. Kolla kursens hemsida minst en gång per vecka. Övningar kommer att läggas ut där, skriv ut dem och ha

Läs mer

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Statistiska analyser C2 Inferensstatistik. Wieland Wermke + Statistiska analyser C2 Inferensstatistik Wieland Wermke + Signifikans och Normalfördelning + Problemet med generaliseringen: inferensstatistik n Om vi vill veta ngt. om en population, då kan vi ju fråga

Läs mer

Betingad sannolikhet och oberoende händelser

Betingad sannolikhet och oberoende händelser Kapitel 5 Betingad sannolikhet och oberoende händelser Betrakta ett försök med ett ändligt utfallsrum Ω och en händelse A vid detta försök. Definitionsmässigt gäller att A Ω och försökets utfall ligger

Läs mer

5. BERÄKNING AV SANNOLIKHETER

5. BERÄKNING AV SANNOLIKHETER 5. BERÄKNING V SNNOLIKHETER 5.1 dditionssatsen Viharnukommitframtilldetstegdärvikanbörjaatträknapraktisktmed sannolikheter. Vi skall utveckla olika regler och begrepp som är nödvändiga för att praktiskt

Läs mer

Stokastisk geometri. Lennart Råde. Chalmers Tekniska Högskola och Göteborgs Universitet

Stokastisk geometri. Lennart Råde. Chalmers Tekniska Högskola och Göteborgs Universitet Stokastisk geometri Lennart Råde Chalmers Tekniska Högskola och Göteborgs Universitet Inledning. I geometrin studerar man geometriska objekt och deras inbördes relationer. Exempel på geometriska objekt

Läs mer

Föreläsning 1. 732G60 Statistiska metoder

Föreläsning 1. 732G60 Statistiska metoder Föreläsning 1 Statistiska metoder 1 Kursens uppbyggnad o 10 föreläsningar Teori blandas med exempel Läggs ut några dagar innan på kurshemsidan o 5 räknestugor Tillfälle för individuella frågor Viktigt

Läs mer

MA 1202 Matematik B Mål som deltagarna skall ha uppnått efter avslutad kurs.

MA 1202 Matematik B Mål som deltagarna skall ha uppnått efter avslutad kurs. MA 202 Matematik B Mål som deltagarna skall ha uppnått efter avslutad kurs. Deltagaren skall kunna formulera, analysera och lösa matematiska problem av betydelse för tillämpningar och vald studieinriktning

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Anna: Bertil: Cecilia:

Anna: Bertil: Cecilia: Marco Kuhlmann 1 Osäkerhet 1.01 1.02 1.03 1.04 1.05 Intelligenta agenter måste kunna hantera osäkerhet. Världen är endast delvist observerbar och stokastisk. (Jmf. Russell och Norvig, 2014, avsnitt 2.3.2.)

Läs mer

Industriell matematik och statistik, LMA136 2013/14

Industriell matematik och statistik, LMA136 2013/14 Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2

Läs mer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. Tony Pansell, optiker Universitetslektor Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp

Läs mer

Föreläsning 7 FK2002

Föreläsning 7 FK2002 Föreläsning 7 FK2002 Föreläsning 7 Binomialfördelning Poissonfördelning Att testa en hypotes Binomialfördelningen Betrakta ett experiment som består av n försök varav ν är lyckade försök. Mätningar har

Läs mer

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK TERM Analytisk statistik Bias Confounder (förväxlingsfaktor)) Deskriptiv statistik Epidemiologi Fall-kontrollstudie (case-control study)

Läs mer

EXAMINATION KVANTITATIV METOD

EXAMINATION KVANTITATIV METOD ÖREBRO UNIVERSITET Hälsoakademin Idrott B, Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-09 (090209) Examinationen består av 8 frågor, några med tillhörande följdfrågor. Frågorna 4-7 är knutna till

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

TENTAMEN I STATISTIKENS GRUNDER 2

TENTAMEN I STATISTIKENS GRUNDER 2 STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson HT2012 TENTAMEN I STATISTIKENS GRUNDER 2 2012-11-20 Skrivtid: kl 9.00-14.00 Godkända hjälpmedel: Miniräknare, språklexikon Bifogade hjälpmedel:

Läs mer

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015 SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 13 HYPOTESPRÖVNING. Tatjana Pavlenko 13 maj 2015 PLAN FÖR DAGENS FÖRELÄSNING Begrepp inom hypotesprövning (rep.) Tre metoder för att avgöra om H 0 ska

Läs mer

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga

Läs mer

Mer om slumpvariabler

Mer om slumpvariabler 1/20 Mer om slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/2 2013 2/20 Dagens föreläsning Diskreta slumpvariabler Vilket kretskort ska man välja? Väntevärde

Läs mer

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 13 november 2004, kl. 09.00-13.00

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 13 november 2004, kl. 09.00-13.00 Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A Deltentamen, 4p november 004, kl. 09.00-.00 Tillåtna hjälpmedel: Bifogad formel- och

Läs mer

en femma eller en sexa?

en femma eller en sexa? REPETITION 3 A Du kastar en vanlig tärning en gång. Hur stor är sannolikheten att du får en femma eller en sea? 2 Eleverna i klass C fick ge betyg på en bok som de hade läst. Diagrammet visar resultatet.

Läs mer

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 (2015-04-29) OCH INFÖR ÖVNING 8 (2015-05-04)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 (2015-04-29) OCH INFÖR ÖVNING 8 (2015-05-04) LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB ÖVNING 7 (25-4-29) OCH INFÖR ÖVNING 8 (25-5-4) Aktuella avsnitt i boken: 6.6 6.8. Lektionens mål: Du ska kunna sätta

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD 6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller

Läs mer

Vidare får vi S 10 = 8,0 10 4 = 76, Och då är 76

Vidare får vi S 10 = 8,0 10 4 = 76, Och då är 76 Ellips Sannolikhet och statistik lösningar till övningsprov sid. 38 Övningsprov.. i) P(:a äss och :a äss och 3:e äss och 4:e äss ) P(:a äss) P(:a äss :a äss) P(3:e äss :a och :a äss) antal P(4:a äss :a

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Statistik 1 för biologer, logopeder och psykologer Paul Blomstedt Innehåll 1 Inledning 2 2 Deskriptiv statistik 2 2.1 Variabler och datamaterial...................... 2 2.2 Tabulering och grask beskrivning.................

Läs mer

Blandade problem från elektro- och datateknik

Blandade problem från elektro- och datateknik Blandade problem från elektro- och datateknik Sannolikhetsteori (Kapitel 1-10) E1. En viss typ av elektroniska komponenter anses ha exponentialfördelade livslängder. Efter 3000 timmar brukar 90 % av komponenterna

Läs mer

2010-09-13 Resultatnivåns beroende av ålder och kön analys av svensk veteranfriidrott med fokus på löpgrenar

2010-09-13 Resultatnivåns beroende av ålder och kön analys av svensk veteranfriidrott med fokus på löpgrenar 1 2010-09-13 Resultatnivåns beroende av ålder och kön analys av svensk veteranfriidrott med fokus på löpgrenar av Sven Gärderud, Carl-Erik Särndal och Ivar Söderlind Sammanfattning I denna rapport använder

Läs mer

Explorativ övning 5 MATEMATISK INDUKTION

Explorativ övning 5 MATEMATISK INDUKTION Explorativ övning 5 MATEMATISK INDUKTION Syftet med denna övning är att introducera en av de viktigaste bevismetoderna i matematiken matematisk induktion. Termen induktion är lite olycklig därför att matematisk

Läs mer

1 10 e 1 10 x dx = 0.08 1 e 1 10 T = 0.08. p = P(ξ < 3) = 1 e 1 10 3 0.259. P(η 2) = 1 P(η = 0) P(η = 1) = 1 (1 p) 7 7p(1 p) 6 0.

1 10 e 1 10 x dx = 0.08 1 e 1 10 T = 0.08. p = P(ξ < 3) = 1 e 1 10 3 0.259. P(η 2) = 1 P(η = 0) P(η = 1) = 1 (1 p) 7 7p(1 p) 6 0. Tentamen TMSB18 Matematisk statistik IL 091015 Tid: 08.00-13.00 Telefon: 036-10160 (Abrahamsson, Examinator: F Abrahamsson 1. Livslängden för en viss tvättmaskin är exponentialfördelad med en genomsnittlig

Läs mer

Induktion, mängder och bevis för Introduktionskursen på I

Induktion, mängder och bevis för Introduktionskursen på I Induktion, mängder och bevis för Introduktionskursen på I J A S, ht 04 1 Induktion Detta avsnitt handlar om en speciell teknik för att försöka bevisa riktigheten av påståenden eller formler, för alla heltalsvärden

Läs mer

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram 2.1 Grundläggande matematik 2.1.1 Potensfunktioner xmxn xm n x x x x 3 4 34 7 x x m n x mn x x 4 3 x4 3 x1 x x n 1 x n x 3 1 x 3 x0 1 1

Läs mer

Matematik 1A 4 Potenser

Matematik 1A 4 Potenser Matematik 1A 4 Potenser förklara begrepp t ex. potens, bas, exponent och grundpotensform (Nivå E C) tolka, skriva och räkna med tal i grundpotensform (Nivå E A) helst kunna redogöra för räkneregler för

Läs mer

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = 1 0.34. ξ = 2ξ 1 3ξ 2

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = 1 0.34. ξ = 2ξ 1 3ξ 2 Lösningsförslag TMSB18 Matematisk statistik IL 101015 Tid: 12.00-17.00 Telefon: 101620, Examinator: F Abrahamsson 1. Varje dag levereras en last med 100 maskindetaljer till ett företag. Man tar då ett

Läs mer

Dekomponering av löneskillnader

Dekomponering av löneskillnader Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 01, HT-07 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen, enkla punktskattningar

Läs mer

5.3 Sannolikhet i flera steg

5.3 Sannolikhet i flera steg 5.3 Sannolikhet i flera steg När man singlar slant kan man få utfallen krona eller klave. Sannolikheten att få klave är - och krona ^. Vad är sannolikheten att fä krona två. kast i rad? Träddlagram För

Läs mer

Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer Laboration 1 i 5B1512, Grundkurs i matematisk statistik för ekonomer Namn:........................................................ Elevnummer:.............. Laborationen syftar till ett ge information

Läs mer

Lösningstips till de flesta uppgifterna i fjärde upplagan av Statistisk dataanalys

Lösningstips till de flesta uppgifterna i fjärde upplagan av Statistisk dataanalys Lösningstips till de flesta uppgifterna i fjärde upplagan av Statistisk dataanalys Din granne är hungrig. Ge honom en fisk och han har mat för dagen. Lär honom att fiska och han har mat resten av sitt

Läs mer

Artificiell Intelligens

Artificiell Intelligens Omtentamen Artificiell Intelligens Datum: 2014-02-20 Tid: 14.00 18.00 Ansvarig: Resultat: Hjälpmedel: Gränser: Anders Gidenstam Redovisas inom tre veckor Inga G 8p, VG 12p, Max 16p Notera: Skriv läsbart!

Läs mer

Datorlaboration 2 Konfidensintervall & hypotesprövning

Datorlaboration 2 Konfidensintervall & hypotesprövning Statistik, 2p PROTOKOLL Namn:...... Grupp:... Datum:... Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta den statistiska

Läs mer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I G. Gripenberg Aalto-universitetet 28 januari 2014 G. Gripenberg (Aalto-universitetet) MS-A0509 Grundkurs i sannolikhetskalkyl

Läs mer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I G. Gripenberg Sannolikheter Slumpvariabler Centrala gränsvärdessatsen Aalto-universitetet 8 januari 04 3 Tvådimensionella slumpvariabler

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Kapitel 5. Scanlon bemöter delvis invändningen genom att hävda att kontraktualistiskt resonerande är holistiskt.

Kapitel 5. Scanlon bemöter delvis invändningen genom att hävda att kontraktualistiskt resonerande är holistiskt. Men stämmer det att man har skäl att förkasta en princip endast om det vore dåligt för en om den blev allmänt accepterad? En intressant tillämpning i sammanhanget är det som Scanlon kallar fairness. Han

Läs mer

Sammanfattningar Matematikboken X

Sammanfattningar Matematikboken X Sammanfattningar Matematikboken X KAPITEL 1 TAL OCH RÄKNING Naturliga tal Med naturliga tal menas talen 0, 1,,, Jämna tal 0,,, 6, 8 Udda tal 1,,, 7 Tallinje Koordinater En tallinje kan t ex användas för

Läs mer

Uppgift 1 (14p) lika stor eller mindre än den förväntade poängen som efterfrågades i deluppgift d? Endast svar krävs, ingen motivering.

Uppgift 1 (14p) lika stor eller mindre än den förväntade poängen som efterfrågades i deluppgift d? Endast svar krävs, ingen motivering. Uppgift 1 (14p) I en hockeymatch mellan lag A och lag B leder lag A med 4-3 när det är en kvart kvar av ordinarie matchtid. En oddssättare på ett spelbolag behöver bestämma sannolikheten för de tre matchutfallen

Läs mer

Övningshäfte 1: Logik och matematikens språk

Övningshäfte 1: Logik och matematikens språk GÖTEBORGS UNIVERSITET MATEMATIK 1, MMG200, HT2014 INLEDANDE ALGEBRA Övningshäfte 1: Logik och matematikens språk Övning A Målet är att genom att lösa och diskutera några inledande uppgifter få erfarenheter

Läs mer

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U. Veckoblad 3 Kapitel 3 i Matematisk statistik, Blomqvist U. ya begrepp: likformig fördelning, hypergeometerisk fördelning, Hyp(, n, p), binomialfördelningen, Bin(n, p), och Poissonfördelningen, Po(λ). Standardfördelningarna

Läs mer

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))

För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z)) Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt

Läs mer

Kvantitativa metoder och datainsamling

Kvantitativa metoder och datainsamling Kvantitativa metoder och datainsamling Kurs i forskningsmetodik med fokus på patientsäkerhet 2015-09-23, Peter Garvin FoU-enheten för närsjukvården Kvantitativ och kvalitativ metodik Diskborsten, enkronan

Läs mer

Matematik B (MA1202)

Matematik B (MA1202) Matematik B (MA10) 50 p Betygskriterier med exempeluppgifter Värmdö Gymnasium Betygskriterier enligt Skolverket Kriterier för betyget Godkänd Eleven använder lämpliga matematiska begrepp, metoder och tillvägagångssätt

Läs mer

Lösningar till tentamen i Matematisk Statistik, 5p

Lösningar till tentamen i Matematisk Statistik, 5p Lösningar till tentamen i Matematisk Statistik, 5p LGR00 6 juni, 200 kl. 9.00 1.00 Kursansvarig: Eric Järpe Maxpoäng: 0 Betygsgränser: 12p: G, 21p: VG Hjälpmedel: Miniräknare samt tabell- och formelsamling

Läs mer

Lokal pedagogisk planering i matematik för årskurs 9

Lokal pedagogisk planering i matematik för årskurs 9 Lokal pedagogisk planering i matematik för årskurs 9 Arbetsområde 1. Procent och statistik Syfte formulera och lösa problem med hjälp av matematik samt värdera valda strategier och metoder. reflektera

Läs mer

Lär lätt! Statistik - Kompendium

Lär lätt! Statistik - Kompendium Björn Lantz Lär lätt! Statistik - Kompendium Studentia 006 Björn Lantz och Studentia Ladda ner kompendiet gratis på ISBN 87-7681-080-1 Studentia Innehållsförteckning Innehållsförteckning 1. Introduktion

Läs mer

Uppgift a b c d e Vet inte Poäng 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Uppgift a b c d e Vet inte Poäng 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 TENTAMEN: Dataanalys och statistik för I, TMS136 Onsdagen den 5 oktober kl. 8.30-13.30 på M. Jour: Jenny Andersson, ankn 5317 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på kursen använd ordlista

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Three Monkeys Trading. Tärningar och risk-reward

Three Monkeys Trading. Tärningar och risk-reward Three Monkeys Trading Tärningar och risk-reward I en bok vid namn A random walk down Wall Street tar Burton Malkiel upp det omtalade exemplet på hur en apa som kastar pil på en tavla genererar lika bra

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl 14.00-19.00

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl 14.00-19.00 Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 004, kl 14.00-19.00 Tillåtna hjälpmedel: Bifogad formelsamling, approimationsschema och tabellsamling (dessa skall returneras). Egen miniräknare.

Läs mer

Tentamen 2016-01-13. Marco Kuhlmann

Tentamen 2016-01-13. Marco Kuhlmann TDDD02 Språkteknologi för informationssökning (2015) Tentamen 2016-01-13 Marco Kuhlmann Denna tentamen består av 10 frågor. Frågorna 8 10 ligger på en högre kunskapsnivå än de övriga och kräver utförliga

Läs mer

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar Sannolikhetslära och inferens II Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar 1 Diskreta slumpvariabler En slumpvariabel tilldelar tal till samtliga utfall i ett slumpförsök. Vi

Läs mer

Lär lätt! Statistik - Kompendium

Lär lätt! Statistik - Kompendium Björn Lantz Lär lätt! Statistik - Kompendium Studentia 006 Björn Lantz och Studentia Ladda ner kompendiet gratis på ISBN 87-7681-080-1 Studentia Innehållsförteckning Innehållsförteckning 1. Introduktion

Läs mer

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10

Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10 Läsanvisningar - Medicinsk statistik - Läkarprogrammet T10 Läsanvisningarna baseras på boken Björk J. Praktisk statistik för medicin och hälsa, Liber Förlag (2011), som är gemensam kursbok för statistikavsnitten

Läs mer

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4 Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 014-015 Denna lektion ska vi studera rekursion. Lektion 4 Principen om induktion Principen om induktion är ett vanligt sätt att bevisa

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 2 ÖVNINGSUPPGIFTER KAPITEL 2 DATAMATRISEN 1. Datamatrisen nedan visar ett utdrag av ett datamaterial för USA:s 50 stater. Stat Befolkningsmängd Inkomst Marijuana Procent män (miljoner) per person lagligt?

Läs mer

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU KURSENS INNEHÅLL Statistiken ger en empirisk grund för ekonomin. I denna kurs betonas statistikens idémässiga bakgrund och

Läs mer

Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl 14.00-19.00

Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl 14.00-19.00 Tentamen i Statistik STG A01 (12 hp) Fredag 16 januari 2009, Kl 14.00-19.00 Tillåtna hjälpmedel: Bifogad formelsamling, tabellsamling (dessa skall returneras). Miniräknare. Ansvarig lärare: Jari Appelgren,

Läs mer

Repetitionsuppgifter inför Matematik 1. Matematiska institutionen Linköpings universitet 2013

Repetitionsuppgifter inför Matematik 1. Matematiska institutionen Linköpings universitet 2013 Repetitionsuppgifter inför Matematik Matematiska institutionen Linköpings universitet 0 Innehåll De fyra räknesätten Potenser och rötter 7 Algebra 0 4 Facit 4 Repetitionsuppgifter inför Matematik Repetitionsuppgifter

Läs mer

ÄNDLIGT OCH OÄNDLIGT AVSNITT 4

ÄNDLIGT OCH OÄNDLIGT AVSNITT 4 VSNITT ÄNDLIGT OCH OÄNDLIGT Är det möjligt att jämföra storleken av olika talmängder? Har det någon mening om man säger att det finns fler irrationella tal än rationella? Är det överhuvudtaget möjligt

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 2

ÖVNINGSUPPGIFTER KAPITEL 2 ÖVNINGSUPPGIFTER KAPITEL 2 DATAMATRISEN 1. Datamatrisen nedan visar ett utdrag av ett datamaterial för USA:s 50 stater. Stat Befolkningsmängd Inkomst Marijuana Procent män (miljoner) per person lagligt?

Läs mer

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar

STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar 2007-10-08 sida 1 # 1 STOKASTIK Sannolikhetsteori och statistikteori med tillämpningar Sven Erick Alm och Tom Britton Typsatt med liber1ab 2007-10-08 1 2007-10-08 sida 2 # 2 2007-10-08 sida i # 3 Innehåll

Läs mer

Stockholms Universitet Statistiska institutionen Termeh Shafie

Stockholms Universitet Statistiska institutionen Termeh Shafie Stockholms Universitet Statistiska institutionen Termeh Shafie TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2011-10-28 Skrivtid: 9.00-14.00 Hjälpmedel: Miniräknare utan lagrade formler eller text, bifogade

Läs mer

Lutande torn och kluriga konster!

Lutande torn och kluriga konster! Lutande torn och kluriga konster! Aktiviteter för barn under Vetenskapsfestivalens skolprogram 2001 Innehåll 1 Bygga lutande torn som inte faller 2 2 Om konsten att vinna betingat godis i spel 5 3 Den

Läs mer

Tema Förväntat värde. Teori Förväntat värde

Tema Förväntat värde. Teori Förväntat värde Tema Förväntat värde Teori Förväntat värde Begreppet förväntat värde används flitigt i diskussioner om olika pokerstrategier. För att kunna räkna ut det förväntade värdet så tar du alla möjliga resultat,

Läs mer

Excel-guide. Introduktion

Excel-guide. Introduktion Excel-guide Introduktion I denna laboration kommer ni få använda några grundfunktioner i Microsoft Excel. Laborationen utgår ifrån Excel 2010, men om ni vill använda ett annat program för att lösa uppgifterna

Läs mer

Psykologi som vetenskap

Psykologi som vetenskap Psykologi som vetenskap Begrepp och metoder Forskningsetik Av Jenny Wikström, KI till Psykologprogrammet HT10 Kurslitteratur: Myers Psychology, Kap.1 Kurs: Introduktion till psykologi 7,5 hp Psykologi

Läs mer