The Title. The Author. The Date

Storlek: px
Starta visningen från sidan:

Download "The Title. The Author. The Date"

Transkript

1 The Title The Author The Date

2 ii

3 Innehåll Vad statistik handlar om. Modeller Tre typer av medelvärden Median Typvärde Aritmetiskt medelvärde Tre typer av avvikelser Varians standardavvikelse Skevhet Toppighet Tre typer av gram Stolpdiagram och kumulerat stolpdiagram Histogram och kumulerat histogram Stokastiska variabler, väntevärden och sannolikheter 3. Diskret och kontinuerlig Väntevärden Sannolikhet Mera om sannolikheter Betingade sannolikheter Betingade väntevärden Betingade varianser Oberoende Diskreta modeller Betygssättning Optionsmodell Binomial optionsmodell ett tidssteg Binomial optionsmodell era tidssteg Epostmodell iii

4 iv INNEHÅLL 3.4 Spelmodeller Kvalitetskontroll Sammanfattning Lösningar till uppgifter Kontinuerliga modeller Bussmodell Försäkringsmodell Fördelning för antal skador En försäkrings premie Normalfördelningen Centrala gränsvärdessatsen Lösningar till uppgifter Stickprov och skattningar 5. Stickprov Vad ett stickprov kan ge Skattningar Önskade egenskaper hos skattningar Metoder för att nna skattningar Momentmetoden Minsta kvadrat metoden Maximum likelihood metoden Tankeväckande exempel Lösningar till uppgifter Passar vår fördelning 4 6. Funktionen ^F Fördelningsdiagram P-P diagram K-K diagram Exempel Rörvik Timber B Lösningar till uppgifter Trovärdiga intervall Normalfördelningen Fall : Kon densintervall för när är känt Fall : Kon densintervall för med okänt väntevärde Fall 3: Kon densintervall för när är okänt Kon densintervall vid normalapproximation

5 INNEHÅLL v 7.. Kon densintervall vid Poissonfördelning Kon densintervall vid binomialfördelning Lösningar till uppgifter Prövning av antaganden Introduktion Test av vid normalfördelning Steg : Formulera lämplig hypotes Steg : Bestäm en testvariabel Steg 3: Bestäm en beslutsregel Steg 4: Besluta Jämförelse mellan kon densintervall och test Test av vid normalfördelning Test av p Test av vid normalfördelning Olika typer av fel Styrkefunktion p-värden Test av fördelningar testet Ett enklare exempel Fördelningar diskreta Fördelningar kontinuerliga Test av oberoende Övningar och Problem Lösningar till uppgifter Linjär regression enkel 7 0 Linjär regression multipel 9 Icke linjär regresion Logistisk regression 3. När är logistisk regression användbart Hur ser p(x ; : : : ; x m ) ut Logistisk regressionsmodell via odds Logistisk regressionsmodell via tillväxtmodell Hur bestäms parametrarna 0 och För att summera och generalisera Tillbaks till exemplen Hur man tolkar parametrar

6 vi INNEHÅLL.6 Övningar Lösningar till uppgifter Tidsserier 5 3. Introduktion Glidande medelvärden Komponentmodeller Modell Konstruktion av en tidsserie Analys av tidsserien ovan Enkel exponentiell utjämning Dubbel exponentiell utjämning à la Holt ARMA-modeller Introduktion Hur ser en stationär tidsserie ut Autokorrelationsfunktionen Partiella autokorrelationsfunktionen Modellen AR() Modellen MA() Lösningar till uppgifter ARMA processer 87 5 Beslutsteori Beslutsprocessen Enkla beslutsproblem Minimax Maximax Förlorade möjligheter Enkla beslut baserade på väntevärden Enkla beslutsträd Aposteriorisannolikheter Allmäna beslutsträd

7 . Vad statistik handlar om Människans ojämförligt största upp nning är språket och därefter kommer matematik och statistik. Utan det förra skulle vi inte kunna utväxla ideer och utan det senare skulle våra ideer vara fördunklade av allehanda övernaturligt tankebråte. Ett samhälle utan matematik kan förvisso existera men dömer sig självt till evigt stillastående. Matematiken och i dess förlängning statistiken är två speciella universiella språk som hjälper oss att reda ut vad som är sant och vad som är tro. Matematiken gör modeller som utgår från "odelbara sanningar" och härleder därur statiska beskrivningar av verkligheten. Det statistiska språket lägger till en osäkerhetsaspekt till det matematiska språket, slumpen, som gör det möjligt att även ge beskrivningar av en kaotisk, dynamisk, verklighet. Statistik har gett uphov till och/eller understött utvecklingen av många intressanta verksamheter som nationalekonomi, sociologi, marknadsföring, fysik, nans, medicin, farmakologi, psykologi, dataalgoritmer o s v. Statistik har även använts för att förklara hur slumpen kan skapa mönster där inga nnes. I bästsäljaren Bibelkoden presenterar författaren [7, Michael Drosnin] följande resultat: Tag bibelns text och skriv ned den med exakt lika många bokstäver i varje rad. I den så erhållna textmassan kan man nu, vertikalt eller diagonalt, hitta en mängd intressanta saker. Vid ett sådant försök lyckades man para ihop 34 rabbiners namn med deras födelsedata. Något så märkligt kan inte vara en slump utan måste vara ett hemligt meddelande från Gud. Alltså nns Gud (vilka dumheter man får höra). Nu kan man med statistiska metoder bevisa att slumpen faktiskt ger dylika e ekter (se [8, Qvartilen Vol 9-3, Olle Häggström]). Statistik kan därför även användas för att avslöja direkt felaktiga påståenden och blir därmed ett utmärkt verktyg för att hålla koll på medvetet/omedvetet ljug från både politiker, astrologer och andra. För att kunna fungera som ett verktyg för utveckling och renhållning behöver statistiken matematiken ty med matematikens hjälp kan en statistiker visa att t ex aritmetiska medelvärden uppträder på ett speciellt sätt när antalet mätningar ökar. Detta betyder att den som vill stud-

8 era statistik måste, för att få verklig behållning av och självständigt kunna använda de statistiska verktygen, börja med att studera matematik. Har man inte elementa inom matematik klart för sig så blir statistiken knastertorr (utantillärning) och, utanför den deskriptiva statistikens värld, totalt obegriplig. Av denna anledning nns till denna bok en nätbok, Introduktion till matematik för ekonomer, som innehåller det minimum av kunskaper i matematik som behövs för att med god behållning kunna tillägna sig denna bok. Jaha vad handlar nu statistik om? Tillspetsat kan man säga att statistik handlar om två saker ) Hur man beräknar medelvärden och ) begreppet oberoende händelser. Sannolikt får jag en massa belackare som hävdar annat så jag får likt biskop Brask skriva en liten lapp: Hur man sedan använder dessa kunskaper är fram till var och en. Olle Sjöström påminner om statistikens tre ben (se [9, Qvartilen Vol 0-, Olle Sjöström]) Svårigheterna att svara på frågan Vad är statistik? beror inte minst på att statistikens idéhistoriska framväxt är komplex och svårfångad. Ett sätt att söka beskriva denna utveckling är att skilja på tre olika linjer. ) Statistik som kritisk samhällslära med rötter i Upplysningen. ) Statistik som generell metod, i dagens statistiska språkbruk en metod för surveyundersökningar, i allmänt språkbruk statistisk undersökning. En teori formulerades i slutet av 800-talet. 3) Statistik som tillämpning av sannolikhetsmodeller, som har haft en stark utveckling under 900-talet. Det är fråga om en mer utbyggd statistiskt orienterad matematik, även kallad matematisk statistik. Dessa tre traditioner lever kvar i dag. Alla tre nns med i statistikens olika tillämpningar, den tredje dominerar undervisning och forskning inom universitet och högskolor nästan helt. Även i det samhällsvetenskapliga ämnet statistik

9 . Vad statistik handlar om 3 har denna uppfattning fått insteg och intresset har glidit mer mot andra tillämpningar än de samhällsvetenskapliga. I det följande vill jag söka visa, att alla dessa tre traditioner är relevanta.... Ovanstående beskrivning stämmer bra med de faktiska förhållandena och det är onekligen så att det första benet har haft en tendens till att bli bortglömt och det andra har den statliga myndigheten SCB tagit hand om. Men både det första och andra benet behöver det tredje för att få hjälp att undvika fällor och fel.. Modeller Innan vi börjar räkna på medelvärden måste vi göra mätningar och dessa mätningar måste ha någon form av relevans för oss. Detta betyder att innan vi börjar mäta måste vi bestämma varför vi skall mäta, vad vi skall mäta och hur vi skall mäta. För att bli lite mer konkret tänker vi oss ett företag som sysslar med guldprospektering. Den första frågan varför får då svaret: För att hitta lönsam guldmalm. Vi kommer sedan över på frågan vad vi skall mäta guld så klart! Ja men hur? Så hamnade vi på den sista frågan hur innan vi besvarat vad. Detta är egentligen inget att förundras över de två frågorna hänger intimt samman. Hur prospekterar man guld? Min naiva tanke är att man i lämpligt område utför borrningar som ger borrkärnor. På lämpliga ställen på dessa borrkärnor gör man analyser av guldförekomsten hos, säg, en kubikcentimeter. Nu börjar det bli komplicerat ty vad du just läst innebär dels en metod för att välja borrhål och dels en metod för att välja ut de delar av borrkärnan som skall analyseras. Men vi har i varje fall kommit fram till svaret på frågan vad och det blev: Guldhalten i en (sammanhängande) kubikcentimeter borrkärna. Detta leder mig till att skapa följande storhet X = guldhalten i en cm 3 borrkärna. Eftersom vi kommer att analysera er prov, säg n, så erhåller vi n stycken guldhalter X ; X ; : : : ; X n. När vi så har erhållit dessa n guldhalter så måste vi fatta beslut om brytning eller ej och det är självklart så att om alla prov innehåller 00% guld så tar vi fram spaden och börjar gräva och om inget prov innehåller guld packar vi ihop vår utrustning för att pröva vår lycka annorstädes. Någonstans däremellan nns gänsen för brytvärd respektive ej brytvärd malm.

10 4.. Tre typer av medelvärden Vad vi nu har gjort är att skapa början till en modell av det som vi är intresserade av, i detta fall guldhalten, och vi har infört beteckningen X för att beteckna guldhalten hos en cm 3 malm innan vi ens har mätt denna halt. En naturlig beteckning för den faktiska uppmätta halten blir x så vi nner alltså de faktiska procentvärdena x ; x ; : : : ; x n t ex 0:00; 0:00; : : : ; 0:000. Nästa fråga är hur vi på bästa sätt skall hantera denna information för att avgöra om det nns brytvärt guld eller ej när vi tagit säg n = 000 prov. Detta blir för många värden för hjärnan att överblicka och vi behöver någon form av samlingsmått. Här skall vi endast ange ett (man kan tänka sig hur många som helst) som har blivit mycket grundligt studerat under århundrandenas lopp nämligen det aritmetiska medelvärdet X = nx X i n och dess observerade motsvarighet x = n i= nx x i. Vårt beslut att bryta eller ej kommer således att basera sig på talet x men hur beslutet skall fattas blir en senare historia. Vi skall nu gå över till att studera det aritmetiska medelvärdet och dess egenskaper men innan vi börjar med denna studie noterar vi ytterligare en sak om vårt exempel, nämligen: De värden som är möjliga att observera ligger alla mellan 0 och 00. Mängden av dessa tal betecknar vi med X och det gäller i= X = fx j 0 x 00g. Detta utläses "mängden omega-x där X antar alla reella tal mellan 0 och 00". Mängden X kallas X:s utfallsrum och anger precis de värden som är möjliga att erhålla vid en mätning av X. Sammanfattning Vi har infört beteckningen stor bokstav för det som vi skall mäta och liten bokstav för det som är uppmätt. De möjliga mätvärdena, utfallsrummet, betecknas med X eller alternativt (X).. Tre typer av medelvärden Ovan nämnde vi att det nns en uppsjö av samlingsmått men namngav bara ett det aritmetiska medelvärdet. Här skall vi börja med att kort

11 . Vad statistik handlar om 5 ta upp ytterligare två samlingsmått median och typvärde för att därefter ta itu med analysen av det aritmetiska medelvärdet... Median Om vi ordnar alla värden i växande storleksordning och sedan tar det mittersta värdet (om antalet mätningar är jämnt tar vi summan av de två mittersta värdena och delar med ) så får vi ett medelvärde som kallas median. Denna storhet har egenskapen att precis hälften av guldhalterna understiger medianen och den resterande hälften är större än medianen. Medianen är därför, för oss, en bra kandidat till ett medelvärde. Ovan har vi betecknat våra mätvärden med x ; x ; : : : ; x n och om vi ordnar dessa i växande storleksordning och inför beteckningen (i) för att beteckna det storleksmässigt i:te mätvärdet har vi för den ordnade mätmängden följande beteckning där det gäller att x () ; x () ; : : : ; x (n) x () x () x (n). Med detta skrivsätt de nerar vi nu medianen enligt De nition (Median) Med medianen, M (x), till mängden av mätvärden fx ; x ; : : : ; x n g menas talet 8 < M (x) = : x (k) n = k + x (k) + x (k+) n = k Medianen är således ett bra förslag på medelvärde och det är ett uppriktigt värde ty det är just det mittersta värdet av de givna värdena... Typvärde Ett annat uppriktigt värde är det så kallade typvärdet, T (x), som helt enkelt är det vanligast förekommande värdet. Detta värde kan dock vara svårt att de niera för många typer av mätvärden. Tag t ex längder av män och antag att vi mäter längden, i cm, hos 0 män och att vi då får längderna 73; 65; 78; 5; 73; 73; 79; 69; 89; 73.

12 6.. Tre typer av medelvärden Vi ser direkt att fyra av dem är 73 cm långa. Typvärdet skulle i detta fall bli just 73 cm. Men om vi nu tar och mäter längden av dessa 4 i mm så skulle vi troligtvis få att alla fyra har olika längd och typvärdet blir då ode nierat. Typvärdet är således inget bra mått för genomsnittligt värde eftersom det blir beroende av sorten. Ibland kan det dock ge en viss information...3 Aritmetiskt medelvärde Det artitmetiska medelvärdet är grundbulten inom statistik och denna bok. För att se detta måste vi ha ett exibelt exempel (eller snarare era) där vi kan exempli era olika egenskaper på sätt som är lätta att förstå. Eftersom detta är en bok i statistik, för ekonomer, med en speciell inriktning mot grunderna inom nansiell statistik så skall vi som utfallsrum betrakta Den Nordiska Börsen under 00 dagar. Detta utfallsrum är ändligt om än mycket stort och ändligheten behövs för att enkelt införa vissa storheter och begrepp. Bilda nu följande storheter X = Broström B, slutkurs mätt i ören, X = Atlas Copco B, slutkurs mätt i ören, X 3 = Rörvik Timber B, slutkurs mätt i ören. Observera här min petighet med angivande av mått och tidpunkt (statistiker blir lätt lite petiga eftersom de lärt sig att skit in blir skit ut, ursäkta svenskan). Den i:te dagens slutkurser ger vi beteckningarna X i, X i och X 3i där i = ; ; : : : ; 00. Statistiker har ett speciellt sätt att kalla sådana storheter: stokastiska variabler. Stokastisk betyder slumpmässig, så vi har slumpmässiga variabler eller kort och gott slumpvariabler. Ett alternativt sätt att uttrycka sig blir då: X, X och X 3 är tre stokastiska variabler. Detta uttryckssätt kommer att spara en hel del trycksvärta framöver samt underlätta införandet av nya begrepp, men visst blir det mer abstrakt. Men med abstraktionen följer å andra sidan en betydligt ökad tillämplighet ty jag behöver inte nämna några aktier dessa ingår som specialfall. Vårt exempel med en aktieportfölj kan då innefattas i de tre stokastiska variablerna X, X och X 3 på det ändliga utfallsrummet (X) = fx j x f0; 0:0; 0:0; : : : ; 300:00gg = f0; 0:0; 0:0; : : : ; 300:00g. Den Nordiska Börsen nns på adressen (00706). Atlas Copco B kostade i skrivande stund mest ca 45 kronor.

13 . Vad statistik handlar om 7 Med detta exempel i bakhuvudet betraktar vi nu det abstrakta men ändliga utfallsrummet (X) = fx ; x ; : : : ; x N g av storlek N. Det aritmetiska medelvärdet, A (X), de nieras av att man summerar alla mätvärden och dividerar med antalet summerade värden d v s man bildar A (X) = x + x + + x N N och vi skall närmast undersöka vilka egenskaper denna storhet har. Balanseringspunkt Antag att vi har två lika vikter om v kg utplacerade på en homogen planka. Den första vikten be nner sig på avståndet x från plankans vänstra ändpunkt och den andra på avståndet x från samma punkt. Hur kan vi nu bestämma den punkt (jämviktspunkt, balanseringspunkt) på plankan där de två vikternas inverkan tar ut varandra d v s där vi skall placera en bock för att erhålla balans. v x v x?? x x x x x 3 (a) (b) v 3 v x v x v? v? x x x x x 3 (c) (d) Figur.: Balanseringspunkter i fyra olika typfall

14 8.. Tre typer av medelvärden Beteckna denna balanspunkt med x. Vi vet enligt fysikens lagar (eller om man så vill enligt lekparkens) att följande jämviktsekvation ( gur.a) måste gälla (x x ) v = (x x) v. Ur denna ekvation är det lätt att lösa ut den sökta punkten, x = x + x. Men vi skall också skriva jämviktsekvationen på ett annat sätt nämligen (x x) v + (x x) v = 0 ty denna form låter sig lätt generaliseras både till ett godtyckligt antal vikter och godtyckliga vikter. Antag först att vikterna är v och v istället för v ( gur.c). För att jämvikt skall gälla måste fortfarande (x x ) v = (x x) v, (x x) v + (x x) v = 0 och ur denna ekvation erhålls x = v x + v x v + v. Antag nu att vi har tre lika vikter v på avstånden x, x och x 3 och söker jämviktspunkten för dessa tre vikter ( gur.b). Vi konstaterar då först att de två första vikterna kan ersättas med vikten v i x (där vi lagt till index i x för att markera två vikter). Därefter har vi ånyo två vikter men denna gång med vikterna v på avståndet x respektive v på avståndet x 3. Detta ger jämviktsekvationen varur vi erhåller (x x 3 ) v + (x 3 x 3 ) v = 0 x 3 = vx + vx 3 3v = v (x + x ) + vx 3 3v = x + x + x 3. 3 Man övertygar sig lätt (?) om att jämviktsekvationen i detta senare fall kan skrivas (x x) v + (x x) v + (x 3 x) v = 0.

15 . Vad statistik handlar om 9 Den allmäna jämviktsekvationen med tre olika vikter v, v och v 3 på avstånden x, x och x 3 blir analogt varur vi erhåller (x x 3 ) v + (x x 3 ) v + (x 3 x 3 ) v 3 = 0 x 3 = v x + v x + v 3 x 3 v + v + v 3 3X v i = x i P 3 j= v. j i= Medelst ett enkelt induktionsbevis (se Introduktion till den ekonomiska matematiken) kan man nu visa (för dem som inte tror på sanningshalten) att det allmänt gäller x n = nx i= x i v i P n j= v j = nx x i p i för n olika vikter på olika avstånd. Den införda storheten p i kommer vi behandla utförligt längre fram. Storheten x n kallas det aritmetiska medelvärdet och för specialfallet v i = v erhålls, som ett specialfall, den storhet som vanligtvis förknippas med A (x), det aritmetiska medelvärdet baserat på n mätvärden. Tre egenskaper Funktionen A (X) har tre viktiga egenskaper som alla synes vara självklara men som inte desto mindre är av stor betydelse. För den vidare framställningen behöver vi De nition Med X avses följden av tal fx ; x ; : : : ; x N g = fx i g N i=. Vi skriver nu X 0 när alla X i 0. X = när alla X i =. Den första egenskapen hos funktionen A (X) kan nu skrivas: ) om X 0 så gäller att A (X) 0. Trivialt sant ty summerar man positiva tal så blir summan positiv. Den andra egenskapen är ) om X och X är två stokastiska variabler och c och c är två rella tal så gäller att i= A (c X + c X ) = c A (X ) + c A (X ).

16 0.3. Tre typer av avvikelser Tänk bara på en portfölj som består av två aktier. Oavsett om vi betraktar protföljen som helhet eller varje aktie för sig så skall ju slutresultatet bli detsamma. Den tredje och sista egenskapen är 3) Om X = så gäller att A () =. Sätt X i = i uttrycket för A (X) varvid påståendet följer direkt. Funktionen A (X) kallas inom matematiken, en normaliserad linjär operator och till dessa har vi anledning att återkomma många gånger. Vidare noterar vi att alla resonemang går igenom även om utfallsrummet är oändligt. Ofta har vi inte tillgång till hela utfallsrummet utan endast en del av det, säg n värden, d v s vi har ett urval. Vi kan då inte beräkna A (X) men väl A (x) där Här gäller för subindex I i att x = fx Ii g n i=. om det i:e värdet i X är med i urvalet, I i = 0 annars. Detta senare värde A (x) används sedan som en approximation av det förra A (X). Det gäller naturligtvis att för olika urval x erhålls olika värden på A (x) och dessa är med säkerhet skilda från det sanna värdet A (X). Då uppstår två naturliga frågor: ) hur utspridda är de olika värdena på A (x) och ) hur nära kan A (x) tänkas vara det sanna värdet A (X)..3 Tre typer av avvikelser Under denna rubrik kommer vi uteslutande betrakta det aritmetiska medelvärdet och lämnar de två andra medelvärdena median och typvärde åt sitt öde. I och med detta kan vi också kalla det aritmetiska medelvärdet för medelvärdet kort och gott. Medelvärdet ger oss en balanseringspunkt för vikter på en planka. Denna bild förs nu enkelt över till ett två-dimensionellt koordinatsystem där vikterna symboliseras av pinnar, med olika höjd, utplacerade på x- axeln. Pinne nummer i be nner sig på avstånd x i från origo (Detta har vi egentligen redan gjort i gur.). För att vara helt generella från början räknar vi avstånd med tecken. Om vi nu normerar pinnarnas sammanlagda höjd, p i, till d v s så att P N till att jag införde beteckningen p i för v i PN j= vj i= p i = så ser vi ett skäl (p för normerad pinne )

17 . Vad statistik handlar om ovan ty för vikterna gäller att NX i= v i P N j= v j P N i= = v i P N j= v j =. De nition 3 (Aritmetiskt medelvärde) Med det aritmetiska medelvärdet förstås den storhet (operator) som beskrivs av uttrycket där p i = A (X) = P vi N och fx i g N j= vj i= = X. NX x i p i Det är nu klart att två olika uppsättningar pinnar kan ha samma balanseringspunkt men till sin struktur vara helt olika. Vi skall därför införa tre olika mått (varians, skevhet och toppighet), som beskriver tre ytterligare egenskaper, för en uppsättning pinnar. i=.3. Varians standardavvikelse I nedanstående gur ser vi dels två lika stora pinnar nära varandra och dels samma pinnar långt ifrån varandra (pinnen i mitten är inte en pinne utan en pil y-axeln). (a) x = x = + x = 00 x = +00 (b) Figur.: Variansen i två olika typfall Vi nner lätt de två gurernas medelvärden till x = X i= x i p i = x + x respektive x = 4X i=3 x i p i = x 3 + x 4

18 .3. Tre typer av avvikelser och dessa medelvärden hamnar båda mittemellan de två positionerna, x och x respektive x 3 och x 4, men ändock ger gurerna helt olika intryck. Ett mått som mäter detta intryck är variansen (standardavvikelse) som för dessa två fall de nieras av X 4X = (x i x ) p i respektive = (x i x ) p i. i= För att övertyga oss om att variansen är ett mått på den visuella skillnaden i gurerna.a och.b beräknar vi varianserna för de storheter som ingår i respektive gur (med de angivna valen blir x = 0 och x = 0) och erhåller = = X i= 4X i=3 (x i ) = ( ) + () = i=3 (x i ) = ( 00) + (00) = En tydligare skillnad än den mellan och 0 000, kan vi inte önska oss. För att få samma sort som för medelvärdet brukar man dra roten ur variansen och får då standardavvikelsen. Man erhåller vårt exempels standardavvikelser till respektive 00. Allmänt gör vi följande de nition De nition 4 (Varians) Variansen för den stokastiska variabeln X med utfallsrummet X, med N element, de nieras av där X = A (X). = NX i= x i X pi Med den ovan införda linjära operatorn A (X) kan variansen även skrivas 3 = A X X = A X X och vi nner följande identitet A X X = A X X X + X = A X XA (X) + X A () = A X A (X) 3 Det är lite otympligt att skriva A (X c) så det nns en oskriven överenskommelse att man istället skriver A (X A (X) A (X). c) vidare skriver man A (X) för att beteckna

19 . Vad statistik handlar om 3 ty A (X) = X..3. Skevhet Nästa steg är att beskriva begreppet skevhet och i gur.3 sid 3 är a) skev åt vänster, b) symmetrisk och c) skev åt höger. p p 3 3 (a) 9 (b) p 3 (c) 9 Figur.3: Skevheten i tre olika typfall Liksom ovan betraktar vi avståndet till medelvärdet och den allmäna de nitionen av skevhet i utfallsrummet X är talet A X X 3. För detta tal kan vi visa följande identitet A X X 3 = A X 3 3 XA X + 3 X A (X) X 3 = A X 3 3 XA X + X 3. För alla tre gurer ovan gäller att p i = 3. Vi nner nu skevheten i de tre fallen i gur.3 till:

20 4.3. Tre typer av avvikelser a) x =, x = och x 3 = 9 vilket ger x = 4 och skevhetens värde blir ( 4) ( 4)3 3 + (9 4)3 3 = 30, b) x = 3, x = 4 och x 3 = 5 vilket ger x = 4 och skevhetens värde blir (3 4) (4 4)3 3 + (5 4)3 3 = 0, c) x =, x = 8 och x 3 = 9 vilket ger x = 6 och skevhetens värde blir ( 6) (8 6)3 3 + (9 6)3 3 = 30. Det gäller således att om den största tyngden nns till vänster om medelvärdet så erhåller vi en positiv skevhet, om tyngden är jämnt utspridd, d v s vi har symmetri, så erhåller vi skevheten 0 och slutligen om den största delen av tyngden ligger till höger om medelvärdet så har vi en negativ skevhet. För att få en dimensionslös storhet på skevheten används vanligen följande de nition på skevhet: De nition 5 (Skevhet) Skevheten för den stokastiska variabeln X med utfallsrummet X, med N element, de nieras av.3.3 Toppighet = A X X 3 3. Sista steget är att beskriva begreppet toppighet och om vi fortsätter på den inslagna vägen med högre potenser så de nerar vi toppigheten i utfallsrummet X som talet A X X 4. För toppigheten gäller följande identitet A X X 4 = A X 4 4 XA X X A X 4 X 3 A (X) + X 4 = A X 4 4 XA X X A X 3 X 4. För alla fyra del gurer i gur.4 sid 5 gäller att x = ; x = och x 3 = 3 vilket, tillsammans med värdena på p, p och p 3, ger x = i samtliga fall. Vi nner nu toppigheten i de fyra fallen till:

21 . Vad statistik handlar om 5 p p (a) 3 4 (b) 3 p p (c) 3 (d) 3 Figur.4: Toppigheten för fyra olika typfall a) p = 8, p = 3 4 och p 3 = 8 ger värdet ( ) ( ) (3 )4 8 = 0:5, b) p = 4, p = 4 och p 3 = 4 ger värdet ( ) ( )4 8 + (3 )4 4 = 0:5, c) p = 3, p = 3 och p 3 = 3 ger värdet4 ( ) ( )4 3 + (3 )4 3 = 0:66 6, d) p = 3 8, p = 8 och p 3 = 3 8 ger värdet ( ) ( )4 8 + (3 )4 3 8 = 0:75. 4 ett streck över talet, som i 6, betyder att 6 skall upprepas i all oändlighet.

22 6.4. Tre typer av gram Figur a) ger ett spetsigare intryck än gur b) och har även ett mindre värde på toppigheten. Figur b) är i sin tur spetsigare än gur c) som i sin tur är spetsigare än d) (som är urgröpt) och vi får hela tiden störra värden. Toppighet mäter således en gurs spetsighet. För att få en dimensionslös storhet på toppigheten används vanligen följande de nition på toppighet De nition 6 (Toppighet) Toppigheten för den stokastiska variabeln X med utfallsrummet X, med N element, de nieras av = A X X där trean inte kan förklaras på nuvarande stadium (egentligen är den helt onödig) utan vi får återkomma till den längre fram..4 Tre typer av gram Vi skall nu undersöka den information som nns i p i :na i operatorn A (X). Låt oss göra det utifrån exemplet med 00 dagars slutkurser i aktien Rörvik Timber B (period år 006). För denna har vi modellen X 3 = Rörvik Timber B, slutkurs mätt i 0-ören. där utfallsrummet är en uppräkning av de kurser som faktiskt noterats (X) = f6:8; 6:9; 7:; 7:; 7:3; 7:4; 7:5; 7:8; 7:9; :8; ; : : : ; :; :4; :5; :6; 3:5; 3:6; 3:7; 3:8; 3:9; 4; 4:4; 4:5g Slutkurserna i tidsordning kan ses i tabellen nedan (vilken skall läsas från vänster till höger, uppifrån och ned).4. Stolpdiagram och kumulerat stolpdiagram Om vi beräknar medelvärdet av dessa slutkurser så erhålls A (X) = x + x + + x = 0:869. Nu är det väl inte så intelligent att räkna ut medelvärdet av aktiekurser 5 men i detta läge är vi ute efter något annat. Vi vet nämligen också att 5 Aktiekurser vandrar och man är mer intresserad av vart de är på väg.

23 . Vad statistik handlar om 7 Tabell.: Slutkurser Rörvik Timber B, :0 7:3 8:0 7:5 7:3 7: 7: 6:8 7: 7: 6:9 7:4 7: 7: 7:3 7: 7:8 7:5 8:7 8:4 8:0 8: 7:9 9:5 9:3 9:4 0:8 0:7 : :3 : :0 0:6 0:9 :3 :3 0:8 :4 : :5 :8 0:7 0:5 0:7 : 0:5 0: 0:3 0:0 0:6 0:8 0:6 : :3 : 0:7 0:5 :0 :8 :3 :5 :8 :3 0:9 0:5 0:5 :3 :4 :4 :4 :6 :8 3:0 3: 4:0 3:5 3:8 3:9 3:6 3:6 3:0 :0 :4 :9 3:0 4:0 3:7 4:0 4:4 4:5 3:5 3:8 :7 3:0 : :7 3:0 4:0 3: vårt medelvärde kan skrivas X00 A (X) = i= x i v i P N j= v j X00 = x i p i där talen v i står för vikter. Genom att sortera ovanstående slutkurser i stigande ordning och därefter räkna antalet gånger en kurs inträ ar kan vi bilda paren (x i ; v i ) och medelst ett stolpdiagram beskriva hur ofta t ex kursen 8 förekommer. Vi ser i gur.5 att detta värde förekommer precis 3 gånger. Detta betyder att att värdet 8 förekommer 3 gånger bland de 00 värdena d v s att chansen för att få 8 vid lottdragning bland de 00 slutkurserna är 3 på 00 eller som vi också säger 3%. Nu kan vi resonera på samma sätt för vart och ett av de i (X) ingående talen och erhåller då en följd av procentsi ror: p = %, p = %, p 3 = 4%, o s v speciellt ser vi att p 8 = 7%. Om vi nu istället för Antal på y-axeln inför Procent, eller helt enkelt bara talet p, så erhåller vi vad vi skall kalla det relativa stolpdiagrammet och det är detta diagram som kommer att användas framöver. Givet detta diagram kan vi snabbt utläsa påståenden av typen i= Sannolikheten för att X 3 = 0:9 är 0:0. 6 Vi ritar inte om det relativa stolpdiagrammet utan nöjer oss med att konstatera att de ändringar som behöver göras är att byta ut si rorna på y-axeln (t ex 7! 0:7) samt skriva p istället för Antal. Ett annat viktigt diagram som i sig innehåller materialet till ett mycket viktigt verktyg, som vi har anledning att återkomma till längre 0:0. 6 I matematiken lär vi oss att procent kan skrivas som hundradelar d v s att % =

24 8.4. Tre typer av gram Antal Rörvik Timber Figur.5: Stolpdiagram över slutkurser i Rörvik Timber B, period fram, är det relativa kumulerade stolpdiagrammet. Detta diagram bestäms av punkterna! nx x n ; x i p i ; n = ; ; 3; : : : ; 00. i= Vi skriver inte upp dess matematiska de nition, som bara blir krånglig, utan nöjer oss med gur.6. p Rörvik Timber Figur.6: Kumulerat stolpdiagram över slutkurser i Rörvik Timber B, period Observera att det kumulativa relativa stolpdiagrammet alltid är växande och går från 0 till.

25 . Vad statistik handlar om 9 Exempel (SQL-anrop) Till en resebyrås databasserver inkommer SQL-anrop och den dataansvarige har under dagens brådaste timme noterat hur många anrop som anländer varje minut (och varje anrops svarstid) och därvid erhållit bland annat följande tabell över anropen Materialet är tänkt att användas för att söka svar på frågor som: Klarar servern alltid av att besvara frågorna inom rimlig tid? Hur stor andel av tiden har servern inga frågor att besvara? Finns det risk för att servern kan bli överbelastad, så att svarstiderna blir orimliga, och i så fall hur stor är denna risk? Vi har ännu inte alla de verktyg som behövs för att kunna besvara dylika frågor men för en första analys kan vi alltid uttnyttja de vi har. Till att börja med beräknar vi de fyra måtten x s g g Medelvärde Varians Skevhet Toppighet 5:90 5:4 0:08 0:39 Vidare nner vi materialets relativa stolpdiagram och relativa kumulerade stolpdiagram se gur.7a och.7b. p p A n r o p A n r o p (a) Stolpdiagram (b) Kumulerat stolpdiagram Figur.7: SQL-anrop till en server.4. Histogram och kumulerat histogram Hitills har vi betraktat de möjliga slutkurserna för Rörvik Timber B som varande ett ändligt antal men en stunds eftertanke ger att detta

26 0.4. Tre typer av gram utfallsrum bara är en approximation av alla de möjligheter som nns. Det skulle därför inte vara helt fel att för Rörvik Timber B tänka sig ett utfallsrum av typen X = fx j 6:8 x 4:5g. Detta utfallsrum består då av oändligt många punkter och idén med stolpdiagram fungerar inte längre. Vad vi då kan göra är att fösa ihop alla observationer i ett intervall t ex kan vi notera antalet observationer mellan 6:8 x < 6:9, mellan 6:9 x < 7 o s v. Den uppmärksamme ser nu att vi i princip är tillbaks till stolpdiagrammet men nu från en annan utgångspunkt. Vidare är valet av intervall godtyckligt ty jag kunde lika gärna ha valt intervallen 6:8 x < 7, 7 x < 7: o s v eller varför inte olika intervalllängder 6:7 x < 7:3, 7:3 x < 7:7 o s v. Alla varianter kan förekomma och vissa av dem är bättre på att avslöja inneboende strukturer hos data än andra. För att komma fram till en avslöjande intervallindelning nns ingen annan metod än att göra intelligenta prövningar. Till varje indelning hör ett histogram och dess kumulerade histogram och vi skall för vår illustration välja indelningen 6 x < 7, 7 x < 8 o s v se gur.8a och b. Exempel (Skogsområde) Vid försäljning av ett skogsområde skall områdets värde i form av avverkningsbart timmer uppmätas. För att göra detta indelades området i ett rutnät om N rutor ur vilka 49 rutor togs slumpmässigt. I varje utvald ruta uppmättes därefter volymen timmer varvid följande avrundade värden, i något mått, erhölls 0:7 0:9 :0 :3 :9 :7 3: 3:4 3:4 3:5 3:5 4:3 5: 5:9 6:0 6:3 6:5 6:6 7: 7:4 7:6 7:9 8:3 8:3 8:3 8:3 8:7 0:0 0:0 0:3 :0 3:4 4: 4:8 6:7 6:8 7: 7:7 8:9 9:0 9:4 9:7 4:3 6: 6: 8:3 3:7 39:3 44:8 Analysera materialet och skatta den totala mängden timmer i skogsområdet. Data är de nierat på ett sådant sätt, volymmått, att det kan betraktas som kontinuerligt. De fyra måtten blir x s g g Medelvärde Varians Skevhet Toppighet :0 00:0 339:5 45

27 . Vad statistik handlar om p (a) Histogram p (b) Kumulerat histogram Rörvik Timber Rörvik Timber Figur.8: Två typer av gurer över slutkurser i Rörvik Timber, period Vi ser att standardavvikelsen (roten ur variansen) är stor jämfört med medelvärdet och det är därför av vikt att nna data:s underliggande struktur. Skevheten säger oss att det mesta av data ligger till vänster om medelvärdet. Vårt nästa steg blir att rita några lämpliga histogram se gur.9 på sid. Observera att data självt informerar oss om att en symmetrisk fördelning inte kan föreligga. I det vänstra histogrammet har vi lika stor bas på alla rektanglar (vilket är olämpligt vid skeva fördelningar) och i det högra histogrammet gäller istället att varje rektangel har lika stor yta.det vänstra diagrammet är förvisso skevt men alltför grovt för att ge en bra bild över data. I det högra diagrammet ger vi varje rektangel en lika stor yta och detta ger en bättre bild över hur data fördelar sig på ytor med lite respektive mycket timmer. De två första diagrammen bekräftar således den skevhet som anges av talet g. Vårt nästa steg blir att pröva med en nare indelning som tar hänsyn till att det nns mer data i början. Därvid erhålls digram (c) som, av ännu ej diskuterade skäl, ger en bra beskrivning av data.

28 .4. Tre typer av gram (a) Lika intervall, total yta= (b) Lika ytor, total yta= (c) Olika intervall, total yta= Figur.9: Försäljning av ett markområde

29 . Stokastiska variabler, väntevärden och sannolikheter I avsnittet om Vad statistik handlar om infördes en mängd nya begrepp på intuitiv grund och vi skall nu ägna ett par kapitel åt att formalisera och exakt de niera vad vi menar med begrepp som stokastisk variabel, väntevärde (synonym till vårt aritmetiska medelvärde), sannolikhet (våra pinnar) och fördelningsfunktion (våra diagram). Observera att om man inte är noggrann inom statistik så kan man bevisa vad som helst t ex att gud nns eller att medlemmarna i Stockholms Kooperativa Hyresförening vill ha höga hyror och många andra tokigheter. I detta kapitel börjar vi med att diskutera begreppet stokastisk variabel.. Diskret och kontinuerlig Trot det eller ej men en stokastisk variabel är faktiskt en funktion så egentligen verkar benämningen variabel helt korkad. Men för er som läst lite matematik och speciellt då funktionslära vet att man kan skapa en funktion av en funktion och då är den ena funktionen en variabel till den andra (i matematisk formalism blir det att funktionerna f(x) och g(x) båda med variabeln x ger upphov till funktionen f(g(x)) och g(x) som faktiskt är en funktion blir en variabel till f(x)). För att erhålla en intuitiv förståelse för detta tänker vi på situationen kast med en tärning där vi intresserar oss för antalet prickar som kommer upp d v s vi bildar den stokastiska variabeln X = antal prickar som erhålls vid kast med en tärning. Vad vi oftast tänker på i denna situation är antalet prickar men det egentliga utfallsrummet innehåller sådana händelser som att tärningen hamnar på kanten eller hörnet. Även hur tärningen är vriden i förhållande till något godtyckligt koordinatsystem kommer in. Vår hjärna applicerar dock en funktion som bortser från dessa möjligheter, den lterar bort dem, och det enda som återstår är "antalet prickar". En mer 3

30 4.. Diskret och kontinuerlig korrekt beskrivning av vår variabel X är därför X (!) = antal prickar som erhålls vid kast med en tärning. för alla! i mängden av alla möjliga utfall. Detta ger oss nu en anledning att ta upp skillnaden mellan utfallsrummen och X. Med utfallsrummet menar vi de nitionsmängden till den stokastiska variabeln X och med X avses X:s värdemängd. Om t ex = f! ;! ; : : :g så blir X = fx (! ) ; X (! ) ; : : :g och om är uppräkneligt så blir också X det. Vidare nns inget slumpmässigt i talet X (! k ) och vi betcknar det därför med x k och har därför att X = fx ; x ; : : :g. Observera att mycket väl kan vara större än X ty det kan t ex gälla att X (! i ) = X (! j ). Om vi t ex intresserar oss för familjer så består dessa ofta av er än en person men varje person i familjen är en representant för familjen. Detta resonemang är även giltigt för icke-uppräkneliga utfallsrum t ex kan sex, vid kast med tärning, komma upp på ett oändligt antal sätt om man beaktar vridningar i förhållande till något xerat koordinatsystem. Stokastiska variabler delar naturligt in sig i två grupper dels de som är diskreta och dels de som är kontinuerliga. Vårt nästa steg är att de niera vad vi menar med de två orden diskret och kontinuerlig och för att de niera dem använder vi oss av utfallsrummets struktur. Om utfallsrummet för den stokastiska variabeln X kan skrivas X = fx i j i N \ Bg där N är de naturliga talen (de positiva heltalen) d v s ; ; 3; : : : och B någon form av begränsning säges utfallsrummet vara diskret (uppräkneligt). Till denna typ av utfallsrum hör mängden av de naturliga talen, de hela talen, de rationella talen och många er mängder. Mängderna behöver inte ens bestå av tal utan kan vara alla pilsnerkorvar i ett snabbköp. Det enda kravet är att elementen (talen, pilsnerkorvarna m m) i vårt utfallsrum inte får vara er än de naturliga talen (märkligt men sannt men de hela talen är lika många som den naturliga talen). Med en diskret stokastisk variabel avses sålunda den funktion som har ett diskret utfallsrum (X). Med begränsningen B = f; ; 3; 4; 5; 6g svarar vårt (X) ovan de nitivt mot en diskret stokastisk variabel. Om utfallsrummet kan skrivas X = fx j x R \ Bg Detta är vid en noggrannare analys inte helt korrekt men synsättet duger mer än väl. I löpande text skriver vi (X) och i formelområden X om vi nu överhuvudtaget bryr oss om att ange X.

31 . Stokastiska variabler, väntevärden och sannolikheter 5 där R är de reella talen och B någon form av begränsning säges utfallsrummet vara kontinuerligt (icke-uppräkneligt). Ett exempel på en stokastisk variabel som ger upphov till ett kontinuerligt utfallsrum är X = längden hos en homo sapiens. Här är en möjlig begränsning på längden cm till 400 cm (även om längden cm måste vara en kort rackare) ty längden måste vara positiv och människan kan inte bli hur lång som helst. Vi har således X = fx j x R \ (; 400)g där begränsningen B är intervallet cm till 400 cm. Detta utfallsrum kan även skrivas X = fx j x 400g och det behövs mycken eftertanke för att visa att punkterna i denna mängd ej är möjlig att räkna upp. Än mer märkligt är att antalet punkter i intervallet (; 400) är lika många som antalet punkter i intervallet (0; ). 3 De nition 7 En stokastisk variabel säges vara diskret om dess utfallsrum är uppräkneligt och kontinuerlig om dess utfallsrum är ickeuppräkneligt.. Väntevärden I vår de nition av A (X) utgick vi ifrån ett ändligt utfallsrum och kunde visa att funktionen A (X) uppfyller följande tre egenskaper. Om X 0 ) A (X) 0. Om X och X är två stokastiska variabler och c ; c R så gäller att A (c X + c X ) = c A (X ) + c A (X ). 3. A () =. Vi skall nu utvidga storheten A (X) till att gälla för godtyckliga diskreta (d v s även sådana med uppräkneligt oändliga utfallsrum) och kontinuerliga stokastiska variabler och vi gör detta axiomatiskt (med icke bevisbara påståenden som vi tror på) genom att stipulera att väntevärdet (ett generaliserat medelvärde, även kallat det förväntade värdet) E (X) är en storhet som uppfyller följande 3 Beviset för detta påstående är dock helt elementärt bara man skapar rätt geometrisk bild.

32 6.. Väntevärden Axiom 8 (Väntevärde) För en godtycklig stokastisk variabel X gäller. Om X 0 ) E (X) 0.. Om X och X är två stokastiska variabler och c ; c R så gäller att E (c X + c X ) = c E (X ) + c E (X ). 3. E () =. Detta betyder att även E (X) är en normaliserad positiv linjär operator (på samma sätt som A (X)). Eftersom vi nu tillåter oändliga utfallsrum behöver vi ytterligare ett "axiom" 4. Givet stokastiska variabler fx i g som växer monotont (X i X i+ ) mot en x gräns X då gäller för dessa stokastiska variabler att lim E (X i) = E lim X i = E (X) i! i! d v s att vi kan låta symbolerna E och lim byta plats. Nu behövs egentligen inte detta fjärde axiom ty det går att visa att det, under vissa förutsättningar, gäller och därmed är det inte ett axiom utan ett bevisbart påstående. Axiomen ger oss direkt följande viktiga samband. Theorem 9 För väntevärdesoperatorn E har vi att. för godtyckliga X i (X) och c i R så gäller E! nx nx c i X i = c i E (X i ). i= i=. om X Y X så gäller E (X ) E (Y ) E (X ). Bevis ) Axiom och induktionsbevis ger påståendet. ) Den första olikheten följer av axiom och eftersom varav det följer Y X 0 ) E (Y X ) 0 ) E (Y ) E (X ) 0 E (Y ) E (X ). Den andra olikheten följer på samma sätt.

33 . Stokastiska variabler, väntevärden och sannolikheter 7 Ibland kan det inträ a att E (X ) = + och E (X ) = så att E (X + X ) = +. Detta är ett obestämt tal. Vi löser detta problem genom att helt enkelt inskränka oss till de variabler där detta inte kan inträ a (prata om gordisk lösning) genom att kräva att.3 Sannolikhet E (jxj) < +. Hitills har vi undvikit begreppet sannolikhet även om vi pratat om chans och pinnar vilka båda i princip är synonyma med detta begrepp. Detta beror på att vi vill sätta den sannolikhet vi skall prata om på en objektiv och matematiskt formell grund. Låt vara ett utfallsrum och tag en delmängd A. 4 Bilda nu den stokastiska variabeln (en s k indikatorvariabel)! A I A (!) = 0! = A som indikerar om! nns i mängden A eller ej. De niera sedan sannolikheten för A genom relationen P (A) = E I A (!). (.) Notera att P sannolikheten i sig är en funktion vars de nitionsområde är alla (ja de viktigaste i varje fall) delmängder i utfallsrummet. En indikatorfunktion har ett par trevliga egenskaper. Om A och B är två delmängder i så ger gur. på sid 8 och en stunds eftertanke att. I A[B (!) = I A (!) + I B (!) om A och B är disjunkta,. I A\B (!) = I A (!) I B (!). Dessa egenskaper låter sig lätt utvidgas, med hjälp av induktion, till att gälla för n disjunkta mängder. I följande exempel, baserat på ett diskret utfallsrum, skall ordet symmetri tolkas som att ha identiska egenskaper. 4 Läsaren må se upp här därför att beteckningen A, nu och framledes, står för två olika saker. Sammanhanget avgör om vi betraktar en delmängd eller ett medelvärde.

34 8.3. Sannolikhet A B A B (a) Union A [ B (b) Snitt A \ B Figur.: Illustration av union och snitt Exempel 3 Bilda den stokastiska variabeln X = antalet prickar vid kast med en symmetrisk tärning. Det gäller då att X = f; ; 3; 4; 5; 6g ty det är endast dessa tal vi intresserar oss för. Eftersom X kan delas upp i sex disjunkta delmängder X = fg [ fg [ f3g [ f4g [ f5g [ f6g erhålls med upprepad användning av. ovan och axiom för väntevärdet att! 6X P ( X ) = E (I X (!)) = E I fig (!) = = 6X E I fig (!) = i= 6X p i. i= i= 6X P (fig) Att tärningen är symmetrisk betyder att varje möjligt utfall har samma sannolikhet (identisk egenskap) d v s p i = p och detta tillsammans med axiom 3 för väntevärdet ger oss = E (I X (!)) = P ( X ) = i= 6X p i = i= 6X p = 6p i=

35 . Stokastiska variabler, väntevärden och sannolikheter 9 varför sannolikheten p erhålls till (förvånad?) p = 6. I detta exempel har vi att elementarmängden 5! är en av mängderna fig, för något i. Observera att det är skillnad på fig och i den första storheten är en mängd och den andra ett tal. Detta gör att vi kan ställa och besvara frågor av typen vad är sannolikheten att få mer än tre prickar vid kast med en symmetrisk tärning. Exempel 4 Bilda den stokastiska variabeln X = antal prickar vid kast med en symmetrisk tärning där X = f; ; 3; 4; 5; 6g. Vi har nu att den efterfrågade sannolikheten kan skrivas P (X > 3) = P (f4g [ f5g [ f6g)! 6X = E I fig (!) = i=4 6X E I fig (!) i=4 = P (f4g) + P (f5g) + P (f6g) = 3 6 = 0:5. Nåväl, inte orkar man skriva hela uppsatser för de enklaste problem så istället skriver man kortare P (X > 3) = gynnsamma utfall för fx > 3g möjliga utfall = 3 6. Med hjälp av de fyra axiomen, för väntevärdet, kan vi nu generellt ange sannolikheterna för alla delmängder A, på det diskreta utfallsrummet = f! k g kn, till P (A) = E I A (!) = X! k A P (! k ). (.) 5 En av de minsta möjliga delmängderna d v s den innehåller ingen annan delmängd än sig själv.

36 30.3. Sannolikhet Sannolikheten p k = P (! k ) är sannolikheten för en av de ömsesidigt uteslutande händelserna (kallade elementarhändelser 6, t ex att få en sexa) och denna sannolikhet kan vara godtycklig så länge som axiomen ovan är uppfyllda d v s den behöver inte anta ett och samma värde för alla k. Ovanstående ger oss följande alternativa, komplementära, sätt att beräkna sannolikheter som vi kommer ha stor nytta av framöver. Theorem 0 För varje utfallsrum = f! ;! ; : : : ;! N g där de tillhörande sannolikheterna p ; p ; : : : ; p N alla är rationella tal så gäller för en godycklig delmängd A i att P (A) = gynnsamma utfall för A möjliga utfall Bevis Vi kan i ett första steg betrakta utfallsrummet 0 =! ; f! ; : : : ;! N g = f! ;! 0 g med sannolikheterna p och p 0. Det gäller nu att kvoten p p 0 är ett rationellt tal och det nns därför tal k och l sådana att i utfallsrummet 00 = f! ; : : : ;! k ;! 0 ; : : : ;! 0 lg, där! = =! k och! 0 = =! l 0, har alla elementarhändelser samma sannolikheter p 00 = k+l. Sålunda inses att varje utfallsrum = f! ;! ; : : : ;! N g kan utvidgas till ett nytt och större utfallsrum 0 = f! ; 0! ; 0 : : : ;! N 0 0g där varje elementarhändelse har samma sannolikhet p = N. Det gäller därför att 0 P (A) = X ia = E I (! i) 0 = X p = ia gynnsamma utfall för A möjliga utfall antal elemtarhändelser i A N 0 6 Händelse och mängd är synonyma ord för samma sak. Händelse är vardagsspråk och mängd matematikspråk.

37 . Stokastiska variabler, väntevärden och sannolikheter 3 Låt nu X vara en godtycklig stokastisk variabel på utfallsrummet och I f!k g (!) vara indikatorfunktionen för elementarhändelsen! k. Observera att X är en funktion på utfallsrummet varav följer att uttrycket X (!) = X I (! k ) X (! k ) för!! k är välde nierat för diskreta utfallsrum. Om vi nu använder förväntningsoperatorn E på detta uttryck så erhålls E X (!) = X E I f!k g (!) X (! k ) = X E I f!k g (!) X (! k )! k = X! k X (! k ) p k! k ty X (! k ) är ett xt reellt tal. Detta innebär att vi nu har en metod för att räkna ut väntevärdet för en diskret stokastisk variabel om vi känner till de enskilda sannolikheterna p k. Exempel 5 Bilda den stokastiska variabeln X = antal prickar vid kast med en symmetrisk tärning där X = f; ; 3; 4; 5; 6g. För denna variabel gäller att p k = P (X = k) = 6 ; k X och vi nner det förväntade antalet prickar till E (X) = 6X x 6 = 3:5. x= Ett resultat som vi intuitivt känner för ty det är inget annat än balanseringspunkten för talen ; ; 3; 4; 5; 6 alla med lika sannolikhet (vikt). Vi har nu ett uttryck för sannolikheten av en mängd A i ett diskret utfallsrum men vi saknar motsvarande uttryck för de kontinuerliga utfallsrummen. När det gäller diskreta utfallsrum så är dessa hanterbara på en elementär nivå ty vi kan alla räkna ; ; 3; : : : och det är allt som behövs. Men de kontinuerliga utfallsrummen skapar problem av en helt annan dimension (vi behöver t ex måtteori en av många grenar på matematikens träd) och vi skall därför nöja oss med att de niera denna sannolikhet.

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare Stockholms universitet November 2011 Data på annat sätt - I Stolpdiagram Data på annat sätt - II Histogram För kvalitativa data som nominal- och ordinaldata infördes stapeldiagram. För kvantitativa data

Läs mer

4 Diskret stokastisk variabel

4 Diskret stokastisk variabel 4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare "Det finns inget så praktiskt som en bra teori" November 2011 Repetition Vad vi gjort hitills Vi har börjat med att studera olika typer av mätningar och sedan successivt tagit fram olika beskrivande mått

Läs mer

2 Dataanalys och beskrivande statistik

2 Dataanalys och beskrivande statistik 2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare Stockholms universitet September 2011 Balanseringspunkt Låt oss betrakta mätserie 4 för vilken vi antar att mätdata är längder hos rekryter. En strukturell kunskap om dessa längder är av betydelse vid

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Statistikens grunder HT, dagtid Statistiska institutionen

Statistikens grunder HT, dagtid Statistiska institutionen Statistikens grunder 1 2013 HT, dagtid Statistiska institutionen Orsak och verkan N Kap 2 forts. Annat ord: kausalitet Något av det viktigaste för varje vetenskap. Varför? Orsakssamband ger oss möjlighet

Läs mer

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4) Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative

Läs mer

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram 2.1 Grundläggande matematik 2.1.1 Potensfunktioner xmxn xm n x x x x 3 4 34 7 x x m n x mn x x 4 3 x4 3 x1 x x n 1 x n x 3 1 x 3 x0 1 1

Läs mer

Föreläsning 12: Repetition

Föreläsning 12: Repetition Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse

Läs mer

13.1 Matematisk statistik

13.1 Matematisk statistik 13.1 Matematisk statistik 13.1.1 Grundläggande begrepp I den här föreläsningen kommer vi att definiera och exemplifiera ett antal begrepp som sedan kommer att följa oss genom hela kursen. Det är därför

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson Uppsala Universitet Matematiska Institutionen Thomas Erlandsson LÄSANVISNINGAR VECKA 36 VERSION 1. ARITMETIK FÖR RATIONELLA OCH REELLA TAL, OLIKHETER, ABSOLUTBELOPP ADAMS P.1 Real Numbers and the Real

Läs mer

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik Statistik Statistik betyder ungefär sifferkunskap om staten Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information. Verkligheten

Läs mer

Övningshäfte 1: Logik och matematikens språk

Övningshäfte 1: Logik och matematikens språk GÖTEBORGS UNIVERSITET MATEMATIK 1, MMG200, HT2014 INLEDANDE ALGEBRA Övningshäfte 1: Logik och matematikens språk Övning A Målet är att genom att lösa och diskutera några inledande uppgifter få erfarenheter

Läs mer

ÄNDLIGT OCH OÄNDLIGT AVSNITT 4

ÄNDLIGT OCH OÄNDLIGT AVSNITT 4 VSNITT ÄNDLIGT OCH OÄNDLIGT Är det möjligt att jämföra storleken av olika talmängder? Har det någon mening om man säger att det finns fler irrationella tal än rationella? Är det överhuvudtaget möjligt

Läs mer

1.1 Diskret (Sannolikhets-)fördelning

1.1 Diskret (Sannolikhets-)fördelning Föreläsning III. Diskret (Sannolikhets-)fördelning Med diskret menas i matematik, att något antar ett ändligt antal värden eller uppräkneligt oändligt med värden e.vis {, 2, 3,...}. Med fördelning menas

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

MVE051/MSG Föreläsning 7

MVE051/MSG Föreläsning 7 MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel

Läs mer

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade HT 2011 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas in senast 29/9 kl 16.30.

Läs mer

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Kapitel 4 Sannolikhetsfördelningar Sid 79-14 Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Slumpvariabel En variabel för vilken slumpen bestämmer utfallet. Slantsingling, tärningskast,

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

Övning 1 Sannolikhetsteorins grunder

Övning 1 Sannolikhetsteorins grunder Övning 1 Sannolikhetsteorins grunder Två händelser A och B är disjunkta om {A B} =, det vill säga att snittet inte innehåller några element. Om vi har en mängd händelser A 1, A 2, A 3,..., A n, vilka är

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15 Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 6 april 004, klockan 08.15-13.15 Tillåtna hjälpmedel: Bifogad

Läs mer

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.). STOKASTISKA VARIABLER Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.). Definition 1. En reellvärd funktion definierad på ett utfallsrum Ω kallas en (endimensionell)

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten

Läs mer

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan) Statistiska institutionen VT 2012 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas

Läs mer

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori,

1 Föreläsning I, Mängdlära och elementär sannolikhetsteori, 1 Föreläsning I, Mängdlära och elementär sannolikhetsteori, LMA201, LMA521 1.1 Mängd (Kapitel 1) En (oordnad) mängd A är en uppsättning av element. En sådan mängd kan innehålla ändligt eller oändlligt

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Vad är statistik?

Läs mer

Grundläggande matematisk statistik

Grundläggande matematisk statistik Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.

Läs mer

MATEMATIKENS SPRÅK. Avsnitt 1

MATEMATIKENS SPRÅK. Avsnitt 1 Avsnitt 1 MATEMATIKENS SPRÅK Varje vetenskap, liksom varje yrke, har sitt eget språk som ofta är en blandning av vardagliga ord och speciella termer. En instruktionshandbok för ett kylskåp eller för en

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska

Läs mer

Stokastiska processer med diskret tid

Stokastiska processer med diskret tid Stokastiska processer med diskret tid Vi tänker oss en följd av stokastiska variabler X 1, X 2, X 3,.... Talen 1, 2, 3,... räknar upp tidpunkter som förflutit från startpunkten 1. De stokastiska variablerna

Läs mer

Fö relä sning 1, Kö system vä ren 2014

Fö relä sning 1, Kö system vä ren 2014 Fö relä sning 1, Kö system vä ren 2014 Här följer en mycket kort sammanfattning av det viktigaste i Föreläsning 1. Observera att dessa anteckningar inte kan ersätta läroboken, de är alltför kortfattade

Läs mer

Matematisk statistik - Slumpens matematik

Matematisk statistik - Slumpens matematik Matematisk Statistik Matematisk statistik är slumpens matematik. Började som en beskrivning av spel, chansen att få olika utfall. Brevväxling mellan Fermat och Pascal 1654. Modern matematisk statistik

Läs mer

Mer om slumpvariabler

Mer om slumpvariabler 1/20 Mer om slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/2 2013 2/20 Dagens föreläsning Diskreta slumpvariabler Vilket kretskort ska man välja? Väntevärde

Läs mer

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar Sannolikhetslära och inferens II Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar 1 Diskreta slumpvariabler En slumpvariabel tilldelar tal till samtliga utfall i ett slumpförsök. Vi

Läs mer

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse

Läs mer

Sanningsvärdet av ett sammansatt påstående (sats, utsaga) beror av bindeord och sanningsvärden för ingående påståenden.

Sanningsvärdet av ett sammansatt påstående (sats, utsaga) beror av bindeord och sanningsvärden för ingående påståenden. MATEMATISK LOGIK Matematisk logik formaliserar korrekta resonemang och definierar formellt bindeord (konnektiv) mellan påståenden (utsagor, satser) I matematisk logik betraktar vi påståenden som antingen

Läs mer

Mer om reella tal och kontinuitet

Mer om reella tal och kontinuitet Kapitel R Mer om reella tal och kontinuitet I detta kapitel formulerar vi ett av de reella talens grundläggande axiom, axiomet om övre gräns, och studerar några konsekvenser av detta. Med dess hjälp kommer

Läs mer

6-2 Medelvärde och median. Namn:

6-2 Medelvärde och median. Namn: 6-2 Medelvärde och median. Namn: Inledning Du har nu lärt dig en hel del om datainsamling och presentation av data i olika sorters diagram. I det här kapitlet skall du studera hur man kan karaktärisera

Läs mer

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p) Avd. Matematisk statistik TENTAMEN I SF1901, SF1905, SANNOLIKHETSTEORI OCH STATISTIK, MÅNDAGEN DEN 17:E AUGUSTI 2015 KL 8.00 13.00. Kursledare: Tatjana Pavlenko, 08-790 84 66 Tillåtna hjälpmedel: Formel-

Läs mer

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 1 Mängdlära Grundläggande sannolikhetsteori Kombinatorik Deskriptiv statistik Jörgen Säve-Söderbergh Information om kursen Kom ihåg att

Läs mer

SF1901 Sannolikhetsteori och statistik I

SF1901 Sannolikhetsteori och statistik I SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 6 13 november 2017 1 / 29 Idag Förra gången Mer om väntevärden och varianser (Kap. 5.2 5.3) Beroendemått (Kap. 5.4) Summor, linjärkombinationer

Läs mer

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel Finansiell Statistik (GN, 7,5 hp,, VT 009) Föreläsning Diskreta (LLL Kap 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level course, 7,5 ECTS,

Läs mer

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6.

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, a 2 e x2 /a 2, x > 0 där a antas vara 0.6. Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 5, 28-4-6 EXEMPEL (max och min): Ett instrument består av tre komponenter.

Läs mer

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Christian Gottlieb Gymnasieskolans matematik med akademiska ögon Induktion Dag 1 1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta

Läs mer

Kontinuitet och gränsvärden

Kontinuitet och gränsvärden Kapitel Kontinuitet och gränsvärden.1 Introduktion till kontinuerliga funktioner Kapitlet börjar med allmänna definitioner. Därefter utvidgar vi successivt familjen av kontinuerliga funktioner, genom specifika

Läs mer

Lärmål Sannolikhet, statistik och risk 2015

Lärmål Sannolikhet, statistik och risk 2015 Lärmål Sannolikhet, statistik och risk 2015 Johan Jonasson Februari 2016 Följande begrepp och metoder ska behärskas väl, kunna förklaras och tillämpas. Direkta bevis av satser från kursen kommer inte på

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I G. Gripenberg Sannolikheter Slumpvariabler Centrala gränsvärdessatsen Aalto-universitetet 8 januari 04 3 Tvådimensionella slumpvariabler

Läs mer

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6): EM-fotboll 2012 några grafer Sport är en verksamhet som genererar mängder av numerisk information som följs med stort intresse EM i fotboll är inget undantag och detta dokument visar några grafer med kommentarer

Läs mer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I G. Gripenberg Aalto-universitetet 28 januari 2014 G. Gripenberg (Aalto-universitetet) MS-A0509 Grundkurs i sannolikhetskalkyl

Läs mer

Induktion, mängder och bevis för Introduktionskursen på I

Induktion, mängder och bevis för Introduktionskursen på I Induktion, mängder och bevis för Introduktionskursen på I J A S, ht 04 1 Induktion Detta avsnitt handlar om en speciell teknik för att försöka bevisa riktigheten av påståenden eller formler, för alla heltalsvärden

Läs mer

732G01/732G40 Grundläggande statistik (7.5hp)

732G01/732G40 Grundläggande statistik (7.5hp) 732G01/732G40 Grundläggande statistik (7.5hp) 2 Grundläggande statistik, 7.5 hp Mål: Kursens mål är att den studerande ska tillägna sig en översikt över centrala begrepp och betraktelsesätt inom statistik.

Läs mer

Fö relä sning 1, Kö system 2015

Fö relä sning 1, Kö system 2015 Fö relä sning 1, Kö system 2015 Här följer en kort sammanfattning av det viktigaste i Föreläsning 1. Kolla kursens hemsida minst en gång per vecka. Övningar kommer att läggas ut där, skriv ut dem och ha

Läs mer

Vidare får vi S 10 = 8,0 10 4 = 76, Och då är 76

Vidare får vi S 10 = 8,0 10 4 = 76, Och då är 76 Ellips Sannolikhet och statistik lösningar till övningsprov sid. 38 Övningsprov.. i) P(:a äss och :a äss och 3:e äss och 4:e äss ) P(:a äss) P(:a äss :a äss) P(3:e äss :a och :a äss) antal P(4:a äss :a

Läs mer

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.

DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler. LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03 Syfte: Syftet med dagens laborationen är att du skall: få förståelse

Läs mer

Jörgen Säve-Söderbergh

Jörgen Säve-Söderbergh SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 8 Binomial-, hypergeometrisk- och Poissonfördelning Exakta egenskaper Approximativa egenskaper Jörgen Säve-Söderbergh Binomialfördelningen

Läs mer

TMS136. Föreläsning 7

TMS136. Föreläsning 7 TMS136 Föreläsning 7 Stickprov När vi pysslar med statistik handlar det ofta om att baserat på stickprovsinformation göra utlåtanden om den population stickprovet är draget ifrån Situationen skulle kunna

Läs mer

inte följa någon enkel eller fiffig princip, vad man nu skulle mena med det. All right, men

inte följa någon enkel eller fiffig princip, vad man nu skulle mena med det. All right, men MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Christian Gottlieb Gymnasieskolans matematik med akademiska ögon Induktion Dag 2. Explicita formler och rekursionsformler. Dag mötte vi flera talföljder,

Läs mer

bli bekant med summor av stokastiska variabler.

bli bekant med summor av stokastiska variabler. LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 2 MATEMATISK STATISTIK FÖR E FMSF20 Syfte: Syftet med dagens laborationen är att du skall: få förståelse för diskreta, bivariate

Läs mer

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh

SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler. Jörgen Säve-Söderbergh SF1920/SF1921 Sannolikhetsteori och statistik 6,0 hp Föreläsning 3 Diskreta stokastiska variabler Jörgen Säve-Söderbergh Stokastisk variabel Singla en slant två gånger. Ω = {Kr Kr, Kr Kl, Kl Kr, Kl Kl}

Läs mer

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2

Finansiell Statistik (GN, 7,5 hp, HT 2008) Föreläsning 2 Finansiell Statistik (GN, 7,5 hp, HT 008) Föreläsning Diskreta sannolikhetsfördelningar (LLL kap. 6) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics (Basic-level

Läs mer

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 3 Matematisk statistik AK för CDIFysiker, FMS012/MASB03, HT15 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla

Läs mer

TMS136. Föreläsning 4

TMS136. Föreläsning 4 TMS136 Föreläsning 4 Kontinuerliga stokastiska variabler Kontinuerliga stokastiska variabler är stokastiska variabler som tar värden i intervall av den reella axeln Det kan handla om längder, temperaturer,

Läs mer

Övningshäfte 2: Induktion och rekursion

Övningshäfte 2: Induktion och rekursion GÖTEBORGS UNIVERSITET MATEMATIK 1, MMG200, HT2017 INLEDANDE ALGEBRA Övningshäfte 2: Induktion och rekursion Övning D Syftet är att öva förmågan att utgående från enkla samband, aritmetiska och geometriska,

Läs mer

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler 5 45 4 5 5 5 5 Öppningskurs 5 9 7 5 9 7 4 45 49 5 57 6 65 abb Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 Kontinuerliga variabler Kontinuerliga s.v.

Läs mer

SF1901: Sannolikhetslära och statistik

SF1901: Sannolikhetslära och statistik SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 25..26 Jan Grandell & Timo Koski Matematisk statistik 25..26 / 44 Stokastiska

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

Föreläsning 2 (kap 3): Diskreta stokastiska variabler

Föreläsning 2 (kap 3): Diskreta stokastiska variabler Föreläsning 2 (kap 3): Diskreta stokastiska variabler Marina Axelson-Fisk 20 april, 2016 Idag: Diskreta stokastiska (random) variabler Frekvensfunktion och fördelningsfunktion Väntevärde Varians Några

Läs mer

Säsongrensning i tidsserier.

Säsongrensning i tidsserier. Senast ändrad 200-03-23. Säsongrensning i tidsserier. Kompletterande text till kapitel.5 i Tamhane och Dunlop. Inledning. Syftet med säsongrensning är att dela upp en tidsserie i en trend u t, en säsongkomponent

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA21/9MA31, STN2) 212-8-2 kl 8-12 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är värd 6 poäng.

Läs mer

Kap 3: Diskreta fördelningar

Kap 3: Diskreta fördelningar Kap 3: Diskreta fördelningar Sannolikhetsfördelningar Slumpvariabler Fördelningsfunktion Diskreta fördelningar Likformiga fördelningen Binomialfördelningen Hypergeometriska fördelningen Poisson fördelningen

Läs mer

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.).

Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.). STOKASTISKA VARIABLER Resultat till ett försök är ofta ett tal. Talet kallas en stokastisk variabel (kortare s. v.). Definition 1. En reellvärld funktion definierad på ett utfallsrum Ω kallas en (endimensionell)

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU KURSENS INNEHÅLL Statistiken ger en empirisk grund för ekonomin. I denna kurs betonas statistikens idémässiga bakgrund och

Läs mer

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar Föreläsning 3 Kapitel 4, sid 79-124 Sannolikhetsfördelningar 2 Agenda Slumpvariabel Sannolikhetsfördelning 3 Slumpvariabel (Stokastisk variabel) En variabel som beror av slumpen Ex: Tärningskast, längden

Läs mer

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3. Laboration 2. Fördelningar och simulering Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 - Biostatistisk grundkurs VT2014, lp3 Laboration 2 Fördelningar och simulering Introduktion 2014-02-06 Syftet med laborationen är dels

Läs mer

LKT325/LMA521: Faktorförsök

LKT325/LMA521: Faktorförsök Föreläsning 2 Innehåll Referensfördelning Referensintervall Skatta variansen 1 Flera mätningar i varje grupp. 2 Antag att vissa eekter inte existerar 3 Normalfördelningspapper Referensfördelning Hittills

Läs mer

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer

Läs mer

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Något om sannolikheter, slumpvariabler och slumpmässiga urval LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Stig Danielsson 004-0-3 Något om sannolikheter, slumpvariabler och slumpmässiga urval 1. Inledning Observerade data innehåller ofta någon form

Läs mer

(N) och mängden av heltal (Z); objekten i en mängd behöver dock inte vara tal. De objekt som ingår i en mängd kallas för mängdens element.

(N) och mängden av heltal (Z); objekten i en mängd behöver dock inte vara tal. De objekt som ingår i en mängd kallas för mängdens element. Grunder i matematik och logik (2017) Mängdlära Marco Kuhlmann 1 Grundläggande begrepp Mängder och element 2.01 En mängd är en samling objekt. Två standardexempel är mängden av naturliga tal (N) och mängden

Läs mer

Sannolikheter och kombinatorik

Sannolikheter och kombinatorik Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter

Läs mer

Lutande torn och kluriga konster!

Lutande torn och kluriga konster! Lutande torn och kluriga konster! Aktiviteter för barn under Vetenskapsfestivalens skolprogram 2001 Innehåll 1 Bygga lutande torn som inte faller 2 2 Om konsten att vinna betingat godis i spel 5 3 Den

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Mängdlära. Kapitel Mängder

Mängdlära. Kapitel Mängder Kapitel 2 Mängdlära 2.1 Mängder Vi har redan stött på begreppet mängd. Med en mängd menar vi en väldefinierad samling av objekt eller element. Ordet väldefinierad syftar på att man för varje tänkbart objekt

Läs mer

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tid: Måndagen den 2015-06-01, 8.30-12.30. Examinator och Jour: Olle Nerman, tel. 7723565, rum 3056, MV, Chalmers. Hjälpmedel: Valfri

Läs mer

Föreläsning 8 för TNIU23 Integraler och statistik

Föreläsning 8 för TNIU23 Integraler och statistik Föreläsning 8 för TNIU Integraler och statistik Krzysztof Marciniak ITN, Campus Norrköping, krzma@itn.liu.se www.itn.liu.se/ krzma ver. - 9--6 Inledning - lite om statistik Statistik är en gren av tillämpad

Läs mer

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning? När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns

Läs mer

4.1 Grundläggande sannolikhetslära

4.1 Grundläggande sannolikhetslära 4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser osv. Sannolikhet är ett tal mellan

Läs mer

Material till kursen SF1679, Diskret matematik: Lite om kedjebråk. 0. Inledning

Material till kursen SF1679, Diskret matematik: Lite om kedjebråk. 0. Inledning Matematik, KTH Bengt Ek november 207 Material till kursen SF679, Diskret matematik: Lite om kedjebråk 0 Inledning Talet π (kvoten mellan en cirkels omkrets och dess diameter) är inte ett rationellt tal

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

Några extra övningsuppgifter i Statistisk teori

Några extra övningsuppgifter i Statistisk teori Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,

Läs mer