The Title. The Author. The Date

Storlek: px
Starta visningen från sidan:

Download "The Title. The Author. The Date"

Transkript

1 The Title The Author The Date

2 ii

3 Innehåll Vad statistik handlar om. Modeller Tre typer av medelvärden Median Typvärde Aritmetiskt medelvärde Tre typer av avvikelser Varians standardavvikelse Skevhet Toppighet Tre typer av gram Stolpdiagram och kumulerat stolpdiagram Histogram och kumulerat histogram Stokastiska variabler, väntevärden och sannolikheter 3. Diskret och kontinuerlig Väntevärden Sannolikhet Mera om sannolikheter Betingade sannolikheter Betingade väntevärden Betingade varianser Oberoende Diskreta modeller Betygssättning Optionsmodell Binomial optionsmodell ett tidssteg Binomial optionsmodell era tidssteg Epostmodell iii

4 iv INNEHÅLL 3.4 Spelmodeller Kvalitetskontroll Sammanfattning Lösningar till uppgifter Kontinuerliga modeller Bussmodell Försäkringsmodell Fördelning för antal skador En försäkrings premie Normalfördelningen Centrala gränsvärdessatsen Lösningar till uppgifter Stickprov och skattningar 5. Stickprov Vad ett stickprov kan ge Skattningar Önskade egenskaper hos skattningar Metoder för att nna skattningar Momentmetoden Minsta kvadrat metoden Maximum likelihood metoden Tankeväckande exempel Lösningar till uppgifter Passar vår fördelning 4 6. Funktionen ^F Fördelningsdiagram P-P diagram K-K diagram Exempel Rörvik Timber B Lösningar till uppgifter Trovärdiga intervall Normalfördelningen Fall : Kon densintervall för när är känt Fall : Kon densintervall för med okänt väntevärde Fall 3: Kon densintervall för när är okänt Kon densintervall vid normalapproximation

5 INNEHÅLL v 7.. Kon densintervall vid Poissonfördelning Kon densintervall vid binomialfördelning Lösningar till uppgifter Prövning av antaganden Introduktion Test av vid normalfördelning Steg : Formulera lämplig hypotes Steg : Bestäm en testvariabel Steg 3: Bestäm en beslutsregel Steg 4: Besluta Jämförelse mellan kon densintervall och test Test av vid normalfördelning Test av p Test av vid normalfördelning Olika typer av fel Styrkefunktion p-värden Test av fördelningar testet Ett enklare exempel Fördelningar diskreta Fördelningar kontinuerliga Test av oberoende Övningar och Problem Lösningar till uppgifter Linjär regression enkel 7 0 Linjär regression multipel 9 Icke linjär regresion Logistisk regression 3. När är logistisk regression användbart Hur ser p(x ; : : : ; x m ) ut Logistisk regressionsmodell via odds Logistisk regressionsmodell via tillväxtmodell Hur bestäms parametrarna 0 och För att summera och generalisera Tillbaks till exemplen Hur man tolkar parametrar

6 vi INNEHÅLL.6 Övningar Lösningar till uppgifter Tidsserier 5 3. Introduktion Glidande medelvärden Komponentmodeller Modell Konstruktion av en tidsserie Analys av tidsserien ovan Enkel exponentiell utjämning Dubbel exponentiell utjämning à la Holt ARMA-modeller Introduktion Hur ser en stationär tidsserie ut Autokorrelationsfunktionen Partiella autokorrelationsfunktionen Modellen AR() Modellen MA() Lösningar till uppgifter ARMA processer 87 5 Beslutsteori Beslutsprocessen Enkla beslutsproblem Minimax Maximax Förlorade möjligheter Enkla beslut baserade på väntevärden Enkla beslutsträd Aposteriorisannolikheter Allmäna beslutsträd

7 . Vad statistik handlar om Människans ojämförligt största upp nning är språket och därefter kommer matematik och statistik. Utan det förra skulle vi inte kunna utväxla ideer och utan det senare skulle våra ideer vara fördunklade av allehanda övernaturligt tankebråte. Ett samhälle utan matematik kan förvisso existera men dömer sig självt till evigt stillastående. Matematiken och i dess förlängning statistiken är två speciella universiella språk som hjälper oss att reda ut vad som är sant och vad som är tro. Matematiken gör modeller som utgår från "odelbara sanningar" och härleder därur statiska beskrivningar av verkligheten. Det statistiska språket lägger till en osäkerhetsaspekt till det matematiska språket, slumpen, som gör det möjligt att även ge beskrivningar av en kaotisk, dynamisk, verklighet. Statistik har gett uphov till och/eller understött utvecklingen av många intressanta verksamheter som nationalekonomi, sociologi, marknadsföring, fysik, nans, medicin, farmakologi, psykologi, dataalgoritmer o s v. Statistik har även använts för att förklara hur slumpen kan skapa mönster där inga nnes. I bästsäljaren Bibelkoden presenterar författaren [7, Michael Drosnin] följande resultat: Tag bibelns text och skriv ned den med exakt lika många bokstäver i varje rad. I den så erhållna textmassan kan man nu, vertikalt eller diagonalt, hitta en mängd intressanta saker. Vid ett sådant försök lyckades man para ihop 34 rabbiners namn med deras födelsedata. Något så märkligt kan inte vara en slump utan måste vara ett hemligt meddelande från Gud. Alltså nns Gud (vilka dumheter man får höra). Nu kan man med statistiska metoder bevisa att slumpen faktiskt ger dylika e ekter (se [8, Qvartilen Vol 9-3, Olle Häggström]). Statistik kan därför även användas för att avslöja direkt felaktiga påståenden och blir därmed ett utmärkt verktyg för att hålla koll på medvetet/omedvetet ljug från både politiker, astrologer och andra. För att kunna fungera som ett verktyg för utveckling och renhållning behöver statistiken matematiken ty med matematikens hjälp kan en statistiker visa att t ex aritmetiska medelvärden uppträder på ett speciellt sätt när antalet mätningar ökar. Detta betyder att den som vill stud-

8 era statistik måste, för att få verklig behållning av och självständigt kunna använda de statistiska verktygen, börja med att studera matematik. Har man inte elementa inom matematik klart för sig så blir statistiken knastertorr (utantillärning) och, utanför den deskriptiva statistikens värld, totalt obegriplig. Av denna anledning nns till denna bok en nätbok, Introduktion till matematik för ekonomer, som innehåller det minimum av kunskaper i matematik som behövs för att med god behållning kunna tillägna sig denna bok. Jaha vad handlar nu statistik om? Tillspetsat kan man säga att statistik handlar om två saker ) Hur man beräknar medelvärden och ) begreppet oberoende händelser. Sannolikt får jag en massa belackare som hävdar annat så jag får likt biskop Brask skriva en liten lapp: Hur man sedan använder dessa kunskaper är fram till var och en. Olle Sjöström påminner om statistikens tre ben (se [9, Qvartilen Vol 0-, Olle Sjöström]) Svårigheterna att svara på frågan Vad är statistik? beror inte minst på att statistikens idéhistoriska framväxt är komplex och svårfångad. Ett sätt att söka beskriva denna utveckling är att skilja på tre olika linjer. ) Statistik som kritisk samhällslära med rötter i Upplysningen. ) Statistik som generell metod, i dagens statistiska språkbruk en metod för surveyundersökningar, i allmänt språkbruk statistisk undersökning. En teori formulerades i slutet av 800-talet. 3) Statistik som tillämpning av sannolikhetsmodeller, som har haft en stark utveckling under 900-talet. Det är fråga om en mer utbyggd statistiskt orienterad matematik, även kallad matematisk statistik. Dessa tre traditioner lever kvar i dag. Alla tre nns med i statistikens olika tillämpningar, den tredje dominerar undervisning och forskning inom universitet och högskolor nästan helt. Även i det samhällsvetenskapliga ämnet statistik

9 . Vad statistik handlar om 3 har denna uppfattning fått insteg och intresset har glidit mer mot andra tillämpningar än de samhällsvetenskapliga. I det följande vill jag söka visa, att alla dessa tre traditioner är relevanta.... Ovanstående beskrivning stämmer bra med de faktiska förhållandena och det är onekligen så att det första benet har haft en tendens till att bli bortglömt och det andra har den statliga myndigheten SCB tagit hand om. Men både det första och andra benet behöver det tredje för att få hjälp att undvika fällor och fel.. Modeller Innan vi börjar räkna på medelvärden måste vi göra mätningar och dessa mätningar måste ha någon form av relevans för oss. Detta betyder att innan vi börjar mäta måste vi bestämma varför vi skall mäta, vad vi skall mäta och hur vi skall mäta. För att bli lite mer konkret tänker vi oss ett företag som sysslar med guldprospektering. Den första frågan varför får då svaret: För att hitta lönsam guldmalm. Vi kommer sedan över på frågan vad vi skall mäta guld så klart! Ja men hur? Så hamnade vi på den sista frågan hur innan vi besvarat vad. Detta är egentligen inget att förundras över de två frågorna hänger intimt samman. Hur prospekterar man guld? Min naiva tanke är att man i lämpligt område utför borrningar som ger borrkärnor. På lämpliga ställen på dessa borrkärnor gör man analyser av guldförekomsten hos, säg, en kubikcentimeter. Nu börjar det bli komplicerat ty vad du just läst innebär dels en metod för att välja borrhål och dels en metod för att välja ut de delar av borrkärnan som skall analyseras. Men vi har i varje fall kommit fram till svaret på frågan vad och det blev: Guldhalten i en (sammanhängande) kubikcentimeter borrkärna. Detta leder mig till att skapa följande storhet X = guldhalten i en cm 3 borrkärna. Eftersom vi kommer att analysera er prov, säg n, så erhåller vi n stycken guldhalter X ; X ; : : : ; X n. När vi så har erhållit dessa n guldhalter så måste vi fatta beslut om brytning eller ej och det är självklart så att om alla prov innehåller 00% guld så tar vi fram spaden och börjar gräva och om inget prov innehåller guld packar vi ihop vår utrustning för att pröva vår lycka annorstädes. Någonstans däremellan nns gänsen för brytvärd respektive ej brytvärd malm.

10 4.. Tre typer av medelvärden Vad vi nu har gjort är att skapa början till en modell av det som vi är intresserade av, i detta fall guldhalten, och vi har infört beteckningen X för att beteckna guldhalten hos en cm 3 malm innan vi ens har mätt denna halt. En naturlig beteckning för den faktiska uppmätta halten blir x så vi nner alltså de faktiska procentvärdena x ; x ; : : : ; x n t ex 0:00; 0:00; : : : ; 0:000. Nästa fråga är hur vi på bästa sätt skall hantera denna information för att avgöra om det nns brytvärt guld eller ej när vi tagit säg n = 000 prov. Detta blir för många värden för hjärnan att överblicka och vi behöver någon form av samlingsmått. Här skall vi endast ange ett (man kan tänka sig hur många som helst) som har blivit mycket grundligt studerat under århundrandenas lopp nämligen det aritmetiska medelvärdet X = nx X i n och dess observerade motsvarighet x = n i= nx x i. Vårt beslut att bryta eller ej kommer således att basera sig på talet x men hur beslutet skall fattas blir en senare historia. Vi skall nu gå över till att studera det aritmetiska medelvärdet och dess egenskaper men innan vi börjar med denna studie noterar vi ytterligare en sak om vårt exempel, nämligen: De värden som är möjliga att observera ligger alla mellan 0 och 00. Mängden av dessa tal betecknar vi med X och det gäller i= X = fx j 0 x 00g. Detta utläses "mängden omega-x där X antar alla reella tal mellan 0 och 00". Mängden X kallas X:s utfallsrum och anger precis de värden som är möjliga att erhålla vid en mätning av X. Sammanfattning Vi har infört beteckningen stor bokstav för det som vi skall mäta och liten bokstav för det som är uppmätt. De möjliga mätvärdena, utfallsrummet, betecknas med X eller alternativt (X).. Tre typer av medelvärden Ovan nämnde vi att det nns en uppsjö av samlingsmått men namngav bara ett det aritmetiska medelvärdet. Här skall vi börja med att kort

11 . Vad statistik handlar om 5 ta upp ytterligare två samlingsmått median och typvärde för att därefter ta itu med analysen av det aritmetiska medelvärdet... Median Om vi ordnar alla värden i växande storleksordning och sedan tar det mittersta värdet (om antalet mätningar är jämnt tar vi summan av de två mittersta värdena och delar med ) så får vi ett medelvärde som kallas median. Denna storhet har egenskapen att precis hälften av guldhalterna understiger medianen och den resterande hälften är större än medianen. Medianen är därför, för oss, en bra kandidat till ett medelvärde. Ovan har vi betecknat våra mätvärden med x ; x ; : : : ; x n och om vi ordnar dessa i växande storleksordning och inför beteckningen (i) för att beteckna det storleksmässigt i:te mätvärdet har vi för den ordnade mätmängden följande beteckning där det gäller att x () ; x () ; : : : ; x (n) x () x () x (n). Med detta skrivsätt de nerar vi nu medianen enligt De nition (Median) Med medianen, M (x), till mängden av mätvärden fx ; x ; : : : ; x n g menas talet 8 < M (x) = : x (k) n = k + x (k) + x (k+) n = k Medianen är således ett bra förslag på medelvärde och det är ett uppriktigt värde ty det är just det mittersta värdet av de givna värdena... Typvärde Ett annat uppriktigt värde är det så kallade typvärdet, T (x), som helt enkelt är det vanligast förekommande värdet. Detta värde kan dock vara svårt att de niera för många typer av mätvärden. Tag t ex längder av män och antag att vi mäter längden, i cm, hos 0 män och att vi då får längderna 73; 65; 78; 5; 73; 73; 79; 69; 89; 73.

12 6.. Tre typer av medelvärden Vi ser direkt att fyra av dem är 73 cm långa. Typvärdet skulle i detta fall bli just 73 cm. Men om vi nu tar och mäter längden av dessa 4 i mm så skulle vi troligtvis få att alla fyra har olika längd och typvärdet blir då ode nierat. Typvärdet är således inget bra mått för genomsnittligt värde eftersom det blir beroende av sorten. Ibland kan det dock ge en viss information...3 Aritmetiskt medelvärde Det artitmetiska medelvärdet är grundbulten inom statistik och denna bok. För att se detta måste vi ha ett exibelt exempel (eller snarare era) där vi kan exempli era olika egenskaper på sätt som är lätta att förstå. Eftersom detta är en bok i statistik, för ekonomer, med en speciell inriktning mot grunderna inom nansiell statistik så skall vi som utfallsrum betrakta Den Nordiska Börsen under 00 dagar. Detta utfallsrum är ändligt om än mycket stort och ändligheten behövs för att enkelt införa vissa storheter och begrepp. Bilda nu följande storheter X = Broström B, slutkurs mätt i ören, X = Atlas Copco B, slutkurs mätt i ören, X 3 = Rörvik Timber B, slutkurs mätt i ören. Observera här min petighet med angivande av mått och tidpunkt (statistiker blir lätt lite petiga eftersom de lärt sig att skit in blir skit ut, ursäkta svenskan). Den i:te dagens slutkurser ger vi beteckningarna X i, X i och X 3i där i = ; ; : : : ; 00. Statistiker har ett speciellt sätt att kalla sådana storheter: stokastiska variabler. Stokastisk betyder slumpmässig, så vi har slumpmässiga variabler eller kort och gott slumpvariabler. Ett alternativt sätt att uttrycka sig blir då: X, X och X 3 är tre stokastiska variabler. Detta uttryckssätt kommer att spara en hel del trycksvärta framöver samt underlätta införandet av nya begrepp, men visst blir det mer abstrakt. Men med abstraktionen följer å andra sidan en betydligt ökad tillämplighet ty jag behöver inte nämna några aktier dessa ingår som specialfall. Vårt exempel med en aktieportfölj kan då innefattas i de tre stokastiska variablerna X, X och X 3 på det ändliga utfallsrummet (X) = fx j x f0; 0:0; 0:0; : : : ; 300:00gg = f0; 0:0; 0:0; : : : ; 300:00g. Den Nordiska Börsen nns på adressen (00706). Atlas Copco B kostade i skrivande stund mest ca 45 kronor.

13 . Vad statistik handlar om 7 Med detta exempel i bakhuvudet betraktar vi nu det abstrakta men ändliga utfallsrummet (X) = fx ; x ; : : : ; x N g av storlek N. Det aritmetiska medelvärdet, A (X), de nieras av att man summerar alla mätvärden och dividerar med antalet summerade värden d v s man bildar A (X) = x + x + + x N N och vi skall närmast undersöka vilka egenskaper denna storhet har. Balanseringspunkt Antag att vi har två lika vikter om v kg utplacerade på en homogen planka. Den första vikten be nner sig på avståndet x från plankans vänstra ändpunkt och den andra på avståndet x från samma punkt. Hur kan vi nu bestämma den punkt (jämviktspunkt, balanseringspunkt) på plankan där de två vikternas inverkan tar ut varandra d v s där vi skall placera en bock för att erhålla balans. v x v x?? x x x x x 3 (a) (b) v 3 v x v x v? v? x x x x x 3 (c) (d) Figur.: Balanseringspunkter i fyra olika typfall

14 8.. Tre typer av medelvärden Beteckna denna balanspunkt med x. Vi vet enligt fysikens lagar (eller om man så vill enligt lekparkens) att följande jämviktsekvation ( gur.a) måste gälla (x x ) v = (x x) v. Ur denna ekvation är det lätt att lösa ut den sökta punkten, x = x + x. Men vi skall också skriva jämviktsekvationen på ett annat sätt nämligen (x x) v + (x x) v = 0 ty denna form låter sig lätt generaliseras både till ett godtyckligt antal vikter och godtyckliga vikter. Antag först att vikterna är v och v istället för v ( gur.c). För att jämvikt skall gälla måste fortfarande (x x ) v = (x x) v, (x x) v + (x x) v = 0 och ur denna ekvation erhålls x = v x + v x v + v. Antag nu att vi har tre lika vikter v på avstånden x, x och x 3 och söker jämviktspunkten för dessa tre vikter ( gur.b). Vi konstaterar då först att de två första vikterna kan ersättas med vikten v i x (där vi lagt till index i x för att markera två vikter). Därefter har vi ånyo två vikter men denna gång med vikterna v på avståndet x respektive v på avståndet x 3. Detta ger jämviktsekvationen varur vi erhåller (x x 3 ) v + (x 3 x 3 ) v = 0 x 3 = vx + vx 3 3v = v (x + x ) + vx 3 3v = x + x + x 3. 3 Man övertygar sig lätt (?) om att jämviktsekvationen i detta senare fall kan skrivas (x x) v + (x x) v + (x 3 x) v = 0.

15 . Vad statistik handlar om 9 Den allmäna jämviktsekvationen med tre olika vikter v, v och v 3 på avstånden x, x och x 3 blir analogt varur vi erhåller (x x 3 ) v + (x x 3 ) v + (x 3 x 3 ) v 3 = 0 x 3 = v x + v x + v 3 x 3 v + v + v 3 3X v i = x i P 3 j= v. j i= Medelst ett enkelt induktionsbevis (se Introduktion till den ekonomiska matematiken) kan man nu visa (för dem som inte tror på sanningshalten) att det allmänt gäller x n = nx i= x i v i P n j= v j = nx x i p i för n olika vikter på olika avstånd. Den införda storheten p i kommer vi behandla utförligt längre fram. Storheten x n kallas det aritmetiska medelvärdet och för specialfallet v i = v erhålls, som ett specialfall, den storhet som vanligtvis förknippas med A (x), det aritmetiska medelvärdet baserat på n mätvärden. Tre egenskaper Funktionen A (X) har tre viktiga egenskaper som alla synes vara självklara men som inte desto mindre är av stor betydelse. För den vidare framställningen behöver vi De nition Med X avses följden av tal fx ; x ; : : : ; x N g = fx i g N i=. Vi skriver nu X 0 när alla X i 0. X = när alla X i =. Den första egenskapen hos funktionen A (X) kan nu skrivas: ) om X 0 så gäller att A (X) 0. Trivialt sant ty summerar man positiva tal så blir summan positiv. Den andra egenskapen är ) om X och X är två stokastiska variabler och c och c är två rella tal så gäller att i= A (c X + c X ) = c A (X ) + c A (X ).

16 0.3. Tre typer av avvikelser Tänk bara på en portfölj som består av två aktier. Oavsett om vi betraktar protföljen som helhet eller varje aktie för sig så skall ju slutresultatet bli detsamma. Den tredje och sista egenskapen är 3) Om X = så gäller att A () =. Sätt X i = i uttrycket för A (X) varvid påståendet följer direkt. Funktionen A (X) kallas inom matematiken, en normaliserad linjär operator och till dessa har vi anledning att återkomma många gånger. Vidare noterar vi att alla resonemang går igenom även om utfallsrummet är oändligt. Ofta har vi inte tillgång till hela utfallsrummet utan endast en del av det, säg n värden, d v s vi har ett urval. Vi kan då inte beräkna A (X) men väl A (x) där Här gäller för subindex I i att x = fx Ii g n i=. om det i:e värdet i X är med i urvalet, I i = 0 annars. Detta senare värde A (x) används sedan som en approximation av det förra A (X). Det gäller naturligtvis att för olika urval x erhålls olika värden på A (x) och dessa är med säkerhet skilda från det sanna värdet A (X). Då uppstår två naturliga frågor: ) hur utspridda är de olika värdena på A (x) och ) hur nära kan A (x) tänkas vara det sanna värdet A (X)..3 Tre typer av avvikelser Under denna rubrik kommer vi uteslutande betrakta det aritmetiska medelvärdet och lämnar de två andra medelvärdena median och typvärde åt sitt öde. I och med detta kan vi också kalla det aritmetiska medelvärdet för medelvärdet kort och gott. Medelvärdet ger oss en balanseringspunkt för vikter på en planka. Denna bild förs nu enkelt över till ett två-dimensionellt koordinatsystem där vikterna symboliseras av pinnar, med olika höjd, utplacerade på x- axeln. Pinne nummer i be nner sig på avstånd x i från origo (Detta har vi egentligen redan gjort i gur.). För att vara helt generella från början räknar vi avstånd med tecken. Om vi nu normerar pinnarnas sammanlagda höjd, p i, till d v s så att P N till att jag införde beteckningen p i för v i PN j= vj i= p i = så ser vi ett skäl (p för normerad pinne )

17 . Vad statistik handlar om ovan ty för vikterna gäller att NX i= v i P N j= v j P N i= = v i P N j= v j =. De nition 3 (Aritmetiskt medelvärde) Med det aritmetiska medelvärdet förstås den storhet (operator) som beskrivs av uttrycket där p i = A (X) = P vi N och fx i g N j= vj i= = X. NX x i p i Det är nu klart att två olika uppsättningar pinnar kan ha samma balanseringspunkt men till sin struktur vara helt olika. Vi skall därför införa tre olika mått (varians, skevhet och toppighet), som beskriver tre ytterligare egenskaper, för en uppsättning pinnar. i=.3. Varians standardavvikelse I nedanstående gur ser vi dels två lika stora pinnar nära varandra och dels samma pinnar långt ifrån varandra (pinnen i mitten är inte en pinne utan en pil y-axeln). (a) x = x = + x = 00 x = +00 (b) Figur.: Variansen i två olika typfall Vi nner lätt de två gurernas medelvärden till x = X i= x i p i = x + x respektive x = 4X i=3 x i p i = x 3 + x 4

18 .3. Tre typer av avvikelser och dessa medelvärden hamnar båda mittemellan de två positionerna, x och x respektive x 3 och x 4, men ändock ger gurerna helt olika intryck. Ett mått som mäter detta intryck är variansen (standardavvikelse) som för dessa två fall de nieras av X 4X = (x i x ) p i respektive = (x i x ) p i. i= För att övertyga oss om att variansen är ett mått på den visuella skillnaden i gurerna.a och.b beräknar vi varianserna för de storheter som ingår i respektive gur (med de angivna valen blir x = 0 och x = 0) och erhåller = = X i= 4X i=3 (x i ) = ( ) + () = i=3 (x i ) = ( 00) + (00) = En tydligare skillnad än den mellan och 0 000, kan vi inte önska oss. För att få samma sort som för medelvärdet brukar man dra roten ur variansen och får då standardavvikelsen. Man erhåller vårt exempels standardavvikelser till respektive 00. Allmänt gör vi följande de nition De nition 4 (Varians) Variansen för den stokastiska variabeln X med utfallsrummet X, med N element, de nieras av där X = A (X). = NX i= x i X pi Med den ovan införda linjära operatorn A (X) kan variansen även skrivas 3 = A X X = A X X och vi nner följande identitet A X X = A X X X + X = A X XA (X) + X A () = A X A (X) 3 Det är lite otympligt att skriva A (X c) så det nns en oskriven överenskommelse att man istället skriver A (X A (X) A (X). c) vidare skriver man A (X) för att beteckna

19 . Vad statistik handlar om 3 ty A (X) = X..3. Skevhet Nästa steg är att beskriva begreppet skevhet och i gur.3 sid 3 är a) skev åt vänster, b) symmetrisk och c) skev åt höger. p p 3 3 (a) 9 (b) p 3 (c) 9 Figur.3: Skevheten i tre olika typfall Liksom ovan betraktar vi avståndet till medelvärdet och den allmäna de nitionen av skevhet i utfallsrummet X är talet A X X 3. För detta tal kan vi visa följande identitet A X X 3 = A X 3 3 XA X + 3 X A (X) X 3 = A X 3 3 XA X + X 3. För alla tre gurer ovan gäller att p i = 3. Vi nner nu skevheten i de tre fallen i gur.3 till:

20 4.3. Tre typer av avvikelser a) x =, x = och x 3 = 9 vilket ger x = 4 och skevhetens värde blir ( 4) ( 4)3 3 + (9 4)3 3 = 30, b) x = 3, x = 4 och x 3 = 5 vilket ger x = 4 och skevhetens värde blir (3 4) (4 4)3 3 + (5 4)3 3 = 0, c) x =, x = 8 och x 3 = 9 vilket ger x = 6 och skevhetens värde blir ( 6) (8 6)3 3 + (9 6)3 3 = 30. Det gäller således att om den största tyngden nns till vänster om medelvärdet så erhåller vi en positiv skevhet, om tyngden är jämnt utspridd, d v s vi har symmetri, så erhåller vi skevheten 0 och slutligen om den största delen av tyngden ligger till höger om medelvärdet så har vi en negativ skevhet. För att få en dimensionslös storhet på skevheten används vanligen följande de nition på skevhet: De nition 5 (Skevhet) Skevheten för den stokastiska variabeln X med utfallsrummet X, med N element, de nieras av.3.3 Toppighet = A X X 3 3. Sista steget är att beskriva begreppet toppighet och om vi fortsätter på den inslagna vägen med högre potenser så de nerar vi toppigheten i utfallsrummet X som talet A X X 4. För toppigheten gäller följande identitet A X X 4 = A X 4 4 XA X X A X 4 X 3 A (X) + X 4 = A X 4 4 XA X X A X 3 X 4. För alla fyra del gurer i gur.4 sid 5 gäller att x = ; x = och x 3 = 3 vilket, tillsammans med värdena på p, p och p 3, ger x = i samtliga fall. Vi nner nu toppigheten i de fyra fallen till:

21 . Vad statistik handlar om 5 p p (a) 3 4 (b) 3 p p (c) 3 (d) 3 Figur.4: Toppigheten för fyra olika typfall a) p = 8, p = 3 4 och p 3 = 8 ger värdet ( ) ( ) (3 )4 8 = 0:5, b) p = 4, p = 4 och p 3 = 4 ger värdet ( ) ( )4 8 + (3 )4 4 = 0:5, c) p = 3, p = 3 och p 3 = 3 ger värdet4 ( ) ( )4 3 + (3 )4 3 = 0:66 6, d) p = 3 8, p = 8 och p 3 = 3 8 ger värdet ( ) ( )4 8 + (3 )4 3 8 = 0:75. 4 ett streck över talet, som i 6, betyder att 6 skall upprepas i all oändlighet.

22 6.4. Tre typer av gram Figur a) ger ett spetsigare intryck än gur b) och har även ett mindre värde på toppigheten. Figur b) är i sin tur spetsigare än gur c) som i sin tur är spetsigare än d) (som är urgröpt) och vi får hela tiden störra värden. Toppighet mäter således en gurs spetsighet. För att få en dimensionslös storhet på toppigheten används vanligen följande de nition på toppighet De nition 6 (Toppighet) Toppigheten för den stokastiska variabeln X med utfallsrummet X, med N element, de nieras av = A X X där trean inte kan förklaras på nuvarande stadium (egentligen är den helt onödig) utan vi får återkomma till den längre fram..4 Tre typer av gram Vi skall nu undersöka den information som nns i p i :na i operatorn A (X). Låt oss göra det utifrån exemplet med 00 dagars slutkurser i aktien Rörvik Timber B (period år 006). För denna har vi modellen X 3 = Rörvik Timber B, slutkurs mätt i 0-ören. där utfallsrummet är en uppräkning av de kurser som faktiskt noterats (X) = f6:8; 6:9; 7:; 7:; 7:3; 7:4; 7:5; 7:8; 7:9; :8; ; : : : ; :; :4; :5; :6; 3:5; 3:6; 3:7; 3:8; 3:9; 4; 4:4; 4:5g Slutkurserna i tidsordning kan ses i tabellen nedan (vilken skall läsas från vänster till höger, uppifrån och ned).4. Stolpdiagram och kumulerat stolpdiagram Om vi beräknar medelvärdet av dessa slutkurser så erhålls A (X) = x + x + + x = 0:869. Nu är det väl inte så intelligent att räkna ut medelvärdet av aktiekurser 5 men i detta läge är vi ute efter något annat. Vi vet nämligen också att 5 Aktiekurser vandrar och man är mer intresserad av vart de är på väg.

23 . Vad statistik handlar om 7 Tabell.: Slutkurser Rörvik Timber B, :0 7:3 8:0 7:5 7:3 7: 7: 6:8 7: 7: 6:9 7:4 7: 7: 7:3 7: 7:8 7:5 8:7 8:4 8:0 8: 7:9 9:5 9:3 9:4 0:8 0:7 : :3 : :0 0:6 0:9 :3 :3 0:8 :4 : :5 :8 0:7 0:5 0:7 : 0:5 0: 0:3 0:0 0:6 0:8 0:6 : :3 : 0:7 0:5 :0 :8 :3 :5 :8 :3 0:9 0:5 0:5 :3 :4 :4 :4 :6 :8 3:0 3: 4:0 3:5 3:8 3:9 3:6 3:6 3:0 :0 :4 :9 3:0 4:0 3:7 4:0 4:4 4:5 3:5 3:8 :7 3:0 : :7 3:0 4:0 3: vårt medelvärde kan skrivas X00 A (X) = i= x i v i P N j= v j X00 = x i p i där talen v i står för vikter. Genom att sortera ovanstående slutkurser i stigande ordning och därefter räkna antalet gånger en kurs inträ ar kan vi bilda paren (x i ; v i ) och medelst ett stolpdiagram beskriva hur ofta t ex kursen 8 förekommer. Vi ser i gur.5 att detta värde förekommer precis 3 gånger. Detta betyder att att värdet 8 förekommer 3 gånger bland de 00 värdena d v s att chansen för att få 8 vid lottdragning bland de 00 slutkurserna är 3 på 00 eller som vi också säger 3%. Nu kan vi resonera på samma sätt för vart och ett av de i (X) ingående talen och erhåller då en följd av procentsi ror: p = %, p = %, p 3 = 4%, o s v speciellt ser vi att p 8 = 7%. Om vi nu istället för Antal på y-axeln inför Procent, eller helt enkelt bara talet p, så erhåller vi vad vi skall kalla det relativa stolpdiagrammet och det är detta diagram som kommer att användas framöver. Givet detta diagram kan vi snabbt utläsa påståenden av typen i= Sannolikheten för att X 3 = 0:9 är 0:0. 6 Vi ritar inte om det relativa stolpdiagrammet utan nöjer oss med att konstatera att de ändringar som behöver göras är att byta ut si rorna på y-axeln (t ex 7! 0:7) samt skriva p istället för Antal. Ett annat viktigt diagram som i sig innehåller materialet till ett mycket viktigt verktyg, som vi har anledning att återkomma till längre 0:0. 6 I matematiken lär vi oss att procent kan skrivas som hundradelar d v s att % =

24 8.4. Tre typer av gram Antal Rörvik Timber Figur.5: Stolpdiagram över slutkurser i Rörvik Timber B, period fram, är det relativa kumulerade stolpdiagrammet. Detta diagram bestäms av punkterna! nx x n ; x i p i ; n = ; ; 3; : : : ; 00. i= Vi skriver inte upp dess matematiska de nition, som bara blir krånglig, utan nöjer oss med gur.6. p Rörvik Timber Figur.6: Kumulerat stolpdiagram över slutkurser i Rörvik Timber B, period Observera att det kumulativa relativa stolpdiagrammet alltid är växande och går från 0 till.

25 . Vad statistik handlar om 9 Exempel (SQL-anrop) Till en resebyrås databasserver inkommer SQL-anrop och den dataansvarige har under dagens brådaste timme noterat hur många anrop som anländer varje minut (och varje anrops svarstid) och därvid erhållit bland annat följande tabell över anropen Materialet är tänkt att användas för att söka svar på frågor som: Klarar servern alltid av att besvara frågorna inom rimlig tid? Hur stor andel av tiden har servern inga frågor att besvara? Finns det risk för att servern kan bli överbelastad, så att svarstiderna blir orimliga, och i så fall hur stor är denna risk? Vi har ännu inte alla de verktyg som behövs för att kunna besvara dylika frågor men för en första analys kan vi alltid uttnyttja de vi har. Till att börja med beräknar vi de fyra måtten x s g g Medelvärde Varians Skevhet Toppighet 5:90 5:4 0:08 0:39 Vidare nner vi materialets relativa stolpdiagram och relativa kumulerade stolpdiagram se gur.7a och.7b. p p A n r o p A n r o p (a) Stolpdiagram (b) Kumulerat stolpdiagram Figur.7: SQL-anrop till en server.4. Histogram och kumulerat histogram Hitills har vi betraktat de möjliga slutkurserna för Rörvik Timber B som varande ett ändligt antal men en stunds eftertanke ger att detta

26 0.4. Tre typer av gram utfallsrum bara är en approximation av alla de möjligheter som nns. Det skulle därför inte vara helt fel att för Rörvik Timber B tänka sig ett utfallsrum av typen X = fx j 6:8 x 4:5g. Detta utfallsrum består då av oändligt många punkter och idén med stolpdiagram fungerar inte längre. Vad vi då kan göra är att fösa ihop alla observationer i ett intervall t ex kan vi notera antalet observationer mellan 6:8 x < 6:9, mellan 6:9 x < 7 o s v. Den uppmärksamme ser nu att vi i princip är tillbaks till stolpdiagrammet men nu från en annan utgångspunkt. Vidare är valet av intervall godtyckligt ty jag kunde lika gärna ha valt intervallen 6:8 x < 7, 7 x < 7: o s v eller varför inte olika intervalllängder 6:7 x < 7:3, 7:3 x < 7:7 o s v. Alla varianter kan förekomma och vissa av dem är bättre på att avslöja inneboende strukturer hos data än andra. För att komma fram till en avslöjande intervallindelning nns ingen annan metod än att göra intelligenta prövningar. Till varje indelning hör ett histogram och dess kumulerade histogram och vi skall för vår illustration välja indelningen 6 x < 7, 7 x < 8 o s v se gur.8a och b. Exempel (Skogsområde) Vid försäljning av ett skogsområde skall områdets värde i form av avverkningsbart timmer uppmätas. För att göra detta indelades området i ett rutnät om N rutor ur vilka 49 rutor togs slumpmässigt. I varje utvald ruta uppmättes därefter volymen timmer varvid följande avrundade värden, i något mått, erhölls 0:7 0:9 :0 :3 :9 :7 3: 3:4 3:4 3:5 3:5 4:3 5: 5:9 6:0 6:3 6:5 6:6 7: 7:4 7:6 7:9 8:3 8:3 8:3 8:3 8:7 0:0 0:0 0:3 :0 3:4 4: 4:8 6:7 6:8 7: 7:7 8:9 9:0 9:4 9:7 4:3 6: 6: 8:3 3:7 39:3 44:8 Analysera materialet och skatta den totala mängden timmer i skogsområdet. Data är de nierat på ett sådant sätt, volymmått, att det kan betraktas som kontinuerligt. De fyra måtten blir x s g g Medelvärde Varians Skevhet Toppighet :0 00:0 339:5 45

27 . Vad statistik handlar om p (a) Histogram p (b) Kumulerat histogram Rörvik Timber Rörvik Timber Figur.8: Två typer av gurer över slutkurser i Rörvik Timber, period Vi ser att standardavvikelsen (roten ur variansen) är stor jämfört med medelvärdet och det är därför av vikt att nna data:s underliggande struktur. Skevheten säger oss att det mesta av data ligger till vänster om medelvärdet. Vårt nästa steg blir att rita några lämpliga histogram se gur.9 på sid. Observera att data självt informerar oss om att en symmetrisk fördelning inte kan föreligga. I det vänstra histogrammet har vi lika stor bas på alla rektanglar (vilket är olämpligt vid skeva fördelningar) och i det högra histogrammet gäller istället att varje rektangel har lika stor yta.det vänstra diagrammet är förvisso skevt men alltför grovt för att ge en bra bild över data. I det högra diagrammet ger vi varje rektangel en lika stor yta och detta ger en bättre bild över hur data fördelar sig på ytor med lite respektive mycket timmer. De två första diagrammen bekräftar således den skevhet som anges av talet g. Vårt nästa steg blir att pröva med en nare indelning som tar hänsyn till att det nns mer data i början. Därvid erhålls digram (c) som, av ännu ej diskuterade skäl, ger en bra beskrivning av data.

28 .4. Tre typer av gram (a) Lika intervall, total yta= (b) Lika ytor, total yta= (c) Olika intervall, total yta= Figur.9: Försäljning av ett markområde

29 . Stokastiska variabler, väntevärden och sannolikheter I avsnittet om Vad statistik handlar om infördes en mängd nya begrepp på intuitiv grund och vi skall nu ägna ett par kapitel åt att formalisera och exakt de niera vad vi menar med begrepp som stokastisk variabel, väntevärde (synonym till vårt aritmetiska medelvärde), sannolikhet (våra pinnar) och fördelningsfunktion (våra diagram). Observera att om man inte är noggrann inom statistik så kan man bevisa vad som helst t ex att gud nns eller att medlemmarna i Stockholms Kooperativa Hyresförening vill ha höga hyror och många andra tokigheter. I detta kapitel börjar vi med att diskutera begreppet stokastisk variabel.. Diskret och kontinuerlig Trot det eller ej men en stokastisk variabel är faktiskt en funktion så egentligen verkar benämningen variabel helt korkad. Men för er som läst lite matematik och speciellt då funktionslära vet att man kan skapa en funktion av en funktion och då är den ena funktionen en variabel till den andra (i matematisk formalism blir det att funktionerna f(x) och g(x) båda med variabeln x ger upphov till funktionen f(g(x)) och g(x) som faktiskt är en funktion blir en variabel till f(x)). För att erhålla en intuitiv förståelse för detta tänker vi på situationen kast med en tärning där vi intresserar oss för antalet prickar som kommer upp d v s vi bildar den stokastiska variabeln X = antal prickar som erhålls vid kast med en tärning. Vad vi oftast tänker på i denna situation är antalet prickar men det egentliga utfallsrummet innehåller sådana händelser som att tärningen hamnar på kanten eller hörnet. Även hur tärningen är vriden i förhållande till något godtyckligt koordinatsystem kommer in. Vår hjärna applicerar dock en funktion som bortser från dessa möjligheter, den lterar bort dem, och det enda som återstår är "antalet prickar". En mer 3

30 4.. Diskret och kontinuerlig korrekt beskrivning av vår variabel X är därför X (!) = antal prickar som erhålls vid kast med en tärning. för alla! i mängden av alla möjliga utfall. Detta ger oss nu en anledning att ta upp skillnaden mellan utfallsrummen och X. Med utfallsrummet menar vi de nitionsmängden till den stokastiska variabeln X och med X avses X:s värdemängd. Om t ex = f! ;! ; : : :g så blir X = fx (! ) ; X (! ) ; : : :g och om är uppräkneligt så blir också X det. Vidare nns inget slumpmässigt i talet X (! k ) och vi betcknar det därför med x k och har därför att X = fx ; x ; : : :g. Observera att mycket väl kan vara större än X ty det kan t ex gälla att X (! i ) = X (! j ). Om vi t ex intresserar oss för familjer så består dessa ofta av er än en person men varje person i familjen är en representant för familjen. Detta resonemang är även giltigt för icke-uppräkneliga utfallsrum t ex kan sex, vid kast med tärning, komma upp på ett oändligt antal sätt om man beaktar vridningar i förhållande till något xerat koordinatsystem. Stokastiska variabler delar naturligt in sig i två grupper dels de som är diskreta och dels de som är kontinuerliga. Vårt nästa steg är att de niera vad vi menar med de två orden diskret och kontinuerlig och för att de niera dem använder vi oss av utfallsrummets struktur. Om utfallsrummet för den stokastiska variabeln X kan skrivas X = fx i j i N \ Bg där N är de naturliga talen (de positiva heltalen) d v s ; ; 3; : : : och B någon form av begränsning säges utfallsrummet vara diskret (uppräkneligt). Till denna typ av utfallsrum hör mängden av de naturliga talen, de hela talen, de rationella talen och många er mängder. Mängderna behöver inte ens bestå av tal utan kan vara alla pilsnerkorvar i ett snabbköp. Det enda kravet är att elementen (talen, pilsnerkorvarna m m) i vårt utfallsrum inte får vara er än de naturliga talen (märkligt men sannt men de hela talen är lika många som den naturliga talen). Med en diskret stokastisk variabel avses sålunda den funktion som har ett diskret utfallsrum (X). Med begränsningen B = f; ; 3; 4; 5; 6g svarar vårt (X) ovan de nitivt mot en diskret stokastisk variabel. Om utfallsrummet kan skrivas X = fx j x R \ Bg Detta är vid en noggrannare analys inte helt korrekt men synsättet duger mer än väl. I löpande text skriver vi (X) och i formelområden X om vi nu överhuvudtaget bryr oss om att ange X.

31 . Stokastiska variabler, väntevärden och sannolikheter 5 där R är de reella talen och B någon form av begränsning säges utfallsrummet vara kontinuerligt (icke-uppräkneligt). Ett exempel på en stokastisk variabel som ger upphov till ett kontinuerligt utfallsrum är X = längden hos en homo sapiens. Här är en möjlig begränsning på längden cm till 400 cm (även om längden cm måste vara en kort rackare) ty längden måste vara positiv och människan kan inte bli hur lång som helst. Vi har således X = fx j x R \ (; 400)g där begränsningen B är intervallet cm till 400 cm. Detta utfallsrum kan även skrivas X = fx j x 400g och det behövs mycken eftertanke för att visa att punkterna i denna mängd ej är möjlig att räkna upp. Än mer märkligt är att antalet punkter i intervallet (; 400) är lika många som antalet punkter i intervallet (0; ). 3 De nition 7 En stokastisk variabel säges vara diskret om dess utfallsrum är uppräkneligt och kontinuerlig om dess utfallsrum är ickeuppräkneligt.. Väntevärden I vår de nition av A (X) utgick vi ifrån ett ändligt utfallsrum och kunde visa att funktionen A (X) uppfyller följande tre egenskaper. Om X 0 ) A (X) 0. Om X och X är två stokastiska variabler och c ; c R så gäller att A (c X + c X ) = c A (X ) + c A (X ). 3. A () =. Vi skall nu utvidga storheten A (X) till att gälla för godtyckliga diskreta (d v s även sådana med uppräkneligt oändliga utfallsrum) och kontinuerliga stokastiska variabler och vi gör detta axiomatiskt (med icke bevisbara påståenden som vi tror på) genom att stipulera att väntevärdet (ett generaliserat medelvärde, även kallat det förväntade värdet) E (X) är en storhet som uppfyller följande 3 Beviset för detta påstående är dock helt elementärt bara man skapar rätt geometrisk bild.

32 6.. Väntevärden Axiom 8 (Väntevärde) För en godtycklig stokastisk variabel X gäller. Om X 0 ) E (X) 0.. Om X och X är två stokastiska variabler och c ; c R så gäller att E (c X + c X ) = c E (X ) + c E (X ). 3. E () =. Detta betyder att även E (X) är en normaliserad positiv linjär operator (på samma sätt som A (X)). Eftersom vi nu tillåter oändliga utfallsrum behöver vi ytterligare ett "axiom" 4. Givet stokastiska variabler fx i g som växer monotont (X i X i+ ) mot en x gräns X då gäller för dessa stokastiska variabler att lim E (X i) = E lim X i = E (X) i! i! d v s att vi kan låta symbolerna E och lim byta plats. Nu behövs egentligen inte detta fjärde axiom ty det går att visa att det, under vissa förutsättningar, gäller och därmed är det inte ett axiom utan ett bevisbart påstående. Axiomen ger oss direkt följande viktiga samband. Theorem 9 För väntevärdesoperatorn E har vi att. för godtyckliga X i (X) och c i R så gäller E! nx nx c i X i = c i E (X i ). i= i=. om X Y X så gäller E (X ) E (Y ) E (X ). Bevis ) Axiom och induktionsbevis ger påståendet. ) Den första olikheten följer av axiom och eftersom varav det följer Y X 0 ) E (Y X ) 0 ) E (Y ) E (X ) 0 E (Y ) E (X ). Den andra olikheten följer på samma sätt.

33 . Stokastiska variabler, väntevärden och sannolikheter 7 Ibland kan det inträ a att E (X ) = + och E (X ) = så att E (X + X ) = +. Detta är ett obestämt tal. Vi löser detta problem genom att helt enkelt inskränka oss till de variabler där detta inte kan inträ a (prata om gordisk lösning) genom att kräva att.3 Sannolikhet E (jxj) < +. Hitills har vi undvikit begreppet sannolikhet även om vi pratat om chans och pinnar vilka båda i princip är synonyma med detta begrepp. Detta beror på att vi vill sätta den sannolikhet vi skall prata om på en objektiv och matematiskt formell grund. Låt vara ett utfallsrum och tag en delmängd A. 4 Bilda nu den stokastiska variabeln (en s k indikatorvariabel)! A I A (!) = 0! = A som indikerar om! nns i mängden A eller ej. De niera sedan sannolikheten för A genom relationen P (A) = E I A (!). (.) Notera att P sannolikheten i sig är en funktion vars de nitionsområde är alla (ja de viktigaste i varje fall) delmängder i utfallsrummet. En indikatorfunktion har ett par trevliga egenskaper. Om A och B är två delmängder i så ger gur. på sid 8 och en stunds eftertanke att. I A[B (!) = I A (!) + I B (!) om A och B är disjunkta,. I A\B (!) = I A (!) I B (!). Dessa egenskaper låter sig lätt utvidgas, med hjälp av induktion, till att gälla för n disjunkta mängder. I följande exempel, baserat på ett diskret utfallsrum, skall ordet symmetri tolkas som att ha identiska egenskaper. 4 Läsaren må se upp här därför att beteckningen A, nu och framledes, står för två olika saker. Sammanhanget avgör om vi betraktar en delmängd eller ett medelvärde.

34 8.3. Sannolikhet A B A B (a) Union A [ B (b) Snitt A \ B Figur.: Illustration av union och snitt Exempel 3 Bilda den stokastiska variabeln X = antalet prickar vid kast med en symmetrisk tärning. Det gäller då att X = f; ; 3; 4; 5; 6g ty det är endast dessa tal vi intresserar oss för. Eftersom X kan delas upp i sex disjunkta delmängder X = fg [ fg [ f3g [ f4g [ f5g [ f6g erhålls med upprepad användning av. ovan och axiom för väntevärdet att! 6X P ( X ) = E (I X (!)) = E I fig (!) = = 6X E I fig (!) = i= 6X p i. i= i= 6X P (fig) Att tärningen är symmetrisk betyder att varje möjligt utfall har samma sannolikhet (identisk egenskap) d v s p i = p och detta tillsammans med axiom 3 för väntevärdet ger oss = E (I X (!)) = P ( X ) = i= 6X p i = i= 6X p = 6p i=

35 . Stokastiska variabler, väntevärden och sannolikheter 9 varför sannolikheten p erhålls till (förvånad?) p = 6. I detta exempel har vi att elementarmängden 5! är en av mängderna fig, för något i. Observera att det är skillnad på fig och i den första storheten är en mängd och den andra ett tal. Detta gör att vi kan ställa och besvara frågor av typen vad är sannolikheten att få mer än tre prickar vid kast med en symmetrisk tärning. Exempel 4 Bilda den stokastiska variabeln X = antal prickar vid kast med en symmetrisk tärning där X = f; ; 3; 4; 5; 6g. Vi har nu att den efterfrågade sannolikheten kan skrivas P (X > 3) = P (f4g [ f5g [ f6g)! 6X = E I fig (!) = i=4 6X E I fig (!) i=4 = P (f4g) + P (f5g) + P (f6g) = 3 6 = 0:5. Nåväl, inte orkar man skriva hela uppsatser för de enklaste problem så istället skriver man kortare P (X > 3) = gynnsamma utfall för fx > 3g möjliga utfall = 3 6. Med hjälp av de fyra axiomen, för väntevärdet, kan vi nu generellt ange sannolikheterna för alla delmängder A, på det diskreta utfallsrummet = f! k g kn, till P (A) = E I A (!) = X! k A P (! k ). (.) 5 En av de minsta möjliga delmängderna d v s den innehåller ingen annan delmängd än sig själv.

36 30.3. Sannolikhet Sannolikheten p k = P (! k ) är sannolikheten för en av de ömsesidigt uteslutande händelserna (kallade elementarhändelser 6, t ex att få en sexa) och denna sannolikhet kan vara godtycklig så länge som axiomen ovan är uppfyllda d v s den behöver inte anta ett och samma värde för alla k. Ovanstående ger oss följande alternativa, komplementära, sätt att beräkna sannolikheter som vi kommer ha stor nytta av framöver. Theorem 0 För varje utfallsrum = f! ;! ; : : : ;! N g där de tillhörande sannolikheterna p ; p ; : : : ; p N alla är rationella tal så gäller för en godycklig delmängd A i att P (A) = gynnsamma utfall för A möjliga utfall Bevis Vi kan i ett första steg betrakta utfallsrummet 0 =! ; f! ; : : : ;! N g = f! ;! 0 g med sannolikheterna p och p 0. Det gäller nu att kvoten p p 0 är ett rationellt tal och det nns därför tal k och l sådana att i utfallsrummet 00 = f! ; : : : ;! k ;! 0 ; : : : ;! 0 lg, där! = =! k och! 0 = =! l 0, har alla elementarhändelser samma sannolikheter p 00 = k+l. Sålunda inses att varje utfallsrum = f! ;! ; : : : ;! N g kan utvidgas till ett nytt och större utfallsrum 0 = f! ; 0! ; 0 : : : ;! N 0 0g där varje elementarhändelse har samma sannolikhet p = N. Det gäller därför att 0 P (A) = X ia = E I (! i) 0 = X p = ia gynnsamma utfall för A möjliga utfall antal elemtarhändelser i A N 0 6 Händelse och mängd är synonyma ord för samma sak. Händelse är vardagsspråk och mängd matematikspråk.

37 . Stokastiska variabler, väntevärden och sannolikheter 3 Låt nu X vara en godtycklig stokastisk variabel på utfallsrummet och I f!k g (!) vara indikatorfunktionen för elementarhändelsen! k. Observera att X är en funktion på utfallsrummet varav följer att uttrycket X (!) = X I (! k ) X (! k ) för!! k är välde nierat för diskreta utfallsrum. Om vi nu använder förväntningsoperatorn E på detta uttryck så erhålls E X (!) = X E I f!k g (!) X (! k ) = X E I f!k g (!) X (! k )! k = X! k X (! k ) p k! k ty X (! k ) är ett xt reellt tal. Detta innebär att vi nu har en metod för att räkna ut väntevärdet för en diskret stokastisk variabel om vi känner till de enskilda sannolikheterna p k. Exempel 5 Bilda den stokastiska variabeln X = antal prickar vid kast med en symmetrisk tärning där X = f; ; 3; 4; 5; 6g. För denna variabel gäller att p k = P (X = k) = 6 ; k X och vi nner det förväntade antalet prickar till E (X) = 6X x 6 = 3:5. x= Ett resultat som vi intuitivt känner för ty det är inget annat än balanseringspunkten för talen ; ; 3; 4; 5; 6 alla med lika sannolikhet (vikt). Vi har nu ett uttryck för sannolikheten av en mängd A i ett diskret utfallsrum men vi saknar motsvarande uttryck för de kontinuerliga utfallsrummen. När det gäller diskreta utfallsrum så är dessa hanterbara på en elementär nivå ty vi kan alla räkna ; ; 3; : : : och det är allt som behövs. Men de kontinuerliga utfallsrummen skapar problem av en helt annan dimension (vi behöver t ex måtteori en av många grenar på matematikens träd) och vi skall därför nöja oss med att de niera denna sannolikhet.

2 Dataanalys och beskrivande statistik

2 Dataanalys och beskrivande statistik 2 Dataanalys och beskrivande statistik Vad är data, och vad är statistik? Data är en samling fakta ur vilken man kan erhålla information. Statistik är vetenskapen (vissa skulle kalla det konst) om att

Läs mer

F9 SAMPLINGFÖRDELNINGAR (NCT

F9 SAMPLINGFÖRDELNINGAR (NCT Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Statistikens grunder HT, dagtid Statistiska institutionen

Statistikens grunder HT, dagtid Statistiska institutionen Statistikens grunder 1 2013 HT, dagtid Statistiska institutionen Orsak och verkan N Kap 2 forts. Annat ord: kausalitet Något av det viktigaste för varje vetenskap. Varför? Orsakssamband ger oss möjlighet

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data

Läs mer

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4) Stat. teori gk, ht 006, JW F5 STOKASTISKA VARIABLER (NCT 5.1-5.3, samt del av 5.4) Ordlista till NCT Random variable Discrete Continuous Probability distribution Probability distribution function Cumulative

Läs mer

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012 Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår

Läs mer

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram 2.1 Grundläggande matematik 2.1.1 Potensfunktioner xmxn xm n x x x x 3 4 34 7 x x m n x mn x x 4 3 x4 3 x1 x x n 1 x n x 3 1 x 3 x0 1 1

Läs mer

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik Statistik Statistik betyder ungefär sifferkunskap om staten Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information. Verkligheten

Läs mer

ÄNDLIGT OCH OÄNDLIGT AVSNITT 4

ÄNDLIGT OCH OÄNDLIGT AVSNITT 4 VSNITT ÄNDLIGT OCH OÄNDLIGT Är det möjligt att jämföra storleken av olika talmängder? Har det någon mening om man säger att det finns fler irrationella tal än rationella? Är det överhuvudtaget möjligt

Läs mer

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson Uppsala Universitet Matematiska Institutionen Thomas Erlandsson LÄSANVISNINGAR VECKA 36 VERSION 1. ARITMETIK FÖR RATIONELLA OCH REELLA TAL, OLIKHETER, ABSOLUTBELOPP ADAMS P.1 Real Numbers and the Real

Läs mer

Matematisk statistik - Slumpens matematik

Matematisk statistik - Slumpens matematik Matematisk Statistik Matematisk statistik är slumpens matematik. Började som en beskrivning av spel, chansen att få olika utfall. Brevväxling mellan Fermat och Pascal 1654. Modern matematisk statistik

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Innehåll 1 2 Diskreta observationer Kontinuerliga observationer 3 Centralmått Spridningsmått Vad är statistik?

Läs mer

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Kapitel 4 Sannolikhetsfördelningar Sid 79-14 Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin Slumpvariabel En variabel för vilken slumpen bestämmer utfallet. Slantsingling, tärningskast,

Läs mer

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3 Kontinuerliga sannolikhetsfördelningar (LLL Kap 7 & 9) Department of Statistics (Gebrenegus Ghilagaber, PhD, Associate Professor) Financial Statistics

Läs mer

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten

Läs mer

Övningshäfte 1: Logik och matematikens språk

Övningshäfte 1: Logik och matematikens språk GÖTEBORGS UNIVERSITET MATEMATIK 1, MMG200, HT2014 INLEDANDE ALGEBRA Övningshäfte 1: Logik och matematikens språk Övning A Målet är att genom att lösa och diskutera några inledande uppgifter få erfarenheter

Läs mer

6-2 Medelvärde och median. Namn:

6-2 Medelvärde och median. Namn: 6-2 Medelvärde och median. Namn: Inledning Du har nu lärt dig en hel del om datainsamling och presentation av data i olika sorters diagram. I det här kapitlet skall du studera hur man kan karaktärisera

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15 Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 6 april 004, klockan 08.15-13.15 Tillåtna hjälpmedel: Bifogad

Läs mer

MATEMATIKENS SPRÅK. Avsnitt 1

MATEMATIKENS SPRÅK. Avsnitt 1 Avsnitt 1 MATEMATIKENS SPRÅK Varje vetenskap, liksom varje yrke, har sitt eget språk som ofta är en blandning av vardagliga ord och speciella termer. En instruktionshandbok för ett kylskåp eller för en

Läs mer

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse

Läs mer

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar

Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar Sannolikhetslära och inferens II Kapitel 3 Diskreta slumpvariabler och deras sannolikhetsfördelningar 1 Diskreta slumpvariabler En slumpvariabel tilldelar tal till samtliga utfall i ett slumpförsök. Vi

Läs mer

Fö relä sning 1, Kö system 2015

Fö relä sning 1, Kö system 2015 Fö relä sning 1, Kö system 2015 Här följer en kort sammanfattning av det viktigaste i Föreläsning 1. Kolla kursens hemsida minst en gång per vecka. Övningar kommer att läggas ut där, skriv ut dem och ha

Läs mer

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Christian Gottlieb Gymnasieskolans matematik med akademiska ögon Induktion Dag 1 1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Säsongrensning i tidsserier.

Säsongrensning i tidsserier. Senast ändrad 200-03-23. Säsongrensning i tidsserier. Kompletterande text till kapitel.5 i Tamhane och Dunlop. Inledning. Syftet med säsongrensning är att dela upp en tidsserie i en trend u t, en säsongkomponent

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

Induktion, mängder och bevis för Introduktionskursen på I

Induktion, mängder och bevis för Introduktionskursen på I Induktion, mängder och bevis för Introduktionskursen på I J A S, ht 04 1 Induktion Detta avsnitt handlar om en speciell teknik för att försöka bevisa riktigheten av påståenden eller formler, för alla heltalsvärden

Läs mer

Mer om slumpvariabler

Mer om slumpvariabler 1/20 Mer om slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/2 2013 2/20 Dagens föreläsning Diskreta slumpvariabler Vilket kretskort ska man välja? Väntevärde

Läs mer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I G. Gripenberg Sannolikheter Slumpvariabler Centrala gränsvärdessatsen Aalto-universitetet 8 januari 04 3 Tvådimensionella slumpvariabler

Läs mer

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Sammanfattning, del I G. Gripenberg Aalto-universitetet 28 januari 2014 G. Gripenberg (Aalto-universitetet) MS-A0509 Grundkurs i sannolikhetskalkyl

Läs mer

Sannolikheter och kombinatorik

Sannolikheter och kombinatorik Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter

Läs mer

Vidare får vi S 10 = 8,0 10 4 = 76, Och då är 76

Vidare får vi S 10 = 8,0 10 4 = 76, Och då är 76 Ellips Sannolikhet och statistik lösningar till övningsprov sid. 38 Övningsprov.. i) P(:a äss och :a äss och 3:e äss och 4:e äss ) P(:a äss) P(:a äss :a äss) P(3:e äss :a och :a äss) antal P(4:a äss :a

Läs mer

inte följa någon enkel eller fiffig princip, vad man nu skulle mena med det. All right, men

inte följa någon enkel eller fiffig princip, vad man nu skulle mena med det. All right, men MATEMATISKA INSTITUTIONEN STOCKHOLMS UNIVERSITET Christian Gottlieb Gymnasieskolans matematik med akademiska ögon Induktion Dag 2. Explicita formler och rekursionsformler. Dag mötte vi flera talföljder,

Läs mer

Kap 3: Diskreta fördelningar

Kap 3: Diskreta fördelningar Kap 3: Diskreta fördelningar Sannolikhetsfördelningar Slumpvariabler Fördelningsfunktion Diskreta fördelningar Likformiga fördelningen Binomialfördelningen Hypergeometriska fördelningen Poisson fördelningen

Läs mer

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad

Läs mer

Mer om reella tal och kontinuitet

Mer om reella tal och kontinuitet Kapitel R Mer om reella tal och kontinuitet I detta kapitel formulerar vi ett av de reella talens grundläggande axiom, axiomet om övre gräns, och studerar några konsekvenser av detta. Med dess hjälp kommer

Läs mer

Något om sannolikheter, slumpvariabler och slumpmässiga urval

Något om sannolikheter, slumpvariabler och slumpmässiga urval LINKÖPINGS UNIVERSITET Matematiska institutionen Statistik Stig Danielsson 004-0-3 Något om sannolikheter, slumpvariabler och slumpmässiga urval 1. Inledning Observerade data innehåller ofta någon form

Läs mer

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer

Läs mer

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts

Läs mer

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola. Tid: Måndagen den 2015-06-01, 8.30-12.30. Examinator och Jour: Olle Nerman, tel. 7723565, rum 3056, MV, Chalmers. Hjälpmedel: Valfri

Läs mer

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6):

Nedan redovisas resultatet med hjälp av ett antal olika diagram (pkt 1-6): EM-fotboll 2012 några grafer Sport är en verksamhet som genererar mängder av numerisk information som följs med stort intresse EM i fotboll är inget undantag och detta dokument visar några grafer med kommentarer

Läs mer

4.1 Grundläggande sannolikhetslära

4.1 Grundläggande sannolikhetslära 4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser osv. Sannolikhet är ett tal mellan

Läs mer

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4 LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, 216-4-6 OCH INFÖR ÖVNING 4 Övningens mål: Du ska förstå begreppet slumpvariabel och skilja

Läs mer

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU KURSENS INNEHÅLL Statistiken ger en empirisk grund för ekonomin. I denna kurs betonas statistikens idémässiga bakgrund och

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare Olika figurer Stockholms universitet September 2011 Olika typer av data Olika figurer Data nominal, ordinal, intervall och kvot Nominaldata Ordinaldata Intervalldata Kvotdata Med data menar vi jämförbara

Läs mer

Tentamensskrivning i Diskret Matematik för CINTE och CMETE, SF1610, onsdagen den 20 augusti 2014, kl

Tentamensskrivning i Diskret Matematik för CINTE och CMETE, SF1610, onsdagen den 20 augusti 2014, kl 1 Matematiska Institutionen KTH Tentamensskrivning i Diskret Matematik för CINTE och CMETE, SF1610, onsdagen den 20 augusti 2014, kl 14.00-19.00. Examinator: Olof Heden Hjälpmedel: Inga hjälpmedel är tillåtna

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14

Tentamen för kursen. Linjära statistiska modeller. 16 augusti 2007 9 14 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 16 augusti 2007 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Några extra övningsuppgifter i Statistisk teori

Några extra övningsuppgifter i Statistisk teori Statistiska institutionen Några extra övningsuppgifter i Statistisk teori 23 JANUARI 2009 2 Sannolikhetsteorins grunder 1. Tre vanliga symmetriska tärningar kastas. Om inte alla tre tärningarna visar sexa,

Läs mer

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko. SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt

Läs mer

Sannolikhetsbegreppet

Sannolikhetsbegreppet Kapitel 3 Sannolikhetsbegreppet Betrakta följande försök: Ett symmetriskt mynt kastas 100 gånger och antalet krona observeras. Antal kast 10 20 30 40 50 60 70 80 90 100 Antal krona 6 12 16 21 25 30 34

Läs mer

Oberoende stokastiska variabler

Oberoende stokastiska variabler Kapitel 6 Oberoende stokastiska variabler Betrakta ett försök med ett ändligt (eller högst numrerbart) utfallsrum Ω samt två stokastiska variabler ξ och η med värdemängderna Ω ξ och Ω η. Vi bildar funktionen

Läs mer

Kapitel 4. Funktioner. 4.1 Definitioner

Kapitel 4. Funktioner. 4.1 Definitioner Kapitel 4 Funktioner I det här kapitlet kommer vi att undersöka funktionsbegreppet. I de första sektionerna genomgås definitionen av begreppet funktion och vissa egenskaper som funktioner har. I slutet

Läs mer

Föreläsning 1. 732G60 Statistiska metoder

Föreläsning 1. 732G60 Statistiska metoder Föreläsning 1 Statistiska metoder 1 Kursens uppbyggnad o 10 föreläsningar Teori blandas med exempel Läggs ut några dagar innan på kurshemsidan o 5 räknestugor Tillfälle för individuella frågor Viktigt

Läs mer

Beskrivande statistik

Beskrivande statistik Beskrivande statistik Tabellen ovan visar antalet allvarliga olyckor på en vägsträcka under 15 år. år Antal olyckor 1995 36 1996 20 1997 18 1998 26 1999 30 2000 20 2001 30 2002 27 2003 19 2004 24 2005

Läs mer

2.1 Minitab-introduktion

2.1 Minitab-introduktion 2.1 Minitab-introduktion Betrakta följande mätvärden (observationer): 9.07 11.83 9.56 7.85 10.44 12.69 9.39 10.36 11.90 10.15 9.35 10.11 11.31 8.88 10.94 10.37 11.52 8.26 11.91 11.61 10.72 9.84 11.89 7.46

Läs mer

Beskrivande statistik

Beskrivande statistik Beskrivande statistik Sorina Barza Department of Mathematics, Karlstad University, Sweden October 5, 2010 Vad är beskrivande statistik? Sammanställning av statistiska material Vad är beskrivande statistik?

Läs mer

FÖRELÄSNING 8:

FÖRELÄSNING 8: FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data

Läs mer

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski SF1901: SANNOLIKHETSLÄRA OCH STATISTIK FÖRELÄSNING 12. MER HYPOTESPRÖVNING. χ 2 -TEST Jan Grandell & Timo Koski 25.02.2016 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 1 / 46 INNEHÅLL Hypotesprövning

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala

Läs mer

1 Mätdata och statistik

1 Mätdata och statistik Matematikcentrum Matematik NF Mätdata och statistik Betrakta frågeställningen Hur mycket väger en nyfödd bebis?. Frågan verkar naturlig, men samtidigt mycket svår att besvara. För att ge ett fullständigt

Läs mer

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap

Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 3, HT -06 MATEMATISK STATISTIK FÖR F, PI OCH NANO, FMS 012 MATEMATISK STATISTIK FÖR FYSIKER, MAS 233 Laboration 3: Enkla punktskattningar,

Läs mer

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U.

Veckoblad 3. Kapitel 3 i Matematisk statistik, Blomqvist U. Veckoblad 3 Kapitel 3 i Matematisk statistik, Blomqvist U. ya begrepp: likformig fördelning, hypergeometerisk fördelning, Hyp(, n, p), binomialfördelningen, Bin(n, p), och Poissonfördelningen, Po(λ). Standardfördelningarna

Läs mer

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat.

Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat. Föreläsning 5. Funktioner av slumpvariabler. Ett centralt resultat. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Ytterligare begrepp Viktiga

Läs mer

En typisk medianmorot

En typisk medianmorot Karin Landtblom En typisk medianmorot I artikeln Läget? Tja det beror på variablerna! i Nämnaren 1:1 beskrivs en del av problematiken kring lägesmått och variabler med några vanliga missförstånd som lätt

Läs mer

Linjära ekvationer med tillämpningar

Linjära ekvationer med tillämpningar UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Olof Johansson, Nina Rudälv 2006-10-17 SÄL 1-10p Linjära ekvationer med tillämpningar Avsnitt 2.1 Linjära ekvationer i en variabel

Läs mer

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann

Sannolikhetslära. 1 Enkel sannolikhet. Grunder i matematik och logik (2015) 1.1 Sannolikhet och relativ frekvens. Marco Kuhlmann Marco Kuhlmann Detta kapitel behandlar grundläggande begrepp i sannolikhetsteori: enkel sannolikhet, betingad sannolikhet, lagen om total sannolikhet och Bayes lag. 1 Enkel sannolikhet Den klassiska sannolikhetsteorin,

Läs mer

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen

Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS012/MASB03: MATEMATISK STATISTIK, 9 HP, HT-16 Datorövning 2 Betingad fördelning och Centrala gränsvärdessatsen Syftet med den här laborationen

Läs mer

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120)

Övningstentamen i kursen Statistik och sannolikhetslära (LMA120) Övningstentamen i kursen Statistik sannolikhetslära (LMA0). Beräkna ( ) 04.. Malin har precis yttat, ska skruva ihop sitt rektangulära skrivbord igen. Bordet har ett ben i varje hörn, har två långsidor

Läs mer

4. Stokastiska variabler

4. Stokastiska variabler 4. Stokastiska variabler En stokastisk variabel (s.v.) är en funktion som definieras i utfallsrummet. Varje stokastisk variabel har en viss sannolikhetsstruktur. Ex: Man kastar två tärningar. Låt X = summan

Läs mer

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016 SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 4 KONTINUERLIGA STOKASTISKA VARIABLER Tatjana Pavlenko 7 september 2016 PLAN FÖR DAGENS FÖRELÄSNING Repetition av diskreta stokastiska variabler. Väntevärde

Läs mer

Övningshäfte 3: Funktioner och relationer

Övningshäfte 3: Funktioner och relationer GÖTEBORGS UNIVERSITET MATEMATIK 1, MAM100, HT2014 INLEDANDE ALGEBRA Övningshäfte 3: Funktioner och relationer Övning H Syftet är att utforska ett av matematikens viktigaste begrepp: funktionen. Du har

Läs mer

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Tentamen i Sannolikhetslära och statistik Kurskod S0008M Tentamen i Sannolikhetslära och statistik Kurskod S0008M Poäng totalt för del 1: 25 (12 uppgifter) Tentamensdatum 2012-12-19 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson

Läs mer

Laboration 4: Hypotesprövning och styrkefunktion

Laboration 4: Hypotesprövning och styrkefunktion LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR L, FMS 032, HT-07 Laboration 4: Hypotesprövning och styrkefunktion 1 Syfte I denna laboration

Läs mer

ANDREAS REJBRAND 2014-04-25 Matematik http://www.rejbrand.se. Numeriska serier. Andreas Rejbrand, april 2014 1/29

ANDREAS REJBRAND 2014-04-25 Matematik http://www.rejbrand.se. Numeriska serier. Andreas Rejbrand, april 2014 1/29 Numeriska serier Andreas Rejbrand, april 2014 1/29 1 Inledning Författarens erfarenhet säger att momentet med numeriska serier är ganska svårt för många studenter i inledande matematikkurser på högskolenivå.

Läs mer

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare "Det finns inget så praktiskt som en bra teori" November 2011 Bakgrund Introduktion till test Introduktion Formulera lämplig hypotes Bestäm en testvariabel Bestäm en beslutsregel Fatta ett beslut När det

Läs mer

Några vanliga fördelningar från ett GUM-perspektiv

Några vanliga fördelningar från ett GUM-perspektiv Några vanliga fördelningar från ett GUM-perspektiv I denna PM redovisas några av de vanligaste statistiska fördelningarna och deras hantering inom ramen för GUM: Guide to the Expression of Uncertainty

Läs mer

Mer om analytisk geometri

Mer om analytisk geometri 1 Onsdag v 5 Mer om analytisk geometri Determinanter: Då man har en -matris kan man till den associera ett tal determinanten av som också skrivs Determinanter kommer att repeteras och studeras närmare

Läs mer

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation Uppgift 1 Vikt Vikt är en variabel på kvotskalan. Det gör att vi kan räkna med aritmetiskt medelvärde (m) som centralmått (Djurefeldt, 2003:59). Medelvärdet är 35,85 kg. Det saknas värden för två observationer,

Läs mer

Kort om mätosäkerhet

Kort om mätosäkerhet Kort om mätosäkerhet Henrik Åkerstedt 14 oktober 2014 Introduktion När man gör en mätning, oavsett hur noggrann man är, så får man inte exakt rätt värde. Alla mätningar har en viss osäkerhet. Detta kan

Läs mer

SF1911: Statistik för bioteknik

SF1911: Statistik för bioteknik SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion

Läs mer

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)

Läs mer

Sammanfattningar Matematikboken X

Sammanfattningar Matematikboken X Sammanfattningar Matematikboken X KAPITEL 1 TAL OCH RÄKNING Naturliga tal Med naturliga tal menas talen 0, 1,,, Jämna tal 0,,, 6, 8 Udda tal 1,,, 7 Tallinje Koordinater En tallinje kan t ex användas för

Läs mer

Lutande torn och kluriga konster!

Lutande torn och kluriga konster! Lutande torn och kluriga konster! Aktiviteter för barn under Vetenskapsfestivalens skolprogram 2001 Innehåll 1 Bygga lutande torn som inte faller 2 2 Om konsten att vinna betingat godis i spel 5 3 Den

Läs mer

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski

SF1901: Sannolikhetslära och statistik. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski SF1901: Sannolikhetslära och statistik Föreläsning 5. Väntevärde; Väntevärde för funktioner av s.v:er; Varians; Tjebysjovs olikhet. Jan Grandell & Timo Koski 28.01.2015 Jan Grandell & Timo Koski () Matematisk

Läs mer

Föreläsning G70 Statistik A

Föreläsning G70 Statistik A Föreläsning 2 732G70 Statistik A Introduktion till sannolikhetslära Sannolikhetslära: område inom statistiken där vi studerar experiment vars utfall beror av slumpen Sannolikhet: numeriskt värde (mellan

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Enklare matematiska uppgifter

Enklare matematiska uppgifter Elementa Årgång 49, 966 Årgång 49, 966 Första häftet 2555. Visa att 4 n + n + 8 ej kan vara primtal för något heltal n 0. 2556. Man vill göra en behållare utan lock, som rymmer m 3, i form av en rätvinklig

Läs mer

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Beskrivande statistik Kapitel 19. (totalt 12 sidor) Beskrivande statistik Kapitel 19. (totalt 12 sidor) För att åskådliggöra insamlat material från en undersökning används mått, tabeller och diagram vid sammanställningen. Det är därför viktigt med en grundläggande

Läs mer

Grafer och grannmatriser

Grafer och grannmatriser Föreläsning 2, Linjär algebra IT VT2008 Som avslutning på kursen ska vi knyta samman linjär algebra med grafteori och sannolikhetsteori från första kursen. Resultatet blir så kallade slumpvandringar på

Läs mer

Bearbetning och Presentation

Bearbetning och Presentation Bearbetning och Presentation Vid en bottenfaunaundersökning i Nydalasjön räknade man antalet ringmaskar i 5 vattenprover. Följande värden erhölls:,,,4,,,5,,8,4,,,0,3, Det verkar vara diskreta observationer.

Läs mer

4.2.1 Binomialfördelning

4.2.1 Binomialfördelning Ex. Kasta en tärning. 1. Vad är sannolikheten att få en 6:a? 2. Vad är sannolikheten att inte få en 6:a? 3. Vad är sannolikheten att få en 5:a eller 6:a? 4. Om vi kastar två gånger, vad är då sannolikheten

Läs mer

Hur måttsätta osäkerheter?

Hur måttsätta osäkerheter? Geotekniska osäkerheter och deras hantering Hur måttsätta osäkerheter? Lars Olsson Geostatistik AB 11-04-07 Hur måttsätta osäkerheter _LO 1 Sannolikheter Vi måste kunna sätta mått på osäkerheterna för

Läs mer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD 6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller

Läs mer

Exempel. Komplexkonjugerade rotpar

Exempel. Komplexkonjugerade rotpar TATM79: Föreläsning 4 Polynomekvationer och funktioner Johan Thim 2 augusti 2016 1 Polynomekvationer Vi börjar med att upprepa definitionen av ett polynom. Polynom Definition. Ett polynom p(z) är ett uttryck

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig

Läs mer

Obligatorisk uppgift, del 1

Obligatorisk uppgift, del 1 Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten

Läs mer

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013

Föreläsning 11. Slumpvandring och Brownsk Rörelse. Patrik Zetterberg. 11 januari 2013 Föreläsning 11 Slumpvandring och Brownsk Rörelse Patrik Zetterberg 11 januari 2013 1 / 1 Stokastiska Processer Vi har tidigare sett exempel på olika stokastiska processer: ARIMA - Kontinuerlig process

Läs mer