Introduktion till statistik för statsvetare

Relevanta dokument
Grundläggande matematisk statistik

Introduktion till statistik för statsvetare

Introduktion till statistik för statsvetare

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

2 Dataanalys och beskrivande statistik

13.1 Matematisk statistik

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Statistik 1 för biologer, logopeder och psykologer

Arvodesenkät. Resultat Egenföretagare.

Gamla tentor (forts) ( x. x ) ) 2 x1

Forskningsmetodik 2006 lektion 2

MVE051/MSG Föreläsning 7

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

KLEINLEKTION. Område statistik. Lektionens upplägg. Lämplig inom kurserna Matematik 2b och 2c. Engage (Väck intresse) Explore (Upptäck laborera)

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Medicinsk statistik I

Medelvärde, median och standardavvikelse

Introduktion till statistik för statsvetare

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Introduktion till statistik för statsvetare

2.1 Minitab-introduktion

ÖVNINGSUPPGIFTER KAPITEL 2

Statistik och epidemiologi T5

Grundläggande matematisk statistik

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Beskrivande statistik

Läs noggrant informationen nedan innan du börjar skriva tentamen

Introduktion till statistik för statsvetare

Läs noggrant informationen nedan innan du börjar skriva tentamen

Mer om slumpvariabler

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

Väntevärde och varians

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Stokastiska signaler. Mediesignaler

4.2.1 Binomialfördelning

Finansiell statistik, vt-05. Kontinuerliga s.v. variabler. Kontinuerliga s.v. F7 Kontinuerliga variabler

F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion

Tentamen i Statistik, STA A13 (4 poäng) Lördag 11 november 2006, Kl

ÖVNINGSUPPGIFTER KAPITEL 2

Repetitionsprov inför provet Statistik

F9 Konfidensintervall

Är sjukvården jämställd och går det åt rätt håll?

F3 Introduktion Stickprov

Statistik 1 för biologer, logopeder och psykologer

6-2 Medelvärde och median. Namn:

Publikation 1994:40 Mätning av tvärfall med mätbil

Studieplanering till Kurs 2b Grön lärobok

Experimentella metoder, FK3001. Datorövning: Finn ett samband

SF1901: SANNOLIKHETSTEORI OCH KONTINUERLIGA STOKASTISKA VARIABLER STATISTIK. Tatjana Pavlenko. 7 september 2016

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Föreläsning G60 Statistiska metoder

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen L9MA30, LGMA30

F13 Regression och problemlösning

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

The Title. The Author. The Date

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

TAMS65 - Föreläsning 1 Introduktion till Statistisk Teori och Repetition av Sannolikhetslära

19.1 Funktioner av stokastiska variabler

En typisk medianmorot

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Repetition kapitel 1, 2, 5 inför prov 2 Ma2 NA17 vt18

TMS136. Föreläsning 7

Finansiering. Föreläsning 6 Risk och avkastning BMA: Kap. 7. Jonas Råsbrant

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Valresultat Riksdagen 2018

Föreläsning 12: Regression

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Statistisk undersökning och jämförelser mellan några volumetriska kärl. XXXXXXX

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M MAM801 IEK309 Institutionen för matematik Datum Skrivtid

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars Ten 1, 9 hp

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Det är tänkt att varje elev eller grupp ska få en egen kopia av provresultaten och en egen datablankett att fylla i.

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

en observerad punktskattning av µ, ett tal. x = µ obs = 49.5.

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

LMA521: Statistisk kvalitetsstyrning

LMA522: Statistisk kvalitetsstyrning

Why you should love statistics - Alan Smith. Hur väl känner du till ditt område? Vet eller tror du?

BIOSTATISTISK GRUNDKURS, MASB11, VT-16, VT2 ÖVNING 3, OCH INFÖR ÖVNING 4

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment


4 Diskret stokastisk variabel

Matematik 2b 1 Uttryck och ekvationer

Laboration 1. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

Beskrivande statistik

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

Föreläsning G70 Statistik A

Transkript:

Stockholms universitet September 2011

Balanseringspunkt Låt oss betrakta mätserie 4 för vilken vi antar att mätdata är längder hos rekryter. En strukturell kunskap om dessa längder är av betydelse vid tillverkning av tex uniformer. Men samma problem har klädkedjor som H&M, Zara mfl Vi har nu angett vad som skall mätas dvs vår slumpvariabel är X = längden hos en rekryt Ett mått av intresse för dessa längder är den genomsnittliga längden. Ordet genomsnittligt är mycket vagt och kan ges många tolkningar. Vi skall först använda ordet i betydelsen balanseringspunkt. Låt oss se hur detta mått kan beräknas.

Balanseringspunkt (forts) Med balanseringspunkten för två lika vikter, v, på avstånden x 1 och x 2 avses det tal x 2 som är sådant att v (x 1 x 2 ) = v ( x 2 x 2 ) Denna jämviktsekvation har lösningen x 2 = x 1 + x 2 2 Vad blir balanseringspunkten för tre lika vikter, v, på avstånden x 1, x 2 och x 3? För de två första talen finner vi x 2 och balanseringspunkten mellan detta tal, som nu har vikten 2v, och x 3 blir på samma sätt som ovan 2v ( x 2 x 3 ) = v ( x 3 x 3 )

Balanseringspunkt (forts) Denna andra jämviktsekvation har lösningen x 3 = x 1 + x 2 + x 3 3 För fyra tal finner vi analogt (beräkningarna överlåts till läsaren) x 4 = x 1 + x 2 + x 3 + x 4 4 och för våra 20 längdmätningar erhålls balanseringspunkten x 20 = x 1 + x 2 + x 19 + x 20 20 = 1 20 (x 1 + x 2 + x 19 + x 20 ) = 1 20 20 x i = 843 i=1 5 = 168.6

Balanseringspunkt (forts) När vi har många mätningar kommer vi ofta få dubletter, tripletter, osv. Låt oss därför antaga att vi fick n 1 stycken x 1, n 2 stycken x 2,..., n k stycken x k (bland de 20 hittar vi två stycken 154, två stycken 159 och två stycken 170. Resterande längder finns det bara en av). Vi kan nu skriva, n = n 1 + n 2 + + n k, x n = 1 n n i=1 x i = 1 n k n j x j = j=1 k n j j=1 n x j Inför nu beteckningen ˆp j = n j n där vi kallar ˆp j för normerad pinne. För normerade pinnar gäller k k n j ˆp j = j=1 j=1 n = k j=1 n j n = 1

Balanseringspunkt (forts) Allmänt kan vi skriva balanseringspunkten på formen x n = 1 n n x i = i=1 k ˆp j x j = j=1 k x j ˆp j j=1 Den allmänna balanseringspunkten känner vi även igen som det aritmetiska medelvärdet.

Spridning I nedanstående figur ser vi dels två lika stora pinnar nära varandra och dels samma pinnar långt ifrån varandra. x 1 = 1 x 2 = +1 x 1 = 100 x 2 = +100

Spridning (forts) Ett mått som mäter detta intryck är spridningen (variansen). För de två figurerna definieras denna av ˆσ 2 1 = 2 (x 1j x 1 ) 2 ˆp j respektive ˆσ 2 2 2 = (x 2j x 2 ) 2 ˆp j. j=1 j=1 Spridningen i dessa två fall blir ˆσ 2 1 = ˆσ 2 2 = 2 (x 1j x) 2 1 j=1 2 = ( 1)2 + (1) 2 2 = 1 2 (x 2j x) 2 1 j=1 2 = ( 100)2 + (100) 2 2 = 10 000 Här har vi antagit att pinnarna har storlek 1 2 detta följer av att de är lika och skall summeras till 1.

Spridning (forts) Allmänt definerar vi spridningen som ˆσ 2 = 1 n n (x i x) 2 k = (x j x) 2 ˆp j. i=1 j=1 För att få samma sort som för medelvärdet brukar man dra roten ur variansen och får då standardavvikelsen, ˆσ. För vår mätserie 4 finner vi ˆσ 2 = 68.0 ˆσ = 8.2

Ordna mätserien i växande storleksordning. Det värde som hamnar i mitten kallas median. en är en annan kandidat för ett genomsnittligt värde. Vad gör vi om det inte finns ett entydigt mittersta tal? Vi tar det aritmetiska medelvärdet av de två mittersta! För vår mätserie 4 har vi 20 mätningar och således blir medianen det aritmetiska medlevärdet av de två mittersta. Vi har ˆm = 169 + 170 2 = 169.5

(forts) Allmänt har vi en mätserie x 1, x 2,..., x n och arbetsgången blir 1 ordna i växande storleksordning och beteckna den ordnade mätserien x (1), x (2),..., x (n) och för denna gäller x (1) x (2) x (n). 2 bestäm medianen som x (k) n = 2k + 1 m = x (k) + x (k+1) 2 n = 2k

Första och tredje kvartilen en till den första hälften av den sorterade mätserien kallas den första kvartilen, Q 1. en till den andra hälften av den sorterade mätserien kallas den tredje kvartilen, Q 3. Med andra kvartilen, Q 2, menar vi medianen. För vår mätserie 4 erhålls Q 1 = 163, Q 3 = 174.5

Kvartilavstånd och räckvidd Vi kan nu definiera ett par enkla spridningsmått Med kvartilavståndet IQR avses skillnaden mellan tredje och första kvartilen IQR = Q 3 Q 1 Med räckvidden (range) avses skillnaden mellan största och minsta värdet R = x (n) x (1) För vår mätserie 4 finner vi IQR = 174.5 163 = 11.5 R = 184 154 = 30

Skevhet Begreppet skevhet introduceras enklast med hjälp av figurer y y 1 3 1 2 9 y x 1 3 3 4 5 x 1 3 1 29 x Här är figur a) skev åt höger, b) symmetrisk och c) skev åt vänster.

Skevhet (forts) Hur skapa ett mått för skevhet? Betraktar avståndet till medelvärdet och ta detta höjt till 3. Beräkna talet 3 j=1 (x j x) 3 ˆp j för de tre olika figurerna. Vi finner med x = 4 1 (1 4) 3 1 3 + (2 4)3 1 3 + (9 4)3 1 3 = 30, 2 (3 4) 3 1 3 + (4 4)3 1 3 + (5 4)3 1 3 = 0, 3 (1 6) 3 1 3 + (8 6)3 1 3 + (9 6)3 1 3 = 30. En dimensionslös skevhet definieras av ˆγ 1 = k j=1 (x j x) 3 ˆp j ˆσ 3 = 1 n n i=1 (x i x) 3 ˆσ 3 Framgent avses denna storhet när vi skriver ˆγ 1.

Toppighet Begreppet toppighet introduceras även det enklast med figurer 1 3 6 8 1 8 y y 1 2 3 1 2 3 x x 2 4 1 4 y y 2/5 1/5 1 2 3 1 2 3 Figur a) är spetsigare än b) som är spetsigare än c) som är spetsigare än d). x x

Toppighet (forts) Hur skapa ett mått för toppighet? Betraktar avståndet till medelvärdet och ta detta höjt till 4. Beräkna talet 3 j=1 (x j x) 4 ˆp j för de fyra olika figurerna. Vi finner med x = 2 1 (1 2) 4 1 8 + (2 2)4 6 8 + (3 2)4 1 8 = 0.25, 2 (1 2) 4 1 4 + (2 2)4 2 4 + (3 2)4 1 4 = 0.5, 3 (1 2) 4 1 3 + (2 2)4 1 3 + (3 2)4 1 3 = 0.66 6, 4 (1 2) 4 2 5 + (2 2)4 1 5 + (3 2)4 2 5 = 0.8. En dimensionslös toppighet definieras av ˆγ 2 = k j=1 (x j x) 4 ˆp 1 j n ˆσ 4 = n i=1 (x i x) 4 ˆσ 4 Framgent avses denna storhet när vi skriver ˆγ 2.

För vår mätserie 4 erhålls 20 1 20 (x i x) 3 = 3.41 och i=1 20 1 20 (x i x) 4 = 502.05 i=1 varför vi erhåller skevheten och toppigheten ˆγ 1 = 3.41 8.2 3 = 0.006 och ˆγ 2 = 502.05 8.2 4 = 0.111 Bestäm de genomgångna måtten (balanseringspunkt, spridning, varians, skevhet och toppighet) för de övriga mätserierna. Beskriv med egna ord vad de olika måtten står för.

169, 172, 159, 170, 154, 159, 184, 177, 181, 166, 170, 167, 164, 168, 174, 171,