732G01/732G40 Grundläggande statistik (7.5hp)

Relevanta dokument
Föreläsning G70 Statistik A

732G70, 732G01 Statistik A 7hp

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder

Statistik 1 för biologer, logopeder och psykologer

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 5. Kapitel 6, sid Inferens om en population

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

F3 Introduktion Stickprov

Föreläsning G60 Statistiska metoder

13.1 Matematisk statistik

0 om x < 0, F X (x) = x. 3 om 0 x 1, 1 om x > 1.

EXAMINATION KVANTITATIV METOD vt-11 (110204)

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Föreläsning G60 Statistiska metoder

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Forskningsmetoder i offentlig förvaltning

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 12 november 2005, kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

F9 SAMPLINGFÖRDELNINGAR (NCT

EXAMINATION KVANTITATIV METOD

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Bearbetning och Presentation

En typisk medianmorot

MVE051/MSG Föreläsning 7

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 27 mars 2004, kl

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

b) Beräkna väntevärde och varians för produkten X 1 X 2 X 10 där alla X i :na är oberoende och R(0,2). (5 p)

Deskription (Kapitel 2 i Howell) Moment 1: Statistik, 3 poäng

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Föreläsning 7: Punktskattningar

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Välkommen till Matematik 3 för lärare!

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

Studentens namn: Studentens personnummer: Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta.

732G04 Surveymetodik 7.5hp. Jörgen Säve-Söderbergh

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Föreläsning 1: Introduktion

Exempel: Väljarbarometern. Föreläsning 1: Introduktion. Om Väljarbarometern. Statistikens uppgift

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Lektionsanteckningar 11-12: Normalfördelningen

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

2 Dataanalys och beskrivande statistik

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Sannolikhet och statistik 1MS005

STOCKHOLMS UNIVERSITET HT 2011 Statistiska institutionen Bertil Wegmann

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Välkomna till Statistik och kvantitativa undersökningar Lars Bohlin Syfte: Lärandemål. Lärandemål forts.

Tentamen i Matematisk statistik Kurskod S0001M

2. Test av hypotes rörande medianen i en population.

Tentamen i Statistik, STA A13 Deltentamen 1, 4p 24 april 2004, kl

Avd. Matematisk statistik

Förra gången (F4-F5)

GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Beskrivande statistik

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Föreläsningsanteckningar. Grundläggande statistik 732G01/732G40

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Tentamen i Sannolikhetslära och statistik Kurskod S0008M

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Föreläsning G60 Statistiska metoder

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Föreläsning 7: Punktskattningar

Skriv tydligt. Besvara inte frågor med lösryckta ord, utan sammanhängande och tydligt. Visa även dina beräkningar.

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning G70 Statistik A

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

(a) Vilket av följande alternativ är sannolikheten för JACKPOT: P (A \ B), P A C \ B, P (A \ B), P A C \ B C?

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

Skriv tydligt. Besvara inte frågor med lösryckta ord, utan sammanhängande och tydligt. Visa även dina beräkningar.

Transkript:

732G01/732G40 Grundläggande statistik (7.5hp)

2 Grundläggande statistik, 7.5 hp Mål: Kursens mål är att den studerande ska tillägna sig en översikt över centrala begrepp och betraktelsesätt inom statistik. Innehåll: Beskrivande mått Sannolikhetslära Slumpvariabler (stokastiska variabler) Statistiska fördelningar Konfidensintervall Hypotesprövning

3 Grundläggande statistik, 7.5 hp Lärare Annika Tillander E-post: annika.tillander@liu.se Rum: 3E:475 (B-huset, plan 2 ovanför café JAVA) Litteratur Wahlin, K. Tillämpad statistik - en grundkurs. Andra upplagan. Bonnier utbildning. ISBN: 9789152327821

4 Kursupplägg 732G01/732G40 Föreläsningar: teori presenteras (9 st) Lektioner: läraren räknar uppgifter på tavlan (4 st) Räknestugor: studenterna löser uppgifter i boken (4 st) Datorövningar: övningar i praktiska problem på dator (3 st)

5 Examination Skriftlig tentamen (värd 6 hp) kan ge betygen VG, G eller U Inlämningsuppgift (värd 1.5 hp) kan ge betygen G eller U Slutbetyg på kursen är detsamma som betyget på tentamen (givet att inlämningsuppgiften är godkänd)

6 Skriftlig tentamen 4 timmar Tillåtna hjälpmedel: Dubbelsidigt handskrivet A4 med anteckningar Formel- och tabellsamling (delas ut med tentan) Miniräknare av valfri modell

Inlämningsuppgift 7 Görs i grupper om 1-2 studenter Arbetet sker i grupper om högst två personer och genomförs självständigt inom varje grupp - samarbete mellan grupper är alltså inte tillåtet. Uppgiften ska lämnas in senast kl. 23.59 onsdag den 13 september och kommer bedömas som godkänd eller underkänd. Grupper på gränsen till godkänt erbjudas möjlighet till komplettering. Kompletteringen måste lämnas inom en vecka efter att den första versionen rättats och därefter görs en slutgiltig bedömning om godkännande. En slutgiltigt underkänd uppgift eller uppgift inlämnad efter deadline kan inte bli godkänd, utan uppgiften måste genomföras nästa gång kursen ges.

8 Kurshemsida LISAM Kan också googla 732G01 för generell information.

FÖRELÄSNING 1 Kapitel 2 sid 11-46 Populationer, stickprov och variabler

10 Population Den samling enheter (exempelvis individer) som vi vill dra slutsatser om Populationen definieras på logisk väg med utgångspunkt från den frågeställning vi vill besvara Exempel: Studerande vid LiU Röstberättigande i Sverige Antalet enheter i populationen betecknas med N

11 Ändlig och oändlig population En ändlig population har ett begränsat antal enheter Ex: Studenter i ett klassrum I en oändlig population kan man observera oändligt många enheter Ex: Upprepade tärningskast Leder ofta till enklare uträkningar Population brukar (approximativt) betraktas som oändlig om urvalet utgör mindre än 10 procent av populationsstorleken

12 Stickprov eller urval En del av enheterna ur populationen, oftast slumpmässigt utvalda Stickprovet ska vara representativt för populationen Antalet enheter i stickprovet betecknas med n

13 Variabler Resultatet av upprepade mätningar eller observationer av ett fenomen Kvalitativa variabler: Icke-numeriska mätningar Ex: Nationalitet Kvantitativa variabler: Numeriska mätningar Ex: Ålder

14 Variabler Kvantitativa variabler kan delas upp i: Diskreta: Antar bara heltalsvärden Ex: Antal anställda på ett företag Kontinuerliga: Decimalers noggrannhet Ex: Längd

15 Variabler En variabel betecknas med X (stort) De värden som observeras för variabeln betecknas med x 1, x 2, (små)

16 Nominalskala Förekommer bland kvalitativa variabler Grupper som inte kan rangordnas! Ex: Favoritfärg

17 Ordinalskala Förekommer bland både kvalitativa och kvantitativa variabler Grupper som kan rangordnas! Ex: Betyg

18 Metrisk skala Förekommer bland kvantitativa variabler Har numeriska värden (siffror) Ex: Daglig försäljning i en butik

19 Variablers fördelning En fördelning är en sammanställning över vilka värden variabeln kan anta och hur ofta Presenteras ofta med diagram Olika angreppssätt används för att beskriva Kvalitativa variabler Kvantitativa diskreta variabler Kvantitativa kontinuerliga variabler

20 Exempel Företagshälsovården vid ett företag sänder ut en enkät där de anställda bland annat får svara på frågan Hur bedömer Du Din närmaste chefs ledaregenskaper? ( ) Mycket goda ( ) Ganska goda ( ) Varken bra eller dåliga ( ) Ganska dåliga ( ) Mycket dåliga Resultaten sammanställs i följande frekvenstabell Vilken sorts variabel är detta? Åsikt (x) Antal (f) Mycket goda 42 Ganska goda 61 Varken bra eller dåliga 84 Ganska dåliga 23 Mycket dåliga 10 Totalt 220

21 Kvalitativ variabel: Stapeldiagram 45% 40% 35% 30% 25% 20% 15% 10% 5% 0% Mycket goda Ganska goda Varken bra eller dåliga Ganska dåliga Mycket dåliga

22 Exempel En annan fråga på enkäten löd Hur många dagar i veckan motionerar Du? ( ) Ingen ( ) 1 ( ) 2 ( ) 3 ( ) 4 ( ) 5 ( ) 6 ( ) 7 Resultaten sammanställs enligt Vilken sorts variabel är detta? Antal dagar (x) Antal (f) Andel (%) 0 84 38 1 41 19 2 51 23 3 22 10 4 8 4 5 6 3 6 5 2 7 3 1 Totalt 220 100%

23 Diskret kvantitativ: Stolpdiagram Stolpdiagrammet är likt stapeldiagrammet, men ritas med smalare staplar

24 Exempel Dygnstemperaturen (grader Celsius) i centrala Linköping under juli månad 2015 Variabelsort? Dag 1 2 3 4 5 6 7 Temp 20.9 20.7 19.1 16.6 18.7 19.8 19.1 Dag 8 9 10 11 12 13 14 Temp 19.2 18.6 18.4 17.3 17.8 16.0 14.7 Dag 15 16 17 18 19 20 21 Temp 16.1 16.7 18.2 15.6 18.7 19.0 18.6 Dag 22 23 24 25 26 27 28 Temp 19.7 20.1 17.0 19.1 18.4 18.4 20.8 Dag 29 30 31 Temp 20.1 19.0 19.9

25 35% 30% 25% 20% 15% 10% 5% Kontinuerlig kvantitativ: Histogram 0% -15.9 16.0-16.9 17.0-17.9 18.0-18.9 19.0-19.9 20.0- Dygnsmedeltemperatur (grader Celsius)

26 Beskrivande mått Stickprovsmedelvärde n x ҧ = 1 n i=1 x i Populationsmedelvärde N μ = 1 N i=1 x i Ex: Längden på fem slumpmässigt utvalda personer ur en population: 165, 188, 159, 170, 198 5 x ҧ = 1 5 i=1 x i = 1 5 165 + 188 + 159 + 170 + 198 = 176 cm

ҧ 27 Beskrivande mått - Frekvenstabell Stickprov Population g x = σ i=1 f i x i n μ = σ g i=1 f i x i N där g är antalet klasser i tabellen Antal dagar (x) Antal (f) Andel (%) 0 84 38 1 41 19 2 51 23 3 22 10 4 8 4 5 6 3 6 5 2 7 3 1 Totalt 220 100%

28 Beskrivande mått Stickprovsstandardavvikelse (beräkningsformel) s = 1 n n 1 i=1 x i xҧ 2 = σx2 σx 2 n n 1 Population σ = N 1 N i=1 x i μ 2 = σx2 σx 2 N N

29 Beskrivande mått - Frekvenstabell Stickprov s = 1 g n 1 i=1 f i x i xҧ 2 = σ g i=1 f i x 2 i σ g 2 i=1 f i x i n n 1 Population g σ = 1 N i=1 f i x i μ 2 = σ g i=1 f i x 2 i σ g 2 i=1 f i x i N N

30 Beskrivande mått - Andel Stickprovsandel antal enheter i stickprovet med studerad egenskap p = n Population antal enheter i populationen med studerad egenskap π = N Ex: Bland 550 anställda i ett stickprov uppgav 187 att de röker. Vilken andel röker bland urvalet? p = 187 = 0.34 = 34% 550

31 Beskrivande mått - Median Medianen är alltid det mittersta värdet i ett storleksordnat material Om n (eller N) är udda: mittersta värdet Om n (eller N) är jämnt: medelvärdet av de två mittersta värdena Ex: Längder på fem personer 159, 165, 170,188, 198 Medianen = 170 cm Ex: Vikten av fyra personer 53, 62, 70, 85 Medianen = 62+70 2 = 66kg

32 Beskrivande mått - Kvartiler Första kvartilen q 1 är mitten av första halvan av materialet Andra kvartilen q 2 är medianen Tredje kvartilen q 3 är mitten av andra halvan av materialet

33 Beskrivande mått - Typvärde Det vanligaste förekommande värdet i en fördelning Ex: Vid en tentamen har studenterna följande betyg U, U, G, G, G, VG, VG Typvärdet = G

34 När bör vi använda de olika måtten? Kvalitativ variabel Typvärde Median Kvartiler Andelar Kvantitativ variabel Median Kvartiler Medelvärde Standardavvikelse Andelar

35 Standardvägning Ibland är medelvärden missvisande Ex: Ett fackförbund önskar jämföra medellönen vid två företag inom samma verksamhetsområde. Följande information samlas in. Befattning Bolag A Antal personer Jämför lönerna i de två bolagen Medellön (tkr) Bolag B Antal personer Mellanchef/chef 6 36.6 15 34.5 Tjänstemän 77 20.4 34 19.8 Administrativ personal 89 17.2 21 17.1 Medellön (tkr)

36 Exempel Vägda medeltal x A ҧ = 6 36.6 + 77 20.4 + 89 17.2 6 + 77 + 89 = 3321.2 172 19.309 xҧ B = 15 34.5 + 34 19.8 + 21 17.1 15 + 34 + 21 = 1549.8 70 22.140 Företag B verkar ha en högre medellön. MEN det verkar som att det finns fler (större andel) chefer bland företag B. Hur skulle medellönen se ut om andelen som jobbar i de olika befattningarna är densamma i de två företagen?

37 Exempel - Standardvägning x A ҧ = xҧ B = Bolag A 21 36.6 + 111 20.4 + 110 17.2 242 21 34.5 + 111 19.8 + 110 17.1 242 Bolag B Befattning Medellön (tkr) Medellön (tkr) Standardpopulation Mellanchef/chef 36.6 34.5 21 Tjänstemän 20.4 19.8 111 Administrativ personal 17.2 17.1 110 = 4925 242 20.351 = 4803.3 242 19.848 Om befattningsfördelningen vore densamma, har bolag A högst medellön.