Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Relevanta dokument
Föreläsning G60 Statistiska metoder

Lektionsanteckningar 11-12: Normalfördelningen

732G01/732G40 Grundläggande statistik (7.5hp)

F9 SAMPLINGFÖRDELNINGAR (NCT

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning G70 Statistik A

Föreläsning G60 Statistiska metoder

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Statistik 1 för biologer, logopeder och psykologer

Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

MVE051/MSG Föreläsning 7

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

F3 Introduktion Stickprov

FÖRELÄSNING 7:

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

FÖRELÄSNING 8:

Forskningsmetodik 2006 lektion 2

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

F9 Konfidensintervall

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

2 Dataanalys och beskrivande statistik

Samplingfördelningar 1

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

TMS136. Föreläsning 7

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Laboration 3: Urval och skattningar

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

732G70, 732G01 Statistik A 7hp

Föreläsning G60 Statistiska metoder

Laboration 3: Urval och skattningar

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Föreläsning G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin

, s a. , s b. personer från Alingsås och n b

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

Varför statistik? det finns inga dumma frågor, bara dumma svar! Serik Sagitov

Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

4.3 Stokastiska variabler (slumpmässiga variabler) 4.4 Väntevärde och varians till stokastiska variabler

Statistik 1 för biologer, logopeder och psykologer

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )

Studietyper, inferens och konfidensintervall

4 Diskret stokastisk variabel

Föreläsning 7: Punktskattningar

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval

Föreläsning 7: Punktskattningar

Statistik 1 för biologer, logopeder och psykologer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

S0005M. Stokastiska variabler. Notes. Notes. Notes. Stokastisk variabel (slumpvariabel) (eng: random variable) Mykola Shykula

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Föreläsning 3. Kapitel 4, sid Sannolikhetsfördelningar

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Föreläsning 5. Kapitel 6, sid Inferens om en population

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

F5 STOKASTISKA VARIABLER (NCT , samt del av 5.4)

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Hypotestestning och repetition

F22, Icke-parametriska metoder.

Föreläsning 7: Punktskattningar

2. Test av hypotes rörande medianen i en population.

S0005M, Föreläsning 2

Datorlaboration 8/5 Jobba i grupper om 2-3 personer Vi jobbar i Minitab Lämna in rapport via fronter senast 22/5 Förbered er genom att läsa och se

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Stockholms Universitet Statistiska institutionen Termeh Shafie

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

EXAMINATION KVANTITATIV METOD vt-11 (110204)

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Finansiell Statistik (GN, 7,5 hp,, VT 2009) Föreläsning 2. Diskreta Sannolikhetsfördelningar. (LLL Kap 6) Stokastisk Variabel

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Matematikcentrum 1(7) Matematisk Statistik Lunds Universitet Per-Erik Isberg. Laboration 1. Simulering

Inledning till statistikteorin. Skattningar och konfidensintervall för μ och σ

Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder

9. Konfidensintervall vid normalfördelning

Statistik och epidemiologi T5

Föreläsning 4: Konfidensintervall (forts.)

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

TMS136. Föreläsning 4

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 8: Konfidensintervall

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

Transkript:

Föreläsning 1 Statistik; teori och tillämpning i biologi 1

Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer Datasalar i E-huset, ingång 27 (B-huset) Statistiska programpaketet SPSS Inlämningsuppgift i 3 delar Grupparbete, 3-4 stycken i varje grupp Godkänd om minst 60 % av de besvarade uppgifterna är rätt för respektive del. Salstenta 3 juni, kl. 14-18 2

Statistik i biologi Inom biologi finns det väldigt mycket data Men hur ska man analysera all data? Med hjälp av statistik kan man bland annat: Beräkna intervall för förväntad viktminskning efter foderbyte Undersöka om det finns samband mellan snödjup och antal fjällämlar Utreda om försurningen i en sjö minskar efter kalkning Och mycket annat! 3

Population och stickprov Inom statistik är en population den mängd av enheter (antal = N) man vill dra slutsatser om. En population kan vara t.ex. alla älgtjurar i Sverige. Det kan vara svårt att observera alla enheter i en population, så därför kan man dra ett stickprov (eng. sample) bestående av ett visst antal urvalsenheter (observationer, antal = n). Vid dragning av stickprov ska varje enhet i populationen ha lika stor chans att komma med i stickprovet och det ska vara ett oberoende mellan dragningarna. Detta kallas för att dra ett obundet slumpmässigt urval (OSU) (eng. random sample). 4

Population och stickprov Utifrån det slumpmässigt dragna stickprovet beräknas vissa statistikor, vilket är skattningar på populationens sanna värden, dess parametrar. Dessa parametrar är t.ex. medelvärde, standardavvikelse. Ju större stickprovsstorlek man använder, desto bättre kommer skattningen på populationens parametrar att bli. Vid dragning av stickprov kan det hända att det kommer med en eller flera så kallade outliers. Det är en extrem observation, som avviker väldigt mycket från de andra. Beroende på vad man vet om denna outliers egenskaper så kan den antingen behållas eller raderas. 5

Variabler och variabeltyper En variabel är något som observeras och som kan variera från enhet till enhet. Variabler antar vissa värden och kan vara på olika skalor: Metrisk skala: värden med en fast nollpunkt och konsekvent skillnad (t.ex. längd, vikt) Intervallskala: värden som bara kan finnas inom ett specifikt intervall, saknar fast nollpunkt (t.ex. temperatur) Ordinalskala: värden som kan rangordnas, dock ej konsekvent skillnad (t.ex. storlek på tröjor) Nominalskala: attribut som den observerade enheten har (t.ex. ögonfärg, hårfärg) 6

Variabler och variabeltyper Kvantitativa variabler brukar också beskrivas som antingen kontinuerliga eller diskreta, vilket är olika variabeltyper. Detta gäller för variabler på alla skalor utom nominalskala. Kontinuerliga: variabler som kan anta ett oändligt antal decimaler (t.ex. längd, vikt) Diskreta: variabler som bara kan anta heltalsvärden (t.ex. antal taggar på ett älghorn) 7

Medelvärde och median Populationsmedelvärdet: (GB s. 23, BB s. 21) μ = N i=1 N X i Stickprovsmedelvärdet: (GB s. 24, BB s. 22) X = n i=1 n X i Stickprovsmedelvärdet beräknat på frekvenstabell: (GB s. 25, BB s. 23) X = n i=1 n f i X i Stickprovsmedianen är värdet i mitten när värdena är i storleksordning och ligger på position: n+1 2 (GB s. 26,BB s. 24) 8

Percentiler och kvartiler För att beskriva hur ett stickprov är fördelat brukar percentiler och kvartiler användas. (GB s. 37-38, BB s. 35-36) Percentil: under denna ligger en viss andel av stickprovets observationer (t.ex. under 30:e percentilen ligger 30 % av observationerna) Kvartil: benämningar på 25:e, 50:e, 75:e percentilerna, där de är respektive första, andra, och tredje kvartil. Kvartilavståndet: Avståndet mellan tredje och första kvartilerna. Andra kvartilen är samma sak som medianen! 9

Varians och standardavvikelse (GB s. 39-43, BB s. 37-41) Populationsvarians: σ 2 = X i μ 2 = X i 2 N N Stickprovsvarians: X i 2 N s 2 = X i X 2 = X i 2 X 2 i n n 1 n 1 Stickprovsvarians beräknad på frekvenstabell: s 2 = f ix 2 2 f i i X i n n 1 Standardavvikelsen är kvadratroten ur variansen 10

Exempel X = antal taggar på ett slumpmässigt valt älghorn i Sverige Vi observerar 15 slumpmässigt utvalda älgtjurar och noterar antalet taggar på deras horn och får följande siffror: 4, 7, 10, 6, 4, 18, 12, 10, 9, 5, 6, 6, 12, 10, 7 Utifrån dessa siffror ska följande göras: Sammanställ data i en frekvenstabell Visa data i ett stapeldiagram Beräkna medelvärde och median Beräkna första och tredje kvartil samt kvartilavståndet Beräkna varians och standardavvikelse 11

Normalfördelning Väldigt viktig inom statistiken och återkommer väldigt ofta i statistiska beräkningar Symmetrisk kring sitt väntevärde (medelvärdet μ) Ytan under normalfördelningskurvan summerar till 1 Normalfördelning Medelvärde 0 med olika standardavvikelser Normalfördelning Standardavvikelse 1 med olika medelvärden 0,4 S 1 2 3 0,4 Medel 0 1 2 0,3 0,3 0,2 0,2 0,1 0,1 0,0-10 -5 0 X 5 10 0,0-3 -2-1 0 1 X 2 3 4 5 6 12

Normalfördelning Standardisering (GB s. 74, BB s. 68) Med hjälp av normalfördelningen kan man undersöka hur stor andel som är mindre eller större än ett givet värde på en variabel (X), eller mellan två givna värden på X. Detta görs genom så kallad standardisering. Z = X i μ σ där μ = variabelns väntevärde och σ = variabelns standardavvikelse Den standardiserade variabeln Z är N(μ = 0, σ = 1). Tabell B.2 (BB s. 676) visar hur stor andel av en normalfördelning som ligger ovanför ett givet värde på Z. 13

Normalfördelning Exempel standardisering X = vikten på en slumpmässigt vald älgtjur i Östergötland i kilogram X är N(μ = 450, σ = 30) Hur stor andel av älgtjurarna i Östergötland väger: a) mer än 475 kg? b) mindre än 440 kg? c) mellan 430 och 470 kg? Det går även att vända på frågeställningen: d) Under vilken vikt finns 10 % av älgtjurarna? e) Över vilken vikt finns 5 % av älgtjurarna? 14

Tack för idag! Nästa tillfälle: Föreläsning 2, onsdag 25/1, 10-12, sal R44 15