Innehåll. Normalfördelning och t-test. Vanliga statistiska mått 2/11/2014. Vad är punktskattningar? Figurer somvisarmedelochsd, SE ochki (ellerci)



Relevanta dokument
Statistik 1 för biologer, logopeder och psykologer

Uppgift

Föreläsning 9: Hypotesprövning

Tentamen i TMA321 Matematisk Statistik, Chalmers Tekniska Högskola.

Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) kl 08-13

HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem

Kvalster. Korrelation och regression: lineära modeller för bivariata samband. Spridningsdiagram. Bivariata samband

Grundläggande biostatistik. Jenny Selander

Statistik och epidemiologi T5

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

parametriska test Mätning Ordinalskala: Nominalskala:

Datorlaboration 2 Konfidensintervall & hypotesprövning

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

F14 Repetition. Måns Thulin. Uppsala universitet Statistik för ingenjörer 6/ /15

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Lunds tekniska högskola Matematikcentrum Matematisk statistik

Regression med kvalitativa variabler. Jesper Rydén

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Skrivning i statistik med beslutsteori för Brandingenjörer tisdag 26 maj 2009

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Statistik och epidemiologi T5

Repetition och ANOVA. nbib44

Nedlagd studietid och olika kurskarakterisika en anspråkslös analys baserad på kursvärderingsdata. Fan Yang Wallentin

Statistiska metoder för säkerhetsanalys

Datorövning 2 Statistik med Excel (Office 2003, engelska)

Diskussionsproblem för Statistik för ingenjörer

Medicinsk statistik II

DATORÖVNING MED R: ANALYS AV KORSTABELLER, RANGSUMMETEST, ÅTERSAMPLINGSMETODER

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Fristående förskolor totalt Antal svar samtliga fristående förskolor: 360 (57 %)

OBS! Skriv e-postadress på tentan om du vill ha resultatet innan jul. Tentamensgenomgång måndagen den 9/ kl i MC413.

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Stella Nova förskola

SANNOLIKHET. Sannolikhet är: Hur stor chans (eller risk) att något inträffar.

TT091A, TVJ22A, NVJA02 By, Pu, Ti. 50 poäng

Lektion 1: Fördelningar och deskriptiv analys

STATISTIK. Statistik är: 1. Insamling av data 2. Analys av data 3. Presentation av data.

4-6 Trianglar Namn:..

Konjunkturen i Östra Mellansverige i regionalt perspektiv

INLÄMNINGSUPPGIFT 2 (Del 2, MATEMATISK STATISTIK) Kurs: MATEMATIK OCH MATEMATISK STATISTIK 6H3000

Statsbidrag för läxhjälp till huvudmän 2016

DATORÖVNING MED R: ANALYS AV KORSTABELLER, RANGSUMMETEST, ÅTERSAMPLINGSMETODER

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Höjd arbetsgivaravgift för unga. Konsekvenser för detaljhandeln

Lathund, procent med bråk, åk 8

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl

Ungdomsindikator: Avgångna ledamöter

Statistiska synpunkter på politiska opinionsundersökningar

Kriterium Kvalitet 1 Kvalitet 2 Kvalitet 3 Kvalitet 4 Använda, Utveckla och uttrycka

Är sjukvården jämställd och går det åt rätt håll?

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 ( ) OCH INFÖR ÖVNING 9 ( )

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Genomsnittlig ny månadshyra för 3 rum och kök 2013 efter region

Datorövning 2 Diskret fördelning och betingning

Stratsys för landsting och regioner

Linjär regressionsanalys. Wieland Wermke

Statistik Lars Valter

1. Frekvensfunktionen nedan är given. (3p)

Datorövning 3: Icke-parametriska test

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

DOP-matematik Copyright Tord Persson. Bråktal Läs av vilka tal på tallinjen, som pilarna pekar på. Uppgift nr

Mätning av effekter. Vad är elektrisk effekt? Vad är aktiv-, skenbar- reaktiv- medel- och direkteffekt samt effektfaktor?

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 7. Multipel regression. (LLL Kap 15) Multipel Regressionsmodellen

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Föreläsning 14: Försöksplanering

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet. Laboration 4. Regressionsanalys

ARBETSRAPPORT NR 6 INOM GAVRA-ROJEKTET. Maria Nygren. Barnen en jämförelse mellan svenska och grekiska barn i tvillingmaterialet (2007)

Tentamen i Matematisk statistik Kurskod S0001M

För övrigt fullständig överensstämmelse kvalitativt sett för båda proverna. Alla lab som analyserat P-CCP ak på prov 18/D rapporterar ett starkt

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Snabbslumpade uppgifter från flera moment.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl

Riktlinjer - Rekryteringsprocesser inom Föreningen Ekonomerna skall vara genomtänkta och välplanerade i syfte att säkerhetsställa professionalism.

Träning i bevisföring

Modul 6: Integraler och tillämpningar

Så sparar vi till barnen. Rapport från Länsförsäkringar sommar 2016

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Avd. Matematisk statistik

Måttbandet nr 236 mars 2014

912 Läsförståelse och matematik behöver man lära sig läsa matematik?

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

Sammanfattning av kursdag 2, i Stra ngna s och Eskilstuna

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Axiell Arena. Samarbeta om bilder Regionbiblioteket i Kalmar län

Erfarenheter från ett pilotprojekt med barn i åldrarna 1 5 år och deras lärare

Rapport Agilityverksamhetens framtid

ATT KUNNA TILL. MA1050 Matte Grund Vuxenutbildningen Dennis Jonsson

David Wessman, Lund, 30 oktober 2014 Statistisk Termodynamik - Kapitel 5. Sammanfattning av Gunnar Ohléns bok Statistisk Termodynamik.

Hur skapar man formula r

Lathund för att ta ut data/rapporter från databas PPM-Trycksår

NATIONELLA MATEMATIKTÄVLING

Viktiga dimensioner vid val av test (och även val av deskriptiv statistik) Biostatistik II - Hypotesprövning i teori och praktik.

Uppgift 1. Deskripitiv statistik. Lön

Förlängningen av yrkesutbildningarna på gymnasiet: effekter på utbildnings- och arbetsmarknadsutfall. Caroline Hall SNS,

Transkript:

Innehåll Normalfördelning och t-test NBIB44 Vad är punktskattningar? Figurer somvisarmedelochsd, SE ochki (ellerci) Vad är normalfördelning? Processer och mönster Vadärettt-test? Förutsättningar för att t-test ska gälla 2014-02-11, Lars Westerberg, IFM Biologi Linköpings universitet, lawes@ifm.liu.se Vanliga statistiska mått Vanliga statistiska mått Du haren samling observationer (7,8,7,8,2,4,15,13,5,8) Min/max, medel, median, varians, standardavvikelse, standard fel Sammanfattar och beskriver data Tabell eller figur Kontroll Medel 23.7 25.9 Behandl. Du haren samling observationer (7,8,7,8,2,4,15,13,5,8) Min/max, medel, median, varians, standardavvikelse, standard fel Sammanfattar och beskriver data Tabell eller figur Kontroll Behandl. Medel 23.7 25.9 St.avv. 15.7 13.1 1

Excel-demo DetärnästanALDRIG felattvisa data på detta sätt Gårattanvändaföratt tolka hur tydliga sambanden är och dra de enkla slutsatserna Viktiga statistiska parametrar Medel(median, mode): μeller Standardavvikelse beskriver medelspridning i data kring medlet: Kanbetecknasmed: σ, s alt. SD använd till att skapa felmarginaler, konfidensintervall (KI eller CI), kring medel N istickprovet ettavvärdenaistickprovet medelvärdet i stickprovet medelvärdet i stickprovet Använda standardavvikelse i test? Beskriv hur de två erna skiljer sig åt en fµ, s²(x) 0.0 0.2 0.4 0.6 0.8 1.0 fµ, s²(x) 0.0 0.2 0.4 0.6 0.8 1.0-4 -2 0 2 4 X -4-2 0 2 4 X 2

en en en 0.0 1.0 2.0 3.0 en 0.0 1.0 2.0 3.0 0.0 0.4 0.8 3

en 0.0 1.0 2.0 3.0 0.0 0.4 0.8 en 0.0 0.5 1.0 1.5 2.0 0.0 0.4 0.8 en 0 1 2 3 4 5 0.0 0.5 1.0 1.5 2.0 Detsannamedlet, µ, och standardavvikelsen, σ Medlet och standardavvikelsen i stickprovet är punktskattningar av de sanna värdena Standardfelet (standard error) är standardavvikelsen hos medlen. Beräknas utifrån stickprovets SD 0.06 0.10 0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0 0.02 0.14 σ = 2.54 µ = 9.86 10 12 6 8 14 sd= 2.49 medel= 9.64 medel= 9.68 se= 0.12 4

0.05 0.10 0.15 σ = 2.44 µ = 9.93 0.0 0.1 0.2 0.3 0.4 σ = 1 µ = 10.04 Större stickprov ger bättre punktskattningar upptill en gräns 2 4 6 8 10 sd= 2.51 Medel=9.99 medel= 9.99 Mindre standardavvikelse ger mindre felmarginaler 0 1 2 3 4 5 sd= 0.94 medel= 9.83 0 1 2 3 4 5 6 7 se= 0.01 medel= 10.01 0 1 2 3 4 se= 0.05 medel= 10.05 Är allting normalfördelat? Många biologiska faktorer är normalfördelade (hela eller delar av organismen) Vikt(kroppsvikt, viktökning) Antal(blad, ägg, celler) Mängd(C 14 -metoden) Även mätfel anses normalfördelat Quincunx Vad kan skapa normalfördelning? Centrala gränsvärdessatsen: Enligt centrala gränsvärdessatsen gäller att om flera slumpmässiga variabler med samma sannolikhetsfördelning och med ändlig varians adderas, kommer summan att gå mot en normalfördelning. http://sv.wikipedia.org/wiki/centrala_gr%c3%a4nsv%c3%a4rdessatsen 5

Använda normalfördelning Demo Excel konfidensintervall Dranyttaavattdata är/kan antas vara normalfördat Bättrepunktskattningar (medel, sd) Konfidensintervall för intervallskattningar Sk parametriska metoder Icke-parametriska rangordnar data istället och kan vara bättreomintedata är normalfördelat Medel +-95%CI Funktion för konfidensintervall baserat på normalfördeling: Excel, OpenOffice/LibreOffice, Google docs etc: =confidence eller =confidence.t Känn igen en normalfördelning Är det normalfördelat? Kontinuerlig Medel& standardavvikelse Reellatal (-inf inf) Kallas även Gaussfördelning, el. klock-fördelning (Bell-shaped) http://en.wikipedia.org/wiki/normal_distribution Serdetutsomen klocka(en topp)? Är det symmetriskt kring medlet? Är67% inom1sd? Gör histogram Avgör visuellt, eller räkna i klasserna Testa observerat och förväntatmed t.ex. Komolgorov-Smirnoff 6

Använda normalfördelning: t-test T-test: jämför om medlen mellan två stickprov är olika H0: stickproven kommer från samma /er med samma medel; µ 1 = µ 2 H1: stickproven kommer inte från samma / er med samma medel; µ 1 µ 2 Two-sample t-test Beräkna medel(och sd) för båda grupperna Beräkna hur stor skillnaden mellan medlen är jämfört med standardavvikelsen Jämförskillnadenmed student t-distribution ; om den är tillräckligt stor föreligger statistisk signifikans Antaganden för att t-test ska gälla De enskilda stickproven är oberoende av varandra Data är normalfördelat De båda grupperna har samma varians Demo: Excel Funktion för t-test i excel: =t.test eller mer avancerade add-on s I google docs och OpenOffice/Libre: Beräkna t-värdet och använd funktionen =tdist för att finna p-värdet 7