Innehåll Normalfördelning och t-test NBIB44 Vad är punktskattningar? Figurer somvisarmedelochsd, SE ochki (ellerci) Vad är normalfördelning? Processer och mönster Vadärettt-test? Förutsättningar för att t-test ska gälla 2014-02-11, Lars Westerberg, IFM Biologi Linköpings universitet, lawes@ifm.liu.se Vanliga statistiska mått Vanliga statistiska mått Du haren samling observationer (7,8,7,8,2,4,15,13,5,8) Min/max, medel, median, varians, standardavvikelse, standard fel Sammanfattar och beskriver data Tabell eller figur Kontroll Medel 23.7 25.9 Behandl. Du haren samling observationer (7,8,7,8,2,4,15,13,5,8) Min/max, medel, median, varians, standardavvikelse, standard fel Sammanfattar och beskriver data Tabell eller figur Kontroll Behandl. Medel 23.7 25.9 St.avv. 15.7 13.1 1
Excel-demo DetärnästanALDRIG felattvisa data på detta sätt Gårattanvändaföratt tolka hur tydliga sambanden är och dra de enkla slutsatserna Viktiga statistiska parametrar Medel(median, mode): μeller Standardavvikelse beskriver medelspridning i data kring medlet: Kanbetecknasmed: σ, s alt. SD använd till att skapa felmarginaler, konfidensintervall (KI eller CI), kring medel N istickprovet ettavvärdenaistickprovet medelvärdet i stickprovet medelvärdet i stickprovet Använda standardavvikelse i test? Beskriv hur de två erna skiljer sig åt en fµ, s²(x) 0.0 0.2 0.4 0.6 0.8 1.0 fµ, s²(x) 0.0 0.2 0.4 0.6 0.8 1.0-4 -2 0 2 4 X -4-2 0 2 4 X 2
en en en 0.0 1.0 2.0 3.0 en 0.0 1.0 2.0 3.0 0.0 0.4 0.8 3
en 0.0 1.0 2.0 3.0 0.0 0.4 0.8 en 0.0 0.5 1.0 1.5 2.0 0.0 0.4 0.8 en 0 1 2 3 4 5 0.0 0.5 1.0 1.5 2.0 Detsannamedlet, µ, och standardavvikelsen, σ Medlet och standardavvikelsen i stickprovet är punktskattningar av de sanna värdena Standardfelet (standard error) är standardavvikelsen hos medlen. Beräknas utifrån stickprovets SD 0.06 0.10 0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0 0.02 0.14 σ = 2.54 µ = 9.86 10 12 6 8 14 sd= 2.49 medel= 9.64 medel= 9.68 se= 0.12 4
0.05 0.10 0.15 σ = 2.44 µ = 9.93 0.0 0.1 0.2 0.3 0.4 σ = 1 µ = 10.04 Större stickprov ger bättre punktskattningar upptill en gräns 2 4 6 8 10 sd= 2.51 Medel=9.99 medel= 9.99 Mindre standardavvikelse ger mindre felmarginaler 0 1 2 3 4 5 sd= 0.94 medel= 9.83 0 1 2 3 4 5 6 7 se= 0.01 medel= 10.01 0 1 2 3 4 se= 0.05 medel= 10.05 Är allting normalfördelat? Många biologiska faktorer är normalfördelade (hela eller delar av organismen) Vikt(kroppsvikt, viktökning) Antal(blad, ägg, celler) Mängd(C 14 -metoden) Även mätfel anses normalfördelat Quincunx Vad kan skapa normalfördelning? Centrala gränsvärdessatsen: Enligt centrala gränsvärdessatsen gäller att om flera slumpmässiga variabler med samma sannolikhetsfördelning och med ändlig varians adderas, kommer summan att gå mot en normalfördelning. http://sv.wikipedia.org/wiki/centrala_gr%c3%a4nsv%c3%a4rdessatsen 5
Använda normalfördelning Demo Excel konfidensintervall Dranyttaavattdata är/kan antas vara normalfördat Bättrepunktskattningar (medel, sd) Konfidensintervall för intervallskattningar Sk parametriska metoder Icke-parametriska rangordnar data istället och kan vara bättreomintedata är normalfördelat Medel +-95%CI Funktion för konfidensintervall baserat på normalfördeling: Excel, OpenOffice/LibreOffice, Google docs etc: =confidence eller =confidence.t Känn igen en normalfördelning Är det normalfördelat? Kontinuerlig Medel& standardavvikelse Reellatal (-inf inf) Kallas även Gaussfördelning, el. klock-fördelning (Bell-shaped) http://en.wikipedia.org/wiki/normal_distribution Serdetutsomen klocka(en topp)? Är det symmetriskt kring medlet? Är67% inom1sd? Gör histogram Avgör visuellt, eller räkna i klasserna Testa observerat och förväntatmed t.ex. Komolgorov-Smirnoff 6
Använda normalfördelning: t-test T-test: jämför om medlen mellan två stickprov är olika H0: stickproven kommer från samma /er med samma medel; µ 1 = µ 2 H1: stickproven kommer inte från samma / er med samma medel; µ 1 µ 2 Two-sample t-test Beräkna medel(och sd) för båda grupperna Beräkna hur stor skillnaden mellan medlen är jämfört med standardavvikelsen Jämförskillnadenmed student t-distribution ; om den är tillräckligt stor föreligger statistisk signifikans Antaganden för att t-test ska gälla De enskilda stickproven är oberoende av varandra Data är normalfördelat De båda grupperna har samma varians Demo: Excel Funktion för t-test i excel: =t.test eller mer avancerade add-on s I google docs och OpenOffice/Libre: Beräkna t-värdet och använd funktionen =tdist för att finna p-värdet 7