Försöksplanering, forts Per Milberg, IFM biologi
Mån31 mar 2014 1. Snabbrepetion 2. Datatyper 3. Frågeställning 4. Datahantering 5. Felpinnar
1a. Snabbrepetition 1 Kunskapshanteringsexpert Försöksplanering & statistik: gäller alla (inte bara blivande forskare) Försöksplanering Optimera den statistiska styrkan Minimera risken för felslut Precisera frågeställningen Frågor av olika typ Omöjliga, orealistiska, oprecisa frågor Naturvetenskapliga frågor = skall gå att besvara med tillgänglig metodik
1b. Snabbrepetition 2 Naturvetenskapliga hypoteser Observation => tolkning (hypotes) => prediktion Viktsutveckligen hos yngre svenska män 1920=> 1) Minskning i kroppsarbete Prediktion 1: Ökande skillnad mellan yrkesgrupper 2) Ökat födointag Prediktion 2: Matportionernas storlek har ökat 3) Mer energirikt födointag Prediktion 3: Matportionernas energiinnehåll har ökat 4) Speglar bara på en allmän ökning i kroppsstorlek Prediktion 4: Om vi korrigerar data för kroppsstorleksökning (tex kroppslängd, BMI) så ser vi inte längre någon ökning i vikt
1c. Snabbrepetition 3 Precision kontra noggrannhet hög precision låg precision hög precision låg precision hög noggrannhet hög(?) noggrannhet låg noggrannhet låg noggrannhet Dålig precision => ökad replikering (fler prov) Pilotförsök: Praktiskta problem Tidsåtgång => kostnader Vilka koncentrationer; doser; tätheter...? Hur ser data ut (medelvärde, varians)? =>styrkeanalyser
1d. Snabbrepetition 4 Urval: population kontra stickprov Population: Den grupp du vill uttala dig om SIFOs senaste väljarbarometer visar att Stickprov: Den grupp du undersöker Exempel: Könskvot i sal E324, 25/1 2013, 10.15-12 Sanna värdet: 33,33333333333333 % utgörs av män Stickprov 1 (stort N=15) => 40,0%
1d. Snabbrepetition 4 Urval: population kontra stickprov Population: Den grupp du vill uttala dig om SIFOs senaste väljarbarometer visar att Stickprov: Den grupp du undersöker Exempel: Könskvot i sal E324, 25/1 2013, 10.15-12 Sanna värdet: 33,33333333333333 % utgörs av män Stickprov 1 (stort N=15) => 40,0% Stickprov 2 (litet N=5) => 0,0% Stickprov 3 (litet N=5) => 60,0%
Mån31 mar 2014 1. Snabbrepetion 2. Datatyper 3. Frågeställning 4. Datahantering 5. Felpinnar
2a. Olikatyperavdata BIKUPA: Hitta på flera exempel på dessa båda datatyper
2a. Olikatyperavdata p 34-36 i statistikboken Enormt stor betydelse! 1. försöksplanering 2. val av analys 3. statistisk styrka
2b. Olikatyperavdata En del attribut/egenskaper är av en viss typ kön, ögonfärg, HIV-positiv Andra attribut är svåra att mäta Hårfärg, smärta, studenters uppfattning om en kurs Frestande/nödvändigt att använda klasser Mörkhårig, ljushårig Svarthårig, blond, rödhårig Svarthårig, mörkblond, mellanblond, ljusblond
2c Olikatyperavdata Fenomenet vi studerar är troligen kontinuerligt, men vi väljer att klassa Sjuk/frisk Antibiotikaresistent/icke-abr Aggresiv invasionsart/icke-aggresiv Problemhund/icke-problemhund Studenter är nöjda med kursen/icke-nöjda med kursen +/- data: minsta möjliga informationsvärde; gränsdragningsproblem Alltid bättre att (om möjligt) mäta än att klassa Grumligt/Klart Grumligt/Halvgrumligt/Halvklart/Klart Absorbans vid 470 nm i en 10-mm kolonn Alltid bättre att (om möjligt) klassa i >2 grupper än i bara 1
Fre15 feb2013 1. Snabbrepetion 2. Datatyper 3. Frågeställning 4. Datahantering 5. Felpinnar
3b. Förfinafrågeställningen1 Frågeställningen som redskap Precisera Kommunicera Frågeställningar: de glasögon genom vilka vi betraktar världen
8h. Förfinafrågeställning Fall 4: Sprit ochdagisbarn Sprit är ett billigt och effektivt desinfektionsmedel Men blir dagisbarnen verkligen friskare av att personalen använder sprit istället för tvål (som är billigare men mindre effektivt)? Formulera en relevant forskningsbar frågeställning kring ovanstående
Frågeställningar Sprit ochdagisbarn determine if the use of alcohol-based hand-disinfection as a complement to regular hand washing by children and staff at DCCs can reduce the rate of childhood absenteeism. Lennell et al. (2008) Acta Paediatrica 97, 1672 80 evaluate the possibilities for reducing the transmission of infections by an infection prevention program. The program was introduced in 10 day care centers and 10 centers served as controls. 15-month. Records were made of the occurrence of infections and absences among the children, parents and personnel. Uhari et al. (1999) Pediatric Infectious Disease Journal 18, 672-677
Fre15 feb2013 1. Snabbrepetion 2. Datatyper 3. Frågeställning 4. Datahantering 5. Felpinnar
Konventionerkring datahanterning: Protokoll 1) BIKUPA: För och nackdelar med att ha ett genomtänkt protokoll (på papper, eller i datorn)?
Konventionerkring datahanterning: Protokoll 1) Protokoll Sparar tid... i fält, växthus, eller lab vid datorn Snyggt och prydligt Bättre stöd för minnet Lättare för andra att förstå & använda data Minskar risken att glömma... objekt (tex en viss planta, eller patient) variabel (tex antal blad, eller kroppsvikt) avläsningstidpunkt Enkelt att göra i tex Excel
Konventionerkring datahanterning: Datafil 1) Uppställningen kan ofta likna protokollets Variabler (antal blad; kroppsvikt; ögonfärg; CFU) i kolumner Objekt (planta; patient; petriskål) i rader Logisk ordning: 1) löpnr, 2) datum, 3) expr beh, 4) respons, 5) uträknade variabler Plant-ID Datum Behandling Höjd(cm) Antal blad 1 1 april 2011 GA3, 0.1 2.1 3 0.70 2 1 april 2011 GA3, 1.0 3.2 3 1.08 3 1 april 2011 GA3, 10.0 4.6 4 1.15 4 1 april 2011 GA3, 0.1 2.4 3 0.80......... Internod längd
Konventionerkring datahanterning: Datafil Uppställningen kan ofta likna protokollets Variabler (antal blad; kroppsvikt; CFU) i kolumner Objekt (planta; patient; petriskål) i rader Logisk ordning: 1) löpnr, 2) datum, 3) expr beh, 4) respons, 5) uträknade variabler
Gibberellinetsbetydelse... Upprepade mätningar på samma objekt (planta), specialfall => Plant-ID Beh. Höjd (cm) 1 apr Höjd (cm) 4 apr Höjd (cm) 9 apr #blad 1 apr #blad 4 apr #blad 9 apr Inter -nod 1 apr Inter -nod 4 apr Inter -nod 9 apr 1 GA3, 0.1 2 GA3, 1.0 3 GA3, 10.0 4 GA3, 0.1...... 2.1 3 0.70 3.2 3 1.08 4.6 4 1.15 2.4 3 0.80
Botaniklaboration Flera laborationer Hormon som påverkar tillväxt 3. Gibberellinets betydelse för tillväxten Långtidsförsök Komplext experiment Genererar mycket data Kontinuerliga data Variansanalys
Nästa seminarium Deadline 1) Labrapport (individuell) 2) Data (gruppvis) 3) Frågor på kapitel 4-5 (Ruxton & Colegrave) individuellt, en diskutabel fråga per kapitel Seminariet Diskkuterar (i) frågor på kapitel 4-5 (ii) urval av era frågeställningar (labrapport) (iii) era redovisningar av resultat (labrapport) (iv) era resultat & slutsatser (övergripande)
Fre15 feb2013 1. Snabbrepetion 2. Datatyper 3. Frågeställning 4. Datahantering 5. Felpinnar
Konfidensintervall, felpinnar, felmarginal (error bars) ipraktiken 1.2 0.8 0.4 0.0-0.4 Beskriva variation i data (tex SD) Beskriva precision i estimat (tex medelvärde) Informell jämförelse av estimat =>oerhört användbart, vanligt & viktigt! NBIB44: tolkning ( felpinnar ord myntat av Laila Karlsson; finns ej officiellt, än...; Ty: Fehlerbalken)
Santvärdekontrastickprov: andelmänie324 Sant värde: 33.3% Prov 1: 40% Prov 2: 0% Prov 3: 60% Osäkerhet, som ökar med minskade provstorlek
Santvärdekontrastickprov: andelmänie324 Sant värde: 33.3% Prov 1: 40% Prov 2: 0% Prov 3: 60% Osäkerhet, som ökar med minskade provstorlek
Hastighet (miles per hour) 40,4 km/h
1.2 0.8 Felpinnaripraktiken2 0.4 0.0-0.4 Konfidensintervall (CI) Standardfel (SE; standard error) Standardavvikelse (SD; standard deviation) Boxplot Range graph
1.2 0.8 Felpinnaripraktiken3 0.4 0.0-0.4 Standardavvikelse (SD): spridningen i data Standardfel (SE): precision i estimat (tex medel) SE=SD/(sqrt(N))
1.2 0.8 Felpinnaripraktiken4 0.4 0.0 SE=SD/(sqrt(N)) SD oberoende av N SE minskar med N -0.4
1.2 0.8 Felpinnaripraktiken5 0.4 0.0 SE=SD/(sqrt(N)) CI 95% ~2*SE -0.4 För att kunna tolka måste vi veta vad pinnarna illustrerar Hädanefter 95%-konfidensintervall
Jämföra värden Rule of thumb for CI 95% : If the overlap is about half of one one-sided error bar, the difference is sign at ~ p <0.05 If the error bars just about meet, the difference is sign at ~ P<0.01 Works if N>10 Cumming & Finch, 2005
2007 Rockefeller University Press Cumming G et al. J Cell Biol 2007;177:7-11
Tolkningavfelpinnar Fall 1: Ogräskonkurens Average biomass sorghum (g) 0.22 0.21 0.20 0.19 0.18 0.17 0.16 Effekt av närvaro av ogräs på biomassan av hirs. Referenslinjen är biomassa utan ogräs. Felpinnarna är konfidensintervall 96% 0.15 0.14 0.13 Parthenium Tagetes Verbesina
Tolkningavfelpinnar Fall 2: OgräsbekämpningiEtiopien Relativ mängd (%) biomassa av parthenium efter 5 metoder för ogräskontroll jämfört med obehandlad kontroll. Försöket utfördes på två platser (Babile, Dire Dawa). Horisontal linje i boxen är medel, boxen inkluderar ±1 SE, och de vertikala pinnarna KI 95% Hoeing=hackning; Smother=täckgröda; 2,4-D=herbicid