Vid Medicinsk statistik - Frågestund ges tillfälle att fråga om övningarna.

Relevanta dokument
Statistik och epidemiologi T5

Medicinsk statistik I

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Statistik och epidemiologi T5

Medicinsk statistik II

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Medicinsk statistik I

BIOSTATISTIK OCH EPIDEMIOLOGI

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Medicinsk statistik II

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hur skriver man statistikavsnittet i en ansökan?

Parade och oparade test

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

EXAMINATION KVANTITATIV METOD vt-11 (110319)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 6 ( ) OCH INFÖR ÖVNING 7 ( )

Statistik. Statistik. Statistik. Lars Walter Fil.lic. Statistik

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

2 Dataanalys och beskrivande statistik

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

VANLIGA TERMER OCH BEGREPP INOM MEDICINSK VETENSKAP OCH STATISTIK

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

, s a. , s b. personer från Alingsås och n b

Hur man tolkar statistiska resultat

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

TENTAMEN TEORI. EXAMENSARBETE 1 (LÄLA53/LÄMA53) TERMIN 5, HT 2012, , kl

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Statistik 1 för biologer, logopeder och psykologer

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

F3 Introduktion Stickprov

Föreläsning G60 Statistiska metoder

Gamla tentor (forts) ( x. x ) ) 2 x1

Föreläsning 12: Regression

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Bilaga 6 till rapport 1 (5)

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M, MAM801, IEK600,IEK309 Institutionen för matematik Datum Skrivtid

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Hypotestestning och repetition

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

EXAMINATION KVANTITATIV METOD

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Uppgift a b c d e Vet inte Poäng

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Föreläsning G60 Statistiska metoder

Sänkningen av parasitnivåerna i blodet

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

17/10/14. Kvantitativ metod och grundläggande statistik. Varför. Epidemiologi

TMS136. Föreläsning 13

LYCKA TILL! Omtentamen i Statistik A1, Institutionen för Farmaceutisk Biovetenskap Institutionen för Farmaci

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Föreläsning G70 Statistik A

ÖVNINGSUPPGIFTER KAPITEL 8

Medicinsk statistik III Läkarprogrammet, Termin 5 VT 2016

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

HYPOTESPRÖVNING sysselsättning

Statistik Termin 10, Läkarprogrammet, HT16

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Stockholms Universitet Statistiska institutionen Termeh Shafie

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Industriell matematik och statistik, LMA /14

Introduktion till Biostatistik. Hans Stenlund, 2011

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Biostatistik: Begrepp & verktyg. Kvantitativa Metoder II: teori och tillämpning.

Grundläggande Biostatistik. Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet

Föreläsning G60 Statistiska metoder

Föreläsning 5. Kapitel 6, sid Inferens om en population

FACIT (korrekta svar i röd fetstil)

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Beskrivande statistik

Statistik en introduktion

Studietyper, inferens och konfidensintervall

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Uppgift a b c d e Vet inte Poäng

TENTAMEN I STATISTIKENS GRUNDER 2

Beskrivande statistik. Tony Pansell, Leg optiker Docent, Universitetslektor

Föreläsning G60 Statistiska metoder

OBS! Vi har nya rutiner.

Transkript:

Räkneövningar i Medicinsk statistik ISEX T5 HT 014 Vid Medicinsk statistik - Frågestund ges tillfälle att fråga om övningarna. 1. I en pilotstudie där man ville undersöka en kräm som verkade lokalt smärtstillande deltog 11 friska frivilliga. Krämen applicerades på låret, och efter att man gett den tid att verka fick de frivilliga ett nålstick på det behandlade området. De fick därefter bedöma smärtan i nålsticket på en skala från 1 till 10. a Vilken sorts data är det man samlar in? Nominala, ordinala, kontinuerliga eller diskreta? Motivera! b Vilket lägesmått, och vilket/vilka spridningsmått skulle du använda för att beskriva data om det var du som genomfört studien och var intresserad av att publicera den? c De elva personerna i studien uppgav följande smärtintensitet efter nålsticket: 1, 4, 1,, 9, 4, 6, 10, 5, 7, 10. Beräkna lägesmått och spridningsmått enligt uppgiften ovan!. För att undersöka om barns födelsevikt förändras över tid planerade man att på ett stort sjukhus vart tionde år slumpmässigt registrera födelsevikterna hos 10 barn. a Vilken sorts data är det man samlar in? Nominala, ordinala, kontinuerliga eller diskreta? Motivera! b Man vet sedan tidigare att födelsevikter hos barn tenderar att komma från en normalfördelning. Vilket lägesmått och vilket/vilka spridningsmått skulle du använda för att beskriva födelsevikterna? c Första året fick man följande värden: 3450, 4100, 390, 950, 4600, 3365, 3550, 570, 350, 3475. Beräkna lägesmått och spridningsmått enligt uppgiften ovan! 3. Att födas för tidigt är en riskfaktor för ett flertal oönskade utfall, som t.ex. CP. För att motverka detta kan modern ges kortikosteroider under graviditeten. Man har dock sett att effekten av dessa endast varar i sju dagar, och vill därför undersöka huruvida det är riskfritt att efter en vecka ge en upprepad dos, d.v.s. om man får den positiva effekten av behandlingen utan att orsaka negativa effekter som t.ex. påverkan på födelsevikten. För att göra detta sätter man upp en studie med två grupper av kvinnor en som behandlas med kortikosteroider och en som behandlas med placebo. Barnen undersöks vid födsel och följs dessutom upp vid två års ålder. (N Engl J Med. 007 Sep 0;357(1):1179-89) a Medelfödelsevikten i den behandlade gruppen (n=531) var 1911 g (standardavvikelse 83 g) och i placebogruppen (n=537) 1915 g (standardavvikelse 803 g). Beräkna ett 95% konfidensintervall för medelvärdet i vardera gruppen! Tolka dessa!

b Vid två års ålder var det av 51 barn i den behandlade gruppen och 5 av 56 barn i placebogruppen som hade CP. Beräkna ett 95% konfidensintervall för andelen behandlade i vardera gruppen! Tolka dessa! 4. För att undersöka om behandling med nikotininhalator permanent kunde reducera antalet rökta cigaretter utförde man en randomiserad studie i vilken 400 frivilliga rökare fick antingen aktiv behandling eller placebo. (BMJ 000;30:39-33) a Efter första veckan med behandling/placebo fick deltagarna ange hur mycket de hade minskat sin cigarettkonsumtion. I den grupp som fick behandling rökte deltagarna i snitt endast 53% (95% konfidensintervall 4.3-105) av den mängd man hade rökt vid studiens start. Vilken nollhypotes relaterar detta konfidensintervall till? Hur tolkar du konfidensintervallet? b Efter fyra månader hade 5 av 00 personer med behandling minskat sitt rökande. Använd c = 1.96 och beräkna ett konfidensintervall för andelen som minskat sitt rökande. Vad kan du dra för slutsats av detta konfidensintervall? c Efter fyra månader hade 6% i den behandlade gruppen och 9% i placebogruppen minskat sitt rökande (p < 0.001). Efter två år var motsvarande siffror 10% och 3% (p = 0.01). Vilka nollhypoteser relaterar p-värdena till? Vad kan du med hjälp av p-värdena dra för slutsats om behandlingens effektivitet? 5. I en studie du nyligen gjort har du lyckats få ett nästan statistiskt signifikant resultat (p = 0,056). Detta irriterar dig eftersom du gärna ville kunna visa på en effekt. Om du fick en chans att göra om studien, vad skulle du göra annorlunda? 6. I en publikation om ulcus duodeni (sår i tolvfingertarmen) läser du följande korta tabell. Koncentration av gastrin hos patienter och kontrollpersoner. Siffrorna anger medelvärden standardavvikelse. Patienter (pmol/l) 7 55 Kontroller (pmol/l) 8 4 Vad har du för kommentarer till författarnas val av centralvärden och spridningsmått? Finns det andra alternativ? 7. I en uppsats rapporteras en studie om vätske- och elektrolytbalans hos intensivvårdspatienter. Man skriver att albuminkoncentrationen hos de 5 ingående patienterna var 3 5 g/l (medelvärde standardavvikelse). Det uppmätta värdet har förstås en viss osäkerhet.

a Vilka två faktorer avgör hur exakt man i en studie kan fastställa det sanna medelvärdet? b Vilka uttryck används för att beskriva osäkerheten i ett uppmätt medelvärde? c Kan du beräkna hur säkert det uppmätta medelvärdet i exemplet ovan är, d.v.s. inom vilket intervall det sanna medelvärdet ligger? 8. För att undersöka hur gravida kvinnors förändrade rökvanor påverkar barnets födelsevikt användes data från 1583 kvinnor som deltagit i ett sluta-röka-projekt. (Am J Epide-miol 001;154:694-701) a Barnen som föddes av kvinnor som uppgav att de slutat röka under graviditeten vägde i snitt 3 g (95% konfidensintervall -3 g 95 g) mer än barnen som föddes av kvinnor som enligt egen utsago inte förändrade sina rökvanor. Vid jämförelse erhölls p-värdet 0.33. Vilken nollhypotes relaterar p-värdet till? Med tanke på konfidensintervallet, hade du förväntat dig ett p-värde av denna storleksordning? Motivera! b Förutom att kvinnorna fick uppge sina rökvanor använde man kotinin i urin, en biomarkör för nikotin. I graviditetens tredje trimester hade de 4 kvinnor som slutat röka före studiens start (d.v.s. före graviditeten eller i början av den) i genomsnitt 1 ng/ml kotinin i urinen (standardavvikelse 19 ng/ml). De 17 kvinnor som slutade röka efter inklusion hade i snitt 6 ng/ml kotinin i urinen (standardavvikelse 0 ng/ml). Beräkna ett konfidensintervall för skillnaden mellan grupperna! Använd c=1.96. Den gemensamma (poolade) standardavvikelsen skattas med s pooled n A 1 s A nb 1 n 1 n 1 A B s och det gemensamma standardfelet B SE s pooled 1 na 1 n B Vilken nollhypotes relaterar konfidensintervallet till? Vad drar du för slutsats av detta konfidensintervall? 9. I 103 plasma-prover tagna från kvinnor mättes CB-153, en biomarkör för PCB-exponering. Kvinnorna tillfrågades hur deras första graviditet hade slutat, och man jämförde halten av CB-153 hos dem vars graviditet slutat i missfall med halten hos dem vars graviditet ej slutade i missfall. (Int Arch Occup Environ Health 000;73:04-8) a Vilken sorts data är de två variablerna (CB-153 och graviditetsutfall) nominala, ordinala, diskreta eller kontinuerliga? Motivera!

CB-153 (pg/g fat) b Med hjälp av ett Mann-Whitney-test beräknades p-värdet 0.4 för skillnad i CB-153- halt för de två grupperna. Vilken nollhypotes relaterar p-värdet till? Vilken slutsats kan du dra av p-värdet? 600 500 400 300 00 100 0 N = 95 No 8 Yes Miscarriage/stillbirth c Data beskrivs ovan med hjälp av en box-plot. Vilka parametrar kan man utläsa ur denna? Vad kan du säga om hur data fördelar sig i de två grupperna? 10. För att undersöka om konsumtion av snabbmat påverkar en människas kroppsvikt följde man 804 män och 783 kvinnor under 15 år. I början av studien (baseline) noterade man hur ofta varje individ åt snabbmat. Antalet gånger delades sedan in i grupper om tre (dvs 0: 1-3, 1: 4-6, : 7-9, etc.). Varje individs vikt mättes dels vid studiens början, och dels 15 år senare, och viktförändringen beräknades. (Lancet 005;365:36-4) a Vilken sorts data är det man samlar in (konsumtionsfrekvens av snabbmat och viktförändring)? Nominala, ordinala, kontinuerliga eller diskreta? Motivera! b När studien inleddes var den genomsnittliga konsumtionsfrekvensen hos männen,4 gånger per vecka (SE=0,07). Använd c=1,96 och beräkna ett 95% konfidensintervall för denna skattning! Tolka konfidensintervallet! c För att undersöka hur konsumtionsfrekvensen av snabbmat vid baseline påverkade viktförändringen under de kommande 15 åren analyserade man data med linjär regression. Vilken torde vara x-variabeln, och vilken är y-variabeln? d Den linjära regressionen gav att =1,56. Tolka detta! e p-värdet för var 0,0064. Till vilken nollhypotes relaterar detta p-värde? Hur tolkar du p-värdet?

11. I en studie bland 06 kvinnor studerades sambandet mellan BMI (Body Mass Index, kg/m ) och bentäthet (BMD, Bone Mineral Density, mg/cm ). Studien visade på följande resultat: Vid linjär regression fick man följande ekvation: BMD = 44 + 6.7 BMI Dessutom fick man ett R = 0.18. a Formulera studiens nollhypotes och alternativhypotes. b Vid den linjära regressionen erhölls enligt formeln ovan en lutningskoefficient på 6.7. Hur tolkar man lutningskoefficienten? c Det beräknades även ett 95% konfidensintervall till lutningskoefficienten. Konfidensintervallets gränser var 4.3 till 9.. Hur tolkas detta? Innebär detta att man kan förkasta nollhypotesen? Motivera kortfattat Ditt ställningstagande! d Om man i c-uppgiften skulle angivet ett p-värde i stället för ett 95% konfidensintervall, vilket av följande påstående är riktigt? i) p-värdet kommer vara lika med 0.95 ii) p-värdet kommer vara >0.10 iii) p-värdet kommer vara lika med 0.10 iv) p-värdet kommer vara <0.05 v) p-värdet kommer vara lika med 0.05 vi) p-värdet kommer vara >0.05 e Beskriv kortfattat vad R innebär?

1. En forskargrupp testade en ny markör för testikelcancer som kan analyseras med ett enkelt blodprov där ett förhöjt värde indikerar malignitet. På onkologiska mottagningen togs 00 blodprov från konsekutivt remitterade patienter som alla hade palpationsfynd som ingav misstanke på malignitet. Biopsifynd utgjorde gold standard (~facit). Följande data erhölls: Biopsifynd ( gold standard ) Blodprov ( test ) Malignitet Ej malignitet Totalt Förhöjt 60 0 80 Normalt 40 80 10 Totalt 100 100 00 Beräkna: a Prevalensen b Sensitivitet c Specificitet d Positivt prediktivt värde e Negativt prediktivt värde

Lösningsförslag till Räkneövningar i Medicinsk statistik ISEX T5 HT 014 1. Lokalt smärtstillande kräm a. Ordinaldata, ty 1 < < 3 < men det är inte säkert att -1=3-, d.v.s. avståndet mellan stegen är inte nödvändigtvis lika långa. b. Eftersom det handlar om ordinaldata är det lämpliga lägesmåttet median, medan spridningen beskrivs med kvartiler, percentiler och variationsvidd. c. Börja med att rangordna data och tilldela varje observation en rang: Värde 1 1 4 4 5 6 7 9 10 10 Rang 1 3 4 5 6 7 8 9 10 11 Medianen: Mittvärdet bland de rangordnade variabelvärdena dvs. 5. Undre kvartilen: Enligt formeln (n-1)*(q/100)+1 skall undre kvartilen ha rang (11-1)*(5/100)+1=3,5. Då inte formeln gav ett heltal används interpolation (s. 64-65). I det här fallet utgår vi från värde med rang 3 vilket motsvarar värde och lägger till 50% av avståndet till variabelvärde 4 (värde=4). Undre kvartilen är alltså 3. Övre kvartilen: Övre kvartilen har värdet 8. Variationsvidden är 1 till 10 (eller 10-1=9).. Födelseviktsförändring över tid a. Kvantitativa data, ty det handlar om mätvärden snarare än kategorier, 1 < < 3 < och för det gäller att 3-=-1. Eftersom variabeln kan anta i princip vilka värden som helst är den kontinuerlig. b. Eftersom man vet att data är normalfördelade i målpopulationen kan man använda medelvärde som lägesmått och standardavvikelse som spridningsmått. c. För att beräkna varians och standardavvikelse för hand sätter man enklast in data i en tabell: Mätvärde (x i ) Avvikelse från medelvärdet (x i - x ) Avvikelsen i kvadrat (x i - x ) 3450-10 100 4100 640 409600 390-170 8900 950-510 60100 4600 1140 199600 3365-95 905 3550 90 8100 570-890 79100 350-10 44100 3475 15 5 34600 0 851850

34600 x 851850 3460 s 316875 s 31687 563 10 10 1 3. Kortikosteroider a. För den behandlade gruppen blir SE s n s n 83 35,7 531 och följaktligen 95% konfidensintervall x c SE 19111,96 35,7 1841 1981 g. Med samma formler gäller för placebogruppen att SE = 34,7 och 95% KI = 1847 1983 g. Man kan alltså förvänta sig att i en målpopulation som behandlas med kortikosteroider kommer medelfödelsevikten, med 95% säkerhet, att ligga mellan 1841 g och 1981 g, medan den i en placebobehandlad målpopulation kommer att, återigen med 95% säkerhet, ligga mellan 1847 g och 1983 g. a b. I den behandlade gruppen är andelen med CP q 0, 04. Ett 95% n 51 konfidensintervall blir då q c 1 q 0,04 1 0,04 q n 0,04 1,96 51 0,05 0,059 På motsvarande sätt blir ett 95% konfidensintervall för placebogruppen 0,09 0,066. I en målpopulation där de gravida mammorna behandlats med kortikosteroider kan man alltså förvänta sig att andelen barn med CP vid två års ålder, med 95% säkerhet, ligger mellan,5% och 5,9%, medan man i en placebobehandlad målpopulation förväntar sig att motsvarande andel, med 95% säkerhet, ligger mellan,9% och 6,6%. OBS! En förutsättning för att använda formeln ovan är att a > 5 och n-a>5 4. Nikotininhalator a. Här handlar det om att jämföra ett medelvärde med ett förutbestämt värde. Detta värde är inte angivet i texten/artikeln, och det behövs egentligen inte heller för att tolka konfidensintervallet. Vill man titta på om deltagarna överhuvudtaget har

förändrat sina rökvanor kan man sätta upp nollhypotesen att de inte har förändrat rökvanorna, d.v.s. att de rökte i snitt 100% av vad de rökte när studien började. Vill man titta på om de har halverat antalet rökta cigaretter kan man sätta upp nollhypotesen att de rökte i snitt 50% av vad de rökte när studien började. Det angivna konfidensintervallet säger att med 95% säkerhet röker man efter en veckas behandling mellan 4% och 105% av vad man rökte före behandling. D.v.s. man kan inte utesluta att man ökar antalet rökta cigaretter! b. Andelen som minskat sitt rökande är 5/00 = 0,6. Standardfelet är SE 0,6 (1 0,6) 00 0,03 vilket ger konfidensintervallet 0,6 ± 1,96 0,03 = 0,0 0,3. Detta säger oss att om vi behandlar en grupp rökare (målpopulationen) kommer, med 95% säkerhet, mellan 0% och 3% av de behandlade att ha en lägre cigarettfrekvens efter fyra månader. OBS! En förutsättning för att använda formeln ovan är att a > 5 och n-a>5 c. Det första p-värdet relaterar till nollhypotesen att det inte finns någon skillnad mellan grupperna efter fyra månader, och det andra till nollhypotesen att det inte finns någon skillnad mellan grupperna efter två år. Båda p-värdena < 0,05, så med 5% signifikans kan vi förkasta nollhypoteserna. Med andra ord är det fler rökare som minskar sitt rökande i den behandlade gruppen än i placebogruppen. Hade vi valt 1% signifikansnivå hade vi inte kunnat förkasta nollhypotesen om ingen skillnad efter två år, ty efter två år är p-värdet > 0,01. 5. Nästan signifikant En hypotesprövning ger samma resultat oavsett om man använder konfidensintervall eller p-värde, så vi kan använda oss av vad vi vet om konfidensintervall för att fundera ut detta. Konfidensintervallets bredd beror av konfidensgraden, stickprovets storlek och spridningen i data. Om p-värdet är 0,056 innebär det att ett 95% konfidensintervall bara precis täcker nollhypotesen, och att ett smalare konfidensintervall kanske inte hade gjort det (vi utgår från att det faktiskt finns en skillnad och att vi nu inte använder statistiken för att ljuga ). Det enklaste vore ju förstås att använda sig av en annan signifikansnivå/konfidensgrad, men detta är lite för enkelt att genomskåda och skulle förmodligen inte accepteras av en seriös vetenskaplig tidskrift. Vad gäller spridningen i data kan vi inte göra så mycket åt den (väljer vi en målpopulation med mindre spridning är det inte längre samma frågeställning vi besvarar). Återstår då alltså stickprovets storlek. Gör om studien med ett större stickprov! Finns det en skillnad är sannolikheten större att du lyckas påvisa den med fler observationer.

6. Ulcus duodeni Inte informativa eftersom data inte är normalfördelade. Det syns direkt eftersom intervallet medelvärde ± standardavvikelser sträcker sig till negativa värden. Median och interkvartilintervall eller variationsvidd hade gett en bättre beskrivning av data. 7. Intensivvårspatienter a. Spridningen i data (=den interindividuella biologiska variationen) och antalet observationer. b. Standardfel och konfidensintervall. c. Standardfelet=standardavvikelsen/roten ur n, dvs 5/5=1. Det sanna medelvärdet ligger med 95% säkerhet i intervallet 3±*1 dvs 30-34 g/l. Som konstant använde vi här vilket är en avrundning av 1.96. 8. Gravida kvinnor i sluta-röka-projekt a. Nollhypotesen är att de barn som föddes av kvinnor som slutat röka vägde lika mycket som barnen till de kvinnor som inte förändrade sina rökvanor, d.v.s. att skillnaden är noll. Eftersom det 95%-iga konfidensintervallet täcker nollhypotesen vet vi att p > 0,05, så p-värdet 0,33 är i enlighet med vad vi skulle ha förväntat oss. b. Nollhypotesen här bör vara att det inte finns någon skillnad i kotinin mellan de två grupperna av kvinnor, d.v.s. att skillnaden är noll. Den faktiska skillnaden mellan de två grupperna är 6-1=5. Den poolade standardavvikelsen är s pooled 16 0 319 16 3 375,08 Det gemensamma standardfelet blir SE 1 1 375,08,15 17 4 och det 95%-iga konfidensintervallet 5 ± 1,96,15 = 0,79 9,1. Alltså: I målpopulationen (t.ex. gravida kvinnor) har kvinnor som slutat röka under graviditeten, med 95% säkerhet, mellan 0,79 ng/ml och 9,1 ng/ml högre kotininhalt än kvinnor som slutat röka före graviditeten.

9. CB-153 och missfall a. CB-153: Kvantitativa data, ty det handlar om mätvärden snarare än kategorier, 1 < < 3 < och för det gäller att 3-=-1. Eftersom variabeln kan anta i princip vilka värden som helst är den kontinuerlig. Graviditetsutfall (missfall/ej missfall): Nominaldata, ty utfallet kan delas in i grupper som inte har någon inbördes rangordning. b. Nollhypotesen är att kvinnor som har haft missfall inte skiljer sig åt med avseende på CB-153-halt jämfört med kvinnor som inte haft missfall. Eftersom p > 0,05 kan man på signifikansnivå 5% inte förkasta nollhypotesen, d.v.s. vi kan inte säga att det finns någon skillnad mellan kvinnor med och utan missfall. c. Det tjockare strecket mitt i lådan representerar medianen. Lådans yttre (övre och undre) kanter anger var kvartilerna ligger. Strecken som går ut från lådan går till det minsta och det högsta värdet, outliers borträknade. Ringarna symboliserar outliers, d.v.s. observation som ligger mer än 1,5 kvartilavstånd (lådans höjd) från lådans kant. Det är större spridning i gruppen som inte haft missfall, men lägesmässigt ligger de ungefär lika (d.v.s. medianerna är ungefär de samma). 10. Snabbmatskonsumtion a. När man samlade in information om hur ofta varje individ åt snabbmat var det en diskret variabel. I och med att man grupperade den i grupper om tre blev det dock en ordinalvariabel eftersom man inte längre vet något om den exakta skillnaden mellan två grupper. Om man jämför två individer där den ena ligger i grupp 1 (1-3 mål/vecka) och den andra i grupp (4-6 mål/vecka) vet vi inte om den faktiska skillnaden är 5 mål (d.v.s. att den ena äter 6 mål och den andra 1 mål) eller om den är 1 mål (d.v.s. att den ena äter 4 mål och den andra 3 mål). Vikt och viktförändring är kontinuerliga variabler. b. Konfidensintervallet blir x c SE,4 1,96 0,07,4 0,14,6,54 Detta tolkas som att i den målpopulation som männen i stickprovet representerar ligger den genomsnittliga konsumtionsfrekvensen, med 95% säkerhet, mellan,6 och,54 gånger per vecka. c. Man antar att konsumtionsfrekvensen påverkar viktförändringen. Alltså är konsumtionsfrekvensen x-variabeln och viktförändringen är y-variabeln.

d. För varje en-stegs-ökning i x ökar y med 1,56 steg. I detta specifika fall blir det alltså att ett hopp från en frekvensgrupp (1-3, 4-6, 7-9, etc) till nästa innebär att viktökningen under de 15 åren blir 1,56 kg större än om man hade stannat kvar i den ursprungliga frekvensgruppen. e. Nollhypotesen är att =0. Att p-värdet < 0,05 innebär att man på 5%-nivån kan förkasta nollhypotesen. är alltså sannolikt skilt från noll, vilket innebär att konsumtionsfrekvensen vid baseline påverkar viktökningen under de kommande 15 åren. 11. BMI i linjär regression a. H 0 : Inget samband mellan BMI och BMD, dvs riktningskoefficienten (ß) = 0. H 1 : Samband mellan BMI och BMD, dvs ß 0. b. För varje enhet som BMI ökar så ökar BMD med 6,7 enheter. c. Med 95% säkerhet ligger den sanna lutningskoefficienten mellan 4,3 och 9,. Nollhypotesen kan förkastas eftersom konfidensintervallet inte täcker 0 (= nollhypotesen). d. Alternativ iv), dvs p<0,05. e. R är ett mått på hur stor del av variationen i BMD som förklaras av BMI. I detta fallet förklaras alltså 1,8% av variationen i BMD av BMI. 1 Diagnostiskt test a. Prevalensen = 0,50 eller 50% (100/00) b. Sensitivitet = 0,60 eller 60% (60/100) c. Specificitet = 0,80 eller 80% (80/100) d. Positivt prediktivt värde = 0,75 eller 75% (60/80) e. Negativt prediktivt värde = 0,67 eller 67% (80/10)