LUNDS UNIVRSITET MATEMATIKCENTRUM MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 PROJEKTUPPGIFT VT-2014, LP3 Instruktioner I kursens projektuppgift arbetar du tillsammans med en kurskamrat, handledning ges enligt kursschemat. Det är möjligt att ni behöver mer tid utöver det schemalagda för att slutföra uppgifterna. Samtliga datafiler ska ni kunna nå via kursens hemsida. Ni blir tilldelade ett av de 20 olika datamaterialen; gå in på länken på kurshemsidan för att registrera din grupp och få datamaterialnumret. Målsättningen med denna uppgift är bl.a. att ni: ska träna på att hämta ett problem ur verkligheten och med hjälp av ett insamlat material konstruera en rimlig statistisk modell samt göra en kritisk granskning av modellen och dess förmåga att beskriva verkligheten; ska tillämpa dina kunskaper och med hjälp av R (eller SPSS) analysera ett biostatistiskt datamaterial; ska träna på att skriftligt redovisa antaganden, modeller och slutsatser från en statistisk analys. Redovisningen görs i form av en skriftlig rapport som ska lämnas in fredagen den 7 mars kl. 17.00. Vilka krav det finns på utformningen kan ni läsa om i avsnittet utformning av projektredovisning. Underkända projekt kan kompletteras på torsdag 13 mars kl 13.15 15.00. Utformning av projektredovisning Målgruppen för rapporten är en person med bakgrundskunskaper som en student i samma årskurs, som läst den aktuella kursen men inte är insatt i detaljerna i den aktuella uppgiften. Språket i skriften skall vara anpassat för målgruppen och texten skall vara tillräckligt fyllig för att en person i målgruppen utan större ansträngning skall kunna följa med i resonemang och motiveringar. Skriften skall vara korrekturläst så att språk- och skrivfel är rättade. Rapporten bör vara strukturerad enligt följande: 1. Titelsida med med författarnas namn 2. Kort bakgrund och syfte med undersökningen 3. Redovisning av de uppgifter som finns i projekthandledningen. Ange (om så är lämpligt): vilka antaganden ni gör om data, vilka hypoteser ni ställer upp, resultatet av analysen och vilka tolkningar och slutsatser ni gör. Lämpliga figurer och tabeller ska vara med i rapporten. 4. Sammanfattning av era resultat.
PROJEKTUPPGIFT: En klinisk prövning Bakgrund Pulmicort c Turbuhaler versus Cepofan c MDI in the Treatment of Asthma Overall study design The study will be performed as a double-blind, randomized, multi-centre study of a parallel group design. Starting with a 2 weeks ± 5 days run-in period, one treatment period of 8 weeks ± 5 days duration will follow....... Efficacy will be evaluated from four lung function examinations and from daily diary measurements of PEF, asthma symptoms and β 2 -agonist usage. Safety will be assessed from the occurence of adverse events. Så beskrivs i korthet den kliniska prövning utförd av Astra Draco (sedermera Astra Zeneca, numera nerlagt) i Lund som vi ska analysera i denna uppgift. På Astra Draco har man koncentrerat sin forskning kring andningsorganens sjukdomar. När man ska pröva ett läkemedel på människor krävs att man i förväg i en studieplan (clinical study protocol) noga beskriver studiens uppläggning. I studieplanen beskrivs också hur den statistiska analysen ska göras. Denna studieplan ska godkännas av myndigheterna innan studien får påbörjas. Ur studieplanen hämtar vi också följande skiss över studiens uppläggning. Tidsschema: Pulmicort V3 Pulmicort V4 - V1 Standard V2 - Cepofan V3 Cepofan V4 2 veckor 4 veckor 4 veckor Run-in period Behandlingsperiod V1,..., V4 anger de fyra besök (Visits) som alla försökspersoner gör. För att patienterna ska vara jämförbara när behandlingsperioden börjar får alla samma läkemedel (Standard) under den första 2-veckorsperioden och därefter fördelas de slumpmässigt (randomiseras) så att hälften får Pulmicort och hälften får Cepofan. Studien är dubbel-blind vilket innebär att varken patient eller läkare vet vem som får vilken medicin. Medicinerna är endast märkta med en sifferkod och koden bryts inte förrän efter det att alla data matats in i databasen och kontrollerats noga. Delar av databasen finns överförd till en R-fil (eller tre SPSS-filer) som beskrivs nedan. I samtliga fall skall bokstäverna xx i filnamnet ersättas av ett tal 01,..., 20. Detta tal får du från gruppregistreringssidan. Data-materialet har ställts till förfogande av den avdelning på Astra Draco som har hand om datahanteringen och den statistiska analysen av kliniska prövningar. Studien är autentisk men vissa data har av sekretessskäl genomgått en slumpmässig förändring.
Datafilerna Här följer nu en kort presentation av innehållet i datafilerna. I R-versionen, DRACOxx.RData, finns tre dataframes: PATIENT, VISIT och DIARY. I SPSS-versionen måste man läsa in dessa som varsin fil (patientxx.sav, visitxx.sav och diaryxx.sav). PATIENT innehåller bakgrundsdata om patienterna. centre Centre number nummer på den klinik vid vilken patienten fick sin behandling sex Sex kön (1 = man, 2 = kvinna) age Age (yr) ålder i år weight Weight (kg) vikt i kg height Height (cm) kroppslängd (cm) race Ethnic origin etniskt ursprung (1 = Caucasian, 2 = Negroid, 3 = Oriental, 4 = Other), läkemedelsmyndigheterna i olika länder vill ibland ha separata analyser för olika folkslag smoke Smoking habits rökvanor (1 = icke rökare, 2 = har rökt tidigare, 3 = rökare) VISIT innehåller data från de fyra klinik-besöken (V1 V4). FEV 1, FVC och FEF 25 75 är några olika mått på patienternas lungfunktion, ju högre värde desto bättre lungkapacitet. Värdena beror bl.a. på individens kön, längd och ålder varför man också har beräknat varje individs förväntade FEV 1 -värde (fev pred). fev pred Predicted FEV1 (l) förväntat värde på FEV1, en regressionsskattning baserad på kön, ålder och längd v1 fev1 Visit 1:FEV1 (l) FEV1-värde vid besök 1 v1 fvc Visit 1:FVC (l) FVC-värde vid besök 1 v1 fef Visit 1:FEF25-75 (l/s) FEF25-75-värde vid besök 1 v2 fev1 Visit 2:FEV1 (l) FEV1-värde vid besök 2 v2 fvc Visit 2:FVC (l) FVC-värde vid besök 2 v2 fef Visit 2:FEF25-75 (l/s) FEF25-75-värde vid besök 2 v3 fev1 Visit 3:FEV1 (l) FEV1-värde vid besök 3 v3 fvc Visit 3:FVC (l) FVC-värde vid besök 3 v3 fef Visit 3:FEF25-75 (l/s) FEF25-75-värde vid besök 3 v4 fev1 Visit 4:FEV1 (l) FEV1-värde vid besök 4 v4 fvc Visit 4:FVC (l) FVC-värde vid besök 4 v4 fef Visit 4:FEF25-75 (l/s) FEF25-75-värde vid besök 4 DIARY Varje patient får också med sig hem en enklare apparat för att dagligen kunna mäta ett annat lungfunktionsmått, PEF, peak expiratory flow (l/min). Två gånger varje dag, morgon och kväll, görs dessa mätningar och resultaten noteras tillsammans med några andra variabler i en dagbok. För att förenkla arbetet har vi i den här datafilen beräknat medelvärdet för de olika variablerna under runin-perioden resp. den egentliga behandlingsperioden. Antalet puffar är det antal inhalationer av en snabbverkande bronkvidgande medicin (t.ex. Bricanyl) som patienten tar vid akuta besvär. Ju färre sådana som behövs desto bättre fungerar den andra medicinen.
Den asthma symptom score som används dagligen är kodad enligt 0 = None, 1 = Mild, 2 = Moderate och 3 = Severe. I patientens dagbok finns en utförligare beskrivning vad som avses med de olika begreppen. ri pefmo RI:PEF morning (l/min) genomsnittligt morgon-pef under run-in ri puffn RI:Number of puffs night genomsnittligt antal puffar nattetid under run-in ri sympn RI:Asthma symptoms night genomsnittlig symptom-score nattetid under run-in ri pefev RI:PEF evening (l/min) genomsnittligt kvälls-pef under run-in ri puffd RI:Number of puffs day genomsnittligt antal puffar dagtid under run-in ri sympd RI:Asthma symptoms day genomsnittlig symptom-score dagtid under run-in tr pefmo RI:PEF morning (l/min) genomsnittligt morgon-pef under behandling tr puffn RI:Number of puffs night genomsnittligt antal puffar nattetid under behandling tr sympn RI:Asthma symptoms night genomsnittlig symptom-score nattetid under behandling tr pefev RI:PEF evening (l/min) genomsnittligt kvälls-pef under behandling tr puffd RI:Number of puffs day genomsnittligt antal puffar dagtid under behandling tr sympd RI:Asthma symptoms day genomsnittlig symptom-score dagtid under behandling Analys 1. Det första som bör göras är att kontrollera att de båda behandlingsgrupperna inte skiljer sig åt vad gäller väsentliga bakgrundsvariabler. Beräkna därför tabeller eller beskrivande mått för de olika bakgrundsvariablerna uppdelat på behandling. Några statistiska test behöver ej göras här, men rapportera om det finns några stora skillnader mellan grupperna vad gäller bakgrundsvariablerna. 2. Vi ska först koncentrera oss på ett av lungkapacitetsmåtten, FEV 1, FVC eller FEF 25 75. Välj att av dem! (a) Gör separata histogram över ditt lungkapacitetsmått (FEV 1, FVC eller FEF 25 75 ) vid tillfälle V1 för de båda behandlingsgrupperna var för sig. Är normalfördelning en rimlig modell? (b) Testa, med ett lämplig test, om det finns någon signifikant skillnad mellan grupperna vid besök 1 (V1), respektive besök 2 (V2) för ditt lungfunktionsmått. Kan man påvisa skillnader kan det bero på att patienterna i en av grupperna är underbehandlad vid studiens start. Ange modell för data, hypoteser, teststorhet och slutsatser. 3. (a) Testa om vi fått en signifikant förändring av lungkapaciteten om vi jämför resultatet före behandling (V2) med: i. resultatet efter 4 veckors behandling (V3) ii. resultatet efter 8 veckors behandling (V4) Gör jämförelserna inom respektive behandlingsgrupp. (b) Testa sedan om effekten är lika stor i de båda grupperna. OBS! För att göra detta måste ni först bilda två nya variabler som mäter förändringen från besök 2 till besök 3 respektive 4. 4. Visa i ett diagram hur ditt lungfunktionsmått (FEV 1, FVC eller FEF 25 75 ) utvecklas över tiden genom att visa boxplotar för lungkapacitetsmåttet vid varje visit. Kommentera. 5. Eftersom lungfunktionen beror på en mängd olika saker, t.ex. ålder, beräknar man det förväntade värdet av lungkapacitetsmåttet (FEV 1, FVC eller FEF 25 75 ). Kontrollera först att ett linjärt samband mellan ditt lungkapacitetsmåttet (FEV 1, FVC eller FEF 25 75 ) och ålder verkar rimligt. Om ett linjärt samband verkar lämpligt, skatta sambandet. Hur mycket förändras lungkapacitetsmåttet i genomsnitt under ett år? Behöver vi ta hänsyn till vikt och/eller höjd också?
6. Behandlingarna kan påverka symptomen på olika sätt i de två behandlingsgrupperna. Testa om det finns någon signifikant skillnad mellan grupperna under behandlingsperioden avseende: (a) PEF - morgon (b) Puffar - natt (c) Asthma-symptom - natt För varje test, undersök om ett test baserat på normalfördelningsantagande verkar lämpligt eller om testet bör vara icke-parametriskt. Utför det lämpliga testet. 7. Sammanfatta era resultat. Slutligen... Ha följande visdomsord i åtanke när du arbetar med uppgifterna. Som alltid när man är utkastad i verkligheten: Det finns inte något facit till problemet eller uppgiften, bara bra eller mindre bra lösningar. Som alltid i en kurs: Det är inlärningen under tiden, själva processen, som avgör hur framgångsrikt projektet är. Lycka Till!