Department of Mathematics Uppsala University

Storlek: px
Starta visningen från sidan:

Download "Department of Mathematics Uppsala University"

Transkript

1 Bootstrapvalidering av konfidensintervall för ett standardiserat mått för att jämföra behandlingsbenägenhet mellan sjukhus Trude Warner UUDM Project Report : Examensarbete i matematisk statistik, poäng Handledare: Johan Lindbäck, UCR, Uppsala universitet Examinator: Dag Jonsson Oktober Department of Mathematics Uppsala University

2 Sammanfattning RIKSHIA är ett nationellt kvalitetsregister för hjärtintensivvården i Sverige Det omfattar samtliga patienter som vårdas på deltagande sjukhus hjärtintensivvårdsavdelning Av Sveriges sjukhus deltar idag stycken I och med registret är det lätt att följa upp hur sjukhusen behandlar sina patienter Trots att Socialstyrelsen har gett ut nationella riktlinjer för vård av hjärtpatienter har det observerats skillnader mellan sjukhus För att ta reda på vad dessa skillnader beror på gjordes en registerstudie på åren Man kom fram till att när det gäller relativt nya behandlingar och behandlingar som kräver en viss utrustning som inte finns tillgänglig överallt, så skiljer sig sjukhusen åt I den statistiska analysen gjordes vissa antaganden för att ta fram variansen av ett mått på sjukhusens behandlingsstrategi Man tog även fram konfidensintervall för detta mått Syftet med denna uppsats var att testa hur bra skattade dessa konfidensintervall och varianser är För att göra det använde vi oss av den statistiska metoden Bootstrap, som går ut på att man genererar många stickprov utifrån ett enda genom att dra observationer slumpmässigt med återläggning Det vi kom fram till var att de approximativa konfidensintervallen är goda skattningar Alla antaganden som gjordes för att ta fram en variansformel för måttet på sjukhusens behandlingsstrategi visade sig dock inte stämma lika bra Trots det ger variansformeln för måttet relativt goda skattningar då felen till stor del tar ut varandra

3 Förord Först vill jag tacka min handledare Johan Lindbäck för att du med mycket engagemang och pedagogik hjälpt mig med stora och mindre stora frågor Jag vill också tacka Lars Berglund och Dag Jonsson för stor hjälp och goda råd Till sist vill jag framföra tack till alla på UCR som har hjälpt mig med detta arbete, speciellt Kalle Spångberg och Manuela Zamfir i statistiker gruppen, Sören Gustafsson och Pär Lundqvist i ITgruppen, Jörgen Cronblad, monitor och RIKSHIAexpert samt Matts Högberg Ni har varit mycket hjälpsamma och engagerade

4 Innehållsförteckning INLEDNING BAKGRUND DATAKONTROLL OCH SAKNADEVÄRDENMÖNSTRET TEST AV ANTAGANDEN BOOTSTRAP KONFIDENSINTERVALLEN VAR[LN(STR JT )] VAR[O JT ] VAR[E JT ] COV(O JT,E JT ) DISKUSSION REFERENSER BILAGOR BILAGA KONFIDENSINTERVALL BILAGA FÖRDELNINGEN ÖVER LN(STR JT *) BILAGA PROGRAMKOD I SAS

5 Inledning I Sverige uppgår varje år vården av patienter med hjärtinfarkt eller hotande hjärtinfarkt till en kostnad av miljarder kronor Till det kommer kranskärlsingrepp eller ballongvidgning för en kostnad av miljard årligen [] RIKSHIA är ett nationellt kvalitetsregister för hjärtintensivvården sedan första januari och står för Register of Information and Knowledge about Swedish Heart Intensive care Admission Registret omfattar samtliga patienter som vårdas på hjärtintensivvårdsavdelning på deltagande sjukhus, som idag är uppe i stycken av Sveriges Registret skapades av professor Lars Wallentin, Akademiska sjukhuset i Uppsala och Ulf Stenestrand, kardiolog på Linköpings Universitetssjukhus Det drivs och utvecklas idag av UCR med ekonomiskt stöd från Socialstyrelsen och Landstingsförbundet samt i samarbete med Svenska Kardiologföreningen Syftet med registret är att utveckla den akuta hjärtsjukvården genom ökad kunskap om vårdbehov, vårdinsatser och behandlingsresultat [] Registret består av fyra dataformulär; ett för personuppgifter, ett för intagning, där bla mediciner och EKG vid ankomst förs in, ett för vårdförlopp och slutligen ett för fortsatt vård och utskrivning, där bla mediciner och EKG vid utskrivning förs in Varje vårdtillfälle utgör en post så samma patient kan förekomma flera gånger Uppföljning av registreringen görs genom att en monitor åker ut till sjukhuset och jämför ett slumpmässigt urval av poster i registret med respektive journal Det förekommer att värden saknas i registret och saknade värden såväl som fel ifyllda värden kan påverka kvaliteten Andelen saknade och fel ifyllda värden i RIKSHIA är dock ganska låg, ca % Trots de nationella riktlinjerna som Socialstyrelsen har gett ut om vård av hjärtpatienter har man observerat skillnader mellan sjukhus i andelen patienter som får en viss behandling För att ta reda på om detta kan bero på skillnad i patientkaraktäristika eller behandlingsstrategi gjordes under en registerstudie på RIKSHIA av UCR och Universitetssjukhuset i Linköping [] Studien omfattade patienter som fått diagnosen hjärtinfarkt och som vårdats på sjukhus med minst patienter under Totalt var det sjukhus och registreringar Det man kom fram till var att när det gäller de väletablerade behandlingarna med säkra bevis för effektivitet så har sjukhusen liknande behandlingsstrategier Däremot skiljer de sig åt när det gäller behandlingar med nya eller osäkra indikationer för effektivitet och för behandlingar som inte finns tillgängliga på alla sjukhus

6 I den statistiska analysen gjordes en del antaganden och syftet med denna uppsats är att testa rimligheten i dessa samt att titta på mönstret hos de saknade värdena Bakgrund I registerstudien jämfördes användandet av fyra akuta behandlingar, två undersökningsmetoder och fyra mediciner vid utskrivning (se Tabell ) Dessa tio behandlingar var responsvariabler i studien En responsvariabel kallas också för en beroende variabel då dess värde antas bero av värdet på en eller flera förklarande eller oberoende variabler För att korrigera för skillnader i patientkaraktäristika inkluderades oberoende variabler i analysen (se Tabell ) Dessa valdes ut av Ulf Stenestrand och Lars Wallentin och är vad de anser att en läkare tar hänsyn till när denne bestämmer vilken behandling patienten ska få För var och en av de tio responsvariablerna räknades ett så kallat propensity score ut för varje patient I denna studie är det sannolikheten att få behandling beroende av vad man har för vektor av förklarande variabler,x ij, men oberoende av vilket sjukhus man vårdas på För mer detaljerad läsning om propensity score hänvisas till Rosenbaum & Rubin [] Sannolikheten skattades genom att använda logistisk regressionsanalys Låt Y ijt = om patient i på sjukhus om patient i på sjukhus j j får behandling t ej får behandling t i=,,,n j, j=,,,, t=,,, Om alla sjukhus har samma behandlingsstrategi gäller att Y ijt X ij Bernoulli(π ijt ) och Var[Y ijt X ij ]= π ijt (π ijt ) Här är π ijt = propensity score = sannolikheten att patient i på sjukhus j får behandling t Förväntat antal behandlade patienter på varje sjukhus ges då av och observerat antal ges av E jt = n j i= π ijt

7 n j Y ijt i= O jt = Om man vidare antar att Y ijt X ij och Y i jt X ij är oberoende för varje i i gäller att n j Var[O jt ] = Var[ Y X ] = Var[ Y X ] = π ( π ) () i= ijt ij n j i= ijt ij n j i= ijt ijt För att jämföra observerat antal behandlade patienter med förväntat beräknades i registerstudien statistikan STR (standardised treatment ratio) som är kvoten av de två O STR jt = E jt jt () När STR jt =, behandlar sjukhuset lika många patienter som förväntat utifrån hur deras patienter ser ut Är STR jt < behandlar de färre och är STR jt > behandlar de fler än förväntat Eftersom det förekommer slumpmässig variation togs inte bara en punktskattnig av STR jt fram utan även ett konfidensintervall För att beräkna ett approximativt konfidensintervall för en kvot är det oftast praktiskt att först logaritmera Man minskar dessutom skevheten i fördelningen O jt ln( STR jt ) = ln = ln( O jt ) ln( E jt ) E jt () Väntevärde och varians för detta uttryck skattades med Gauss approximationsformler [] O Låt g(x)=ln E jt jt O jt E[ O jt ] där X= och låt A=E[X]= E jt E[ E jt ] Taylorutveckling av g(x) kring A ger T g( X) g( A) g'( A) *( X A) R = + +, där R är resttermen som antas vara försumbart liten Väntevärdesbildning av det som är kvar ger

8 E[ O ] T jt E[ g( X)] g( A) + g'( A) *( A A) = g( A) = ln = ln(e[ Ojt ]) ln(e[ Ejt ]) E[ E jt ] Vidare blir T Var[ g( X)] g'( X) *Var[ X]* g'( A) g = O g E jt E[ Ojt ] jt E[ Ojt ] E[ Ejt ] E[ Ejt ] Var[ Ojt ] Cov( Ojt, E Cov( O, ) Var[ jt Ejt E jt ] jt g O ) g E jt jt E[ O jt ] E[ E jt ] E[ O jt ] E[ E jt ] g =Var[O jt ]* O jt E[ O jt ] E[ E jt ] +Var[E g g jt]* E[ O ] E +*Cov(O jt,e jt )* jt jt E[ ] O * g jt O jt E E[ O ] jt jt E[ E jt ] E[ E jt ] E[ E jt ] =Var[O jt ]* E[ O jt ] +Var[E jt]* +*Cov(O E[ E jt ] jt,e jt )* E[ O jt ] * E[ E jt ] = Var[O jt ]* E jt +Var[E jt ]* *Cov(O jt, E jt )* E jt () E jt I registerstudien antogs att alla π ijt var bestämda med tillräcklig hög precision för att kunna sägas vara fixa Det skulle i sin tur leda till att E jt = π är fix och följaktligen att n j i= ijt Var[Ejt]=, samt att Cov(O jt,e jt )= Då skulle () bli Sammanfattningsvis blir då Var [ g( X)] = Var[ Ojt ]* E jt E[ln(STR jt )] ln(e[o jt ])ln(e[e jt ]) och Var[ln(STR jt )] E jt n j n j *Var[O jt ]= π ijt * π ijt ( π ijt ) () i= i= Ett (α)*% approximativt konfidensintervall ges nu av:

9 ln( STR ) ± * Var[ln( STR )], () jt λ α / jt där λ α/ är α/ percentilen i en standardiserad normalfördelning Det huvudsakliga syftet med denna uppsats är att testa rimligheten i ovanstående konfidensintervall () och därmed även rimligheten i antagandena () och ()

10 Datakontroll och saknadevärdenmönstret Innan rimligheten i antagandena testades, kontrollerades datat För responsvariablerna tog vi för varje behandlingsvariabel fram hur många som fått respektive behandling och hur många saknade värden respektive behandlingsvariabel har Samma sak gjordes för de oberoende variablerna Tabell Responsvariablerna med antal och andel behandlade samt antal och andel saknade värden på respektive variabel Andel behandlade är uträknad innan korrigering gjorts för saknade värden Responsvariabel Antal (%) N= Antal saknade (%) Akuta behandlingar: Intravenös nitroglycerin () () vidgar blodkärlen Intravenös βblockerare () () sänker hjärtfrekvens och blodtryck Intravenös heparin () () förhindrar blodkoagulation Akut reperfusionbehandling () () återupprättandet av blodflödet i hjärtmuskulaturen Undersökningsmetoder: ekokardiografi () () ultraljudsundersökning av hjärtat koronarangigrafi () () kranskärlsröntgen Utskrivningsmediciner: ACEhämmare eller AIIblockerare () () blodtryckssänkande och kärlvidgande Acetylsalicylsyra eller antikoagulantia () () minskar benägenhet för blodpropp βblockerare () () se ovan lipidsänkare () () sänker kolesterolhalten i blodet

11 Tabell Oberoende variabler För ålder redovisas medianåldern samt den :e och :e percentilen För variabeln kön är det antal och andel män som redovisas För övriga är det antal och andel som fått behandling Dessutom redovisas antal och andel saknade värden för respektive variabel Oberoende variabler Antal(%) Antal saknade(%) Ålder, median (:e, :e) (,) () Kön (män) () () Rökare () () Tidigare reperfusionbehandling () () Tidigare hjärtinfarkt () () Hjärtsvikt på avdelning(lungrassel) () () Diabetes () () Högt blodtryck () () Cirkulationsstillestånd som intagningsorsak () () Importerade från andra register: Huruvida patienten lider/har lidit av Stroke () () Njursvikt () () Kronisk obstruktiv lungsjukdom () () Demens () () Cancer de senaste tre åren () () Hjärtsvikt () () Mediciner vid ankomst: ACEhämmare el AΙΙblockerare () () Antiarytmika () () Reglerar hjärtrytmen Antikoagulantia () () Acetylsalicylsyra () () βblockerare () () Kalciuminhibitorer () () kärlvidgande Digitalis () () Motverkar hjärtsvaghet och sänker hjärtfrekvensen Diuretika () () vätskedrivande Långtidsverkande nitrater () () Vidgar vener och artärer Lipidsänkare () ()

12 För att se om det finns något mönster hos de saknade värdena för de oberoende variablerna summerades antalet saknade värden för dessa Hur detta antal fördelade sig visas i histogrammet nedan FREQUENCY Figur Fördelning över antal saknade värden hos varje observation Xaxeln visar antal saknade värden Y axeln visar antal observationer i varje grupp av saknade värden NMISS Variablerna stroke, njursvikt, kronisk obstruktiv lungsjukdom (KOL), demens, cancer de senaste tre åren och tidigare hjärtsvikt är importerade från andra register Antingen finns patienten med i respektive register eller inte, så dessa variabler har inte ett enda saknat värde Utöver dessa är det bara variablerna kön och cirkulationsstillestånd som intagningsorsak som inte har något saknat värde Variabeln cirkulationsstillestånd fås ur variabeln intagningsorsak i RIKSHIA Denna variabel måste fyllas i för att komma vidare i dataformuläret och det förklarar varför den inte har några saknade värden Då återstår variabler som har saknade värden Det som är anmärkningsvärt i histogrammet ovan är pucklarna vid och För att se vad de kunde bero på plockades alla observationer som har saknade värden ut Av dessa hade % sina saknade värden på de tio ankomstmedicinerna Alla ankomstmediciner fylls i

13 på samma ställe i RIKSHIA och fattas det uppgift om en av dessa så fattas det ofta uppgift om alla Sedan plockades de observationer som har saknade värden ut och av dessa hade % sina saknade på de tio ankomstmedicinerna plus variabeln för hjärtsvikt på avdelning Av de variabler som hade saknade värden hade % dem på de tio ankomstmedicinerna, tidigare reperfusionsbehandling, tidigare hjärtinfarkt, högt blodtryck, diabetes och rökare Alla observationer med saknade värden hade dessa på ovanstående plus hjärtsvikt på avdelning Detta kan förklaras av att i de fall med saknade värden har registreringen, utöver personnummer, inte genomförts alls Det kan tex ha visat sig att patienten inte led av en akut hjärtsjukdom som misstänktes från början Ålder och kön är variabler som fås från patientens personnummer och ska aldrig vara saknade Ålder saknas i två fall och i dessa saknas även alla övriga variabler vilket förklarar stapeln vid Utöver de variabler som aldrig ska vara saknade återstår stycken och därför den relativt stora stapeln där Man skulle kunna tänka sig att andelen saknade värden skulle vara beroende av hur stort sjukhuset är; att ett större sjukhus skulle ha bättre resurser eller rutiner för att fylla i registret För att kontrollera detta beräknades medelvärdet av antalet saknade värden för varje sjukhus och plottades mot antalet patienter under på respektive sjukhus medelvärdet av antal saknade värden,,,,, Nr Nr antal vårdade hjärtpatienter under Figur Relationen mellan medelvärdet av antal saknade värden hos varje observation och antal vårdade hjärtpatienter under för varje sjukhus

14 Inget samband mellan sjukhusstorlek och antal saknade värden kan utläsas ur plotten Det är två sjukhus som utmärker sig; de som i studien har nummer och För att se om det finns någon relation mellan de två åren plottades medelvärdet av antal saknade värden mot medelvärdet av antal saknade värden medelvärdet av antal saknade värden år Nr Nr medelvärdet av antal saknade värden år Figur Relationen mellan år och när det gäller medelvärdet av antal saknade värden Man kan se att det finns en relation De sjukhus som ligger lågt det ena året ligger även lågt det andra och tvärtom Ett undantag är sjukhus nummer, som ligger ovanligt högt år men normalt året därpå Sjukhus nummer ligger ovanligt högt båda åren Eftersom orsakerna till att värden saknas är beroende mellan vissa av variablerna är det svårt att imputera värden, uteslöts alla observationer som hade något saknat värde på de beroende och oberoende variablerna i den fortsatta studien Av den anledningen uteslöts ( %) observationer

15 Test av antaganden För att testa antagandena behöver vi någonting att jämföra dem med Låt oss säga att vi har ett stickprov, x=(x, x,, x n ), från en okänd fördelning F Vi är intresserade av en statistika θ=t(f) och skattar den med θ =t(x) Ibland kan det vara svårt eller tom omöjligt att analytiskt bestämma fördelningen eller variansen för den statistikan Med hjälp av en statistisk metod som kallas Bootstrap kan man dock ta reda på dessa och det är den metoden vi har använt oss av Bootstrap Bootstrap introducerades som en datorbaserad metod att skatta standardavvikelsen för θ En bra introduktion till metoden ges av Efron & Tibshirani [] Namnet kommer från uttrycket to pull oneself up by one s bootstrap som tros komma från baron Münchhausens äventyr Bootstrap går ut på att man genererar flera stickprov utifrån det stickprov man har Detta görs genom att dra med återläggning från stickprovet Om vi tar vårt stickprov, x=(x, x,,x n ), så generar vi ett bootstrapstickprov, x*=(x *, x *,, x n *), där tex x *=x, x *=x, x *=x, x *=x,, x n *=x Dvs i varje bootstrapstickprov kan samma individ förekomma en gång, flera gånger eller inte alls För att ta fram bootstrapskattningen av standardavvikelsen för θ gör man på följande vis: Man generar B stycken oberoende stickprov x *, x *,, x B * genom att dra med återläggning bland de värden man har I varje stickprov beräknar man fram den statistika man är intresserad av θ * =t(x *), θ * =t(x *),, θ B* =t(x B *) B Sedan beräknas standardavvikelsen enligt: ( ˆi* * ˆ θ ) B i= θ, där θˆ * = B i= θˆ B i* En illustration av metoden ges i Figur

16 Ô Var(Ô) Bootstrap Genererar nya stickprov genom att dra med återläggning från originalet Ô * Ô * Ô * Ô * Ô n * Figur En illustration av hur Bootstrap fungerar Var(Ô * ) Vi valde att testa antagandena om konfidensintervallen, Var[O jt ] samt Var[ln(STR jt )] för tre av de tio responsvariablerna De tre som valdes var intravenös βblockerare, ACEhämmare som utskrivningsmedicin och acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin Variationen av andelen patienter som får respektive behandling är högst hos intravenös β blockerare och lägst hos acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin, dvs det är en markant skillnad mellan sjukhusens behandlingsstrategier när det gäller den förra, men knappt någon när det gäller den senare För behandlingen ACEhämmare som utskrivningsmedicin ligger skillnaden någonstans mittemellan Observerat och förväntat antal redovisas i figur

17 a) intravenös betablockerare, andel,,, sjukhus sorterade efter observerad andel b) ACEhämmare som utskrivningsmedicin, andel,,, sjukhus sorterade efter observerad andel andel c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin,,,, sjukhus sorterade efter observerad andel Figur Observerad(staplar) och förväntad(linje) andel patienter som fått de olika behandlingarna

18 Konfidensintervallen Ett konfidensintervall för ln(str) togs fram mha bootstrap och jämfördes med () Detta gjordes genom att bootstrapstickprov drogs från varje sjukhus I varje stickprov beräknades ln(str * jt )=ln(o * jt )ln(e * jt ) inom varje sjukhus E * jt erhölls genom att i varje stickprov räkna ut nya propensity score som summerades Stickproven sorterades sedan efter stigande värde på ln(str * jt ) inom varje sjukhus För att alla konfidensintervall tillsammans skulle täcka det sanna värdet med önskad konfidensgrad justerades intervallen med en Bonferroni korrigering och ett värde, α just, erhölls Denna fås ur formeln α=(α just ) k, där α är önskad konfidensgrad och k är antalet intervall som här också är antalet sjukhus Sedan togs den *(α just /):e och den *((α just )/):e percentilen i den empiriska fördelningen fram inom varje sjukhus För varje sjukhus beräknades dessutom medelvärdet av ln(str * ) De skattade konfidensintervallen beräknade på originalstickprovet jämfördes med bootstrapkonfidensintervallen Se fig nedan och bilaga Konfidensintervallen överensstämmer relativt väl I vissa fall är bootstrapintervallen bredare, i andra smalare Vid beräkningen av konfidensintervallen antogs att ln(str jt ) är normalfördelat Detta kontrollerades genom att rita upp fördelningen av ln(str jt *) från de stickproven för varje sjukhus och behandling I bilaga visas ett urval av dess fördelningar Normalfördelningsantagandet ser ut att stämma för de flesta sjukhus De sjukhus som inte visar på en normalfördelning är små sjukhus Även om konfidensintervallen ser ut att stämma bra kan det vara över och underskattningar som tar ut varandra Därför går vi nu vidare och tittar på de övriga antagandena Vi börjar med att titta närmare på antagandet om Var[ln(STR jt )] Tanken var att vi skulle ha stickprov, men pga en miss i programkoden sparades inte det först dragna stickprovet Eftersom det går lika bra med stickprov drogs inget extra

19 a) intravenös betablockerare ln(str),,,,, sjukhus b) ACEhämmare som utskrivningsmedicin ln(str),,,,,,,,, sjukhus c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin ln(str),,,,,,,,, sjukhus Figur Konfidensintervall för ln(str jt ) Det första i varje par är beräknat enligt formel (), det andra är genererat mha bootstrapsjukhus (ej, och )

20 Var[ln(STR jt )] I studien antogs att ln(str jt ) är normalfördelat samt att Var[ln(STR jt )] n j i= π ijt n j * π ( π ) i= ijt ijt Normalfördelningsantagandet är kommenterat i föregående stycke och det stämmer för de flesta sjukhus Då återstår att testa det andra antagandet I de bootstrapstickprov som drogs för att ta fram konfidensintervall beräknades även variansen för ln(str * jt ) inom varje sjukhus Denna jämfördes med variansen för ln(str jt ), beräknad enligt () på originalstickprovet En jämförelse gjordes genom att standardavvikelserna plottades mot varandra För att få en bättre överblick av hur mycket det skiljer beräknades även kvoten av standardavvikelsen från bootstrapstickprovet genom den beräknade standardavvikelsen på originalstickprovet Vi ser att variansen för ln(str jt ), beräknad enligt (), stämmer väl överens med bootstrapvarianserna Inte helt oväntat eftersom konfidensintervallen stämmer så pass bra Variansformeln med vilken variansen av ln(str jt ) beräknas ser ju ut som Var[ln(STR jt )]= nj nj π ( π ) * π ijt ijt ijt i= i= = Var[O jt ]* Nu vill vi titta närmare på antagandet om Var[O jt ] E jt

21 a) intravenös betablockerare, beräknad standardavvikelse,,,,,,,,,,,,,,, Bootstrapstandardavvikelse b) ACEhämmare som utskrivningsmedicin, beräknad standardavvikelse,,,,,,,,,,,,,,, Bootstrapstandardavvikelse c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin, beräknad standardavvikelse,,,,,,,,,,,,,,, Bootstrapstandardavvikelse Figur Bootstrapstandardavvikelse och beräknad standardavvikelse för ln(str)

22 a) intravenös betablockerare, kvot,, sjukhus sorterade efter kvot b) ACEhämmare som utskrivningsmedicin kvot,,,,,,, sjukhus sorterade efter kvot c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin kvot,,,,,,, sjukhus sorterade efter kvot Figur Kvoten mellan bootstrapstandardardavvikelsen och beräknad standardavvikelse av ln(str jt )

23 Var[O jt ] Som vi tidigare beskrivit bygger variansformeln för O jt dels på antagandet att sannolikheterna, π ijt, är bestämda med tillräcklig hög precision för att dessa ska kunna sägas vara fixa, och dels på antagandet att behandlingsvariablerna Y ijt och Y i jt är oberoende för varje i i' Vi tog fram bootstrapvariansen av O jt genom att i var och ett av de tidigare dragna stickproven summera antalet behandlade patienter inom varje sjukhus så att vi erhöll O jt *, O jt *,O jt *,, O jt * j=,,, t=,, Därefter beräknades variansen för O * jt inom varje sjukhus och denna jämfördes med variansen för O jt beräknad enligt () Jämförelsen gjordes genom att de båda standardavvikelserna plottades mot varandra För att få en bättre överblick beräknades som tidigare kvoten mellan standardavvikelsen i bootstrapstickprovet och standardavvikelsen i originalstickprovet De bägge varianserna överensstämmer väl För behandlingarna intravenös βblockerare och acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin blir den beräknade variansen ibland större, ibland mindre än bootstrapvariansen För behandlingen ACEhämmare som utskrivningsmedicin blir dock den beräknade variansen mindre än bootstrapvariansen för alla sjukhus utom ett

24 a) intravenös betablockerare beräknad standardavvikelse Bootstrapstandardavvikelsen b) ACEhämmare som utskrivningsmedicin beräknad standardavvikelse Bootstrapstandardavvikelse c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin beräknad standardavvikelse Bootstrapstandardavvikelse Figur Bootstrapstandardavvikelsen av O jt * och beräknad standardavvikelse av O jt

25 a) intravenös betablockerare,, kvot,,, sjukhus sorterade efter kvot b) ACEhämmare som utskrivningsmedicin,, kvot,,,, sjukhus sorterade efter kvot c)acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin kvot,,,,,,, sjukhus sorterade efter kvot Figur Kvoten mellan standardavvikelsen av O jt * och standardavvikelsen av O jt, beräknad med den antagna formeln

26 Var[E jt ] Hela variansformeln för ln(str jt ) ser ut som: Var[O jt ]* E jt +Var[E jt ]* *Cov(O jt, E jt )* E jt I studien antogs att både Var[E jt ] och Cov(O jt,e jt ) var noll så att vi fick den förenklade variansformeln () För att kontrollera antagandet om att Var[E jt ]= summerades alla propensity scores inom sjukhus i var och ett av de dragna stickproven så att vi erhöll E jt E jt *, E jt *,E jt *,, E jt * j=,,, t=,, Sedan beräknades variansen över E b* jt inom varje sjukhus Variansen av E jt behöver inte vara exakt noll, bara den är tillräckligt mycket mindre än variansen av O jt för att kunna bortses från i variansformeln () Vi gjorde en jämförelse mellan bootstrapvarianserna av O jt * och E jt * genom att de plottades i samma graf för varje sjukhus Dessutom beräknades kvoten av standardavvikelsen av O jt * genom standardavvikelssen av E jt * I de allra flesta fall är Var[E jt *] större än noll, den är dock alltid mindre än Var[O jt *] Standardavvikelsen av O jt * är som minst runt två gånger så stor som standardavvikelsen av E jt * Det betyder att variansen som minst är runt fyra gånger större

27 a) intravenös betablockerare varians sjukhus bootstrapvariansen avojt* bootstrapvariansen av Ejt* b) ACEhämmare som utskrivningsmedicin varians sjukhus bootstrapvariansen av Ojt* bootstrapvariansen av Ejt* c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin varians sjukhus bootstrapvarians av Ojt* bootstrapvarians av Ejt* Figur Var[O jt *] och Var[E jt *] för sjukhus (ej,,,, och )

28 a) intravenös betablockerare kvot sjukhus sorterade efter kvot b) ACEhämmare som utskrivningsmedicin,, kvot,, sjukhus sorterade efter kvot c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin kvot sjukhus sorterade efter kvot Figur Kvoten mellan standardavvikelsen av O jt * och standardavvikelsen av E jt * Alla sjukhus

29 Tabell Kovarianser mellan observerat antal behandlade och förväntat antal behandlade för de tre olika behandlingarna och för av de sjukhusen Sjukhus Cov(O jt *, E jt *), t=intravenös Cov(O jt *, E jt *), t=ace Cov(O jt *, E jt *), βblockerare hämmare som t=acetylsalicylsyra eller utskrivningsmedicin antikoagulantia som utskrivningsmedicin Cov(O jt,e jt ) För att testa antagandet om att Cov(O jt,e jt )=, summerades i de stickproven propensity scoren till E jt b * och behandlingsvariablerna till O jt b *, där t=,, b=,,, Sedan

30 beräknades kovariansen dem emellan för varje behandling och sjukhus För en del sjukhus och behandlingar är kovariansen i princip noll, men för de allra flesta är den betydligt skiljd från noll I tabell visas ett urval av sjukhus Diskussion Syftet med denna uppsats var främst att testa rimligheten i beräknade konfidensintervall genom att jämföra dem med konfidensintervall framtagna med hjälp av bootstrap Det visade sig att de stämde relativt väl Vi gick ändå vidare i analysen och tittade närmare på uttrycket för variansen, Var[ln(STR jt )], och den del som detta uttryck till stor del består av, Var[O jt ] Som väntat stämde dessa också väl För behandlingen ACEhämmare som utskrivningsmedicin var bootstrapvariansen av O jt * för alla sjukhus utom ett större än variansen beräknad med formel () För behandlingarna intravenös βblockerare och acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin var variationen större mellan sjukhusen avseende skillnaden mellan varianserna för O jt * och O jt Vi tittade även på de uttryck som antogs vara noll och som vi bortsåg från i formel (), Var[E jt ] och Cov(O jt,e jt ) Resultaten visade på att Var[E jt ] inte är noll, men ändå tillräckligt mycket mindre än Var[O jt ] för att man ska kunna bortse från denna i () Utan ovanstående antaganden ser variansformeln ut som: Var[ln(STR jt )]= Var[O jt ]* +Var[E jt ]* E jt *Cov(O jt, E jt )* E jt E jt En jämförelse gjordes mellan det första uttrycket och summan av de andra två genom att för sjukhus stoppa in respektive bootstrapvarianser Istället för E jt tog vi fram, b E jt dvs inom varje sjukhus beräknade vi medelvärdet av E b jt, där b=,,, (se figur ) Vi kan se att term ett är större än termerna två plus tre genomgående och bidrar alltså mer till Var[ln(STR jt )] Så trots att varken Var[E jt ] eller Cov(O jt,e jt ) är noll som antogs i studien så verkar det vara i sin ordning att utesluta dem Var[E jt ] är ungefär lika stor som *Cov(O jt,e jt ) och eftersom det är ett minustecken framför *Cov(O jt,e jt ) tar uttrycken ut varandra

31 a) intravenös betablockerare bidrag till Var[ln(STRjt)],,,,,,, sjukhus term två plus tre term ett b) ACEhämmare som utskrivningsmedicin bidrag till Var[ln(STRjt)],,,, sjukhus term två plus tre term ett c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin bidrag till Var[ln(STRjt)],,,,,, sjukhus term två plus tre term ett Figur Term två plus term tre = Var[E jt ]* E jt *Cov(O jt, E jt )* och term ett=var[o jt ]* E jt E jt

32 Referenser Socialstyrelsen, RIKSHIA, Stenestrand, U, Lindbäck, J & Wallentin, L Reasons for variations in treatment of acute myocardial infarction between different hospitals within one country based on observations in a large prospective cohort Inskickad Rosenbaum, PR & Rubin, DB(), The central role of the propensity score in observational studies for casual effects, Biometrica,, sid Blom, G(), Sannolikhetsteori med tillämpningar, Studentlitteratur, Lund, sid Efron, B & Tibshirani, R J(), An introduction to the Bootstrap, Chapman & Hall, USA

33 Bilagor Bilaga Konfidensintervall a) intravenös betablockerare ln(str),,,,, sjukhus b) ACEhämmare som utskrivningsmedicin ln(str),,,,,,,, sjukhus c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin ln(str),,,,,,,,,,, sjukhus Figur Konfidensintervall över ln(str jt ) Det första i varje par är beräknat enligt formel och det andra är bootstrapintervallet Sjukhus (ej, och )

34 a) intravenös betablockerare,, ln(str),, sjukhus b) ACEhämmare som utskrivningsmedicin,,, ln(str),,,, sjukhus c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin ln(str),,,,,,,,, sjukhus Figur Konfidensintervall över ln(str jt ) Det första i varje par är beräknat enligt formel och det andra är bootstrapintervallet Sjukhus (ej,, och )

35 a) intravenös betablockerare ln(str),,,,, sjukhus b) ACEhämmare som utskrivningsmedicin, ln(str),,, sjukhus c) acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin ln(str),,,,,,,, sjukhus Figur Konfidensintervall över ln(str jt ) Det första i varje par är beräknat enligt formel och det andra är bootstrapintervallet Sjukhus, (ej )

36 Bilaga Fördelningen över ln(str jt *) SJUKHUS= FREQUENCY Z_i be MIDPOINT SJUKHUS= FREQUENCY Z_ibe MIDPOINT SJUKHUS= Z_ibe MIDPOINT Figur Fördelningen för ln(str jt * ) där j=,, och t=intravenös βblockerare

37 SJUKHUS= FREQUENCY Z_uac MIDPOINT SJUKHUS= Z_uac MIDPOINT SJUKHUS= FREQUENCY Z_uac MIDPOINT Figur Fördelningen för ln(str jt * ) där j=,, och t=acehämmare som utskrivningsmedicin

38 SJUKHUS= FREQUENCY Z_asa MI DPOI NT SJUKHUS= FREQUENCY Z_asa MIDPOI NT SJUKHUS= FREQUENCY Z_asa MIDPOI NT Figur Fördelningen för ln(str jt * ) där j=, och och t=acetylsalicylsyra eller antikoagulantia som utskrivningsmedicin

39 Bilaga Programkod i SAS Libname Trude 'm:\my SAS Files'; option nonotes; data str_ett; set Trudeasakoapro; if first sjukhus then n=; else n+; i=; *Tar ett dataset med propensity scores; *för acetylsalicylsyrabara eller; *antikoagulantia som utskrivnings; *medicin och nummrerar observationerna; *inom sjukhus, i skapas enbart för proc; *proc multtest; data TrudeSTR; *skapar ett tomt dataset som ska fyllas; *på Blir här bara en tom rad; /***********************************/ /******* drar stickprov ************/ /***********************************/ %macro str(repl); %do i= %to &repl; *när macrot anropas anges hur många; *gånger dosatsen ska köras; proc multtest data=str_ett noprint nocenter outsamp=str_tva nsample= bootstrap; *med proc multtest och valet bootstrap; *dras ett stpr med återläggning från; class n; *varje sjukhus,n:en dras; test mean(i); *proc multtest kräver att ett test; *genomförs; data str_tva; set str_tva; rename _obs_=n; proc sort data=str_tva; by sjukhus n; *n:en som dras får i det nya stpr; *namnet _obs_,här får de namnet n igen; *det dragna stpr sorteras efter n inom; *varje sjukhus; data str_tre; *och slås samman med ett dataset som; merge str_tva Trudea; *innehåller alla oberoende variabler; by sjukhus n; *de matchas efter sjukhus och n; if _sample_= then delete; proc sort data=str_tre; by sjukhus n; *sorterar det sammanslagna datasetet; *efter n inom varje sjukhus; proc logistic descending data=str_tre noprint; model asakoany=alder kon acirk dm hyperton smoker tinfarkt tptcabg aacei aantiary aantiko aasa abetabl acah adigital adiureti alipids anitro sviktar kom_stro kom_njur kom_kol kom_deme kom_canc kom_hsvi; output out=pred_asa p=phat_asa;*med proc logistic beräknas; *sannolikheten att få behandling; *beroende av vilket värde de oberoende; proc means data=pred_asa noprint;*variablerna har; By sjukhus; *med proc means summeras dessa;

40 var phat_asa asakoany; *sannolikheter & även; output out=str_asa sum=sphat_asa sasak n=n;*behandlingsvariabeln; *så att O & E erhållshär får de namnen; *sphat_asa och sasak; data str_asa; set str_asa(keep=sjukhus sasak sphat_asa n); *behåller önskade variabler:sjukhus,o&e; proc sort data=str_asa; *sorterar detta dataset efter sjukhus; proc logistic descending data=str_tre noprint; model uaceiny=alder kon acirk dm hyperton smoker tinfarkt tptcabg aacei aantiary aantiko aasa abetabl acah adigital adiureti alipids anitro sviktar kom_stro kom_njur kom_kol kom_deme kom_canc kom_hsvi; output out=pred_uac p=phat_uac; *gör här samma sak för ACEhämmare; proc means data=pred_uac noprint; By sjukhus; var phat_uac uaceiny; output out=str_uac sum=sphat_uac suacei n=n; data str_uac; set str_uac(keep=sjukhus suacei sphat_uac n); proc sort data=str_uac; proc logistic descending data=str_tre noprint; model ibetablny=alder kon acirk dm hyperton smoker tinfarkt tptcabg aacei aantiary aantiko aasa abetabl acah adigital adiureti alipids anitro sviktar kom_stro kom_njur kom_kol kom_deme kom_canc kom_hsvi; output out=pred_ibe p=phat_ibe; *och för intravenös betablockerare; proc means data=pred_ibe noprint; By sjukhus; var phat_ibe ibetablny; output out=str_ibe sum=sphat_ibe sibeta n=n; data str_ibe; set str_ibe(keep=sjukhus sibeta sphat_ibe n); proc sort data=str_ibe; data str_ihop; merge str_ibe str_uac str_asa; *slår ihop dataseten med O och E för; Z_asa=log(sasak/sphat_asa); *de tre olikabehoch beräknar ln(str);

41 Z_uac=log(suacei/sphat_uac); *för varje behoch sjukhus; Z_ibe=log(sibeta/sphat_ibe); data TrudeSTR; set TrudeSTR str_ihop; %end; %mend; %str(); *allt matas in i TrudeSTR; *slut på dosatsen; *slut på macrot; *macrot anropas gånger; proc sort data=str(where=(sjukhus ne )); *tar bort tomma raden från TrudeSTR; *och sorterarefter sjukhus; data konf_str_asa; *spar sjukhus och Z för resp behi; set TrudeSTR(keep= sjukhus Z_asa);*varsitt data set; *för att ta fram konfinterv; data konf_str_uac; set TrudeSTR(keep= sjukhus Z_uac); data konf_str_ibe; set TrudeSTR(keep= sjukhus Z_ibe); /**********************************************/ /********* tar fram std av STR ****************/ /**********************************************/ proc means data=trudestr noprint;*beräknar mha proc means stdavvikelsen; *för ln(str)=z för varje beh och; var Z_asa Z_uac Z_ibe; *inom sjukhus; output out=trudestd_str std=std_asa std_uac std_ibe; *vill nu ta fram den beräknade variansen på originalstpr; data var_asa; set Trudeasakoapro; *här acetyl; varians=phat*(phat); proc means data=var_asa noprint; *summerar ovanstående varians för att få; var varians phat; *Var[O] & alla propscores för att få E; output out=var_asa sum=svar sphat; data var_asa; set var_asa; std_asa_org=sqrt((/(sphat**))*svar); *detta är formeln för Var[ln(STR)]; data var_ibe; set Trudeibetablpro; varians=phat*(phat); *gör samma sak för intrav betabl;

42 proc means data=var_ibe noprint; var varians phat; output out=var_ibe sum=svar sphat; data var_ibe; set var_ibe; std_ibe_org=sqrt((/(sphat**))*svar); data var_uac; set Trudeuaceipro; varians=phat*(phat); *och för ACEhämmare; proc means data=var_uac noprint; var varians phat; output out=var_uac sum=svar sphat; data var_uac; set var_uac; std_uac_org=sqrt((/(sphat**))*svar); data TrudetempvarZ; merge var_asa(keep=sjukhus std_asa_org) var_ibe(keep=sjukhus std_ibe_org) var_uac(keep=sjukhus std_uac_org); *behåller det intressanta och slår ihop; *alla beräknade std för de olika beh; data Trudestr; *slår ihop datasetet med bootstrapstd; merge Trudestd_STR(drop= _type freq_) Trudetempvarz; *och datasetet med varianserna beräknade; *enligt formel; /****************************************/ /***** tar fram bootstrapintervall ******/ /****************************************/ proc sort data=konf_str_uac; *Tar datasetet med de Zvärdena; by sjukhus Z_uac; *och sorterar efter Z inom varje sjukhus; *här beh uacei=acehämmare; data konf; set konf_str_uac; if first sjukhus then n=; else n+; passa=; *numrerar Z inom sjukhus; *passa används senare; data konf; set konf end=final; *Tar här fram en variabel som är; if n= then count+; *antal sjukhus och en som är; if final then do;antsj=count; antboot=n; end ; *antal stpr; data konf;

43 set konf(keep=antsj antboot); passa=; *får här en rad med antsj antboot och; if antsj ne then output; *och passa; data konf(drop=passa); merge konf konf; by passa; *slår ihop de numrerade Z:na med antsj; *och antboot; data konf; set kon f; ajust=()**(/antsj); *det bonferroni korrigerade alfat; a=; aaa=antboot*(ajust/); *tar fram den nedre gränsen i intervallet; if n=round(aaa,) then output;*rundar av lite; rename Z_uac=lowerz; *döper om det Z som utgör den nedre gränsen; data konf; set kon f; ajust=()**(/antsj); a=; aa=antboot*((ajust/)); *Tar här fram den övre gränsen; if n=round(aa,)+ then output; rename Z_uac=upperz; data konf; merge konf konf; *slår ihop dataseten innehållandes; *nedre och övre gräns; data konf; *behåller det intressanta; set konf(keep=sjukhus lowerz upperz); proc means data=trudestr noprint; *tar fram medelvärdet av Z=ln(STR) från; var Z_asa Z_uac Z_ibe; *bootstrapstickproven inom varje sjukhus; output out=y mean= mean_asa mean_uac mean_ibe; data konf; merge konf y(keep=sjukhus mean_uac); *slår ihop datasetet med övre & nedre gräns; *med datasetet innehållandes medelvärdet; data trudekonf_str_uac; set konf; rename lowerz=b_lowerz; gränser; rename mean_uac=b_mean; rename upperz=b_upperz; *döper om så jag ska veta att det är boot /********************************************/ /** tar fram konfintervall på orgstpr ***/ /********************************************/ data plotz;

44 set Trudeuacei(drop=_type freq_); Z= log(suacei/e_uacei); *För beh uacei=acehämmare; *Tar fram Z=STR; data konfstr; merge Trudetempvarz(keep=sjukhus std_uac_org) plotz; var_uac=std_uac_org**; *Lägger till variansen; data konfstr; set konfstr; lowerz=z(*sqrt(var_uac)); upperz=z+(*sqrt(var_uac)); *Tar fram nedre och; *övre gräns; data Trudekonfstr; *har nu ett dataset med Z,nedre,; set konfstr(drop=var_uac e_uacei suacei std_uac_org); *&övre gräns för Z från originalstpr; /****************************************/ /********* tar fram std för Ojt *********/ /****************************************/ proc means data=trudestr noprint; var sasak suacei sibeta; *tar fram std för Ojt* för varje; output out=std_o std=std_o_asa std_o_uac std_o_ibe; *beh inom sjukhus; data varo_uacei; set Trudeuaceipro; var_uac=phat*(phat); obs; *i Trudeuaceipro finns prop score; *för alla obs för ACEhämmare; *tar här fram variansen för varje proc means data=varo_uacei noprint; var var_uac; *summerar varianserna för att få Var[Ojt]; output out=varo_uacei sum=varo_uac; data varo_uacei; set varo_uacei; std_o_uac_org=sqrt(varo_uac); *tar fram std; data Trudejmfvouac; merge varo_uacei(keep=sjukhus varo_uac) std_o(keep=sjukhus std_o_uac); *slår ihop bootstd med beräknad; /******************************************/ /******** tar fram std för Ejt ************/ /******************************************/ proc means data=trudestr noprint; var sphat_asa sphat_ibe sphat_uac;

45 output out=std_e std=std_asa std_ibe std_uac; *tar fram std för E=sphat inom varje sjukhus; /******************************************/ /********* tar fram kovariansen ***********/ /******************************************/ data p; set TrudeSTR; *plockar ut sjukhus; if sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus= or sjukhus=; proc corr cov data=p outp=e; var suacei sphat_uac; data W; set E(drop=e); if _type_='cov' and _name_='e'; rename o=cov; *tar fram kovariansen mellan; *O & E inom sjukhushär för; *beh uacei=acehämmare; *fix och trix för att enbart; *behålla kovariansen; data Trudecov_uac; set W(keep=sjukhus cov);

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 4 Syfte: 1. Lära sig beräkna konfidensintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera

Läs mer

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09)

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09) LUNDS UNIVERSITET, MATEMATIKCENTRUM, MATEMATISK STATISTIK BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 8 (2016-05-02) OCH INFÖR ÖVNING 9 (2016-05-09) Aktuella avsnitt i boken är Kapitel 7. Lektionens mål: Du

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer

Läs mer

Avd. Matematisk statistik

Avd. Matematisk statistik Avd. Matematisk statistik TENTAMEN I SF1902 SANNOLIKHETSTEORI OCH STATISTIK, TORSDAGEN DEN 23:E MAJ 2013 KL 14.00 19.00. Kursledare och examinator : Björn-Olof Skytt Tillåtna hjälpmedel: miniräknare, lathund

Läs mer

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs Statistikens grunder och 2, GN, hp, deltid, kvällskurs TE/RC Datorövning 3 Syfte:. Lära sig göra betingade frekvenstabeller 2. Lära sig beskriva en variabel numeriskt med proc univariate 3. Lära sig rita

Läs mer

Uppgift 1. Deskripitiv statistik. Lön

Uppgift 1. Deskripitiv statistik. Lön Uppgift 1 Deskripitiv statistik Lön Variabeln Lön är en kvotvariabel, även om vi knappast kommer att uppleva några negativa värden. Det är sannolikt vår intressantaste variabel i undersökningen, och mot

Läs mer

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik

Syftet med den här laborationen är att du skall bli mer förtrogen med följande viktiga områden inom matematisk statistik LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 01, HT-07 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen, enkla punktskattningar

Läs mer

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2 Lunds universitet Matematikcentrum Matematisk statistik Matematisk statistik allmän kurs, MASA01:B, HT-14 Laboration 2 Rapporten till den här laborationen skall lämnas in senast den 19e December 2014.

Läs mer

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p)

k x om 0 x 1, f X (x) = 0 annars. Om Du inte klarar (i)-delen, så får konstanten k ingå i svaret. (5 p) Avd. Matematisk statistik TENTAMEN I SF1901 SANNOLIKHETSLÄRA OCH STATISTIK MÅNDAGEN DEN 17 AUGUSTI 2009 KL 08.00 13.00. Examinator: Gunnar Englund, tel. 790 74 16. Tillåtna hjälpmedel: Formel- och tabellsamling

Läs mer

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram 2.1 Grundläggande matematik 2.1.1 Potensfunktioner xmxn xm n x x x x 3 4 34 7 x x m n x mn x x 4 3 x4 3 x1 x x n 1 x n x 3 1 x 3 x0 1 1

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan 8.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 23 februari 2004, klockan 8.15-13.15 Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A och STA A3 (9 poäng) 3 februari 4, klockan 85-35 Tillåtna hjälpmedel: Bifogad formelsamling

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2013-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove

Läs mer

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Beskrivande statistik Kapitel 19. (totalt 12 sidor) Beskrivande statistik Kapitel 19. (totalt 12 sidor) För att åskådliggöra insamlat material från en undersökning används mått, tabeller och diagram vid sammanställningen. Det är därför viktigt med en grundläggande

Läs mer

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2.

9. Beräkna volymen av det område som begränsas av planet z = 1 och paraboloiden z = 5 x 2 y 2. Tentamenskrivning för TMS63, Matematisk Statistik. Onsdag fm den 3 juni, 15, V-huset. Examinator: Marina Axelson-Fisk. Tel: 7-88113 Tillåtna hjälpmedel: typgodkänd miniräknare, tabell- och formelhäfte

Läs mer

Datorlaboration 2 Konfidensintervall & hypotesprövning

Datorlaboration 2 Konfidensintervall & hypotesprövning Statistik, 2p PROTOKOLL Namn:...... Grupp:... Datum:... Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta den statistiska

Läs mer

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl. 09.00-13.00

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 24 januari 2004, kl. 09.00-13.00 Karlstads universitet Institutionen för informationsteknologi Avdelningen för statistik Tentamen i Statistik, STA A13 Deltentamen, 5p 4 januari 004, kl. 09.00-13.00 Tillåtna hjälpmedel: Ansvarig lärare:

Läs mer

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen Datorövning 2 Statistikens Grunder 2 Syfte 1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen Exempel Beräkna

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl 08.15-13.15

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Onsdag 1 november 2006, Kl 08.15-13.15 Tentamen i Statistik, STA A och STA A13 (9 poäng) Onsdag 1 november 00, Kl 0.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen miniräknare.

Läs mer

Lennart Carleson. KTH och Uppsala universitet

Lennart Carleson. KTH och Uppsala universitet 46 Om +x Lennart Carleson KTH och Uppsala universitet Vi börjar med att försöka uppskatta ovanstående integral, som vi kallar I, numeriskt. Vi delar in intervallet (, ) i n lika delar med delningspunkterna

Läs mer

Vårdens resultat och kvalitet

Vårdens resultat och kvalitet Vårdens resultat och kvalitet Resultat efter vård 2004-2005 Dödlighet Återinsjuknande Regelbundenhet i vårdkontakter Behov av forskning och utveckling inom hälso- och sjukvården i Region Skåne Rapport

Läs mer

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för: Datorövning 5 Statistisk teori med tillämpningar Hypotestest i SAS Syfte Lära sig beräkna konfidensintervall och utföra hypotestest för: 1. Populationsmedelvärdet, µ. 2. Skillnaden mellan två populationsmedelvärden,

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (9 uppgifter) Tentamensdatum 2011-10-25 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Lennart

Läs mer

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp

Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp Extra övningssamling i undersökningsmetodik HT10 till kursen Regressionsanalys och undersökningsmetodik, 15 hp Författad av Karin Dahmström 1. Utgå från en population bestående av 5 personer med följande

Läs mer

Inference in multiplicative pricing

Inference in multiplicative pricing Inference in multiplicative pricing Tariffanalysis med svaga antaganden Föredrag i aktuarieföreningen 2015-11-26 Stig Rosenlund Metoderna är implementerade i programspråket Rapp. För att hitta Rapp på

Läs mer

TAIU07 Matematiska beräkningar med Matlab

TAIU07 Matematiska beräkningar med Matlab TAIU07 Matematiska beräkningar med Matlab Datorlektion 2. Villkor och Repetition 1 Logiska uttryck Uppgift 1.1 Låt a=3 och b=6 Vad blir resultatet av testerna ab? Uppgift 1.2 Låt a, b,

Läs mer

Resultatet läggs in i ladok senast 13 juni 2014.

Resultatet läggs in i ladok senast 13 juni 2014. Matematisk statistik Tentamen: 214 6 2 kl 14 19 FMS 35 Matematisk statistik AK för M, 7.5 hp Till Del A skall endast svar lämnas. Samtliga svar skall skrivas på ett och samma papper. Övriga uppgifter fordrar

Läs mer

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i

Läs mer

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.''

Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.'' Tentamen'i'TMA321'Matematisk'Statistik,'Chalmers'Tekniska'Högskola.'' Hjälpmedel:'Valfri'räknare,'egenhändigt'handskriven'formelsamling'(4''A4Esidor'på'2'blad)' och'till'skrivningen'medhörande'tabeller.''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''''

Läs mer

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Statistiska analyser C2 Inferensstatistik. Wieland Wermke + Statistiska analyser C2 Inferensstatistik Wieland Wermke + Signifikans och Normalfördelning + Problemet med generaliseringen: inferensstatistik n Om vi vill veta ngt. om en population, då kan vi ju fråga

Läs mer

Bootstrapping i fall-/kontrollstudier av genetiska markörer

Bootstrapping i fall-/kontrollstudier av genetiska markörer Bootstrapping i fall-/kontrollstudier av genetiska markörer Håkan Lövkvist RSKC 2011-03-09 Vad är bootstrapping? Bootstrap = stövelstropp Annan översättning: Ta sig i kragen, vara självbärande Litterär

Läs mer

Kalibreringsrapport. Utländska doktorander

Kalibreringsrapport. Utländska doktorander Kalibreringsrapport Utlänska oktoraner Inlening I en urvalsunersökning är allti skattningarna beäftae me urvalsfel beroene på att enast en elmäng (urval) av populationen stueras. Ett annat fel uppkommer

Läs mer

5 Kontinuerliga stokastiska variabler

5 Kontinuerliga stokastiska variabler 5 Kontinuerliga stokastiska variabler Ex: X är livslängden av en glödlampa. Utfallsrummet är S = x : x 0}. X kan anta överuppräkneligt oändligt många olika värden. X är en kontinuerlig stokastisk variabel.

Läs mer

Blandade problem från väg- och vattenbyggnad

Blandade problem från väg- och vattenbyggnad Blandade problem från väg- och vattenbyggnad Sannolikhetsteori (Kapitel 1 7) V1. Vid en undersökning av bostadsförhållanden finner man att av 300 lägenheter har 240 bad (och dusch) medan 60 har enbart

Läs mer

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta? Tentamen i Matematisk statistik, S0001M, del 1, 2008-01-18 1. Ett företag som köper enheter från en underleverantör vet av erfarenhet att en viss andel av enheterna kommer att vara felaktiga. Sannolikheten

Läs mer

Hjärtinfarkt. Katarina Eggertz 091012

Hjärtinfarkt. Katarina Eggertz 091012 Hjärtinfarkt Hjärtats blodförsörjning Hjärtmuskeln har en egen blodförsörjning från två kranskärl Dessa kommer direkt från stora kroppspulsådern där den lämnar vänster kammare Kranskärlen förgrenar sig

Läs mer

Dekomponering av löneskillnader

Dekomponering av löneskillnader Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden

Läs mer

6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet

6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet 6 Selektionsmekanismernas betydelse för gruppskillnader på Högskoleprovet Sven-Eric Reuterberg Vadar det egentligen som säger att man skallförvänta sig samma genomsnittliga resultat för manliga och kvinnliga

Läs mer

Är sjukvården jämställd och går det åt rätt håll?

Är sjukvården jämställd och går det åt rätt håll? Inledning Som titeln antyder är syftet med den här undersökningen att ta reda på om svensk hälso- och sjukvård är jämställd. Det är en fråga som kan analyseras utifrån olika perspektiv, vilka i huvudsak

Läs mer

SF1901 Föreläsning 14: Felfortplantning, medelfel, Gauss approximation, bootstrap

SF1901 Föreläsning 14: Felfortplantning, medelfel, Gauss approximation, bootstrap SF1901 Föreläsning 14: Felfortplantning, medelfel, Gauss approximation, bootstrap Jan Grandell, Gunnar Englund & Timo Koski 03.03.2016 Jan Grandell, Gunnar Englund & Timo Koski Matematisk statistik 03.03.2016

Läs mer

Sidor i boken 110-113, 68-69 2, 3, 5, 7, 11,13,17 19, 23. Ett andragradspolynom Ett tiogradspolynom Ett tredjegradspolynom

Sidor i boken 110-113, 68-69 2, 3, 5, 7, 11,13,17 19, 23. Ett andragradspolynom Ett tiogradspolynom Ett tredjegradspolynom Sidor i boken 110-113, 68-69 Räkning med polynom Faktorisering av heltal. Att primtalsfaktorisera ett heltal innebär att uppdela heltalet i faktorer, där varje faktor är ett primtal. Ett primtal är ett

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, AK FÖR I, FMS 120, HT-00 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (8 uppgifter) Tentamensdatum 2012-01-13 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 09.00 14.00 Lärare: Adam Jonsson, Ove

Läs mer

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-04. 2.2 Angående grafisk presentation

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT-04. 2.2 Angående grafisk presentation LUNDS TEKNISKA HÖSKOLA ATEATIKCENTRU ATEATISK STATISTIK ATEATISK STATISTIK, AK FÖR L, FS 33, HT-4!"$&' (*) 1 Syfte I den första delen av detta projekt skall vi försöka hitta begripliga tolkningar av begreppen

Läs mer

Högt blodtryck Hypertoni

Högt blodtryck Hypertoni Högt blodtryck Hypertoni För högt blodtryck försvårar hjärtats pumparbete och kan vara allvarligt om det inte behandlas. Har du högt blodtryck ökar risken för följdsjukdomar som stroke, hjärtinfarkt, hjärtsvikt,

Läs mer

Permutationer med paritet

Permutationer med paritet 238 Permutationer med paritet Bernt Lindström KTH Stockholm Uppgift. Att studera permutationerna av talen 1 2... n och indelningen i udda och jämna permutationer ur olika aspekter. Permutationer är särskilt

Läs mer

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, 2001. Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen?

Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, 2001. Beräkna medelvärdet, standardavvikelsen, medianen och tredje kvartilen? Lösningar till Tentamen i Matematisk Statistik, 5p 22 mars, 2001 1. Månadslönerna för 10 lärare vid en viss skola är 1 17 700 19 800 19 900 20 200 20 800 16 100 17 000 23 500 19 700 21 100 Beräkna medelvärdet,

Läs mer

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS

Målet för D3 är att studenterna ska kunna följande: Dra slumptal från olika sannolikhetsfördelningar med hjälp av SAS Datorövning 3 Statistisk teori med tillämpningar Simulering i SAS Syfte Att simulera data är en metod som ofta används inom forskning inom ett stort antal ämnen, exempelvis nationalekonomi, fysik, miljövetenskap

Läs mer

Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011.

Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011. 1 (18) Statistikenheten 20110808 Teknisk beskrivning av undersökning av deltagare i Jobb- och utvecklingsgarantins Fas3. Maj-juni 2011. Inledning Under våren/försommaren 2011 har Arbetsförmedlingens Statistikenhet,

Läs mer

Regressionsanalys av huspriser i Vaxholm

Regressionsanalys av huspriser i Vaxholm Regressionsanalys av huspriser i Vaxholm Rasmus Parkinson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2015:19 Matematisk statistik Juni 2015 www.math.su.se

Läs mer

Summor av slumpvariabler

Summor av slumpvariabler 1/22 Summor av slumpvariabler Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 8/2 2013 2/22 Dagens föreläsning Väntevärde och varians Vanliga kontinuerliga fördelningar Parkeringsplatsproblemet

Läs mer

Föreläsning 12: Regression

Föreläsning 12: Regression Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är

Läs mer

Lektion 1: Fördelningar och deskriptiv analys

Lektion 1: Fördelningar och deskriptiv analys Density Lektion 1: Fördelningar och deskriptiv analys 1.,3 Uniform; Lower=1; Upper=6,3,2,2,1,, 1 2 3 X 4 6 7 Figuren ovan visar täthetsfunktionen för en likformig fördelning. Kurvan antar värdet.2 över

Läs mer

Introduktion. Exempel Övningar Lösningar 1 Lösningar 2 Översikt

Introduktion. Exempel Övningar Lösningar 1 Lösningar 2 Översikt KTHs Sommarmatematik 2003 Exempel Övningar Lösningar 1 Lösningar 2 Översikt 5.1 Introduktion Introduktion Exponentialfunktionen e x och logaritmfunktionen ln x är bland de viktigaste och vanligast förekommande

Läs mer

R AKNE OVNING VECKA 1 David Heintz, 31 oktober 2002

R AKNE OVNING VECKA 1 David Heintz, 31 oktober 2002 RÄKNEÖVNING VECKA David Heintz, 3 oktober 22 Innehåll Uppgift 27. 2 Uppgift 27.8 4 3 Uppgift 27.9 6 4 Uppgift 27. 9 5 Uppgift 28. 5 6 Uppgift 28.2 8 7 Uppgift 28.4 2 Uppgift 27. Determine primitive functions

Läs mer

TENTAMEN KVANTITATIV METOD (100205)

TENTAMEN KVANTITATIV METOD (100205) ÖREBRO UNIVERSITET Hälsoakademin Idrott B, Vetenskaplig metod TENTAMEN KVANTITATIV METOD (205) Examinationen består av 11 frågor, några med tillhörande följdfrågor. Besvara alla frågor i direkt anslutning

Läs mer

Hantering av urvalsbias i KPI

Hantering av urvalsbias i KPI PCA-MFOS Kristina Strandberg Anders Norberg PM till Nämnden för KPI [2014-09-26] 1(5) Hantering av urvalsbias i KPI För information Prisenheten har antagit en stegvis ansats av implementering av den bästa

Läs mer

Recept för rörelse. TEXT Johan Pihlblad. Lena Kallings är medicine doktor och landets främsta expert på fysisk aktivitet på recept.

Recept för rörelse. TEXT Johan Pihlblad. Lena Kallings är medicine doktor och landets främsta expert på fysisk aktivitet på recept. Recept för rörelse Minst hälften av svenska folket rör sig för lite. Forskare varnar för negativa hälsoeffekter och skenande sjukvårdskostnader i en snar framtid. Frågan är vad som går att göra. Fysisk

Läs mer

Enkel linjär regression: skattning, diagnostik, prediktion. Multipel regression: modellval, indikatorvariabler

Enkel linjär regression: skattning, diagnostik, prediktion. Multipel regression: modellval, indikatorvariabler UPPSALA UNIVESITET Matematiska institutionen Jesper ydén Matematisk statistik 1MS026 vt 2014 DATOÖVNING MED : EGESSION I den här datorövningen studeras följande moment: Enkel linjär regression: skattning,

Läs mer

Statistik Lars Valter

Statistik Lars Valter Lars Valter LARC (Linköping Academic Research Centre) Enheten för hälsoanalys, Centrum för hälso- och vårdutveckling Statistics, the most important science in the whole world: for upon it depends the applications

Läs mer

Kurvlängd och geometri på en sfärisk yta

Kurvlängd och geometri på en sfärisk yta 325 Kurvlängd och geometri på en sfärisk yta Peter Sjögren Göteborgs Universitet 1. Inledning. Geometrin på en sfärisk yta liknar planets geometri, med flera intressanta skillnader. Som vi skall se nedan,

Läs mer

Statistisk undersökningsmetodik (Pol. kand.)

Statistisk undersökningsmetodik (Pol. kand.) TENTAMEN Tentamensdatum 2008-10-02 Statistisk undersökningsmetodik (Pol. kand.) Namn:.. Personnr:.. Tentakod: Obs! Var noga med att skriva din tentakod på varje lösningsblad som du lämnar in. Skrivtid

Läs mer

Föreläsning 6: Introduktion av listor

Föreläsning 6: Introduktion av listor Föreläsning 6: Introduktion av listor Med hjälp av pekare kan man bygga upp datastrukturer på olika sätt. Bland annat kan man bygga upp listor bestående av någon typ av data. Begreppet lista bör förklaras.

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Textsträngar från/till skärm eller fil

Textsträngar från/till skärm eller fil Textsträngar från/till skärm eller fil Textsträngar [Kapitel 8.1] In- och utmatning till skärm [Kapitel 8.2] Rekursion Gränssnitt Felhantering In- och utmatning till fil Histogram 2010-10-25 Datorlära,

Läs mer

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt Datorövning 1 Statistisk teori med tillämpningar Repetition av SAS Syfte Syftet med Datoröving 1 (D1) är att repetera de SAS-kunskaperna från tidigare kurser samt att ge en kort introduktion till de studenter

Läs mer

Problemet löd: Är det möjligt att på en sfär färga varje punkt på ett sådant sätt att:

Problemet löd: Är det möjligt att på en sfär färga varje punkt på ett sådant sätt att: Problemet löd: Är det möjligt att på en sfär färga varje punkt på ett sådant sätt att: 1. Om två punkter befinner sig på avståndet pi/2 från varandra så skall de ha olika färg. 2. Endast tre färger används.

Läs mer

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Vi har en ursprungspopulation/-fördelning med medelvärde µ. P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har

Läs mer

Föreläsning 3.1: Datastrukturer, en översikt

Föreläsning 3.1: Datastrukturer, en översikt Föreläsning.: Datastrukturer, en översikt Hittills har vi i kursen lagt mycket fokus på algoritmiskt tänkande. Vi har inte egentligen ägna så mycket uppmärksamhet åt det andra som datorprogram också består,

Läs mer

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant?

(a) Hur stor är sannolikheten att en slumpvist vald person tror att den är laktosintolerant? LÖSNINGAR till tentamen: Statistik och sannolikhetslära (LMA12) Tid och plats: 8.3-12.3 den 24 augusti 215 Hjälpmedel: Typgodkänd miniräknare, formelblad Betygsgränser: 3: 12 poäng, 4: 18 poäng, 5: 24

Läs mer

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU

Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU KURSENS INNEHÅLL Statistiken ger en empirisk grund för ekonomin. I denna kurs betonas statistikens idémässiga bakgrund och

Läs mer

Högt blodtryck. Med nya kostvanor, motion och läkemedel minskar risken för slaganfall och sjukdomar i hjärta och njurar.

Högt blodtryck. Med nya kostvanor, motion och läkemedel minskar risken för slaganfall och sjukdomar i hjärta och njurar. Högt blodtryck Med nya kostvanor, motion och läkemedel minskar risken för slaganfall och sjukdomar i hjärta och njurar. Högt blodtryck (hypertoni) är något av en folksjukdom. Man räknar med att ungefär

Läs mer

F14 Repetition. Måns Thulin. Uppsala universitet thulin@math.uu.se. Statistik för ingenjörer 6/3 2013 1/15

F14 Repetition. Måns Thulin. Uppsala universitet thulin@math.uu.se. Statistik för ingenjörer 6/3 2013 1/15 1/15 F14 Repetition Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 6/3 2013 2/15 Dagens föreläsning Tentamensinformation Exempel på tentaproblem På kurshemsidan finns sex gamla

Läs mer

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011

Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011 STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Louise af Klintberg Lösningar Tentamen i Sannolikhetslära och statistik (lärarprogrammet) 12 februari 2011 Uppgift 1 a) För att få hög validitet borde mätningarna

Läs mer

Begrepp Värde (mätvärde), medelvärde, median, lista, tabell, rad, kolumn, spridningsdiagram (punktdiagram)

Begrepp Värde (mätvärde), medelvärde, median, lista, tabell, rad, kolumn, spridningsdiagram (punktdiagram) Aktivitetsbeskrivning Denna aktivitet är en variant av en klassisk matematiklaboration där eleverna får mäta omkrets och diameter på ett antal cirkelformade föremål för att bestämma ett approximativt värde

Läs mer

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR 2014-05-21 Inledning Saknat data finns alltid, åtminstone i stora registerstudier. Ett problem som måste hanteras på något sätt.

Läs mer

Kursombud sökes! Kursens syfte är att ge en introduktion till metoder för att förutsäga realtidsegenskaper hos betjäningssystem, i synnerhet för data- och telekommunikationssystem. Såväl enkla betjäningssystem,

Läs mer

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14

KA RKUNSKAP. Vad vet samhällsvetarna om sin kår? Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc STAA31 HT14 KA RKUNSKAP Julius Schmidt, Hannes Jägerstedt, Hanna Johansson, Miro Beríc Vad vet samhällsvetarna om sin kår? STAA31 HT14 Handledare: Peter Gustafsson Ekonomihögskolan, Statistiska institutionen Innehållsförteckning

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Uppgift 2 Betrakta vädret under en följd av dagar som en Markovkedja med de enda möjliga tillstånden. 0 = solig dag och 1 = regnig dag

Uppgift 2 Betrakta vädret under en följd av dagar som en Markovkedja med de enda möjliga tillstånden. 0 = solig dag och 1 = regnig dag Avd. Matematisk statistik TENTAMEN I SF904 MARKOVPROCESSER MÅNDAGEN DEN 26 AUGUSTI 203 KL 08.00 3.00. Examinator: Gunnar Englund tel. 073 32 37 45 Tillåtna hjälpmedel: Formel- och tabellsamling i Matematisk

Läs mer

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt Datorövning 1 Statistisk teori med tillämpningar Repetition av SAS Syfte Syftet med Datoröving 1 (D1) är att repetera de SAS-kunskaperna från tidigare kurser samt att ge en kort introduktion till de studenter

Läs mer

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

2. Lära sig beskriva en variabel numeriskt med proc univariate 4. Lära sig rita diagram med avseende på en annan variabel Datorövning 1 Statistikens Grunder 2 Syfte 1. Lära sig göra betingade frekvenstabeller 2. Lära sig beskriva en variabel numeriskt med "proc univariate" 3. Lära sig rita histogram 4. Lära sig rita diagram

Läs mer

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer. Thommy Perlinger Tabell- och formelsamling A4 Grundläggande Statistik A8 Statistik för ekonomer Thommy erlinger Innehåll 1 Beskrivande statistik 3 1.1 Medelvärdeochstandardavvikelse... 3 1.2 Chebyshevsregel... 3 1.3 Empiriskaregeln(normalfördelningsregeln)...

Läs mer

Konsekvenser av indelningar i områden för redovisning av försök i svensk sortprovning. Johannes Forkman, Saeid Amiri and Dietrich von Rosen

Konsekvenser av indelningar i områden för redovisning av försök i svensk sortprovning. Johannes Forkman, Saeid Amiri and Dietrich von Rosen Konsekvenser av indelningar i områden för redovisning av försök i svensk sortprovning Johannes Forkman, Saeid Amiri and Dietrich von Rosen Swedish University of Agricultural Sciences (SLU) Department of

Läs mer

Tentamen MVE300 Sannolikhet, statistik och risk

Tentamen MVE300 Sannolikhet, statistik och risk Tentamen MVE3 Sannolihet, statisti och ris 215-6-4 l. 8.3-13.3 Examinator: Johan Jonasson, Matematisa vetensaper, Chalmers Telefonvat: Johan Jonasson, telefon: 76-985223 31-7723546 Hjälpmedel: Typgodänd

Läs mer

Linjär regressionsanalys. Wieland Wermke

Linjär regressionsanalys. Wieland Wermke + Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån

Läs mer

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum 2009-12-17 Skrivtid 0900 1400 Tentamen i: Statistik 1, 7.5 hp Antal uppgifter: 5 Krav för G: 11 Lärare: Robert Lundqvist, tel

Läs mer

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter.

Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Laboration 5 Under denna laboration kommer regression i olika former att tas upp. Laborationen består av fyra större deluppgifter. Deluppgift 1: Enkel linjär regression Övning Under denna uppgift ska enkel

Läs mer

Datorlära 3 Octave Workspace ovh mijlö Skriva text på skärmen Värdesiffror Variabler och typer Strängar Makro Vektorer

Datorlära 3 Octave Workspace ovh mijlö Skriva text på skärmen Värdesiffror Variabler och typer Strängar Makro Vektorer Datorlära 1 Introduktion till datasystemet, epost konto, afs hemkonto Introduktion till datorer och datasalar Open Office Calculator Beräkningar med Open Office Calc Diagram med OO Calc Datorlära 2 Utforma

Läs mer

Lösningar till SPSS-övning: Analytisk statistik

Lösningar till SPSS-övning: Analytisk statistik UMEÅ UNIVERSITET Statistiska institutionen 2006--28 Lösningar till SPSS-övning: Analytisk statistik Test av skillnad i medelvärden mellan två grupper Uppgift Testa om det är någon skillnad i medelvikt

Läs mer

The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide

The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide This Swedish version is based on the English version available on the NICHD Protocol website (www.nichdprotocol.com).

Läs mer

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen 1. One-Sample T-Test 1.1 När? Denna analys kan utföras om man vill ta reda på om en populations medelvärde på en viss variabel kan antas

Läs mer

NMCC Sigma 8. Täby Friskola 8 Spets

NMCC Sigma 8. Täby Friskola 8 Spets NMCC Sigma 8 Täby Friskola 8 Spets Sverige 2016 1 Innehållsförteckning Innehållsförteckning... 1 Inledning... 2 Sambandet mellan figurens nummer och antalet små kuber... 3 Metod 1... 3 Metod 2... 4 Metod

Läs mer

http://www.leidenhed.se Senaste revideringen av kapitlet gjordes 2014-05-08, efter att ett fel upptäckts.

http://www.leidenhed.se Senaste revideringen av kapitlet gjordes 2014-05-08, efter att ett fel upptäckts. Dokumentet är från sajtsidan Matematik: som ingår i min sajt: http://www.leidenhed.se/matte.html http://www.leidenhed.se Minst och störst Senaste revideringen av kapitlet gjordes 2014-05-08, efter att

Läs mer

Om relationen mellan kommunens storlek och ohälsa

Om relationen mellan kommunens storlek och ohälsa Kurs: SO1201 HT10; B-uppsats Lisa Olsson Om relationen mellan kommunens storlek och ohälsa av Lisa Olsson Kurs: SO1201 HT10; B-uppsats Lisa Olsson Innehållsförteckning Inledning...4 Problembeskrivning...4

Läs mer

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl. 8.15-13.15

Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl. 8.15-13.15 Tentamen STA A10 och STA A13, 9 poäng 19 januari 2006, kl. 8.15-13.15 Tillåtna hjälpmedel: Ansvarig lärare: Räknedosa, bifogade formel- och tabellsamlingar, vilka skall returneras. Christian Tallberg Telnr:

Läs mer

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Läs mer

Finns det en skillnad mellan vad barn tror sig om att klara jämfört med vad de faktiskt klarar?

Finns det en skillnad mellan vad barn tror sig om att klara jämfört med vad de faktiskt klarar? Praktiknära forskning inom ämnet idrott och hälsa Rapport nr. 3: 2006 Finns det en skillnad mellan vad barn tror sig om att klara jämfört med vad de faktiskt klarar? En studie kring barns självvärderingar

Läs mer

HJÄRTINFARKT, HJÄRTSVIKT OCH ANGINA PECTORIS

HJÄRTINFARKT, HJÄRTSVIKT OCH ANGINA PECTORIS HJÄRTINFARKT, HJÄRTSVIKT OCH ANGINA PECTORIS Anette Dolk AiV 1 Innehållsförteckning Inledning... 1 Syfte... 1 Metod... 1 Hjärtinfarkt... 1 Incidens... 1 Orsaker... 2 Symtom... 2 Diagnos... 3 Behandling...

Läs mer

Befolkningsundersökning 2010 Vårdbarometern. Befolkningens attityder till, kunskaper om och förväntningar på svensk hälso- och sjukvård

Befolkningsundersökning 2010 Vårdbarometern. Befolkningens attityder till, kunskaper om och förväntningar på svensk hälso- och sjukvård Befolkningsundersökning 2010 Vårdbarometern Befolkningens attityder till, kunskaper om och förväntningar på svensk hälso- och sjukvård Vårdbarometern Befolkningens attityder till, kunskaper om och förväntningar

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1

Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Tillämpad statistik (A5), HT15 Föreläsning 10: Multipel linjär regression 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-19 Motivering Vi motiverade enkel linjär regression som ett

Läs mer