Analys av signalsubstanser i hjärnan

Relevanta dokument
Analys av signalsubstanser i hjärnan

Föreläsning 8: Konfidensintervall

Föreläsning 7: Punktskattningar

F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17

F13 Regression och problemlösning

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

TMS136. Föreläsning 13

repetera begreppen sannolikhetsfunktion, frekvensfunktion och fördelningsfunktion

Lektionsanteckningar 11-12: Normalfördelningen

Regler för grupparbeten, inlämnings- och laborationsuppgifter

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 11: Mer om jämförelser och inferens

Allmänna krav på utformningen och användandet av inlämningsuppgifter i kurser som ges av Brandteknik

F3 Introduktion Stickprov

Föreläsning 7: Punktskattningar

Föreläsning 7. Statistikens grunder.

FÖRELÄSNING 8:

F9 Konfidensintervall

Föreläsning 12: Regression

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 7: Punktskattningar

Kapitel 4 Sannolikhetsfördelningar Sid Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

SF1901 Sannolikhetsteori och statistik I

Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

träna på att använda olika grafiska metoder för att undersöka vilka fördelningar ett datamaterial kan komma från

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):

Allmänna krav för inlämningsuppgifter vid V- programmet LTH

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Matematisk statistik allmän kurs, MASA01:B, HT-14 Laborationer

TMS136. Föreläsning 4

Föreläsning 4: Konfidensintervall (forts.)

Föreläsning 12: Linjär regression

FÖRELÄSNING 7:

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

TMS136. Föreläsning 7

Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

TMS136. Föreläsning 10

Grundläggande matematisk statistik

Matematisk statistik, Föreläsning 5

Introduktion till statistik för statsvetare

SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011

Metod och teori. Statistik för naturvetare Umeå universitet

0 om x < 0, F X (x) = c x. 1 om x 2.

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 3

EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):

Matematisk statistik för D, I, Π och Fysiker

Föreläsning 12, FMSF45 Hypotesprövning

Demonstration av laboration 2, SF1901

Datorövning 1: Fördelningar

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 08-12

LÖSNINGAR TILL. Matematisk statistik, Tentamen: kl FMS 086, Matematisk statistik för K och B, 7.5 hp

SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.

MVE051/MSG Föreläsning 14

Första sidan är ett försättsblad (laddas ned från kurshemsidan) Alla frågor som nns i uppgiftstexten är besvarade

(a) på hur många sätt kan man permutera ordet OSANNOLIK? (b) hur många unika 3-bokstavskombinationer kan man bilda av OSANNO-

Tentamen i Matematisk statistik Kurskod S0001M

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Kontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)

Matematisk statistik för B, K, N, BME och Kemister

Del 2 tillsammans med förberedelsefrågor - tid för inlämning och återlämning meddelas senare.

Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

Tentamen i matematisk statistik (9MA241/9MA341, STN2) kl 14 18

Summor av slumpvariabler

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 30 oktober 2015 Tid: 9-13:00

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

SF1901 Sannolikhetsteori och statistik I

Statistik 1 för biologer, logopeder och psykologer

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Tentamen i Matematisk statistik Kurskod S0001M

Formler och tabeller till kursen MSG830

Vi har en ursprungspopulation/-fördelning med medelvärde µ.

Tentamen för kursen. Linjära statistiska modeller. 13 januari

Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar

Matematisk statistik 9hp Föreläsning 7: Normalfördelning

Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi

Tentamen i Matematisk statistik Kurskod S0001M

Mer om konfidensintervall + repetition

Statistiska metoder för säkerhetsanalys

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Laboration 4: Lineär regression

PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd

Tentamen MVE301 Sannolikhet, statistik och risk

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

Bestäm med hjälp av en lämplig och välmotiverad approximation P (X > 50). (10 p)

1 Syfte. 2 Moment hos och faltning av fördelningar MATEMATISK STATISTIK, AK FÖR L, FMS 033, HT Angående grafisk presentation

9. Konfidensintervall vid normalfördelning

Härledning av Black-Littermans formel mha allmänna linjära modellen

Grundläggande matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i matematisk statistik (92MA31, STN2) kl 08 12

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Transkript:

Matematisk statistik för K, TMA074 Analys av signalsubstanser i hjärnan Bakgrund och målsättning Projektet går ut på att studera frisättningen av dopamin hos nervceller. De två huvudsakliga frågeställningarna är hur osmotiskt tryck och kolesterolhalt påverkar processen. Syftet med projektuppgiften är bland annat att ni ska träna på att använda Matlab för att tillämpa statistiska metoder på ett kemiskt forskningsproblem. konstruera och analysera statistiska modeller samt utföra kritisk granskning av modellernas förmåga att beskriva verkligheten. skriftligt redovisa modeller, antaganden och slutsatser från statistiska analyser. Arbetet kommer genomföras i grupper om två till tre studenter. Projektet är indelat i fyra delar som motsvarar varsin datorövning. Arbetet kommer huvudsakligen utföras under datorövningarna men troligen kommer mer tid behövas för att slutföra och rapportera arbetet. Projektet ska redovisas i form av en skriftlig rapport som lämnas in via PING PONG senast 2016-10-12. Lämna in rapporten som en PDF och inkludera också koden som ni använde för att utföra beräkningarna. Organisera koden så att en fil utför analysen för varje del, låt projektdel1.m utföra analysen för del 1, projektdel2.m analysen för del 2 och så vidare. Återlämning och eventuell korrigering/komplettering görs vid datorövningen under den sista läsveckan. I Appendix finns mer tips och instruktioner kring rapporteringen av projektet. Inledning Vi har cirka 130 miljarder nervceller i hjärnan. Liksom andra typer av celler i kroppen består nervceller bland annat av en cellkärna med omgivande näringsvätska. Det som är unikt för nervcellen är att den kommunicerar med andra celler genom nervimpulser. Dessa impulser är en form av elektriska urladdningar som sprids i cellen och sedan går vidare genom utskott från cellkroppen. Nervcellen tar emot signaler via utskott som kallas dendriter och leder nervimpulerna till andra celler via ett utskott som kallas axon. Informationsöverföringen från en nervcell till en annan sker vid änden på axonen. Kontaktområdet där en axon möter en annan nervcell kallas för synaps och delas in i tre delar: En presynaptisk del i axonens ände, det synaptiska gapet och en postsynaptisk del i den andra nervcellen. Se Figur 1 för en illustration av en nervcell och en synaps. När en nervimpuls når synapsen triggas synaptiska vesiklar fyllda med signalsubstans att frigöra sitt innehåll i det synaptiska gapet. Denna signalsubstans tas inom en tusendels sekund emot av särskilda mottagarmolekyler, så kallade receptorer, i den postsynaptiska delen. Om den mottagande cellen stimuleras med en tillräcklig mängd av signalämne uppstår en ny impuls, som förs vidare till nästa nervcell. Det finns flera typer av signalsubstanser som har olika funktioner. Några vanligt förekommande är glutamat, noradrenalin och dopamin. Processen när signalsubstans utsöndras från nervcellens vesiklar vid cellmembranet kallas för exocytos. Även om mycket är känt kring denna process pågår bland annat forskning kring hur mycket av sitt innehåll vesiklarna frisläpper vid fusion med cellmembranet. Av intresse är också att studera hur olika faktorer påverkar frisättningen av signalsubstans, så som kolesterolhalt och osmotiskt tryck.

Figure 1: Illustration av nervcell och synaps. Källa: Fischback, G. D. Sci Amer. 1992, 267, 48-57. Amperometriska mätningar För att studera hur frisättningen av dopamin går till kan amperometriska mätningar utföras. Mätningarna utförs genom att en microelektrod placeras mot membranet av en cell med vesiklar som kan frisläppa signalsubstans. När en vesikel frisläpper sitt innehåll registreras detta som en spik i signalen från elektroden, som illustras i Figur 2. Signalen från elektroden analyseras och ett antal viktiga värden tas fram för varje spik i signalen. Det första värdet är Q, vilket är arean under kurvan för spiken. Via Faradays lag kan vi relatera Q till antalet frisläppta molekyler, N: Q = nnf, där F är Faradays konstant och n är antalet elektroner som överförs per oxiderad molekyl (2 för dopamin). Det andra viktiga måttet är t 1/2, vilket är tiden det tar från att spiken når halva sin höjd till att den faller ner under halva sin höjd igen. Detta mått, som brukar kallas halvtidsmätningar, säger alltså något om bredden på spiken och hur fort signalsubstansen frisläpps. Försöksuppställningar Mätningar av Q och t 1/2 har gjorts i två olika försöksuppställningar som kommer studeras i projektet. Det första försöket går ut på att studera om osmotiskt tryck har någon påverkan på frisläppningen av dopamin. I försöket mäts först variablerna hos ett referensprov med normalt osmotiskt tryck och sedan mäts variablerna i ett prov med högt osmotiskt tryck. Dessa observationer kommer studeras i de första tre delarna av projektet. Det andra försöket, som kommer studeras i den sista delen av projektet, går ut på att studera hur cellmembranets kolesterolhalt påverkar processen. Mätningar av processen har gjorts vid fyra olika nivåer av kolesterolhalt och dessa kommer studeras med hjälp av regressionsanalys. Datamaterialet Varje grupp får en bit av det fullständiga datamaterialet att analysera. Datan ni ska analysera finns tillgänglig i filen datagrxx där xx är ert gruppnummer (grupp 4 hämtar alltså sin data från datagr04). Filerna finns tillgängliga på kurshemsidan och gruppens nummer anges i PING PONG. I datafilen finns resultaten från mätningarna relaterade till osmotiskt tryck sparade i variablerna 2

Figure 2: Illustration av processen då en vesikel frisätter signalsubstans samt den amperometriska mätningen av processen. t12nt Uppmätta t 1/2 -tider hos referensprovet med normalt osmotiskt tryck. Qnt Uppmätta Q-värden hos provet med normalt osmotiskt tryck. t12ht Uppmätta t 1/2 -tider hos provet med högt osmotiskt tryck. Qht Uppmätta Q-värden hos provet med högt osmotiskt tryck. Resultaten från försöket med kolesterol finns sparade i variablerna t12cholxx Uppmätta t 1/2 -tider i prov med xx% kolesterol. Qcholxx Uppmätta Q-värden i prov med xx% kolesterol. De uppmätta värden på kolesterolhalten är xx = 0, xx = 10, xx = 20 och xx = 30. Del 1: Undersökning av datan Som alltid vid statistisk analys är det bra att börja med att göra en översikt av datan för att se om det finns anledning till oro kring hur mätningarna utförts. När vi senare gör en fördjupad analys kommer vi till exempel anta att mätningarna är oberoende och likafördelade, vilket bör undersökas. Börja med att titta på t 1/2 -tiderna och Q-värdena för referensprovet med normal osmotiskt tryck och utför en preliminär analys: Plotta datan, gör histogram och beräkna medelvärde och varians för variablerna. Tycks det finnas några trender eller andra konstigheter i datan eller verkar mätsituationen varit under kontroll under hela studien? Vi vill nu ansätta en statistisk modell för t 1/2 -tiderna och Q-värdena och många olika fördelningar är tänkbara. Antag att vi som modell skulle använda normalfördelningen. Är detta en rimlig modell? Studera histogram av de observerade värdena, kan du hitta någon fördelning som vi har gått igenom i kursen som passar bra till datan? Del 2: Modellanpassning Av erfarenhet vet man att lognormalfördelningen kan passa bra till mätningar av detta slag. Slumpvariabeln X är lognormalfördelad med parametrar µ och σ om log X N(µ, σ 2 ). Det innebär att X har täthetsfunktion f(x) = ( 1 σx 2π exp 1 (log(x) µ)2 2σ2 3 ), x > 0.

Väntevärde och varians ges av E(X) = e µ+σ2 /2 och V(X) = (e σ2 1)e 2µ+σ2. Härled uttrycken för maximumlikelihood-skattarna av µ och σ givet ett stickprov x 1,..., x n från lognormalfördelningen. Ta med härledningen i er rapport. Använd uttrycken för att beräkna skattningar av µ och σ baserade på er data. Undersök nu om lognormalfördelningen är en rimlig modell för t 1/2 -tiderna och Q-värdena: Undersök hur lognormalfördelningen ser ut genom att rita ut dess täthetsfunktion. Välj parametrarna enligt ML-skattningarna. Rita histogram för datan och jämför med täthetsfunktionen för lognormalfördelningen. Använd normplot för att undersöka om lognormalfördelningen passar bra. Verkar lognormalfördelningen vara en rimlig modell för datan? Del 3: Undersökning av påverkan av osmotiskt tryck Vi är nu intresserade av att testa hur osmotiskt tryck påverkar frisläppningen av signalsubstans. På grund av den tidigare analysen antar vi att det logaritmerade antalet följer en normalfördelning för både referensmätningarna och mätningarna undre högre tryck. Låt µ r och µ t beteckna väntevärdena för referensprovet och provet taget under högre tryck och låt σ 2 r och σ 2 t beteckna motsvarande varianser. Börja med att testa om det är rimligt att anta att variansen för antalet är samma för de två försöken: Beräkna ett konfidensintervall för kvoten σ 2 r/σ 2 t. Utför hypotestestet H 0 : σ r = σ t H 1 : σ r σ t med hjälp av ett F-test. Beräkna p-värdet för testet. Kan nollhypotesen förkastas? Kontrollera era beräkningar genom att jämföra med resultatet som fås om funktionen vartest2 används. Testa nu om det osmotiska trycket påverkar väntevärdet hos fördelningen: Utför hypotestestet H 0 : µ r = µ t H 1 : µ r µ t Om ni inte kunde förkasta antagandet om lika varianser, utför testet med en poolad skattning av variansen. Utför annars testet när ni antar olika varianser. Beräkna p-värdet för testet. Kan nollhypotesen förkastas? Kontrollera era beräkningar genom att jämföra med resultatet som fås om funktionen ttest2 används. Vad är slutsatserna av studien? Kommentarer? Notera att resultaten i denna del av projektet ska redovisas både för t 1/2 -tiderna och för Q-värdena. Kom ihåg att redovisa modeller och antaganden i rapporten. 4

Del 4: Undersökning av kolesterols påverkan Vi lämnar nu undersökningen av osmotiskt tryck och fokuserar på cellmembranets kolesterolhalt. I datafilen finns mätningar av Q-värden och t 1/2 -tider för fyra olika halter av kolesterol. Med hjälp av dessa mätningar, utför en regressionsanalys av hur kolesterol påverkar processen: Från analysen ovan vet vi att både t 1/2 -tider och Q-värden passar bra att modelleras med lognormalfördelningen. Ansätt regressionsmodeller med log(t 1/2 ) och log(q) som responsvariabler och kolesterolhalt som kovariat och skatta parametrarna. Skatta den förväntade förändringarna i t 1/2 och Q om kolesterolhalten ökar med 1%. Undersök om regressionsmodellen passar bra genom att utföra lämplig residualanalys, plotta även datan och den skattade linjen. Beräkna konfidensintervall för regressionsparametrarna. Har kolesterol en signifikant påverkan på någon av variablerna? Kontrollera era beräkningar genom att jämföra med resultatet som fås om funktionen regress används. Appendix - Riktlinjer för projektredovisning I denna sektion följer anvisningar som är bra att tänka på när ni skriver rapporten för projektarbetet. Ni ska med stöd av frågorna i projekthandledningen skriva en självständig rapport som täcker det väsentliga innehållet. Målgruppen för skriften i projektet ska vara en teknolog i samma årskurs som läst kursen men som inte är insatt i detaljerna kring projektet. Språket i rapporten ska vara anpassat för målgruppen och texten ska vara tillräckligt omfattande och tydlig så att en person i målgruppen utan större ansträngning skall kunna följa resonemang och motiveringar. Speciellt måste texten vara korrekturläst så att språk- och skrivfel är rättade. Rapporten ska innehålla klara och tydliga formuleringar av frågeställningarna, modeller och antaganden. Texten ska vara välstrukturerad med tydliga avsnittsrubriker och ska kunna läsas utan tillgång till vare sig kod som använts för beräkningar eller denna projektbeskrivning. Figurer och tabeller, försedda med figurtexter och tydlig numrering, ska användas för att redovisa resultat när det är lämpligt. Rapporten skall innehålla titelsida, sammanfattning och referenslista. Källhänvisningar ska vara enligt gängse norm men hänvisningar till kursboken och föreläsningsanteckningar får göras i förenklad form. Bedömning Rapporten kommer i huvudsak bedömas enligt riktlinjerna ovan samt följande kriterier: att lämpligt och tydligt statistiskt språk används; att lämpliga tabeller, figurer och sammanfattande mått används för att beskriva datan och resultaten; att de statistiska beräkningarna är rätt utförda och verkar rimliga; att korrekta slutsatser dras med kommentarer om eventuella brister i analysen. Nedan finns en checklista för granskning av rapporter. För att undvika onödiga misstag, gå igenom och bocka av listan med frågor innan rapporten lämnas in och se till att alla krav är uppfyllda. 5

Checklista för rapportering av projektet Ja Nej 1. Har alla moment i uppgiften blivit slutförda? 2. Innehåller rapporten relevanta figurer och tabeller? 3. Introduceras och förklaras all notation som används? 4. Introduceras alla modeller som används? 5. Presenteras och diskuteras resultaten tillräckligt? 6. Är alla beräkningar kontrollräknade? 7. Har rimligheten bedömts hos resultaten och har eventuella orimligheter kontrollerats och kommenterats? 8. Har rapporten: Titel, författare och datum? Inledning? Resultat och slutsatser? 9. Har rapporten korrekturlästs? Är stavningsfel rättade? 10. Angående figurer och tabeller: Är de numrerade? Har de lämpliga figurtexter? Är de refererade i texten? 11. Är texten välstrukturerad och indelad i stycken med lämpliga rubriker? 12. Går det att läsa och förstå rapporten utan: tillgång till projektbeskrivningen? tillgång till Matlabkod som använts? 13. Om kursboken eller föreläsningarna refereras i texten, är referenserna tillräckligt specifika (anges kapitel/nummer på föreläsning)? 6