LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK PROJEKTUPPGIFT HT-11 MATEMATISK STATISTIK FÖR NANO-, BIO- OCH KEMITEKNIKER, FMS086, MASB02 Instruktioner till arbetet med projektuppgift I kursen ingår att du ska göra en projektuppgift. Arbeta med dem i grupper om två, man lär sig mycket genom att diskutera med en kompis. Viss handledning ges under lektionerna, det är möjligt att du behöver mer tid utöver det schemalagda för att slutföra uppgifterna. Målsättning Syftet med denna uppgift är bl a att du: Ska träna på att hämta ett problem ur verkligheten och med hjälp av ett insamlat material konstruera en rimlig statistisk modell samt göra en kritisk granskning av modellen och dess förmåga att beskriva verkligheten; ska tillämpa dina kunskaper och med hjälp av Matlab analysera ett miljö/kemiskt datamaterial; ska träna på att skriftligt redovisa antaganden, modeller och slutsatser från en statistisk analys. Redovisning Projektet ska redovisas i form av en skriftlig rapport. Vilka krav det finns på utformningen av rapporten kan du läsa om i Appendix. Redovisning av projektet lämnas senast in 3/10-11. Feedback lämnas i era fack under påföljande vecka. Diskussion och eventuell korrigering/komplettering görs vid sista datorövningen i läsvecka 7. Bedömningen Rapporten bedöms enligt följande kriterier: Kommunikation att lämpligt statistiskt språk och symboler används; beskrivning att lämpliga figurer, tabeller och sammanfattande mått används för att beskriva data; statistiska beräkningar att statistiska mått är rätt beräknade och verkar rimliga; tolkning av resultat att informationen från tabeller, figurer och sammanfattande mått används rätt för att beskriva data; slutsatser att korrekta slutsatser dras om data, ev med kommentarer om saknad information. Slutligen... Ha följande visdomsord i åtanke när du arbetar med uppgifterna. Som alltid när man är utkastad i verkligheten: Det finns inte något facit till problemet eller uppgiften, bara bra eller mindre bra lösningar. Som alltid i en kurs: Det är inlärningen under tiden, själva processen, som avgör hur framgångsrikt projektet är. Lycka Till!
Kväveoxider från en naturgaseldad värmepanna Bakgrund Det datamaterial ni ska studera består av fem vintermånaders mätningar av NO x -mängden i luften kring en naturgaseldad värmepanna i ett bostadsområde i Åkarp. Några frågeställningar som ni ska arbeta med är: Är halten av kväveoxider i värmepannans avgaser så stor att den är hälsofarlig för dem som bor i huset? Hur stort är pannans tillskott av kväveoxider till luften? Hur förändras de slutsatser ni gör om överskridande av gränsvärde då ni tar hänsyn till att mätningarna störs av mätfel? Bakgrund till mätningarna, mätuppställning och mätinstrument är beskrivna i detta avsnitt. Texten är i huvudsak hämtad från rapporten Vannerberg, Christina & Holmstedt Göran : Spridning av NO 2 från en naturgaseldad väggpanna, Institutionen för brandteknik, LTH, 1989. Inledning Naturgaseldning ger i förhållande till eldning med kol, olja, torv och ved väsentligt mycket mindre emissioner av stoft, svaveldioxider, tungmetaller och oförbrända kolväten. När det gäller emission av kväveoxider, (NO x ), ger natugaseldning, med nuvarande teknik, halter av NO x /MJ i samma storleksordning som eldning med övriga bränslen. Vid vissa konstruktioner av naturgaseldade villapannor krävs korta tillufts- och avgasvägar, varför panna placeras nära en yttervägg med avgasröret monterat rakt genom väggen. För denna typ av utsläppsanordning är man intresserad av att veta hur nära marken pannans avgasutsläpp kan placeras, utan att man riskerar hälsofarliga halter av NO 2 där människor vistas. Målsättning En mätning av NO x -halten på olika avstånd från avgasutsläppet från en naturgaseldad villapanna, en sk väggpanna, har gjorts under perioden december 1987 april 1988. Målsättningen med mätningarna har varit att erhålla långtidsvärden för NO 2, (6 månaders medelvärden). Dessa långtidsvärden ska sedan jämföras med Naturvårdsverkets NO 2 -gränsvärde för 6-månader, och tjäna som underlag för bedömning av riskavstånden från pannans avgasutsläpp till fönster, ventilationsöppningar och mark. Mätplatsen Mätningarna gjordes i ett bostadsområde i Åkarp, ett samhälle som ligger ca 1 mil NV om Malmö. Bakgrundshalten av NO x i området är påverkad av källor från Malmö stad, motorvägarna E6 och E22 samt Lund. Avståndet från E6 och E22 till mätplatsen är ca 500 m respektive 1500 m. Totalt 25 mätpunkter var utplacerade på och kring ett av husen med gaseldad panna. Invid fasaden på olika avstånd från avgasutsläppet placerades 21 punkter medan 4 mätpunkter har placerats framför eller bakom huset enligt figur 1. I denna uppgift ska ni studera mätningarna från punkt 3, placerad invid fasaden 3 m ovanför avgasutsläppet, samt från punkt 25, placerad på 1.5 m höjd ca 10 m bakom huset. Placeringen av punkt 25 är av speciellt intresse eftersom man tänker sig att bakgrundsnivån av kväveoxider i området representeras av just denna mätpunkt. Söder om mätpunkt 25 finns ett bostadsområde med 20 gaseldade pannor av just den typ vi studerar. I östlig och västlig riktning om mätpunkt 25 finns de två motorvägarna medan ett större åkerområde, med inga direkta utsläpp av kväveoxider, utbreder sig norr om mätpunkt 25. 2
#3 #25 N utsläpp 1 S Figur 1: Plan över mätpunkternas placering Data om villapannan Villapannan är av typen Vaillant VC 112 E. Pannan eldas med naturgas och har en maxeffekt på ca 10.5 kw. Vid denna effekt är rökgasvolymen ca 20 Nm 3 /h, dvs brännarens luftöverskottsfaktor eller Ð-tal är lika med 1.85. Temperaturen i rökgaserna är ca 120 C. Rökgaserna innehåller ca 65-70 ppm NO x varav ca 20% är NO 2. Koncentrationen av O 2, CO 2 och H 2 O i rökgaserna uppskattades till 9.2, 5.5 resp. 10.4 %. Avgaserna leds inte upp genom en skorsten utan avgaskanalen mynnar horisontellt direkt i fasaden. Utsläppet sker med forcerat drag, vilket innebär att rökgaserna blåses ut horisontellt, med en hastighet på ca 2 m/s. Pannans utsläpp är placerat på en höjd av ca 2.6 m ovan markplanet och ca 0.6 m från hörnet. Mätsystemet Mätsystemets insamlingsenhet bestod av 25 st 3.75 l tuber, som via 6 mm teflonslangar tog in luft från de olika mätpunkterna. Innehållet i tuberna analyserades med en period om 35 minuter. NO x analysen för varje tub tog 40 sekunder. Efter analysen evakuerades tuben så att en ny mängd luft kunde sugas in. Samtidigt spoladesänalysatorn igenom med N 2 för att en nollnivå för nästa mätning skulle erhållas. Detta gjordes under ytterligare 20 sekunder. Således tog analysen av samtliga mätpunkter, en sk mätcykel, 25 minuter. Efter en mätcykel gjordes ytterligare genomspolning av ren kvävgas på samtliga tuber. Orsaken till att analysatorn spolades med ren kvävgas, kalibreringsgas, var att en betydande drift observerades i NO x analysatorn. Förutom NO x -halt har vindriktning, vindhastighet, utomhustemperatur och pannans avgastemperatur registrerats kontinuerligt. Mätningen av avgastemperaturen gav en indikation på om pannan var i drift eller inte. NO x -analysatorn Instrumentet som använts vid mätningen av kväveoxider är en ÄAL-model 443, NO/NO x chemiluminescent analyser, med mätområde 0-10 ppm. Mätprincipen för analysatorn bygger på den kemiluminescenta reaktionen mellan kväveoxid och ozon NO+O 3 NO 2 + O 2 3
vilken utsänder ljus med en intensitet som är direkt proportionell mot kväveoxidhalten. Ljusstyrkan mäts med ett fotomultiplikatorrör. Den totala halten av NO och NO 2 i luften erhölls genom att först katalytiskt omvandla NO 2 till NO. Den valda analysatorn är speciellt konstruerad för att mäta på förbränningsgaser. Vid mätningen kondenseras vattnet ej ut och detektorcellen arbetar vid ett så lågt tryck att inverkan av gassammansättningen (luft - CO 2, H 2 O förhållande) på mätsignalen kan försummas. Datamaterialet Datafiler Varje grupp får en bit av det stora datamaterialet att analysera, ca 3000 mättillfällen från punkt 3 (på fasaden) och punkt 25 (bakom huset). Data från den mätpunkt ni ska studera finns tillgängligt i fil noxgrxx där xx är ert gruppnummer (grupp 3 hämtar alltså sina data från noxgr03). Uppmätta variabler De variabler som finns tillgängliga i nox-filerna är: p3nox NO x -mätarens signal vid analys av luft (ppm) från mätpunkt 3. p25nox NO x -mätarens signal vid analys av luft (ppm) från mätpunkt 25. Observera att p25nox är kopplad till p3nox på så sätt att element nr k i p25nox hör ihop med elementet nr k i p3nox eftersom mätningarna är gjorda nästan samtidigt. p3n2 NO x -mätarens signal vid mätning på ren kvävgas (ppm) från mätpunkt 3. Observera att p3n2 är kopplad till p3nox på så sätt att element nr k i p3n2 hör ihop med elementet nr k i p3nox eftersom kvävgasmätningen är gjord omedelbart före NO x -mätningen som en kalibreringsmätning. p25n2 NO x -mätarens signal vid mätning på ren kvävgas (ppm) från mätpunkt 25. Observera att p25n2 är kopplad till p25nox på så sätt att element nr k i p25n2 hör ihop med elementet nr k i p25nox eftersom kvävgasmätningen är gjord omedelbart före NO x -mätningen som en kalibreringsmätning. p25vind ger riktningen från vilket håll vinden blåser i mätpunkt 25, 0 360 där 0 är rakt norrut. Analys: Som i all statistisk analys av ett datamaterial startar ni med att göra en översikt över data varefter analysen förfinas och fördjupas efterhand. Preliminär analys Plotta NO x -mätarens signal vid analys av luft från mätpunkt 3 som var mätpunkten på fasaden, placerat 3 m ovanför avgasutsläppet. Undersök också hur NO x -mätaren beter sig då mätningarna sker på ren kvävgas i denna mätpunkt. Korrigering för drift Gör en lämplig korrigering av mätinstrumentets drift för att få observerat NO x -innehåll i mätpunkten. Hur bedömmer du driften i förhållande till det observerade NO x -innehållet? Gör en preliminär analys av NO x genom att plotta ut data, göra histogram och t.ex. beräkna medelvärde och varians. Finns det några konstigheter i data eller verkar mätsituationen ha varit under kontroll under hela den studerade perioden? 4
Är avgasutsläppets placering hälsofarlig? I denna deluppgift ska ni undersöka om den plym av kväveoxider som kommer från avgasutsläppet riskerar att ge hälsofarliga halter av NO x där människor vistas. Detta ska ni göra genom att analysera mätningarna från punkt 3 som är placerad på fasaden 3 meter ovanför avgasutsläppet. Speciellt intressant är det att studera hur ofta man uppmäter kväveoxidhalter som överstiger Naturvårdsverkets gränsvärde på 0.1 ppm (98-percentilen). Fördelningen för observerad NO x -halt Studera fördelningen för observerat NO x -värde i punkt 3 genom att rita ett histogram. Kan du hitta någon standardfördelning som passar bra till data? Hur ofta har de observerade NO x -halterna överskridet gränsvärdet? Ange en skattning av sannolikheten att överskrida 0.1. Gränsvärdet på 0.1 ppm är ett s.k. 98-percentils gränsvärde. Fundera ut vad det kan innebära. Mätfel i observerad NO x -halt Titta på histogrammet över observerade kväveoxider igen. Varför finns det så många negativa värden i data? Så fort man mäter någon storhet har man brus i sina mätningar som gör att även om man mäter en konstant upprepade gånger så kommer mätningarna att ibland ligga under, i bland över konstanten; man har ett mätfel. Här är det mer komplicerat än så eftersom det vi mäter också varierar från mätning till mätning. I modellformulering kan den observerade NO x halten, obsno x beskrivas som summan av verklig kväveoxidhalt, verklno x och mätfel, e, obsno x = verklno x + e Observera att både verklno x och mätfelet e är slumpvariabler och att histogrammet över observerad kväveoxidhalt kan betraktas som en skattning av en täthetsfunktion som i själva verket är summan av två täthetsfunktioner. Det ni ska undersöka är hur era tidigare slutsatser om NO x -haltens fördelning, och speciellt dess överskridande av gränsvärdet, ändras då vi även beaktar mätfelet. Fördelningar för verklno x och mätfel Många olika fördelningar för de två olika slumpvariablerna verklno x -halt och mätfel i ovanstående modell är tänkbara. Antag att vi som modell sätter att verklig kväveoxidhalt och mätfel är oberoende och båda normalfördelade, vad ger det för fördelning för observerad halt av kväveoxider? Passar denna modell till data? Av erfarenhet vet man att koncentrationer av olika kemivariabler i luft ofta kan beskrivas med en lognormalfördelning. X är lognormalfördelad med parametrar Ñ v och v, om ln(x ) är normalfördelad N (Ñ v, 2 v ). Det innebär att X har täthetsfunktionen f (x) = 1 x (ln(x) Ñ) 2 2Ô e 2 2, x > 0 Väntevärdet är E(X ) = e Ñv+ 2 v 2 medan medianen ges av Med(X ) = e Ñv. 5
Hur skulle du skatta Ñ v om x 1,..., x n är observationer från ovanstående lognormalfördelning? Om de observerade NO x -halterna i punkt 3 kunde tänkas vara lognormalfördelade med parameter Ñ v, vad är då skattningen av Ñ v? Undersök hur en lognormalfördelning ser ut genom att rita ut dess täthetsfunktion (se help lognpdf). För att få en fördelning som påminner något om era data, låt Ñ v -värdet ligga i närheten av din skattning av Ñ v, baserad på observerade kväveoxidhalter, och låt v vara ungefär 0.5. Med lognormalfördelningen som modell kan man fånga upp skevheten i data men fortfarande har vi inte modellerat det faktum att observerad halt blir negativ ibland; vi behöver addera ett mätfel. En enkel modell för mätfelet är att det är normalfördelat med väntevärde 0 och standardavvikelse m. Sammantaget ger det följande modell där obsno x = verklno x + e (1) verklno x är lognormalfördelad med parametrar Ñ v och v, mätfelet e är normalfördelat N (0, 2 m ). Tyvärr är det inte alldeles enkelt att uttrycka täthetsfunktionen för denna summafördelning. I det fortsatta arbetet ska ni genom simuleringar undersöka om modellen kan vara rimlig. Simuleringsstudie är modellen rimlig? Använd m-filenlognormsim (sehelp lognormsim) för att undersöka om den ovanstående modellen för observerad NO x -halt är rimlig. M-filen adderar slumptal från en lognormalfördelning och en normalfördelning och plottar histogram över de separata uppsättningarna av slumptal samt över summan. Inparametrar är Ñ och i fördelningarna. Utgå t.ex. från en lognormalfördelning med parametrar i det område du studerat tidigare (Ñ v som din tidigare skattning och v 0.5) samt en normalfördelning med standardavvikelse m i intervallet 0.02 0.1. Jämför histogrammet över summan med histogrammet över dina observerade data. Undersök hur känslig summafördelningen är genom att skruva lite på parametervärdena i lognormaloch normalfördelningen. Verkar modellen rimlig, dvs kan du finna värden på parametrarna så att histogrammet för summan ungefär liknar histogrammet för dina observerade NO x -halter? I modellen ovan påverkas fördelningen för obsno x av de tre parametrarna Ñ v, v och m och ni har flyttat runt lite i det tredimensionella parameterrummet på jakt efter en punkt som ska passa till data så bra som möjligt. Naturligtvis kan man inte göra det helt planlöst, man behöver en strategi för att finna optimum och/eller ytterligare information om parametrarna. I detta fall är det lyckligtvis så att själva försöksuppläggningen av kväveoxidmätningarna ger oss en möjlighet att skatta mätfelets standardavvikelse m. Arbetet med detta ligger dock utanför kursens tidsram. Är det hälsovådligt på tre meters avstånd från avgaskällan? Återgå till den ursprungliga frågeställningen i uppgiften: Är kväveoxidhalten hälsofarlig vid punkt 3, dvs 3 m från avgasutsläppet? Om man bara betraktade observerade kväveoxiderhalter, vad är den skattade sannolikheten att gränsvärdet 0.1 överstiges (det har du redan räknat fram tidigare)? 6
Gör ett hypotestest för att undersöka om, utgående från era observerade data, gränsvärdet (98- percentils) har överskridits? Vad är alltså er slutsats angående hälsovådligheten 3 meter ovanför värmepannans utsläpp? Ni har nu sett rimligheten i en modell för verklno X -halt. Hur tror ni att sannolikheten att gränsvärdet överstiges av verklig NO x -halt är i förhållande till den som ni ovan skattat för observerad halt? Större, mindre eller förändras den inte? Epilog : Projektet med naturgaseldade värmepannor av den studerade typen i villaområden lades ner. En av orsakerna var att man, delvis p.g.a. dessa mätningar, ansåg att kväveoxidhalten var för hög runt avgasutsläppet. Kommentar? Hur stort är pannans tillskott av kväveoxider till luften? Den andra stora frågeställningen i undersökningen var hur stort tillskott av kväveoxider i luften som pannan gav. För att kunna uppskatta detta gjorde man mätningar vid punkt 25 som var placerad bakom huset. I denna punkt hoppades man kunna mäta upp halten av kväveoxider i bakgrundsluft åtminstone då vinden kom från norr där det var åkermark och inte fanns några direkta utsläppskällor av kväveoxider. Undersök hur den observerade mängden av NO x i mätpunkt 25 påverkas av vindens riktning. Dela förslagsvis in vindriktningarna i olika sektorer som motsvarar väderstrecken. Undersök speciellt om det finns skillnader i genomsnittlig NO x -mängd mellan nordliga vindar (från åkern) och sydliga vindar (från bostadsområdet)? Verifiera era resultat! Utnyttja mätresultaten från punkterna 3 och 25 för att undersöka hur mycket värmepannan ökar mängden kväveoxider i luften. 7
Appendix Liten vägledning angående redovisning av datorprojekt Projektredovisning Du skall med stöd av frågorna i projekthandledningen skriva en självständig redovisning som täcker det väsentliga innehållet. Figurer som förtydligar framställningen bör tas med i redovisningen och skall då naturligtvis kommenteras. Redovisningen skall vara utformad i enlighet med de allmänna riktlinjer som presenteras nedan. Du skall innan du lämnar in den gå igenom din redovisning enligt den checklista som bifogas. Fyll i checklistan och lämna in den som försättsblad till din redovisning. Allmänna riktlinjer på utformningen av projektredovisningar Målgrupp Om inget annat anges skall målgruppen för skriften anses vara en person med bakgrundskunskaper som en teknolog i samma årskurs, som läst den aktuella kursen men inte är insatt i detaljerna i den aktuella uppgiften. Språkbruk Språket i skriften skall vara anpassat för målgruppen och texten skall vara tillräckligt fyllig för att en person i målgruppen utan större ansträngning skall kunna följa med i resonemang och motiveringar. Skriften skall vara korrekturläst så att språk- och skrivfel är rättade. Utformning och innehåll Skriften skall vara försedd med sammanfattning, innehållsförteckning och referenslista samt ha titelsida. Den löpande texten bör vara väl strukturerad med tydliga avsnittsrubriker. I texten skall använda metoder, försöksuppställningar, mätningar och liknande beskrivas relativt utförligt om de inte är givna på förhand. Valet av metoderna skall motiveras om de inte är bestämda på förhand. Förutsättningar, förenklingar och gjorda antaganden skall tydligt redovisas. Längre beräkningar, mätresultat etcetera bör, om de inte är väsentliga för diskussionen, redovisas i bilagor till vilka tydliga hänvisningar skall göras. Om det motiveras av innehållet och underlättar förståelsen av texten skall skriften vara försedd med figurer, diagram och tabeller. Figurer och liknande skall vara försedda med figurtexter och tydlig numrering samt vara antingen infogade i anslutning till den löpande texten eller placerade i en bilaga efter löptexten. Källhänvisningar I alla delar av skriften skall använda källor anges noggrant. Dessa källhänvisningar skall vara utformade enligt gängse norm och källorna skall vara allmänt tillgängliga. Hänvisningar till kurskompendier och liknande får dock göras i förenklad form. Återkoppling Återkoppling och kommentarer från rättande lärare skall vara relativt utförliga. De skall framföras skriftligt eller muntligt och med tillfälle till en kort diskussion. De tidigare beskrivna bedömningskriterierna kommer att användas. 8
Lunds Tekniska Högskola Matematikcentrum Matematisk Statistik Matstat för K, B och N, HT-11 namn, projektgrupp och linje : utförd/inlämnad: godkänd: Redovisning av Projekt Checklista Ja Nej 1. Är alla momenten i projektet utförda? 2. Har rapporten blivit korrekturläst? Är språk- och skrivfel rättade? 3. Är figurer, tabeller och liknande försedda med figurtexter och tydlig numrering? 4. Har alla figurer storheter inskrivna på alla axlar? 5. Är de beräkningar som kan kontrollräknas kontrollräknade? 6. Har du gjort en rimlighetsbedömning av samtliga resultat? 7. Har eventuella orimliga resultat blivit vederbörligen kontrollerade och kommenterade? 8. Är den löpande texten väl strukturerad med tydliga avsnittsrubriker? 9. Är skriften försedd med: Projekt/grupp nr? Sammanfattning? Innehållsförteckning? Referenslista? Sidnumrering? Datum? 10. Har förutsättningar, förenklingar och gjorda antaganden tydligt redovisats? 11. Är din rapport läsbar utan tillgång till projekthandledningen? 12. Är detta försättsblad med checklista fullständigt ifyllt? 9