Prediktion av sjödjup och sjövolym från topografiska data
|
|
- Maja Jonasson
- för 8 år sedan
- Visningar:
Transkript
1 Prediktion av sjödjup och sjövolym från topografiska data av Sebastian Sobek, Jakob Nisell and Jens Fölster Institutionen för vatten och miljö, SLU Box 7050, Uppsala Rapport 2009:19
2
3 Prediktion av sjödjup och sjövolym från topografiska data av Sebastian Sobek, Jakob Nisell and Jens Fölster
4 Institutionen för vatten och miljö, SLU Box Uppsala Tryck: Institutionen för vatten och miljö, SLU, årtal (2010) ISSN X
5 Sammanfattning Vi utvecklat en statistiskt modeller med målet att kunna prediktera sjödjup och sjövolym för alla svenska sjöar enbart utgående från kartbaserade data. Sjövolym kunde förklaras mycket väl utifrån sjöarea och den maximala lutningen i en 50 m bred buffertzon från strandlinjen (R 2 =0.92). Däremot kunde varken det maximala djupet eller medeldjupet modelleras utifrån kartbaserade data (R 2 <0.4). Trots den höga förklaringsgraden (92%) är prediktionen av volym för en enstaka sjö behäftad med en stor statistisk osäkerhet. Däremot blir det statistiska felet mycket mindre om man predikterar den genomsnittliga volymen för minst 5 sjöar åt gången. Volymmodellen kan därför användas för att prediktera den totala sjövolymen, och i förlängning vattnets uppehållstid för avrinningsområden som innehåller minst 5 sjöar.
6
7 Inledning En sjös vattendjup och volym bestämmer många av sjöns egenskaper och funktioner. Djup och volym är avgörande för vattnets uppehållstid, och därmed för effekten av sjöprocesser såsom primärproduktion, nedbrytning av organiskt material, näringsomsättning, och sedimentation på vattenkvalitén (Algesten et al. 2004, Hamilton and Lewis 1990, Jeppesen et al. 2005). Vidare är sjöbassängens form viktig för resuspension av sediment (Håkanson 2004), och därmed för sjöns näringsförhållanden och primärproduktion (Hellström 1991). Dessutom påverkar bassängens form skiktningsförhållanden, vilka i sin tur har stor inverkan på bottenvattnets syrekoncentration och rörligheten av fosfor i sedimenten (Jeppesen et al. 2005). Med tanke på hur viktiga sjödjup och sjövolym är för sjöns egenskaper, är det förvånansvärt att dessa grundläggande parameter är okända för de flesta svenska sjöarna. Bara knappt 8000 av de över sjöarna i svenska sjöregistret har uppgift om djup eller volym! Detta beror i huvudsak på att det är tidskrävande att loda en sjö, även med tillgång till GPS och ekolod. Därför är det av intresse att hitta statistiska samband, utifrån vilka man skulle kunna prediktera en sjös djup och volym. Håkanson och Peters (1995) visade att sjövolymen kan bestämmas utifrån sjöarealen och den maximala lutningen i tillrinningsområdet. Denna formel är dock inte användbar för alla sjöar, eftersom tillrinningsområdet oftast inte är känt. Det finns visserligen GIS-rutiner som kan bestämma ett tillrinningsområde utifrån en digital höjdmodell, men dessa rutiner ger inte tillförlitliga resultat i låglänta områden, där höjdskillnaderna i landskapet är mindre än den vertikala upplösningen i tillgängliga höjddatabaser. Vi försökte därför att hitta statistiska samband mellan djup och volym av sjöar och kartbaserad information om topografi, markanvändning och marktyp. Målet var att prediktera sjödjup och volym för alla sjöar i sjöregistret. Detta mål lyckades vi inte uppnå, eftersom den statistiska osäkerheten i prediktionen för enstaka sjöar var för stor. Däremot kom vi fram till statistiska samband som möjliggör att uppskatta den totala sjövolymen i ett tillrinningsområde, om det innehåller minst 5 sjöar. 5
8 Metoder Vi utgick ifrån svenska sjöregistret ( för att undersöka om det finns statistiska samband mellan maximala djupet (D max ), medeldjupet (D med ) och volymen (V) av en sjö och kartbaserade parametrar. Sjöregistret innehåller uppgifter om maximaldjup för 7383 sjöar, och om volym (och därmed medeldjup, som beräknas som volym / area) för 6618 sjöar. För dessa sjöar finns dessutom uppgifter om area (A) och höjd över havet (höh) i sjöregistret. Vi uteslöt stora sjöar (>10 km 2 ) eftersom djup och volym av dessa sjöar är kända. Felaktiga area- eller volymdata identifierades genom att jämföra beräknat medeldjup med angiven medeldjup, och uteslöts. Totalt ingick 6943 sjöar i analysen. Dessa är belägna i olika naturgeografiska regioner av landet, och representerar därför mycket olika sjötyper (Tabell 1). Det förefaller dock att fjällsjöarna förmodligen är underrepresenterade i datamängden. Sjöarna är mycket olika med avseende på storlek, djup, och volym, men de flesta är relativt små och grunda (medianen i A: 0,21 km 2 ; V: 0,57 Mm3; D max : 3.4 m). Tabell 1. Fördelning av sjöar i olika naturgeografiska områden. Naturgeografiskt område N Fjällområdet 79 Mellersta och norra skogsområden 3596 Norra Norrlands kust och slätt 102 Förfjällens slättområde 38 De stora slättarna 247 Västkusten 282 Höglandets sluttningsområden 1752 Småländska höglandet 751 Öland och Gotland 10 Skåne 51 Kalmarslätten 12 Metod för insamling av statistik för sjöns närområde Geometrin för sjöarna hämtades dels från SMHI:s GIS-skikt med vattenförekomster framtagna utifrån kartskalan 1: och dels från vägkartan 1: där data inte fanns i SMHI:s skikt. För varje sjö har fem buffertzoner skapats, 50, 100, 200, 500 och 1000 m från strandlinjen. För varje buffertzonen har statistik om marktyp, jordart, lutnings och höjdförhållanden beräknats. Statistiken har lagrats i en textfil tillsammans med information om sjöns identitetskod, geometriska area och omkrets, De topografiska parametrarna omfattar medelvärdet, maximalvärdet, minimalvärdet och standardavvikelsen av lutningen (lut) och höjden över havet (höh) i varje av dessa buffertzoner. Dessa topografiska parametrar benämndes enligt parameterstatistik, buffertzon, t ex lut max50 för maximala lutningen i en 50 m buffertzon från strandlinjen, eller höh stav500 för standardavvikelsen av höjden i en 500 m buffertzon från strandlinjen. Marktyper och markanvändning omfattar 11 olika klasser som extraherades genom att generalisera indelningen i Svensk marktäckedata (Engberg, 2002). Även en generalisering med 17 markanvändningstyper gjordes. Sjöns omkrets användes för att beräkna s k shoreline development eller flikighet, dvs. sjöns avvikelse från cirkulär form, enligt Håkanson (1981). 6
9 Statistik Den statistiska analysen genomfördes sedan i två steg. Först användes multivariata statistiska metoder såsom PCA (principal components analysis) och PLS (partial least squares regression) för att upptäcka den grundläggande korrelationsstrukuren i datamängden. Både PCA och PLS identifierar osynliga ( latenta ) gradienter i datamängden, längs med vilka en stor del av variansen i datamängden kan förklaras. Dessa till en början osynliga gradienter kan därmed synliggöras i enkla diagram, som visar huruvida olika variabler är positiv, negativt, eller inte alls relaterade till varandra. Skillnaden mellan PCA och PLS är att en PCA visar korrelationer mellan X-variabler, medan en PLS, som är en regressionsmetod, visar hur olika X-variabler bidrar till att förklara variansen i en Y-variabel. Alla PCA- och PLS-analyser genomfördes i Simca-P (Umetrics, Umeå). I ett nästa steg användes sedan de variabler, som i PCA- och PLS-analyserna visade sig vara relaterade till sjödjup och sjövolym, som prediktorer i multipla linjära regressioner. Enbart sinsemellan oberoende variabler användes som prediktorer i multipla linjära regressioner, för att tillfredställa detta antagande i metoden. För dessa analyser användes JMP 8.0. Alla variabler som var tydligt snedfördelade (skewness >2, min/max <0.1) transformerades med naturlig logaritm för att erhålla normalfördelning. Resultat och Diskussion Bara en begränsat andel av variabiliteten i sjödjup kunde förklaras utifrån kartbaserade parametrar. En PLS-regression förklarade 43% av variansen i D max, med sjöarea, omkrets, maximala lutningen i sjöns omgivning och strandlinjens flikighet som viktigaste prediktorer (resultat visas ej). De viktigaste och sinsemellan oberoende av dessa variablerna, A och lut max50, lyckades dock bara förklara 36% procent av variansen i D max (Figur 1). Vi drar därifrån slutsatsen att en sjös maximala djup inte kan predikteras från enbart kartbaserade data. Figur 1. Maximaldjup (D max ) predikerad från sjöarea och maximala lutningen i en 50 m buffertzon från strandlinjen, mot observerat maximaldjup. Linjen visar följande regression: D max = 7,09 + 1,69 * log A + 0,660 * lut max50 ; R 2 =0,36; n=6772; p<0,
10 Liknande resultat erhölls för medeldjupet (D med ). D med uppvisade visserligen en stark korrelation med D max (R 2 =0,78; resultat visas ej), men inte med kartbaserade parametrar (D med = 2,2 + 0,33 * log A + 0,24 * lut max50 ; R 2 =0,31; resultat visas ej). Inte heller en sjös medeldjup kan därför predikteras utifrån kartbaserade parametrar. Sjövolymen, å andra sidan, kunde modelleras utifrån area och den maximala lutningen med mycket hög förklaringsgrad (Figur 2). Hela 92% av variansen i log V kunde förklaras utifrån log A och lut max50 : log V = 0,75 + 1,06 * log A + 0,056 * lut max50 ; R 2 =0,92; n=6130; p<0,0001 (1) Strandlinjens flikighet, minimala lutningen och sjöomkrets, som framgick som måttligt betydelsefulla variabler i PLS-analysen, kunde antingen inte höja förklaringsgraden, eller var starkt interkorrelerade med antingen A eller lut max50. Dessa variabler utelämnades därför från regressionsmodellen. Anmärkningsvärt var att sjöar i olika naturgeografiska regioner verkade följa samma samband; eller med andra ord, förklaringsgraden av log volym kunde inte höjas genom dela upp datamängden i naturgeografiska regioner. Möjligen gäller detta inte fjällsjöarna, som visade en signifikant större lutningskoefficient för log A än alla andra regioner (p<0.05) Eftersom denna skillnad dock är baserad på bara 40 fjällsjöar, som dessutom är förhållandevis stora (median A, 2.9 km 2, att jämföra med median A för hela datamängden, 0.21 km 2 ), måste skillnaden i lutningskoefficienten tolkas med försiktighet. Vi drar därför slutsatsen att sambandet mellan V, A och lut max50 gäller för alla svenska sjöar, med visst förbehåll för fjällsjöar. Figur 2. Volym predikterad från sjöarea och maximala lutningen i en 50 m buffertzon från strandlinjen, mot observerad volym. Observera att volymen är log-transformerad. Den heldragna linjen visar följande regression: log V = 0,75 + 1,06 * log A + 0,056 * lut max50 ; R 2 =0,92; n=6130; p<0,0001. De streckade linjerna visar prediktionsintervallet, dvs. intervallet, inom vilken predikterad log volym av en enstaka sjö ligger med 95% sannolikhet. Ekvation (1) ska dock användas med försiktighet, eftersom den gäller log-transformerad volym. Den parameter som ska predikteras är dock volym, inte log-transformerad volym. Detta innebär att inte bara predikterad log volym måste omräknas till volym, utan även prediktionsintervallet för log volym, dvs. osäkerheten i prediktionen för en enstaka sjö. Figur 3 visar att det icke-log-transformerade prediktionsintervallet för volym är mycket stor. Den enda slutsatsen man med säkerhet kan dra från Figur 3 är att en sjö har en volym, så pass stor 8
11 är osäkerheten i prediktionen för en enstaka sjö. Trots att förklaringsgraden av logaritmen av volymen alltså är så hög som 92 %, så kan man ändå inte prediktera volymen av en enstaka sjö med någon vidare statistisk säkerhet. Figur 3. Volym predikterad från sjöarea och maximala lutningen i en 50 m buffertzon från strandlinjen, mot observerad volym. A visar hela datamängden, B visar en förstoring för mindre sjöar, som utgör >90% av datamängden. Observera att volymen inte är transformerad, till skillnad från Figur 2. Den heldragna linjen visar den linjära regressionen, och de streckade linjerna visar prediktionsintervallet, dvs. intervallet, inom vilken predikterad volym av en enstaka sjö ligger med 95 % sannolikhet. Vi försökte flera sätt för att förbättra modellens prediktionsförmåga, såsom att hitta bättre transformationer, att använda latenta gradienter från PCA som variabler i multipla linjära regressioner, och att använda interaktionstermer mellan variabler som prediktorer, men utan framgång. Inte heller en uppdelning av datamängder i naturgeografiska regioner eller i olika storleksklasser kunde förbättra prediktionsförmågan. Vi försökte även att hitta osynliga grupperingar i datamängden genom clustering (vilket identifierar liknande observationer) och genom partitioning (vilket identifierar grupper av X-värden som bäst predikterar Y-värden), men även detta utan att höja prediktionsförmågan av sjövolym. Observera dock att denna mycket begränsade prediktionsförmåga gäller enbart vid prediktion för en enstaka sjö. Så snart man ökar antal sjöar som det predikteras för, så minskar prediktionsintervallet. Detta eftersom prediktionsfelet är slumpvis fördelat, så att felen till viss del tar ut varandra om man predikterar volymen för flera sjöar åt gången. Predikterar man volym för 5 sjöar åt gången, minskar prediktionsinteravallet storlek (jämför Figur 2) med 55%; vid prediktion för 10 sjöar åt gången med 68%; och vid prediktion för 100 sjöar åt gången med 89%. Detta innebär att prediktion av volym är möjlig med acceptabel statistisk säkerhet, om man predikterar för minst 5 sjöar åt gången. Därmed blir det möjligt att beräkna ett tillrinningsområdes totala sjövolym med hjälp av ekvation (1), om det innehåller minst 5 sjöar. En möjlig tillämpning är att prediktera totala sjövolymen uppströms miljöövervakningsstationer i vattendrag, eftersom uppströms sjövolym och vattnets uppehållstid skulle kunna förklara en del av de observerade skillnaderna i vattnets kemiska sammansättning, och i olika stationers variation i tiden. 9
12 Referenser Algesten, G., Sobek, S., Bergström, A.-K., Ågren, A., Tranvik, L.J., and Jansson, M Role of lakes for organic carbon cycling in the boreal zone. Global Change Biology 10: Engberg A Produktspecification Svenska CORINE Marktäckedata, SCMD-0001, Lantmäteriet. Håkanson, L Lakes: Form and Function. The Blackburn Press, Caldwell, New Jersey. Håkanson, L., and Peters, R.H Predictive Limnology. SPB Academic Publishing, Amsterdam. Hamilton, S.K., and Lewis, W.M Basin morphology in relation to chemical and ecological characteristics of lakes on the Orinoco river floodplain, Venezuela Archiv Fur Hydrobiologie 119(4): Hellström, T The effect of resuspension on algal production in a shallow lake. Hydrobiologia 213(3): Jeppesen, E., Sondergaard, M., Jensen, J.P., Havens, K.E., Anneville, O., Carvalho, L., Coveney, M.F., Deneke, R., Dokulil, M.T., Foy, B., Gerdeaux, D., Hampton, S.E., Hilt, S., Kangur, K., Kohler, J., Lammens, E., Lauridsen, T.L., Manca, M., Miracle, M.R., Moss, B., Noges, P., Persson, G., Phillips, G., Portielje, R., Schelske, C.L., Straile, D., Tatrai, I., Willen, E., and Winder, M Lake responses to reduced nutrient loading - an analysis of contemporary long-term data from 35 case studies. Freshwater Biology 50(10):
Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Sänkningen av parasitnivåerna i blodet
4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet
Beskrivning av använd metod, ingående data och avvägningar som gjorts vid klassificering av näringsämnen i sjöar och vattendrag i Värmlands län 2013
Beskrivning av använd metod, ingående data och avvägningar som gjorts vid klassificering av näringsämnen i sjöar och vattendrag i Värmlands län 2013 1. Allmänt om klassificeringen Klassificeringen baseras
732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2013-03-27
Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner
Linjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Strategier för urval av sjöar som ska ingå i den sexåriga omdrevsinventeringen av vattenkvalitet i svenska sjöar
Strategier för urval av sjöar som ska ingå i den sexåriga omdrevsinventeringen av vattenkvalitet i svenska sjöar Rapportering av uppdrag 216 0648 från Naturvårdsverket Ulf Grandin Department of Environmental
F13 Regression och problemlösning
1/18 F13 Regression och problemlösning Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 4/3 2013 2/18 Regression Vi studerar hur en variabel y beror på en variabel x. Vår modell
F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24
1/24 F12 Regression Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 28/2 2013 2/24 Dagens föreläsning Linjära regressionsmodeller Stokastisk modell Linjeanpassning och skattningar
Bara naturlig försurning. Bilaga 1. Konsekvensanalys av reviderat delmål för försurade sjöar och vattendrag
Rapport Bara naturlig försurning Bara naturlig försurning Bilaga 1 Konsekvensanalys av reviderat delmål för försurade sjöar och vattendrag 1 1 Problemanalys Delmålet för sjöar och vattendrag är uppnått
Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
STOCKHOLMS UNIVERSITET FYSIKUM
STOCKHOLMS UNIVERSITET FYSIKUM Tentamensskrivning i Fysikexperiment, 7,5 hp, för FK2002 Onsdagen den 15 december 2010 kl. 9-14. Skrivningen består av två delar A och B. Del A innehåller enkla frågor och
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Korrelation och regression Innehåll 1 Korrelation och regression Spridningsdiagram Då ett datamaterial består av två (eller era) variabler är man ofta intresserad av att veta om det nns ett
Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Fredagen den 9 e juni 2017 Ten 1, 9 hp Tillåtna hjälpmedel:
Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Exempel på avgränsning av kartobjekt för ytvatten
Håkan Olsson, Siv 2012-09-28 BILAGA 2 Exempel på avgränsning av kartobjekt för ytvatten Lantmäteriet ska med hjälp av SMHI avgränsa ytvattenobjekt i kartdata i skala 1:10 000. SMHI ska sammanställa exempel
3.8 Känslighetsanalys av modell. Introduktion. Hans Larsson och Olof Hellgren, SLU
. Känslighetsanalys av modell Hans Larsson och Olof Hellgren, SLU Introduktion I kapitel. presenteras en modell över skörd av utvinnbart socker per ha som funktion av fyra variabler ph i matjorden, sådatum,
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2013-03-27
F19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland
Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera
Naturliga populationers evolution och bevarande, 6hp
Naturliga populationers evolution och bevarande, 6hp Skriftligt prov Statistik Frågorna besvaras med kryss för rätt svar - uträkningar bifogas ej. Varje rätt besvarad fråga ger 1 poäng. Maximalt antal
Statistiska samband: regression och korrelation
Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel
Multivariat statistik inom miljöövervakning. En introduktion
Multivariat statistik inom miljöövervakning En introduktion Sortera figurerna! Sorteringen är baserad på en kvantifiering av figurerna Figur nr Hörn Gul Blå Röd 1 5 100 0 0 2 8 50 50 0 3 10 100 0 0 4 10
Vad orsakar brunifieringen av svenska vatten detta vet vi idag Lars J. Tranvik Núria Catalan Anne Kellerman Dolly Kothawala Gesa Weyhenmeyer
Vad orsakar brunifieringen av svenska vatten detta vet vi idag Lars J. Tranvik Núria Catalan Anne Kellerman Dolly Kothawala Gesa Weyhenmeyer Limnology Department of Ecology and Genetics Vad orsakar brunifieringen
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Föreläsning 12: Linjär regression
Föreläsning 12: Linjär regression Matematisk statistik Chalmers University of Technology Oktober 4, 2017 Exempel Vi vill undersöka hur ett ämnes specifika värmeskapacitet (ämnets förmåga att magasinera
oberoende av varandra så observationerna är
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 1, 1-5-7 REGRESSION (repetition) Vi har mätningarna ( 1, 1 ),..., ( n, n
MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data
MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data Pär-Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par-Ola.Bendahl@med.lu.se Översikt Introduktion till problemet Enkla
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)
Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10 Laboration Regressionsanalys (Sambandsanalys) Grupp A: 2010-11-24, 13.15 15.00 Grupp B: 2010-11-24, 15.15 17.00 Grupp C: 2010-11-25,
Bedömning av andelen övergödda sjöar i Sverige
Bedömning av andelen övergödda sjöar i Sverige En utvärdering av Bedömningsgrunder för totalfosfor Institutionen för vatten och miljö, SLU Box 7050, 750 07 Uppsala Rapport 2011:7 Bedömning av andelen
Laboration 4 R-versionen
Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 VT13, lp3 Laboration 4 R-versionen Regressionsanalys 2013-03-07 Syftet med laborationen är att vi skall bekanta oss med lite av de funktioner
Matematisk statistik, Föreläsning 5
Matematisk statistik, Föreläsning 5 Ove Edlund LTU 2011-12-09 Ove Edlund (LTU) Matematisk statistik, Föreläsning 5 2011-12-09 1 / 25 Laboration 4 Jobba i grupper med storlek 2 Ove Edlund (LTU) Matematisk
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: 5 25 Mykola Shykula, Inge Söderkvist, Ove Edlund, Niklas Grip Tentamensdatum 2014-03-26
OBS! Vi har nya rutiner.
KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare
MVE051/MSG Föreläsning 14
MVE051/MSG810 2016 Föreläsning 14 Petter Mostad Chalmers December 14, 2016 Beroende och oberoende variabler Hittills i kursen har vi tittat på modeller där alla observationer representeras av stokastiska
Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007
Lunds universitet Kemometri Lunds Tekniska Högskola FMS 210, 5p / MAS 234, 5p Matematikcentrum VT 2007 Matematisk statistik version 7 februari Datorlaboration 3 1 Inledning I denna laboration behandlas
Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet
Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden
HYPE-modellen Hydrological Predictions for the Environment
Avbördningskurvans roll i hydrologiska modellberäkningar Göran Lindström & Joel Dahné, 29-12-1 HYPE-modellen Hydrological Predictions for the Environment Markklasser = kombination av jordart och markanvändning
a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)
5:1 Studien ifråga, High School and beyond, går ut på att hitta ett samband mellan vilken typ av program generellt, praktiskt eller akademiskt som studenter väljer baserat på olika faktorer kön, ras, socioekonomisk
Demografisk rapport 2014:10. Prognosmetoder och modeller. Regressionsanalys. Befolkningsprognos /45
Demografisk rapport 214:1 Prognosmetoder och modeller Regressionsanalys Befolkningsprognos 214-223/45 PCA/MIH Michael Franzén Version 4. 1(32) Rapport 214-1-8 Regressionsmodellen för inrikes inflyttning
Hur måttsätta osäkerheter?
Geotekniska osäkerheter och deras hantering Hur måttsätta osäkerheter? Lars Olsson Geostatistik AB 11-04-07 Hur måttsätta osäkerheter _LO 1 Sannolikheter Vi måste kunna sätta mått på osäkerheterna för
Regressionsanalys med SPSS Kimmo Sorjonen (2010)
1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;
Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).
Matematikcentrum Matematisk statistik MASB11: BIOSTATISTISK GRUNDKURS DATORLABORATION 4, 21 MAJ 2018 REGRESSION OCH FORTSÄTTNING PÅ MINIPROJEKT II Syfte Syftet med dagens laboration är att du ska bekanta
MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?
MULTIPEL IMPUTATION Ett sätt att fylla i hålen i ditt datamaterial? Pär Ola Bendahl IKVL, Avdelningen för Onkologi Lunds Universitet Par Ola.Bendahl@med.lu.se Översikt 1. Introduktion till problemet 2.
Lundsjön-Dammsjön Saltsjöbadens Golfklubbs uttag av vatten från Lundsjön-Dammsjön och eventuell påverkan på sjöns vattenstånd
Lundsjön-Dammsjön Saltsjöbadens Golfklubbs uttag av vatten från Lundsjön-Dammsjön och eventuell påverkan på sjöns vattenstånd Av Magnus Enell Jonas Fejes Miljökommitteen Saltsjöbadens Golfklubb 24 mars
TENTAMEN I MATEMATISK STATISTIK
UMEÅ UNIVERSITET Institutionen för matematisk statistik Statistik för Teknologer, 5 poäng MSTA33 Ingrid Svensson TENTAMEN 2004-01-13 TENTAMEN I MATEMATISK STATISTIK Statistik för Teknologer, 5 poäng Tillåtna
Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 10 e januari 2017 Ten 1, 9 hp Tillåtna hjälpmedel:
Föreläsning 13: Multipel Regression
Föreläsning 13: Multipel Regression Matematisk statistik Chalmers University of Technology Oktober 9, 2017 Enkel linjär regression Vi har gjort mätningar av en responsvariabel Y för fixerade värden på
I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser
OBS! Vi har nya rutiner.
KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 2 november 2011 Tillåtna hjälpmedel: miniräknare
Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas
Laboration 2: Styrkefunktion samt Regression
Lunds Tekniska Högskola Matematikcentrum Matematisk statistik Laboration 2 Styrkefunktion & Regression FMSF70&MASB02, HT19 Laboration 2: Styrkefunktion samt Regression Syfte Styrkefunktion Syftet med dagens
Blandade problem från elektro- och datateknik
Blandade problem från elektro- och datateknik Sannolikhetsteori (Kapitel 1-10) E1. En viss typ av elektroniska komponenter anses ha exponentialfördelade livslängder. Efter 3000 timmar brukar 90 % av komponenterna
Tentamen för kursen. Linjära statistiska modeller. 20 mars 2015 9 14
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 20 mars 2015 9 14 Examinator: Anders Björkström, bjorks@math.su.se Återlämning: Fredag 27/3 kl 12.00, Hus 5,
Höftledsdysplasi hos dansk-svensk gårdshund
Höftledsdysplasi hos dansk-svensk gårdshund Sjö A Sjö B Förekomst av parasitdrabbad öring i olika sjöar Sjö C Jämföra medelvärden hos kopplade stickprov Tio elitlöpare springer samma sträcka i en för dem
Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig
Multipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
SF1911 Statistik för bioteknik: Autumn 2016 Lab 3 för CBIOT3. 1 Problem 1 - Fördelning av nukleotider i DNA
Matematisk Statistik Introduktion SF1911 Statistik för bioteknik: Autumn 2016 Lab 3 för CBIOT3 Detta är handledningen till Laboration 3, ta med en en utskriven kopia av den till laborationen. Läs handledningen
Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren Prediktera Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/28 Statistik för modellval
Förändringar i markanvändning
Förändringar i markanvändning en jämförelse mellan Häradsekonomiska kartan och nutida data för 24 avrinningsområden av Catherine Ivalo, Jakob Nisell och Jens Fölster Institutionen för vatten och miljö,
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Industriell matematik och statistik, LMA136 2013/14
Industriell matematik och statistik, LMA136 2013/14 7 Mars 2014 Disposition r Kondensintervall och hypotestest Kondensintervall Statistika Z (eller T) har fördelning F (Z en funktion av ˆθ och θ) q 1 α/2
För logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Föreläsning 7. Statistikens grunder.
Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande
Torrläggning av områden och näringstransport i Svärtaåns avrinningsområde Emma Lannergård Examensarbete Linköpings universitet Agenda Svärtaåns avrinningsområde Identifierat i studien Områden och källor
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2017-08-22 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Jourhavande lärare: Mykola
Tentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 4 MATEMATISK STATISTIK, FÖR I/PI, FMS 121/2, HT-3 Laboration 4: Stora talens lag, Centrala gränsvärdessatsen och enkla punktskattningar
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: Mykola Shykula 5 25 Tentamensdatum 2014-05-15 Skrivtid 09.00-14.00 Jourhavande lärare:
Mälardalens Högskola. Formelsamling. Statistik, grundkurs
Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken
Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Vägledning till statistisk redovisning i NFTS försöksdokumentation
1(5) Fältforsk 2013-12-09 Vägledning till statistisk redovisning i NFTS försöksdokumentation Inledning Det här dokumentet beskriver hur de statisiska resultat som redovisas i NFTS försöksdokumentation
Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?
När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns
Resultat. Principalkomponentanalys för alla icke-kategoriska variabler
Introduktion Den första delen av laborationen baserar sig på mätdata som skapades i samband med en medicinsk studie där en ny metod för att mäta ögontryck utvärderas. Den nya metoden som testas, Applanation
Bayesiansk statistik, 732g43, 7.5 hp
Bayesiansk statistik, 732g43, 7.5 hp Moment 2 - Linjär regressionsanalys Bertil Wegmann STIMA, IDA, Linköpings universitet Bertil Wegmann (STIMA, LiU) Bayesiansk statistik 1 / 29 Översikt moment 2: linjär
Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på
Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
JÄRLASJÖNS VATTENUTBYTE. producerad av IVL, Svenska miljöinstitutet
JÄRLASJÖNS VATTENUTBYTE producerad av IVL, Svenska miljöinstitutet September 2016 Nr U 5692 September 2016 Järlasjöns vattenutbyte På uppdrag av Nacka Kommun Joakim Hållén & Magnus Karlsson Författare:
Läs noggrant informationen nedan innan du börjar skriva tentamen
Tentamen i Statistik 1: Undersökningsmetodik Ämneskod S0006M Totala antalet uppgifter: Totala antalet poäng Lärare: Mykola Shykula 5 25 Tentamensdatum 2014-05-15 Skrivtid 09.00-14.00 Jourhavande lärare:
Medicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Föreläsning 4. Kap 5,1-5,3
Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet
Nederbördshändelser extraherades från kommundata (avsnitt 2.2) enligt ett antal kriterier. Nederbördshändelserna hämtades enligt följande rutin
BILAGA V Statistisk analys av skyfallsegenskaper i tid och rum I denna bilaga redovisas metodik i och resultat från två detaljstudier av skyfallens egenskaper i tid och rum. I den första studien undersöks
Bilaga 3. Varselstatistik, bortfallsanalys och statistiska beräkningar
bilaga till granskningsrapport dnr: 31-2013-0722 rir 2014:27 Bilaga 3. Varselstatistik, bortfallsanalys och statistiska beräkningar Arbetsförmedlingens arbete vid varsel Ett bidrag till effektiva omställningsinsatser?
Poissonregression. E(y x1, x2,.xn) = exp( 0 + 1x1 +.+ kxk)
Poissonregression En lämplig utgångspunkt om vi har en beroende variabel som är en count variable, en variabel som antar icke-negativa heltalsvärden med ganska liten variation E(y x1, x2,.xn) = exp( 0
Tentamen MVE301 Sannolikhet, statistik och risk
Tentamen MVE301 Sannolikhet, statistik och risk 2018-05-31 kl. 8:30-13:30 Examinator: Johan Jonasson, Matematiska vetenskaper, Chalmers Telefonvakt: Ivar Simonsson, telefon: 031-7725325 Hjälpmedel: Valfri
1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
3.6 Generella statistiska samband och en modell med för sockerskörden begränsande variabler
3.6 Generella statistiska samband och en modell med för sockerskörden begränsande variabler Hans Larsson, SLU och Olof Hellgren, SLU Inledning En uppgift för projektet var att identifiera ett antal påverkbara
SF1911: Statistik för bioteknik
SF1911: Statistik för bioteknik Föreläsning 6. TK 14.11.2016 TK Matematisk statistik 14.11.2016 1 / 38 Lärandemål Stokastiska modeller för kontinuerliga datatyper Fördelningsfunktion (cdf) Sannolikhetstäthetsfunktion
GRUNDVATTENUTREDNING STORUMAN KOMMUN
1(13) Jeffrey Lewis 010 452 39 44 2016-10-07 GRUNDVATTENUTREDNING STORUMAN KOMMUN 1 INLEDNING Preliminärt arbete kopplat till projektet Konsulttjänst för framtagande av geohydrologisk/dagvattenutredning