3.8 Känslighetsanalys av modell. Introduktion. Hans Larsson och Olof Hellgren, SLU

Relevanta dokument
3.6 Generella statistiska samband och en modell med för sockerskörden begränsande variabler

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Statistiska samband: regression och korrelation

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Statistik 1 för biologer, logopeder och psykologer

Föreläsning 12: Regression

3.5 Skördar. Metodik. Resultat. Thomas Wildt-Persson, SBU

NpMa2b ht Kravgränser

Grundläggande matematisk statistik

Höftledsdysplasi hos dansk-svensk gårdshund

Föreläsning G60 Statistiska metoder

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Sänkningen av parasitnivåerna i blodet

Laboration 2: Styrkefunktion samt Regression

Prediktera. Statistik för modellval och prediktion. Trend? - Syrehalt beroende på kovariater. Sambands- och trendanalys

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Medicinsk statistik II

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Bedömningsanvisningar

Föreläsning 10, del 1: Icke-linjära samband och outliers

Laboration 4 R-versionen

Korrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

InStat Exempel 4 Korrelation och Regression

oberoende av varandra så observationerna är

F13 Regression och problemlösning

16. Max 2/0/ Max 3/0/0

Gör uppgift 6.10 i arbetsmaterialet (ingår på övningen 16 maj). För 10 torskar har vi värden på variablerna Längd (cm) och Ålder (år).

Lektionsanteckningar 11-12: Normalfördelningen

10.1 Enkel linjär regression

Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08

Bedömningsanvisningar

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

ÖVNINGSUPPGIFTER KAPITEL 7

Repetitionsföreläsning

Föreläsning 13: Multipel Regression

Valresultat Riksdagen 2018

Föreläsning 12: Linjär regression

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

1 Förberedelseuppgifter

TENTAPLUGG.NU AV STUDENTER FÖR STUDENTER. Kursnamn Fysik 1. Datum LP Laboration Balkböjning. Kursexaminator. Betygsgränser.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Blandade problem från elektro- och datateknik

Linjär regressionsanalys. Wieland Wermke

Fråga nr a b c d 2 D

Tentamen i Linjära statistiska modeller 13 januari 2013, kl. 9-14

Experimentella metoder 2014, Räkneövning 1

ÖVNINGSUPPGIFTER KAPITEL 4

Multipel Regressionsmodellen

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Kravgränser. Provet består av Del B, Del C, Del D samt en muntlig del och ger totalt 63 poäng varav 24 E-, 21 C- och 18 A-poäng.

Datorlaboration 3. 1 Inledning. 2 Grunderna. 1.1 Förberedelse. Matematikcentrum VT 2007

Justeringar och tillägg till Svar till numeriska uppgifter i Andersson, Jorner, Ågren: Regressions- och tidsserieanalys, 3:uppl.

Laboration 2: Normalfo rdelning, regressionsanalys och korstabeller

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Resursfördelningsmodellen

Del A: Digitala verktyg är inte tillåtna. Endast svar krävs. Skriv dina svar direkt på provpappret.

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Laboration 4 Regressionsanalys

Statistik B Regressions- och tidsserieanalys Föreläsning 1

2. Finns samband mellan individbundna faktorer och kontextuella faktorer och skolresultat?

Regressionsanalys med SPSS Kimmo Sorjonen (2010)

ANDREAS REJBRAND NV1A Matematik Linjära ekvationssystem

Statistik och epidemiologi T5

MVE051/MSG Föreläsning 14

Matematisk statistik kompletterande projekt, FMSF25 Övning om regression

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

SVÄNGNINGSTIDEN FÖR EN PENDEL

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

a) Anpassa en trinomial responsmodell med övriga relevanta variabler som (icketransformerade)

Modellutveckling 2016: Regressionsmodellen för inrikes inflyttning

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

Metod och teori. Statistik för naturvetare Umeå universitet

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Forskningsmetodik 2006 lektion 2

import totalt, mkr index 85,23 100,00 107,36 103,76

F19, (Multipel linjär regression forts) och F20, Chi-två test.

MSG830 Statistisk analys och experimentplanering - Lösningar

Del I: Digitala verktyg är inte tillåtna. Endast svar krävs. Skriv dina svar direkt i provhäftet.

Vägda medeltal och standardvägning

5.7 Tillväxt hos sockerbeta (Beta vulgaris) i jord från 14 gårdsytor som värmesteriliserats och tillförts optimal näringslösning

Linjära ekvationssystem. Avsnitt 1. Vi ska lära oss en metod som på ett systematiskt sätt löser alla linjära ekvationssystem. Linjära ekvationssystem

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Statistik 1 för biologer, logopeder och psykologer

FMSF55: Matematisk statistik för C och M OH-bilder på föreläsning 9,

Statistik 1 för biologer, logopeder och psykologer

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

OBS! Vi har nya rutiner.

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Modellutveckling 2015: Regressionsmodellen för inrikes inflyttning

Tentamen för kursen. Linjära statistiska modeller. 17 februari

Transkript:

. Känslighetsanalys av modell Hans Larsson och Olof Hellgren, SLU Introduktion I kapitel. presenteras en modell över skörd av utvinnbart socker per ha som funktion av fyra variabler ph i matjorden, sådatum, vertikal infiltration och medelsvamp. En analys av modellens känslighet kommer att göras i detta kapitel. Med känslighetsanalys menas här en prövning av modellens giltighet och graden av känslighet för olika uppmätta kombinationer av variabelvärden hämtade från provytemätningar och fältmedelvärden. Dessa värden är de värden som modellen bygger på och en validering av modellen kan inte göras utan att nya data uppmäts. För varje variabel är ett giltighetsområde definierat (finns angivet i kapitel.) och följderna av att gå utanför dessa områden kommer att diskuteras här. Modellen är att beteckna som en statistisk regressionsmodell där ingående och utgående komponenter behandlas i en s.k. black box, dvs ingen hänsyn tas i modellen till den interna struktur som skulle kunna förklara sambandet mellan sockerskörd som verkan och valda variablers orsak till denna. Givetvis kan sockerskördens beroende av variablerna diskuteras men detta är inte liktydigt med en matematisk uppställning som tar hänsyn till variablernas funktionella betydelse för skörden. Modeller som tar hänsyn till den interna strukturen mellan orsak och verkan kallas ofta mekanistiska eller syntetiska. En rent statistisk icke-mekanistisk modell stävar mot att beskriva (inte förklara) ett sammanhang där målsättningen är att göra detta så bra som möjligt med så få komponenter som möjligt. Syntetiska modeller däremot stävar mot att förklara orsak och verkan genom de mekanismer som ligger bakom och tenderar därför att hamna i detaljerade sammanhang med många variabler pga komplexa samband mellan mekanismer och orsakande faktorer. Den här angivna modellen har konstruerats för att så enkelt som möjligt beskriva ett resultat, dvs sockerskörden per ha. Den primära målsättningen med en modell är att med tillgängliga data kunna göra någon typ av så korrekt prediktion som möjligt. En statistisk modell bör som påpekats tidigare innehålla så få komponenter som möjligt. En modell måste kunna testas och det som ska testas är modellens förmåga till prediktioner prediktionsstyrkan. Validering av en modell betyder att man fastställer modellens grad av lämplighet för ett givet ändamål. I vårt fall är ändamålet att med få komponenter (variabler) kunna ange ett korrekt värde på sockerskörden. Om modellens resultat ska kunna direkt appliceras på produktionsstyrning i lantbruksföretag måste målprestanda vad gäller tillförlitligheten i modellens prediktioner kunna specificeras. Var gränserna för tillförlitlig prediktion ligger måste alltså anges för att modellen ska vara praktiskt användbar i beslutsfattande. Denna modell är inte validerad. Det bör påpekas att den modell som beskrivs här bara är en av många möjliga beskrivningar av samband mellan sockerskörd och variabler. Variablerna är valda bland totalt ca för att med så hög förklaringsgrad som möjligt och med så få variabler som möjligt kunna beskriva skörderesultatet. Andra kombinationer med samma antal variabler kan väljas men med i vårt fall sämre förklaringsgrad (förklaringsgraden gäller dock endast för det datamaterial som ligger till grund för beräkning av modellen). Förutom att variabler kan bytas ut kan också tillägg av variabler göras. Ju fler variabler som väljs ju större krav måste ställas på modellens förklaringsgrad samtidigt som antal felkällor ökar. Hur lämplig modellen är för att prediktera

sockerskörd med valda variabler kan endast bedömas efter ett väl genomfört framtida valideringsarbete, i vilket även andra variabelkombinationer bör tas med. Modellen Modellen formuleras enligt följande (se kapitel.): Sockerskörd =. + (. vertikal infiltration) + (. ph i matjorden) + (-. sådatum) + (-. medelsvamp) Förutsatt att variablerna i modellen förklarar det som de är avsedda att representera i fält, och inte döljer okända fenomen som påverkar skördens storlek, anger interceptvärdet hur många ton socker modellens variabler inte förklarar, dvs i det här fallet. ton. Detta anger givetvis en osäkerhet eftersom den inte förklaras. Osäkerhet ligger dock inte bara i interceptvärdet utan även i både variablernas värden och i variablernas koefficienter i modellekvationen. Modellen är linjär vilket betyder att den inte tar hänsyn till asymptotiska värden, dvs värden där en ökning eller minskning inte längre ger något resultat. Därför måste en modell som baseras på linjära funktioner vara avgränsad för ett giltighetsområde som gäller varje ingående variabel. Giltiga områden här är för sådatum -, för kvert.-., för medelsvamp.-. och för ph.-.. För att modellen även ska vara giltig utanför dessa områden måste dels nya värden mätas upp genom framtida uppföljningsarbeten, dels varje variabel anpassas till en sigmoid responsfunktion, dvs i ytterlighetsområdena måste anpassning göras till en mindre och mindre inverkan på resultatet. Beräkningar Beräkningar med hjälp av modellen på värden från fältnivå för de pargårdarna och för till utan hänsyn till giltighetsområden visas i tabell.

Tabell. Beräknade skördedata, modell-skörd, jämfört med uppmätt skörd (variabelvärdena är inte korrigerade att ligga inom angivet giltighetsområde). Angivet är resultatet för de data som ger störst avvikelser från uppmätt skörd år fält så- vertikal ph i medel- skörd modell- differens datum infiltr. matjord svamp skörd skörd-modellskörd uppmätta värden..... -...... -...... -...... -...... -............ -...... -...... -...... -. uppmätta värden x koefficient (i ton) -... -... -. -... -... -. -... -... -. -... -... -. -...... -. -... -.... -...... -. -... -... -. -... -... -. -...... -. Höga vertikala infiltrationsvärden ger orimliga differenser mellan verklig skörd och beräknad. Detta visar att infiltrationsvärdet egentligen inte bör behandlas som ett linjärt värde, utan borde anpassas till ett asymptotiskt, dvs ju högre värde ju mindre effekt får man på skörderesultatet. Givetvis gäller samma resonemang om gränsvärden och giltighetsområde för alla ingående variabler. Ju högre precision som krävs av en modell ju bättre måste variablernas funktioner anges och därmed måste de övergå från linjära samband till någon typ av sigmoida, dvs s-formade. Resultatet av beräkningar med hjälp av modellen på värden från fältnivå för de pargårdarna och för till med hänsyn till giltighetsområden visas i tabell.

Tabell. Beräknade skördedata, modell-skörd, jämfört med uppmätt skörd (variabelvärdena är korrigerade att ligga inom angivet giltighetsområde) år fält så- vertikal ph i medel- skörd modell- differens datum infiltr. matjord svamp skörd skörd-modellskörd..... -...... -............ -...... -...... -...... -...... -.................. -............ -.................................... -........................ -............ -.................. -............ -...... -...... -............ -...... -...... -...... -...... -.................. -...... -. Förutom enskilda variabler kan också olika kombinationer av värden ge för stora differenser mellan verkligt skörderesultat och beräknat. Dock är det enbart enstaka fall där detta registrerats.

skörd-modellskörd skörd-modellskörd skörd-modellskörd - -. - -.. - -... -. - -... -. ±. ton. ±. ton -. ±. ton Figur. Fördelning av Figur. Fördelning av Figur. Fördelning av differenser mellan upp- differenser mellan upp- differenser mellan uppmätt och beräknad mätt och beräknad mätt och beräknad skörd för. skörd för. skörd för. skörd-modellskörd - -. - -... - -. ±. ton Figur. Fördelning av differenser mellan uppmätt och beräknad skörd för -. Figurerna - visar fördelningen på differensen mellan uppmätt skörd och beräknad skörd. Beräkningarna baseras på korrigerade värden. Det ideala vore att modellens värde var lika med uppmätt värde, dvs att differensen gav medelvärdet. med avvikelsen.. Medelvärden och avvikelsevärden för differensen mellan uppmätt och beräknad skörd ger en värdering av modellens tillförlitlighet. Modellen kan givetvis inte beräkna bättre än fel och avvikelser i de uppmätta värdena från provytorna. Det ligger alltså en osäkerhet dels i modellens komponenter, dels i de uppmätta värdena. Tabell visar korrigerade variabelvärden gånger koefficienten för variabeln i modellens ekvation vilket ger variabelns bidrag i ton till resultatet, dvs till resultatet sockerskörd. Störst bidrag har ph i matjorden. För att bedöma den beräknade skörden kan dock inte de enskilda värdena användas som förklaring eftersom modellen inte är en förklarande sådan.

Tabell. Beräknade variabelvärden enligt modellens ekvation (variabelvärdena är korrigerade att ligga inom angivet giltighetsområde) år fält sådatum*koeff vert. infiltr.*koeff ph i matjord*koeff medelsvamp*koeff -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. -... -. De uppmätta variablernas spridning i förhållande till skörderesultatet ger möjlighet till värdering över sambandet mellan beroende och oberoende variabel. Modellen kan givetvis inte beräkna bättre än fel och avvikelser i de uppmätta variablernas värden från provytorna. Alltså, det finns dels fel inbyggda i modellens ekvation, dels i de uppmätta värdena. De fel som är inbyggda i modellen kan dock inte bedömas utifrån enskilda variablers samband med skörd, utan måste värderas ur ett integrerat sammanhang, dvs ingen variabel är oberoende av någon annan, utan det är dessa tillsammans som utgör beräkningen av resultatet. Enkelt uttryckt in-

nebär det att vertikal infiltration och ph inte är oberoende av varandra och inte heller de övriga variablerna. I figurerna,,, och visas de enskilda sambanden mellan respektive oberoende variabel och skörd. Regressionslinjer för provytedata, fältmedelvärden och medelvärden - visas i figurerna. Ju mer regressionslinjerna ändrar sig ju ojämnare fördelade är provytedata och ju osäkrare blir medelvärdet. Detta ger en god indikation på antalet data som måste ligga till grund för det värde som ska beräknas i modellen... medelvärde -, r =. med elv är d e fö r fä lt, r =. provytor, r =.... skörd.......... ph i matjorden Figur. Samband mellan ph i matjorden och skörd (utvinnbart socker per ha).... medelvärde -, r =. medelv ärde för fält, r =. provytor, r =... skörd..... sådatum från första april Figur. Samband mellan sådatum från första april och skörd (utvinnbart socker per ha).

... medelvärde -, r =. medelvärde för fält, r =. provytor, r =.. skörd...... medelsvamp Figur. Samband mellan medelsvamp och skörd (utvinnbart socker per ha)..... medelvärde för -, r =. medelv är de för fält, r =. provytor, r =..... skörd. skörd...... medelvärde för -, r =. medelv ärde för fält, r =. provytor, r =.... vertikal infiltration vertikal infiltration Figur. Samband mellan vertikal infiltration och skörd (utvinnbart socker per ha). Alla värden medtagna. Figur. Samband mellan vertikal infiltration och skörd (utvinnbart socker per ha). Infiltrationsvärden över är inte synliga i figuren. Datafördelning för provytedata och fältmedelvärden Antalet observationer på provytenivå var totalt och för fältmedelvärden.

Figur. För variabeln sådatum på provytenivå (vänster figur) var medelvärdet. ±. dagar efter april. Maximumvärdet var och minimumvärdet dagar. Fältmedelvärdena var samma då varje provyta av såddes samtidigt. sådat sådat Figur. För variabeln vertikal infiltration på provytenivå (vänster figur) var medelvärdet. ±. cm per timme. Maximumvärdet var. och minimumvärdet. För fältmedelvärdena var medelvärdet. ±. cm per timme. Maximumvärdet var. och minimumvärdet. kvert kvert........... kvert Figur. För variabeln vertikal infiltration på provytenivå med värden över borttagna som outliers blev medelvärdet. ±. cm per timme. Maximumvärdet var. och minimumvärdet................... Figur. För variabeln ph i matjorden på provytenivå (vänster figur) var medelvärdet. ±.. Maximumvärdet var. och minimumvärdet.. För fältmedelvärdena var medelvärdet. ±.. Maximumvärdet var. och minimumvärdet...... phmatj..... phmatj................

Figur. För variabeln medelsvamp på provytenivå (vänster figur) var medelvärdet. ±. %. Maximumvärdet var. och minimumvärdet. För fältmedelvärdena var medelvärdet. ±. %. Maximumvärdet var. och minimumvärdet. medelsvamp medelsvamp......... Figur. För variabeln skörd, utvinnbart socker i ton per ha, på provytenivå (vänster figur) var medelvärdet. ±. ton. Maximumvärdet var. och minimumvärdet.. För fältmedelvärdena var medelvärdet. ±. ton. Maximumvärdet var. och minimumvärdet..... ueksh....... ueksh.... Förhållandet mellan uppmätt och beräknad skörd på respektive provytedata, fältmedelvärden och medelvärden - visas i figur. Det ideala förhållandet vore korrelationskoefficienter nära och ett intercept på samt en riktningskoefficient på, dvs en fullständig överensstämmelse mellan beräknat och uppmätt värde. beräknad mängd utvinnbart socker, ton ha - provytedata - regressionslinj e för provytedata fältmedelvärden, respektive regressions linje för fält data medelvärden - regressionslinje för medelvärden A=. B =. r =. A=. B =. r =. A=. B =. r =. uppmätt mängd utvinnbart socker, ton ha - Figur. Samband mellan uppmätt och beräknad skörd för provytedata, medelvärden resp. medelvärden -.

Datafördelning för respektive fältmedelvärdesvariabel gånger modellkoefficient Figurerna -, i detta avsnitt visar hur bidraget (variabelvärde gånger modellkoefficient) till den i modellen (nedan) beräknade sockerskörden fördelar sig för fältmedelvärden. Höga ändvärden beror oftast på att ett stort antal värden legat utanför giltighetsområdet och därför korrigerats till giltighetsområdets ändvärde. Sockerskörd =. + (. vertikal infiltration) + (. ph i matjorden) + (-. sådatum) + (-. medelsvamp) Figur. För variabeln vertikal infiltration gånger koefficienten (. x vertikal infiltration) var medelvärdet. ±. ton. Maximumvärdet var. och minimumvärdet. ton. kvert*koeff...... Figur. För variabeln vertikal infiltration gånger koefficienten adderat till interceptet (. +. x vertikal infiltration) var medelvärdet. ±. ton. Maximumvärdet var. och minimumvärdet. ton. intercept+kvert*koeff...... Figur. För variabeln ph i matjorden gånger koefficienten (. x ph i matjorden) var medelvärdet. ±. ton. Maximumvärdet var. och minimumvärdet. ton. phmatj*koeff.......

Figur. För variabeln ph i matjorden gånger koefficienten adderat till vertikal infiltration gånger koefficienten adderat till interceptet (. +. x vertikal infiltration +. x ph i matjorden) var medelvärdet. ±. ton. Maximumvärdet var. och minimumvärdet. ton. intercept+kvert*koeff+phmatj*koeff.... Figur. För variabeln sådatum gånger koefficienten (-. x sådatum) var medelvärdet -. ±. ton. Maximumvärdet i absoluta värden var -. och minimumvärdet -. ton. sådat*koeff - -. -. -. -.. intercept+kvert*koeff+phmatj*koeff+sådat*koeff Figur. För variabeln sådatum gånger koefficienten adderat till ph i matjorden gånger koefficienten adderat till vertikal infiltration gånger koefficienten adderat till interceptet (. +. x vertikal infiltration +. x ph i matjorden -. x sådatum) var medelvärdet. ±. ton. Maximumvärdet var. och minimumvärdet. ton..... Figur. För variabeln medelsvamp gånger koefficienten (-. x medelsvamp) var medelvärdet -. ±. ton. Maximumvärdet i absoluta värden var -. och minimumvärdet -. ton. medelsvamp*koeff -. - -. -. -. -..

Figur. För samtliga variabler gånger respektive koefficient adderat till interceptet (. +. x vertikal infiltration +. x ph i matjorden -. x sådatum -. x medelsvamp) var medelvärdet. ±. ton (. ±.). Maximumvärdet var. (.) och minimumvärdet. (.) ton. Inom parantes anges motsvarande värde för uppmätt skörd. modelsum..... Sammanfattning Modellens prediktionsstyrka beror dels på ingående komponenters tillräcklighet att beskriva sockerskörden, dels på datasäkerheten hos uppmätta värden. Exempelvis ingår inte någon kompentent som beskriver näringsstatus. En bristfällig näringsstatus i det fält som ska beskrivas kan ge lägre resultat på sockerskörden än vad modellen predikterar. Om modellen förutsätter optimal näringsstatus får den endast användas för fält med god näringsstatus. Denna typ av modellfel kan kallas systemfel och i exemplet skulle det innebära att modellen beskrivs med för få variabler. Ett annan typ av fel som ger felaktig prediktion är otillräckligt och felaktigt uppmätta värden. I figurerna och framgår att variabeln vertikal infiltration kan ge felaktiga värden om den inte behandlas rätt, dvs om inte tillräckligt många värden mäts upp så att ett medelvärde som korrekt beskriver fältets status används i modellen. Ett annat fel i modellen kan uppträda som sned fördelning kring medelvärdet för beräknad skörd. Figur visar att fördelningen kring medelvärdet för beräknad skörd inte är sned, vilket tyder på att något systemfel i modellens komponenter inte skulle finnas. Modellens lämplighet att prediktera sockerskörd med valda variabler kan endast bedömas efter ett väl genomfört valideringsarbete, i vilket även andra variabelkombinationer bör tas med. Detta arbete återstår och framtida möjligheter att validera modellen får utvisa lämplighet, prediktionsstyrka, eller om behov finns för modifieringar och korrigeringar. Referenser Johansson R.. System Modeling and Identification. Prentice Hall Information and System Sciences Series. Prentice Hall. ISBN. Brockington N. R.. Computer Modelling in Agriculture. Oxford University Press, Oxford.