Effektivare sågtimmermätning Metodutveckling. Modeller för klassning av sågtimmer enligt befintliga klasser

Relevanta dokument
Automatisk klassning av sågtimmer i 3d mätram

Effektivare sågtimmermätning Metodutveckling. Nya system för klassning av sågtimmer

Kontaktperson Datum Beteckning Sida Fredrik Persson (5) SP Trä

Dubbelklassning enligt VMR 1-07 och VMR 1-99

Kontroll av röntgenklassning av tallsågtimmer

InStat Exempel 4 Korrelation och Regression

Kontroll av automatisk bestämning av utbytesförlust

SF1911 Statistik för bioteknik: Autumn 2016 Lab 3 för CBIOT3. 1 Problem 1 - Fördelning av nukleotider i DNA

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Kontroll av automatisk bestämning av utbytesförlust

Marknadslista IM Område: Distrikt Uppland Period: och tills vidare

Multipel Regressionsmodellen

Slutrapport för projekt Effektivare Sågtimmermätning

MULTIPEL IMPUTATION - Ett sätt att hantera problemet med missing data

Analytisk statistik. Tony Pansell, optiker Universitetslektor

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Hur måttsätta osäkerheter?

3.8 Känslighetsanalys av modell. Introduktion. Hans Larsson och Olof Hellgren, SLU

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

MULTIPEL IMPUTATION. Ett sätt att fylla i hålen i ditt datamaterial?

Marknadslista IM Område: Distrikt Uppland Period: och tills vidare

Marknadslista IM Område: Uppland Period: och tills vidare

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Sänkningen av parasitnivåerna i blodet

Marknadslista IM Område: Härjedalen & Södra Jämtland Period: och tills vidare

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Förteckning över utredningar och rapporter redovisade genom Virkesmätningsrådet

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Marknadslista IM Område: Uppland Period: och tills vidare

Medicinsk statistik II

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Upprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland

Föreläsning 12: Regression

Aggregering av kapitalkrav i standardformeln i Solvens II. Magnus Carlehed

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Statistik 1 för biologer, logopeder och psykologer

Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?

MVE051/MSG Föreläsning 14

B-8106 Hassela/Plyfa- stockmätning av svarvtimmer av gran och rotstockar/grovtimmer av gran

OBS! Vi har nya rutiner.

Logistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013

Tentamen för kursen. Linjära statistiska modeller. 20 mars

3.6 Generella statistiska samband och en modell med för sockerskörden begränsande variabler

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Ny kvalitetsklassning av massaved

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Regressions- och Tidsserieanalys - F1

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

D72 Leveransvirke VIRKESPRISER D72. Leveransvirke fr o m

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

HYPOTESPRÖVNING sysselsättning

STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

2PUlNQLQJVWDOWLOOP IYLG WRSSPlWQLQJDYVnJWLPPHU

Bark på massaved en studie över barkhalten i travar med massaved

Kontroll av sektionsmätt stockvolym

Finansiell statistik

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Bedömningsanvisningar

Regressions- och Tidsserieanalys - F1

Övningshäfte till kursen Regressionsanalys och tidsserieanalys

Resursfördelningsmodellen

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Missing data och imputation eller Får man hitta på data? Lars Lindhagen, UCR

F12 Regression. Måns Thulin. Uppsala universitet Statistik för ingenjörer 28/ /24

Bearbetning och Presentation

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

LUNDS UNIVERSITET 1(6) STATISTISKA INSTITUTIONEN Per-Erik Isberg

OBS! Vi har nya rutiner.

Medicinsk statistik II

Uppgift 1. Produktmomentkorrelationskoefficienten

Marknadslista IM Område: Gästrikland, Dalarna Period: och tills vidare

Hitta rätt värde. Aptering av Tall

Statistiska Institutionen Gebrenegus Ghilagaber (docent)

Matematikcentrum 1(4) Matematisk Statistik Lunds Universitet MASB11 HT10. Laboration. Regressionsanalys (Sambandsanalys)

10.1 Enkel linjär regression

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

OBS! Vi har nya rutiner.

Modellutveckling 2015: Regressionsmodellen för inrikes inflyttning

Johan J Möller, Lennart Moberg Preliminärt första utkast. Stambank VMF Syd VMR 1-99 & VMR 1-07

Föreläsning G60 Statistiska metoder

import totalt, mkr index 85,23 100,00 107,36 103,76

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Ny kvalitetsklassning av massaved

Skrivning i ekonometri torsdagen den 8 februari 2007

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

KOMPLETTERANDE INSTRUKTIONER GÄLLANDE MÄTNING AV RUNDVIRKE

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Transkript:

Effektivare sågtimmermätning Metodutveckling Modeller för klassning av sågtimmer enligt befintliga klasser Preliminär version Jacob Edlund Institutionen för skoghushållning, SLU, Uppsala 30/8-2001 1

Innehållsförteckning Inledning... 3 Projekt Effektivare sågtimmermätning... 3 Syfte... 3 Modeller... 4 Variabeltröskelvärden... 4 Regressionsmodeller allmänt... 4 PLS... 4 Logistisk regression...5 Material och metoder... 6 Variabler... 6 Träningsset... 6 Testset... 7 Övergripande beslutsträd...8 Modellalternativ... 9 Förslag 1. Gränsvärden... 9 Förslag 2. PLS... 9 Förslag 3. Logistisk regression... 9 Prediktionsresultat... 9 Resultat... 11 Modellernas förklaringsgrad... 11 Träffprocent... 11 Diskussion... 13 Slutsatser... 13 Bilaga A. Modeller... 14 Bilaga B. Klassningsresultat... 16 Bilaga C. Förklaring av yttreformsvariabler... 18 2

Inledning Projekt Effektivare sågtimmermätning Vederlagsmätningen av barrsågtimmer sker idag främst som stockmätning, d v s som mätning stock för stock av ett virkesparti. Metoden bygger på ett stort inslag av subjektiva bedömningsmoment som ställer stora krav på virkesmätaren vad gäller kompetens, koncentrationsförmåga och uthållighet. Mätningen är således arbetsdryg vilket kan leda till att mätningskapaciteten blir begränsad. Eftersom virkesmätningen i regel är integrerad med sågverkets dimensionssortering blir effekten också att sorteringsanläggningens kapacitet inte alltid fullt kan utnyttjas. Virkesmätningen kan blir en "flaskhals" i timmerhanteringen. Ett sätt att förenkla vederlagsmätningen vore att så långt som möjligt automatisera de manuella momenten i mätningen. Genom att minimera monotona och stressande arbetsmoment skulle en bättre arbetssituation skapas. Projekt Effektivare sågtimmermätning är uppdelat på två delprojekt. En teknikdel och en metoddel. Mätningarna ingår i delprojektet metodutveckling. Arbetet i fält har genomförts i samarbete med tre försökssågverk: Martinssons Trä, Anebyhus och Boxholms såg. Stockdata har från förutom nämnda sågverk hämtats från Heby Såg och Forssjöbruk. Mätdata har erhållits från de tre virkesmätningsföreningarna. I ett framtida system med automatisk klassning av sågtimmer är en tanke att man visuellt på partinivå skall bedöma andelen fel med liten eller inget samband med yttre from såsom röta, frodvuxenhet och tjurved. Andelen av dessa fel kommer att ligga till grund för ett prisavdrag för det automatiskt mätta partiet. Denna rapport behandlar olika modellers förmåga att automatiskt klassa stockar enligt dagens system (VMR cirkulär Nr 1-99). Syfte Syftet med delprojektet är att utveckla automatiska modeller för klassning av stockar i enlighet med det befintliga systemet (VMR cirkulär Nr 1-99). 3

Modeller Variabeltröskelvärden Tidigare arbeten på inst. för Virkeslära (Blomqvist et al. 1988; Grace, 1994) har visat att tröskelvärden anpassade direkt till variabler kan användas vid sortering av stockar. Utsortering kan baseras på ett eller flera variabeltröskelvärden (ekvation 1). Om (variabel 1> tröskelvärde 1 och variabel 2 < tröskelvärde 2 ) klass X (ekvation 1) Ex. Om(Bulighet1<0,5 och rotavsmalning>15) klass 1+3 Sortering baserat på variabeltröskelvärden är ett till synes enkelt och ofta begripligt sätt att sortera stockar. Om det är fler än ett tröskelvärde vid varje steg kan dock utsorteringen vara svår att kalibrera. Utveckling av modeller med variabeltröskelvärden grundar sig på subjektiva metoder och kan därför anses otillförlitligt. Det är vidare svårt att validera modeller som enbart bygger på gränsvärden på annat sätt än andel träff vid test. Regressionsmodeller allmänt En regressionsmodell beräknar ett sannolikhetsvärde (P) från ett antal variabler på en stock (ekvation 2), detta värde beskriver sannolikheten att stocken är t.ex. klass 2. Till modellen anpassas ett funktionsgränsvärde, om P är större än detta värde, sorteras stocken ut (ekvation 3). Tröskelvärdet anpassas till önskad andel utsorterade stockar, högre tröskelvärde ger en mindre andel stockar och vice versa. P klassx = variabel 1* koefficient 1 + varaibel 2* koefficient 2 (ekvation 2) Om (funktionsgränsvärde klass X < P klassx ) klassx (ekvation 3) Ex. Om( P klass2 =bulighet1*0,5+toppavsmalning*15..> funktionsgränsvärde klass 2 ) klass2 Vid byggandet av modeller med regressionsmodeller är målet att hitta den informationen i de oberoende, förklarande variablerna (ex. rotavsmalning) som kan förklara variationen i de beroende variablerna (ex. kvalitetsklass). Mått på modellens förmåga att hitta denna variation är modellens förklaringsgrad, denna beskriver dock inte bara de sanna sambanden utan också slumpvisa (brus). En risk vid modellering är att modellerna har anpassats i för hög grad till de data som de är utvecklade på (träningsetet), av denna anledning bör modellerna testas på andra data (testset). PLS PLS regression har visat sig användbart vid stora dataset med korrelerade variabler och när det finns brus i datasetet, vilket ofta förekommer i en mätram. För att avgöra andelen brus kan prediktionsförmågan Q 2, som anger hur bra modellen är för att förutsäga nya observationer, jämföras med R 2, vilket är värdet på modellens förklaringsgrad. När Q 2 är lägre än R 2 är modellen överanpassad och kommer således fungera sämre på andra dataset än testsetet. Man bör därmed eftersträva en högt värde på R 2 förutsatt att inte Q 2 inte skiljer sig för mycket från detta värde. PLS- regression har använts på stockdata av ett fler forskare (Oja, 1999; Hagman, 1993) 4

Logistisk regression Logistisk regression är sedan en längre tid statistisk etablerad metod att prediktera binära responsvariabler, dvs sortering i två klasser. Studier av Press och Wilson (1978) har visat att den logistiska funktionen (ekvation 4) är mer robust i jämförelse med en linjär funktion då underliggande data innehåller mycket brus. Logistisk regression har använts av bl.a. Jäppinen (2000) på stockdata. f ( ) = e P klass (ekvation 4) ( ) 1+ e f Där f ( ) är en linjär funktion med valda variabler. Metoden använd att bestämma den logistiska modellens förklaringsgrad, C är baserad på reciever operating curve (Hanley och Macneill, 1982). Där det maximala värdet är 1 och minimala värdet är 0. C är inte direkt jämförbar med PLS modellen R 2. 5

Material och metoder Variabler Fyra huvudtyper av variabler användes i försöket, avsmalning, bulighet, krök och ovalitet. Variablerna har utvecklats av Lundgren (1999) för tall, variablerna har även använts på granstockar (Jäppinen, 2000). Inledande studier visade att dimensionen hade ett linjärt samband med avsmalningen och att modellerna kunde förbättrades om avsmalningsvariablerna dividerades med stockens diameter. Vid modellering användes både de bearbetade variablerna och originalvariablerna. (Bilaga C) Träningsset För att en modell skall bli robust och fungera ändamålsenligt bör man välja ut träningsset med stor varsamhet. Det bör innehålla ett stort material stockar för att täcka in de variationer som normalt förväntas i det material man skall använda modellerna på. Träningssetet samlades in på tre sågverk; Martinsson Trä (Bygdsiljum) i norra delen av landet, Anebyhus och Boxholms Såg i södra delen av landet. Stockarna samlades in under en period av 5 veckor för att få ett så representativt urval som möjligt i de tre dimensionsklasserna och kvalitetsklasserna. När stockarna var insamlade bedömdes kvalitetsklass, stockdimension och nedklassningsorsak. Stockarna numrerades i ändytorna så att rätt stock kunde kopplas till rätt mätramsdata. Stockarna mättes sedan in i mätramen. Målet var att vid varje sågverk insamla 20 stockar i varje dimension och kvalitetsklass. Då stockar i vissa klasser och dimensioner förekommer sparsamt uppnåddes inte målet. Andelen stockar i klass 1 och 9 samt stockarna i klass 2 i grövre dimensioner var betydligt lägre än i övriga klasser för båda trädslagen. Totalt mättes 722 stockar varav 433 tallstockar och 289 granstockar (Tabell 1 och Tabell 2). Tabell 1.Tall. Träningsset Dim. (mm) 1 2 3 4 5 9 Total (152-163) 17 38 39 52 31 4 181 (226-243) 28 5 40 42 30 13 158 (335-359) 11 0 30 30 16 7 94 Total 56 43 109 124 77 24 433 Tabell 2. Gran. Träningsset Dim. (mm) 1 2 3 4 9 Summa (155-164) 5 43 40 25 10 123 (247-259) 8 6 50 26 5 95 (305-324) 1 0 40 22 8 71 Total 14 49 130 73 23 289 6

Testset Sedan våren 2000 har rådata på samtliga kontrollstockars yttre form samlats in från 5 sågverk i landet (tabell 3 och 4). Utifrån dessa data beräknades yttreformsvariabler. Med hjälp av stocknummer kompletterades varje stocks variabler med mätdata (klass, trädslag etc.) från kontroll- och ordinarie mätning, dessa data erhölls från mätningsföreningarna. Beräknad klass enligt modellerna kunde därmed jämföras med kontrollmätarens klassning. Mätdata gav också möjlighet att jämföra för den ordinarie klassningen med kontrollmätningens klassning. Tabell 3.Tall. Testset Klass 1 2 3 4 5 9 Totalt Bygdsiljum 46 121 91 297 42 42 683 Aneby 2 5 8 62 9 87 Forssjö 35 24 93 632 100 22 1017 Boxholm 14 26 33 229 26 5 490 Heby 2 3 1 6 Tabell 4. Gran. Testset Klass 1 2 3 4 9 Totalt Bygdsiljum 226 409 71 62 818 Aneby 3 86 339 64 5 514 Forssjö 7 236 528 113 17 975 Boxholm 1 97 197 45 4 523 Heby 18 529 1150 275 40 2069 Tall Studien som redovisas i Resultat från provsågningar vid Martinssons Trä, Anebyhus och Boxhols Såg visade att tall klass 1 och 3 hade en liknande fördelning av utbytenas kvalitet samt likvärdiga mått på yttre form och kunde slås ihop (fortsättningsvis kallad klass 1+3). Klass 2 tall skilde sig med avseende på yttre form och utbytets egenskaper med avseende på andel friskkvist från andra stockkvalitetsklasser. Övriga kvalitetsklasser ansågs svåra att prediktera med yttreformsvariabler och föreslogs slås samman. Gran I studien redovisas granens stockegenskaper i respektive kvalitetsklass enligt VMR. En sammanslagning av klasserna 1 och 3 föreslogs trots en viss skillnad mellan klassernas egenskaperna. Anledningen till detta var främst att andelen klass 1 stockar normalt är låg i förhållande till övriga klasser. Övriga klasser föreslogs slås samman beroende på att dels att det var svåra att definiera med avseende på yttre form. 7

Övergripande beslutsträd Vid sortering av stockar i klasser enligt VMR Nr 1-99, krävdes en sortering i flera steg beroende på att klasserna inte ligger på ordinal skala, d.v.s. yttreformsvariablerna inte linjärt beror av ökad kvalitetsklass. För sortering i flera steg skapades ett beslutsträd baserat på tidigare nämnda klass-sammanlagningar, med avvikelsen att gran, klass 2 inte slogs samman med klass 4, och att vissa klass 9 stockar sorterades ut. I beslutsträdet (se nedan) lades även en maximal gräns för diametern på klass 2 stockar. Beslutsträdet anpassades till dels funktionsgränsvärden och dels variabelgränsvärden (Förslag 1-3). Steg 1. Klass 9 Längd > 28 cm Längd< 57 cm Diameter>10 cm Diameter< 75 cm Utslag i metalldetektor Ja Klass 9 Nej Steg 2. Klass 1+ 3 PLS eller Log reg. P(1+3)>Offset(1+3) Gränsvärden Om Villkor (klass 1+3) Ja Klass 1+3 Nej Diam<240 Ja Nej Steg 3. Klass 2 PLS eller Log reg. P(1+3)>Offset(2) Gränsvärden Om Villkor (klass 2) Ja Klass 2 Nej Steg 4. Övriga Klass 4+(5)+9 8

Modellalternativ Förslag 1. Gränsvärden Variabelgränsvärden togs fram genom att studera vilka variabler inom respektive klass som skilde sig från samma variabler i övriga klasser. Var medelvärdet av variablerna inom en klass väsentligt högre eller lägre än medelvärdet av samma variabel inom övriga klasser, provades den i ett beslutsträd. Erfarenhet av tidigare studier samt simuleringar i SAS och Simca har även varit till hjälp. Förslag 2. PLS PLS modeller skapades med programmet SIMCA-P 8.0 med målet att erhålla modeller med relativt få variabler och med en hög förklaringsgrad R 2 och prediktionsförmåga Q 2. I vissa fall har ett lägre antal variabler prioriterats före ett högre R 2 värde, speciellt då variablerna inte har något uppenbart samband med förväntad egenskap i klassen. För modellerna redovisas R 2, Q 2 samt koefficienter för variabler. Förslag 3. Logistisk regression För modellering utnyttjades SAS funktion för stegvis val av variabler. Signifikans nivån för val av variabel sattes till 0,05. I tabellerna redovisas koefficient, signifikans nivå och standard avvikelse. Prediktionsresultat För utvärdering av utfall har två nyckeltal använts, träffprocent och aritmetisk träffprocent. Träffprocenten defineras i ekvation 5 och redovisar andelen totalt rätt klassade stockar i procent av totala antalet stockar. Aritmetisk träffprocent definieras som andelen rätt klassade stockar inom en klass (ekvation 6). Träffprocenter beräknas utifrån en eventualitetstabell, denna är uppbyggd enligt principen i tabell 6. Tabell 6. Exempel på eventualitetstabell. Modell Klass 1 Klass 2.. Klass n Kontroll Klass 1 N 11 N 12 N 1n Klass 2 N 21 N 22 N 2n.. Klass n N n1 N n2.. N nn Träffprocent totalt= N + N N +... + N Aritmetisk träffprocent, klass 1 = N 11 12 11 11 + N 1n 22 + N +... + N 21 + N 22 N11 + N 21 +... + N n nn + N 1 2n... + N nn (ekvaton 5) (ekvation 6) Prediktionsresultatet påverkas av andelen stockar i respektive klass, t.ex kan man på ett enkelt sätt få en träffprocent och aritmetisk träffprocent (för klass 4, tall) på 71% genom att klassa alla tallstockar i klass 4, detta hade dock gett en aritmetisk träffprocent på noll i övriga klasser. Det är av samma anledning lättare att få en hög aritmetisk träffprocent i en högfrekvent klass i jämförelse med en lågfrekvent klass. Storleken på träffprocenten är således i hög grad beroende av fördelningen av stockar i resp. klass. 9

Fördelningen av stockar har i denna studie styrts med hjälp av gränsvärden för att få en i så hög grad lika fördelning av stockar som i kontrollen. Som jämförelse redovisas i resultatdelen en slumpmässig fördelning av stockar, där sannolikheten att en stock skall bli klassad i en klass är lika stor som andelen stockar i samma klass enligt kontrollen. Denna träffprocent skall alltså tolkas som en klassning där hänsyn endast tas till att fördelningen av stockar skall vara lika med kontrollmätningen. 10

Resultat Modellernas förklaringsgrad Modellernas förklaringsgrad anges för PLS som R 2 och Q 2 för logistisk regression som C, dessa värden är dock inte direkt jämförbara. I tabell 6 redovisas modellernas förklaringsgrad. För förslag 1, gränsvärden finns inga nyckeltal för modellens förklaringsgrad definierad. Tabell 6. Modellernas förklaringsgrad PLS Log. reg. Klass R 2 Q 2 C Tall Klass 2 0.264 0.213 0.83 Klass 1+3 0.237 0.23 0.8 Gran Klass 2 0.303 0.263 0,89 Klass 1+3 0.241 0.213 0.751 I bilaga A redovisas för PLS och logistisk regression variabler, koefficienter samt för logistisk regression signifikansnivån för varje koefficient. Variabler och koefficienterna har automatiskt bestämts med avseende på bästa möjliga träffprocent. Modellerna har mellan 5 och 9 variabler, i vissa fall har de bearbetade variablerna använts. Variabelgränsvärden för gränsvärdesalternativet redovisas i bilaga A. Träffprocent Tall Ingen av de olika modellerna kunde överträffa ordinarie mätning som hade en träffprocent på 78,9 %, de tre olika alternativen var relativt likvärdiga och hade en träffprocent på ca 72 %. Slump modellen hade ett sämre utfall både vad gäller träffprocent (54,2%) och de aritmetiska träffprocenterna, vilket visar att modellerna var relevanta. I tabell 7 redovisas träffprocenter och aritmetiska träffprocenter för tall, i bilaga B redovisas alla eventualitetstabellerna till fullo. Ur eventualitetstabellerna kan man utläsa att ett mycket litet antal stockar i klass 1+3 klassades som klass 2 och vice versa, enligt de tre förslagen. Tabell 7. Tall, testset. Träffprocent och aritmetisk träffprocent vid klassning med beslutsträd och vid användantet av olika modeller. Klass Andel Ordinarie Gräns. PLS Log. Reg. Slump stockar, (%) (%) (%) (%) (%) kontroll Träffprocent (%) 78.9 72.2 72.9 71.8 54.2 Aritmetisk träffprocent 2 8.9 62 51 58 55 9 1+3 16.3 64 49 47 46 16 4+5 71.1 84 80 80 80 71 9 3.6 70 67 67 67 4 11

Gran Träffprocenten för den ordinarie mätningen var 71%. PLS och logistisk regression var likvärdiga med träffprocenter på 61,5 resp. 61,7 % vilket var cirka 19 %-enheter bättre än slump modellen. Träffprocenten för gränsvärdes alternativet var endast 6,4%-enheter bättre än slump modellen. I bilaga redovisas alla tabeller tabellerna till fullo, dessa visar att relativt fler klass 1+3 stockar klassas som klass 2 stockar, i jämförelse med klassning av tall. Tabell 8. Gran, testset. Träffprocent och aritmetisk träffprocent vid klassning med beslutsträd och vid användantet av olika modeller. Klass Andel Ordinarie Gräns. PLS Log Slump stockar (%) (%) (%) (%) (%) (%) Träffprocent 71.0 49.2 61.5 61.7 42.8 Aritmetisk träffprocent 2 25.0 69 45 57 59 26 1+3 62.5 76 63 72 71 59 4 11.6 47 14 22 22 13 9 3.2 69 18 18 18 3 12

Diskussion Då träffprocenten är beroende av fördelningen av stockar i de olika klasserna, jämförs dessa inte mot ett nollvärde utan mot resultat från klassningen i slump modellen och ordinarie klassning. Prediktionsresultatet för tall visar att de tre förslagen är likvärdiga med avseende på träffprocent och aritmetisk träffprocent. Alla tre förslag skiljer med stor träffsäkerhet på klass1+3 och klass 2 stockar. För gran är prediktionresultatet för förslaget gränsvärden betydligt sämre än PLS och logistisk regression, vilka är likvärdiga. Många stockar som klassas i bättre klasser enligt modellerna men klassats som klass 4 i kontrollen är troligtvis sådana att de klassats ner på grund av ändytefel eller andra fel som inte kan detekteras via yttre form. I det tänkta automatiska systemet kommer dock bedömningar av ändytefel på partinivå kompensera för denna brist i den automatiska yttreformsklassningen. Resultatet av studien kan utvärderas dels med avseende på modellernas förklaringsgrad, dels prediktionsresultat men också användbarhet i automatiskt system, anpassning till olika mätramstyper, möjligheter till kalibrering och modellernas pedagogiska genomlyslighet. Gränsvärdesmetoden är till synes ett begripbart system där gränsvärden anpassas direkt till några lämpliga variabler. Vid kalibrering uppstår dock problem, om t.ex andelen klass 2 stockar blir för låg måste räcker det inte med att minska gränsvärdet för toppavsmalning utan även öka gränsvärdet för bulighets variabeln, givet att man använder föreslagna variabler. Ett robust system med flera variabler att ta hänsyn till kräver att man eventuellt måste tillämpa linjär programmering el. liknande. Kalibreringen för regressionsmodellerna är ett mindre problem, då endast ett gränsvärde, funktionsgränsvärdet behöver justeras, för att öka och minska andelen stockar i en klass. Nyckeltal för förklaringsgraden hos PLS- och logistiska regressionsmodeller är inte direkt jämförbara och prediktionsresultaten var relativt lika för dessa alternativ. Ett val mellan dessa alternativ bör därför snarare baseras på användbarhet, möjlighet till kalibrering och pedagogisk genomlyslighet. Slutsatser PLS modeller och logistiska regressions modeller var likvärdiga med avseende träffprocenten. Träffprocenterna var mellan 17,5-19 %-enheter bättre än slumpmodellen och 6-9,5%-enheter sämre än ordinarie klassning för båda trädslag. Gränsvärdesalternativet var likvärdigt med övriga modeller vid klassning av tall, gränsvärdesalternativet fungerade dock sämre för gran 21, 9 %-enheter sämre än ordinarie klassning. Gränsvärdes alternativet kan i ett automatiskt system vara svårt att kalibrera utan användning av linjär programmering. Val mellan PLS och logistisk regression bör ske på grundval av användbarhet i automatiska system, möjlighet till kalibrering och pedagogisk genomlyslighet. 13

Bilaga A. Modeller Tabell A1.Tall. Variabelgränsvärden och koefficenter för modeller. Klass 1+3 Klass 2 Gränsvärden 2mxavsm > 0.078 bump1 < 4.8 Variabel Koefficient Konstant 0.739042 2topp -0.0653755 2rot 0.145515 2mavsm 0.191746 2mxavsm -0.0261412 Bump3-0.125684 Uneven0-0.0900639 Uneven5-0.13449 Rot 0.180062 Mxavsm 0.0120331 2topp > 0.064 bump1 > 5 Diam < 240 mxdif < 14 PLS Variabel Koefficient Konstant 0.393646 2topp 0.248936 2rot -0.169306 2maxov1 0.0896891 2medov_1 0.0909246 2antal_kr 0.149041 Bump1-0.0195646 Rotov_2 0.0412743 Kr_5-0.125788 Variabel Logistisk regression Koefficient Signifikans Variabel Koefficient Signifikans Konstant -1.2221 0.1609 Topp -0.0965 0.0277 Rot 0.0293 0.0001 Mxdiff2-0.136 0.0428 Mavsm 0.3367 0.0001 Kr_5-0.0165 0.0265 Bump1 0.3735 0.0164 Bump3-1.0994 0.0002 Konstant -3.926 0.0003 Topp 0.164 0.004 Mxavsm -0.1313 0.0005 Kr_5-0.0365 0.0124 Bump1 0.6023 0.0022 14

Tabell A2. Gran. Variabelgränsvärden och koefficenter för modeller Klass 1+3 Klass 2 Gränsvärden 2mxavsm > 0.035 Bump1 < 5.1 PLS Variabel Koefficient Variabel Konstant 0.96477 2topp -0.110239 2rot 0.107279 uneven0-0.119772 uneven1-0.140135 uneven3-0.0665969 uneven4-0.0471037 uneven5-0.0330935 Rot 0.102004 rotov_2-0.0775452 Logistisk regression Variabel Koefficient Signifikans Variabel Konstant 11.4872 0.0069 2rot 3.0899 0.0066 2mavsm -38.6335 0.0128 Uneven0-0.0922 0.0001 Rotoval_1-9.3692 0.0322 2topp > 0.052 bump1 > 2.7 Diam < 240 Mxdif < 14 Koefficient Konstant 0.483143 2topp 0.219763 2rot -0.195309 2mavsm 0.120649 2rotov_2 0.173159 2kr_pos 0.0482512 mndif 0.0329631 mxdif2-0.0372795 Koefficient Signifikans Konstant -2.4226 0.3518 2rot -22.8174 0.0016 2maxoval1 940.3 0.0057 Mxdif 0.5052 0.0352 Mndif 1.3004 0.0008 Mavsm 0.5654 0.0075 15

Bilaga B. Klassningsresultat Tabell B1.Tall. Eventualitetstabeller för klassning av tallstockar enligt förslag 1-3, ordinarie klassning samt slump modell. Viktad TP Gränsvärden Aritmetisk TP Andel, kontroll 72.2% 2 1+3 4 9 Kontroll 2 92 1 83 2 52% 8.9% 1+3 2 150 172 0 46% 16.3% 4+5 74 153 1182 4 84% 71.0% 9 13 0 49 12 16% 3.7% Aritmetisk TP 51% 49% 80% 67% Andel, modell 9.1% 15.3% 74.7% 0.9% Viktad TP PLS Aritmetisk TP Andel, kontroll 72.9% 2 1+3 4 9 Kontroll 2 97 1 78 2 54% 8.9% 1+3 1 138 185 0 43% 16.3% 4+5 57 150 1202 4 85% 71.0% 9 12 4 46 12 16% 3.7% Aritmetisk TP 58% 47% 80% 67% Andel, modell 8.4% 14.7% 76.0% 0.9% Viktad TP Logistisk regression Aritmetisk Andel, TP kontroll 71.8% 2 1+3 4 9 Kontroll 2 103 0 73 2 58% 8.9% 1+3 1 150 173 0 46% 16.3% 4+5 74 172 1163 4 82% 71.0% 9 10 3 49 12 16% 3.7% Aritmetisk TP 55% 46% 80% 67% Andel, modell 9.5% 16.3% 73.3% 0.9% Viktad TP Ordinarie Aritmetisk TP 78.9% 2 1+3 4 9 Andel, kontroll Kontroll 2 108 3 67 0 61% 8.9% 1+3 4 171 148 0 53% 16.3% 4+5 56 92 1245 16 88% 71.1% 9 5 2 25 39 55% 3.6% Aritmetisk TP 62% 64% 84% 70% Andel, ordinarie 8.7% 13.5% 75.0% 2.8% Viktad TP Slump Aritmetisk Andel, TP kontroll 54.2% 2 1+3 4 9 Kontroll 2 0.8% 1.5% 6.3% 0.3% 9% 8.9% 1+3 1.5% 2.7% 11.6% 0.6% 16% 16.3% 4 6.3% 11.6% 50.6% 2.5% 71% 71.1% 9 0.3% 0.6% 2.5% 0.1% 4% 3.6% Aritmetisk TP 9% 16% 71% 4% Andel, Kontroll 8.9% 16.3% 71.1% 3.6% 16

Bilaga B2. Gran. Eventualitetstabeller för klassning av tallstockar enligt förslag 1-3, ordinarie klassning samt slump modell. Viktad TP Gränsvärden Aritmetisk Andel, TP kontroll 49.2% 2 1+3 4 9 Kontroll 2 460 576 139 2 39% 26.0% 1+3 417 1639 594 8 62% 58.6% 4 126 312 127 4 22% 12.5% 9 27 73 28 3 2% 2.9% Aritmetisk TP 45% 63% 14% 18% Andel, modell 22.7% 57.3% 19.6% 0.4% Viktad TP PLS Aritmetisk Andel, TP kontroll 61.5% 2 1+3 4 9 Kontroll 2 664 371 140 2 56% 26.0% 1+3 360 1983 307 8 75% 58.6% 4 100 327 138 4 24% 12.5% 9 32 66 30 3 2% 2.9% Aritmetisk TP 57% 72% 22% 18% Andel, modell 25.5% 60.6% 13.6% 0.4% Viktad TP Logistisk regression Aritmetisk TP 61.7% 2 1+3 4 9 Andel, kontroll Kontroll 2 616 410 149 2 52% 26.0% 1+3 302 2045 303 8 77% 58.6% 4 90 340 135 4 24% 12.5% 9 29 69 30 3 2% 2.9% Aritmetisk TP 59% 71% 22% 18% Andel, modell 22.9% 63.2% 13.6% 0.4% Viktad TP Ordinarie Aritmetisk Andel, TP kontroll 70.9% 2 1+3 4 9 Kontroll 2 754 371 49 3 64% 26.0% 1+3 292 2136 218 11 80% 58.6% 4 31 261 261 16 46% 12.6% 9 8 25 28 68 53% 2.8% Aritmetisk TP 69% 76% 47% 69% Andel, ordinarie 23.9% 61.6% 12.3% 2.2% Viktad TP Slump Aritmetisk TP Andel, kontroll 42.8% 2 1+3 4 9 Kontroll 2 6.7% 15.2% 3.3% 0.7% 26% 26.0% 1+3 15.2% 34.4% 7.4% 1.7% 59% 58.6% 4 3.3% 7.4% 1.6% 0.4% 13% 12.6% 9 0.7% 1.7% 0.4% 0.1% 3% 2.8% Aritmetisk TP 26% 59% 13% 3% Andel, Kontroll 26.0% 58.6% 12.6% 2.8% 17

Bilaga C. Förklaring av yttreformsvariabler Type of feature Variable/suggested name of variable Unevenness uneven1... uneven9* bump1... bump9* Description No data points > index value per mantle surface area unit, 0.8 m from butt end excluded No data points > index value per mantle surface area unit, whole log mxdif1* Maximum positive deviation from reference plane, whole log Mndif1 Minimum positive deviation from reference plane, whole log mxdif2* Maximum positive deviation from reference plane, 0.8m from butt end excluded Mndif2 Minimum positive deviation from reference plane, 0.8m from butt end excluded Taper Butt Difference between diameters at 0.05 m and 0.80 m from butt end expressed as mm/m Topp Difference between diameters at 0.5m and 2.05 m from top end expressed as mm/m Mavsm Median of approximate first derivative of radius curve Mxavsm Maximum of approximate first derivative of radius curve Mnavsm Minimum of approximate first derivative of radius curve Out-of-roundness Maxov1 Maximum eccentricity DiameterMax Eccentricity = DiameterMin Medov_1 Median eccentricity Medov_2 Median ovality DiameterMax Diameter90 from Max Ovality = Diameter 90 from Max Rotov_1 Eccentricity 0.05 m from butt end Straightness Kr_5 Maximum deviation of the logs actual centre line from a perfect straight line connecting the two end surface centra Mvink The sum of angular deviation of centre line from perfect straight line weighted by distance from perfect straight line. Antal_kr Number of maximum points on the centre line Number 2 in front of the variabel means that the variabel has been divided by the diameter ex. 2butt. 18