Kommentarer till behandlingen av data som ligger till grund för den statistiska utvärderingen av Genetisk Analys av Svenska Vorstehklubbens Jaktprov.



Relevanta dokument
Effektivare avel för jaktegenskaper hos engelsk setter

Rasspecifik avelsstrategi RAS för Korthårig vorsteh

Rasspecifik avelsstrategi RAS för. Korthårig vorsteh

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Rasspecifik avelsstrategi RAS för Strävhårig Vizsla

AVELSSTRATEGI (RAS) För Strävhårig Vizsla

Rasspecifik avelsstrategi RAS för Strävhårig vorsteh

Rasspecifik avelsstrategi RAS för Korthårig Vizsla

13.1 Matematisk statistik

Information om SKK:s index för HD och ED

Rasspecifik avelsstrategi RAS för Strävhårig vorsteh

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Kleiner münsterländer

Kort om mätosäkerhet

Rasspecifik avelsstrategi RAS för Kleiner münsterländer

Curt gick igenom de sju stora grupperna kring hundars mentalitet i relation till vår ras.

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Hur skriver man statistikavsnittet i en ansökan?

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Rasspecifik avelsstrategi RAS för. Långhårig vorsteh. Både uppfödare och hanhundsägare bör sätta sig in i den avelstrategi som gäller för rasen

Valresultat Riksdagen 2018

Avelskonferens Svenska Stövarklubben Upplands Väsby

Utvärdering av Svenska Bullterrierklubbens RAS, verksamhetsåret 2008

Sofia Malm, Artikeln får fritt publiceras av ras- och specialklubbar på webbplats eller i tidning

MH SOM HJÄLPMEDEL I HUNDAVELN

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 7 maj, 2011

3 Protokollförare Styrelsen anmälde att Ulla-Britt Schwang skulle vara protokollförare vid mötet.

AR:s sammanställning av SSK:s Uppfödarenkät 2014

EXAMINATION KVANTITATIV METOD

AVELSSTRATEGI (RAS) för Korthårig Vizsla

STATISTISK POWER OCH STICKPROVSDIMENSIONERING

Det är fåfängt att göra med mera det som kan göras med mindre

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Information om index för HD och ED

Introduktion till statistik för statsvetare

Vad man bör tänka på när man har en liten ras? Erling Strandberg, professor vid institutionen för husdjursgenetik, SLU, Uppsala

Betygskriterier för examensarbete/självständigt arbete

Beskrivande statistik

Minnesanteckningar SVK:s avelskonferens

PM FÖR UTBILDNING OCH AUKTORISATION AV DOMARE VID JAKTPROV OCH FULLBRUKSPROV

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

FÅ FRAM INDATA. När inga data finns!? Beslutsfattarens dilemma är att det är svårt att spå! Särskilt om framtiden!

Mentalitet och avel. sid 1

RAS Rasspecifika avelsstrategier.

PM FÖR REDOVISNING AV PROV OCH UTSTÄLLNING

FRÅGEFORMULÄR 0M STUDIEVANOR

SSK s nyhetsbrev för uppfödare av engelsk setter

HD-index. ett nytt verktyg i avelsarbetet för bättre ledhälsa. Text: Sofia Malm, Foto: Åsa Lindholm

Kursutvärdering av Introduktionskursen, 7 poäng, ht 2006

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

8 Gäldenärernas inställning till snabbhet

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Vägda medeltal och standardvägning

Mycket information i nyhetsbrevet.

Naturliga populationers evolution och bevarande, 6hp

Experimentella metoder 2014, Räkneövning 1

Utvärdering av Svenska Bullterrierklubbens RAS, verksamhetsåret

KAN SKADLIGA GENER UTROTAS?

Rasspecifik Avelsstrategi

3.8 Känslighetsanalys av modell. Introduktion. Hans Larsson och Olof Hellgren, SLU

Astrakan Strategisk Utbildning AB

Effekten av hälsoprogram avseende HD hos schäfer. Av Monica Henriksson Statistik David Lundgren/ Erik Vikström

2 Dataanalys och beskrivande statistik

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

STOCKHOLMS UNIVERSITET FYSIKUM

Den gröna påsen i Linköpings kommun

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

WestieAlliansens styrelse, gm ordförande Monica Richard, har gjort denna sammanställning. Layout Ingegerd Grünberger och Monica Richard. 1.

Avelsvärdering med index. Sofia Malm

Välkommen till Kennel Twigg s

Provmoment: Tentamen 3 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Avelsvärdering för HD och AD. Sofia Lindberg Institutionen för husdjursgenetik, SLU

Antalet registrerade westie och medlemmar i WestieAlliansen

Bichon Havanais. Uppfödarträff Scandic Elmia Sammanfattning

Rasspecifik Avelsstrategi. Berner Sennenhund. Utarbetad av Svenska Sennenhundklubbens Avelsråd i samarbete med uppfödare, täckhundsägare och hundägare

Avelspolicy & avelsstrategier

Svenska Älghundklubben och Hälleforshundklubbens Rasstrategi för Hälleforshunden

Uppgift 1. Deskripitiv statistik. Lön

Utvärdering av HD-/ED-index i avelsarbetet under perioden

Examinationsuppgift 2014

Urvalskriterier för projekt inom lokalt ledd utveckling

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

PM FÖR REDOVISNING AV PROV OCH UTSTÄLLNING

Utvärdering RAS Rasspecifik avelsstrategi för NORSK LUNDEHUND

RAS Rasspecifika avelsstrategier.

RAS - Rasspecifik Avelsstrategi Grönlandshund, september

Följande resultat erhålls (enhet: 1000psi):

Kvinnor och män i statistiken 11

1 Mätdata och statistik

Att beräkna t i l l v ä x t takter i Excel

Regeländringar synpunkter på förslag från Regelkomiten. Ersättande av Ukl med unghundstest


TENTAMEN. PC1307/1546 Statistik (5 hp) Måndag den 19 oktober, 2009

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

Detta frågekompendium är avsett att användas i kombination med kompendiet för utbildning av provledare inom Svenska Vorstehklubben.

TENTAMEN. SAMHÄLLSVETENSKAPLIG FORSKNINGSMETODIK Kurs 7 PC1307. Forskningsmetodik 10 poäng (ECTS) Måndag den 13 oktober, 2008

Utvärdering av HD-/ED-index i avelsarbetet under perioden

FRÅGEKOMPENDIUM. Detta frågekompendium är avsett att användas i kombination med kompendiet för utbildning av provledare inom Svenska Vorstehklubben.

GOLDEN RETRIEVERKLUBBEN AVELSPOLICY & AVELSSTRATEGIER

Transkript:

Kommentarer till behandlingen av data som ligger till grund för den statistiska utvärderingen av Genetisk Analys av Svenska Vorstehklubbens Jaktprov. Rolf Bergman Gammelhöjdas Kennel I examensarbetet Genetisk Analys av Svenska Vorstehklubbens Jaktprov, som utförts av Rickard Henriksson vid SLU, framkommer en del intressanta frågeställningar om arvbarhet. Inte minst är detta intressant för uppfödare och avelsråd, som försöker förbättra avelsresultaten med stöd av det samlade kunnandet inom området. I dag finns en enorm mängd data i databaser, men frågan är hur man kan utvärdera data för att för ändamålet få användbar information. Innan man kan dra några säkra slutsatser om signifikansen av arvbarheten av vissa egenskaper, bör man kritiskt granska hur jaktprovsdata har behandlats. Några frågor: 1. Värderas rätt egenskaper/variabler på jaktproven 2. Är precisionen tillräcklig i jaktprovsdata för att kunna uttala sig om arvbarheten av egenskaperna? Jaktprovsdata har förvånansvärt, inte bara i den aktuella rapporten, betraktats som metriska data(numeriskt värde), vilket inte är korrekt då de egenskapspoäng som våra jaktprovsdomare sätter under jaktproven är så kallade kategorivariabler. Till exempel, egenskaperna fart och vidd, som har nivåerna 1-5, innebär inte att domaren mäter den absoluta hastigheten eller kontrollerar hur långt ut hunden söker. Domaren gör t.ex. bedömningen att hunden för dagen uppvisar fart och vidd som uppfyller kriterierna för, fart 4 och vidd 4. Domaren bedömer således inte direkt hundens fart i m/s eller vidden i antal meter, vilket skulle kunna utgöra grund för att notera att hunden t.ex. får 3,75 i fart och 4,25 i vidd. Egenskapspoängen är numrerade kategorier och det skulle gå lika bra att sätta skalan, (A-E) =(1-5). Sedan kan man notera att en 4:a i vidd på fjäll kanske skulle ge en 5:a i skog om samma måttstock användes? Detta exemplifierar att domaren måste göra en bedömning av vidd i förhållande till bl.a. terrängtyp, vilket ytterligare understryker att det är kategorivariabler som bedöms. Problemet man ställs inför med en skala (A-B) är att det inte går att beräkna medelvärden med tre siffrors noggrannhet, vilket har gjorts i bl.a. Genetisk Analys.... Bara för att kategorierna är numrerade får man inte behandla dessa variabler som om det vore reella tal (tal som kan skivas med decimaler). Även om det vore heltal, 1-5, skulle det INTE heller vara tillåtet att beräkna ett medelvärde med decimaler. Felet man gör är att man tror att medelvärdet, beräknat på de numrerade kategorierna, bär information som dessvärre inte finns där. Ett praktiskt exempel kan kanske belysa problemet OM egenskapspoängen vore heltal. Ex. Hur många gånger måste man mäta en planka med en tumstock, graderad i mm, för att kunna skatta längden på plankan inom några tiondedelar eller ännu värre några hundradels mm? (Hur många prov måste man starta på för att kunna skatta medelvärdet med två decimaler?) 1

Det spelar naturligtvis ingen roll hur många mätningar man gör, för det går bara att, i bästa fall, skatta planklängden på någon mm när i varje enskilt fall. Jämförelse kan göras med hur data har behandlats i bl.a. Genetiska analysen.., där medelvärden beräknas med en noggrannhet på hundradelar. Slutsatsen är att det vare sig går att skatta planklängder eller egenskaper på några tiondedelar eller hundradelar, även om man mäter många gånger! Ännu mer häpnadsväckande signifikanstestas dessa medelvärden för variablerna, för att se om det finns någon signifikant skillnad mellan de olika hundraserna! Det är i sammanhanget oroväckande att ingen tycks ha reagerat på den inkorrekta behandlingen av data trots den stora användningen av statistik i samhället generellt. Nu kan, som tidigare nämnts, egenskapspoängen (kategorivariablerna) inte behandlas på detta sätt och det skulle vara intressant att se vilket resultat en korrekt behandling av data skulle få, för bedömning av arvbarheten för de olika egenskaperna. Ett mer korrekt sätt att behandla data är att summera hur många gånger hunden bedömts tillhöra egenskaperna 1-5, för de olika variablerna ( frekvenser av betyg för alla jaktegenskaper, bilaga i Genetisk Analys..). På detta sätt kan man beräkna en procentsats för den aktuella hunden, för respektive kategori, som då kan jämföras med medelhundens fördelning (se rapporten). Man kan då jämföra hur den aktuella hunden förhåller sig till medelhunden för rasen. Dessutom kan man se om det sker någon förändring med tiden för den aktuella hunden, eller om det sker förändringar av medelhunden, som ett resultat av avelsarbetet. Se ett exempel nedan för en hund, Hund 1, som startat 15 gånger på jaktprov (ur SVKs resultatdata). Exemplet begränsas här för överskådlighetens skull till att endast visa hur det ser ut för variablerna fart, vidd, reviering och följsamhet (reviering har skalan 1-4). Medelvärdet är beräknat på samma sätt som i Genetisk Analys.. och som också görs i SVKs hunddata, det vill säga som om det vore reella tal. Provtillfälle Fart vidd reviering följsamhet 1 4 5 1 2 2 4 4 4 4 3 3 2 2 3 4 4 5 2 2 5 4 4 4 4 6 4 4 2 3 7 4 4 3 3 8 4 4 3 3 9 4 4 3 3 10 4 4 3 3 11 4 5 1 2 12 4 5 2 2 13 4 4 2 2 14 4 4 4 4 15 4 4 3 4 medelvärden 3,9 4,1 2,6 2,9 Rasens medel 3,7 3,5 2,9 3,4 2

Ett bättre sätt representera resultaten, se nedan, är att visa histogram för de olika kategorierna. Med en sådan presentation ser man dessutom spridningen(variationen) i de olika egenskaperna, vilket är väl så intressant för den fortsatta analysen. Se i Figur 1 t.ex. Reviering, som för Hund 1 har en stor spridning. Figur 1. % 100 90 80 70 60 50 40 30 20 10 0 Procentuell fördelning av egenskapspoäng för "Hund 1" 1 2 3 4 5 "poäng" Fart Vidd Reviering Följsamhet I figuren är fördelningarna för fyra egenskaper inlagda. För att göra det mer åskådligt kan det vara bättre att titta på varje egenskap separat. Dessutom kan man samtidigt jämföra hur det ser ut för medelhunden (Figur 2). Man summerar totala antalet starter för rasen och sedan kan man räkna ut den procentuella fördelningen för varje kategori. Ex. Hund 1 har 15 starter varav 10 st 4:or för vidd, 10/15=0,66, vilket är 66 %. På motsvarande sätt får Medelhunden egenskap 4 vid 49 % av alla starter (15850 st 4:or av totalt 25272 startande hundar av rasen, hämtat från bilaga i Genetisk Analys.. ). 3

Figur 2 % 100 90 80 70 60 50 40 30 20 10 0 Procentuell fördelning av vidd 1 2 3 4 5 "poäng" Hund 1 Medelhund I figur 1, kan man se att fart i 93 % av starterna bedömts som en 4:a och 7 % som en 3:a för Hund 1. På detta sätt kan man visa hur egenskapsprofilen ser ut för den aktuella hunden och jämföra med medelhunden (enligt hunddata i tabell 1 ovan, är medelvärdet = 93%*4+7%*3=3,93). Man kan också se om t.ex. andelen 4:or ökar och 1:orna minskar med tiden med en riktad avel. Nu måste man åter komma ihåg att det är kategorivariabler där det inte existerar några decimaler. Betänk att t.ex. en 4:a för fart, skulle kunna innefatta allt från 3,50 till 4,49, OM egenskapen bedömdes enligt en metrisk skala! Då måste man fråga sig vad har ett medelvärde för fart på 3,93 med verkligheten att göra? Det är väldigt nära 4 så oftast klassas denna hunds fart som 4, vilket verkar rimligt. Om nu en hund ofta bedöms som en låg 4:a, vilket aldrig syns i protokollen, (tänk 3,50) så blir medelvärdet, beräknat som ovan, också 4, där det om en decimalskala skulle ha använts blivit närmare 3,50. Motsvarande gäller förstås också för den höga 4:an (4,49). Vilken information får man då om man försöker jämföra egenskaper mellan olika raser med en precision på hundradelar där klassindelningen vore ±0,5 dvs. totalt 1, OM det vore heltalsbetyg. I en jämförelse (från Genetisk Analys.. ) mellan korthårig Vorsteh och strävhårig Vorsteh för exempelvis reviering, påstås det att resp. 2,81 är signifikant skild från 2,88 med 99,9% säkerhet!?? Hur trovärdig blir denna jämförelse och mer allvarligt, vilken betydelse kan detta få för det fortsatta avelsarbetet? Ett teoretiskt exempel: En hund som startar på 15 jaktprov och får egenskapspoäng, 10 st 5:or och 5 st 2:or skulle få medelvärdet 4!? Det är nedslående att det tyvärr finns fler exempel på felaktig datahantering bland de av Henriksson citerade publikationerna. Argumentet, i den mån de skulle dyka upp, så här har man alltid gjort håller inte, utan det krävs eftertanke om vilken typ av data som skall bearbetas innan man trycker på startknappen i statistikprogrammet. Det är rena självbedrägeriet att tro att decimaldelen från dessa medelvärden bär verklig information som krävs för att man skall kunna lita på ett resultat från en signifikanstest. Eftersom flera av de registrerade egenskaperna hos hundarna är korrelerade (hänger samman) samt att det ibland saknas data för någon egenskap vore det bäst att göra utvärdering med multivariat analys (MVA). Det finns mjukvaror idag, t.ex. SIMCA (www.umetrics.com), som samtidigt kan behandla kategori och numeriska-variabler samt också missing data. Ur denna typ av mjukvara är det också möjligt att bedöma graden av koppling mellan variablerna, t.ex. verkar det som fart och vidd drar åt samma håll, men där reviering tenderar att gå åt motsatt håll mot båda dessa. Med MVA 4

kan man ofta, inte bara konstatera att hundar är olika/lika, utan man kan också få ett mått på graden hur olika/lika. Dessutom, vilket skulle vara intressant, går det att se om det föreligger någon skillnad i beteendeprofil mellan fält, skog och fjäll. Vid norra Sveriges fjällprov startar i genomsnitt fler korthåriga Vorsthrar och vid södra Sveriges fältprov startar fler strävhår, har det någon inverkan på resultaten? Sammanfattningsvis måste vi ha förståelse för att egenskapsbedömningen, som görs av domaren, är subjektiv. Även om domarkonferenserna syftar till att skapa en gemensam bedömningsgrund, så kan vi aldrig begära någon absolutbedömning, dvs. utan fel eller förutfattade meningar. Domarna är faktiskt bara människor, även om de har en bättre utbildning i bedömningens ädla konst än de flesta av oss andra som bara ställer upp på proven! Innan man förändrar något på grund av den utvärdering Henriksson gjort borde det vara betydelsefullt att se, om en multivariatanalys eller en analys med procentuell egenskapsfrekvens skulle komma fram till liknande slutsatser som de som finns i bl.a. Genetisk Analys... (det är ett hästjobb som gjorts inom examensarbetet för att sammanställa och avlusa jaktprovsdata!!). Det vore även intressant att se den föreslagna histogramformen tillämpad på SVKs hemsida i stället för att som nu beräkna hundens medel där bara ett medelvärde beräknas utan något spridningsmått. Syftet skulle vara att få ett bättre utvärderingsverktyg för användning inom avelsarbetet. Hursomhelst är det positivt att rapporten Genetisk Analys.., har bidragit till att sätta igång en diskussion hur/om jaktproven skulle kunna utformas och utvärderas för att bidra till förbättrade resultat inom avelsarbetet. Målet är ganska enkelt, öka andelen optimala egenskaper, i de flesta fall 4:or på egenskaperna. Det är bara en liten detalj som man måste ha koll på om lutar sig hårt mot dessa egenskapsbedömningar i aveln: vilka egenskaper är arvbara och hur ärvs de?? En korrekt statistisk analys av data, är naturligtvis en förutsättning, för att kunna ge den information som är behövlig för ändamålet. Emellertid kanske det ändå inte spelar så stor roll hur jaktprovsdata behandlas, om man ser till att vi uppfödare bara använder resultaten från jaktproven som en del av den totala utvärderingen hur man skall välja avelsdjur? 5