Diskussion och slutsatser Som jag tidigare visat, har jag konstruerat en simulator med interaktivitet och visualisering. Jag tänker inte här närmare kommentera och diskutera att den iterativa arbetsmetoden fungerat, att experiment och simulatorkonstruktion tillsammans lett till korsbefruktning och prestandahöjning för snabbare experimentiterationer, att modifieringar av och tillägg till KSOM med inspiration från CFM enkelt gått att utföra, att medfödda SOM-konfigurationer kunnat kompletteras med filter och andra operationer etc. Jag menar att resultaten i sig visar att detta blivit till ett bra experimentsystem på både användar- och programmeringsnivå. Det jag finner värt att framhålla är främst: att det överhuvudtaget gick att utföra experiment med anknytning till lärande. att mitt genombrott med att kunna gå från en SOM till två utan att ge vinnaren totalföreträde visserligen är betydande, men att min huvudslutsats är att det inte räcker särskilt långt med ens två SOM:ar. Man bör gå vidare mot min dubbelkonsmodell och koppla samman många SOM:ar och ha SOM-hierarkier i både in-konen och ut-konen. att många modellutvidgningar visade sig vara fruktbara, främst införandet av korttidsminne och lateral inhibering. att visualiseringen visade sig vara oundgänglig. A. Statistiken i experimenten Det ligger i modellens natur (liksom i människans) att två körningar inte ger exakt samma resultat. Det har därför varit intrikat att fastlägga den statistiska nivå som körningarna måste nå till för att resultaten skall ha någon grad av reproducerbarhet. Mina redovisade experiment har körts flera gånger. Alla körningar har inte gett fullgoda resultat, men även i de mindre lyckade har tendenserna funnits till de resultat jag velat framhäva. Särskilt känslig är den spatiala ordningen, ibland blir den perfekt, och ibland tydlig men inte perfekt. Detta är inte något fel, det kan bli så i Kohonens SOM-algoritm [Anderson 1995 kap. 14]. Jag tänker framöver undersöka vilka metoder som kan användas för att öka möjligheten till fullgod spatial ordning. Framförallt är det initieringsfasen i SOMalgoritmen som bör modifieras, det finns bättre metoder än att bara låta slumpen avgöra startvärdena i SOM:ens beräkningsenheter. en datorexekverbar modell för lärande 63
Vidare ska datorresurserna utökas så att långa och många batchkörningar kan göras för att bättre utröna de statistiska egenskaperna. B. Analogier till mänskligt lärande Många simulatorkörningar har gett resultat som man kan känna igen utifrån det mänskliga lärandet. Fortsatta simuleringar kan alltså tänkas leda till både inspiration och nytänkande kring lärande och undervisning. Sammanställning över de viktigaste resultaten som demonstrerar anknytningen till mänskligt lärande och/eller ger inspiration till nytänkande: 1. Allt tyder på att stimulus bör vara lagom variations- och korrelationsrik för att öka variationsgraden inom delområdena och för att ge mjukare övergångar mellan delområdena. Variations- och korrelationsfattiga stimuli har visat sig vara förödande för SOM-hierarkins förmåga att utbilda god spatial ordning. Det har utbildats superspecialister och hårda övergångar mellan delområdena. Variationsfattigdomen ger tydliga och distinkta delområden och övergångar (vilket ger ett visuellt tydligt men förrädiskt resultat) vilket klart försämrar generaliseringsförmågan. 2. Vid ensidig träning med en ny variationsfattig sinuston har denna trängt ut närliggande tidigare inlärda kunskaper från SOM:en. Fenomenet glömska har påvisats. En mer variationsrik träning där närliggande toner samtränas med ny stimulus har förhindrat att tidigare inlärd kunskap glöms. Det är kunskaper som är lika den nya tonen som ligger i farozonen för glömska, mer olika kunskaper påverkas inte. 3. Det har även visat sig att överträning kan vara ineffektivt. En nivå i SOM-hierarkin bör inte färdigtränas innan en senare nivå har börjat tränas. Samträning av hierarkinivåerna, med en viss förskjutning av de senare i hierarkin verkar vara mer effektivt än att färdigträna varje nivå var för sig. 4. Modellen har visat tydlig förmåga till generalisering genom interpolation. Vid nyinlärning har en ny stimulus, genom generaliseringsmekanismen och höjande av lärfaktorn, erövrat sitt revir på SOM:en och med rätt spatial placering. 5. Betingning av en ny stimulus till ett tidigare inlärt har påvisats, och efter inlärning ger den nya insignalen samma respons som det gamla, en betingning (association) har skett. Vidareträning med enbart den nya insignalen har trängt 64 en datorexekverbar modell för lärande
undan kunskapen om den ursprungliga stimulus, en avbetingning har skett, ursprungskunskapen har glömts. 6. Människans fantastiska förmåga till mönsterigenkänning och förmåga att fylla i det saknade motsvaras i min simulerade modell av förmågan att hitta och fylla i grundtonen i en treklang när en sådan saknas (generalisering genom rekonstruktion). 7. När modellen arbetar med inlärning genom härmning visade det sig att det mest effektiva sättet att ge återkoppling inte var att korrigera fel utan att härma det felaktiga (motsvarar hur föräldrar kanske trots allt ger den bästa återkopplingen genom att understundom, som ett eko, tala småbarnsspråk med sina barn). 8. Ju vanligare en stimulus är desto större (och noggrannare) är dess representation på SOM:en. Detta stämmer väl med rön om neuroplasticitet, t.ex. att ytan av somatosensoriska cortex motsvarande vänsterhandens fingrar är betydligt större hos professionella gitarrister och violinister än hos människor i allmänhet [Spitzer 1999 kap. 7]. Samma fenomen har påvisats hos blinda människor som är specialister på Brailleskrift. De har en större kortikal representation av höger pekfinger än vänster pekfinger [Spitzer 1999 kap. 1]. 9. Speciellt intressant kan min modell bli som inspiration för hur människor med autism kan arbeta med sitt lärande och också få bästa möjliga stöd av sin omgivning. Autism framstår i modellerad form som en hård och god uppdelning med redundanta superspecialister och avsaknad av spatial ordning. Svagheterna med detta kan i modellen motverkas genom extrema, starka, variations- och korrelationsrika insignaler. Då utbildas variation inom delområdena, mjukare övergångar mellan områdena och spatial ordning. I den mänskliga domänen motsvarar detta en lärare som systematiskt arbetar med att tillföra variation och likaledes systematiskt arbeta med att bygga upp sammanhangsföreställningar och associationer. 10. Lennart Gustafsson har i sin artikel Inadequate Cortical Feature Maps: A Neural Circuit Theory of Autism [Gustafsson 1997] hävdat att en del symptom hos autistiska människor kan förklaras genom felaktigt organiserade kortikala kartor (i min modell SOM:arna) och att för stark lateral inhibering kan vara en av orsakerna till detta. Alla simuleringar hittills har visat att en variations- och korrelationslös insignal till SOM:arna ger upphov till just de en datorexekverbar modell för lärande 65
egenskaper som beskrivits i föregående punkt. Alltså behöver inte grundfelet ligga i de kortikala kartorna (CFM:erna), de kan bara ha blivit dåligt upplärda av olämpligt förbehandlade insignaler. Detta kan hos människan ha uppkommit genom att barnet vistats i totalt enahanda och stimulusfattiga miljöer. Men det kan också (och i vår kultur troligen betydligt vanligare) bero på att också signalerna från en aldrig så rik och omväxlande omvärld av dataförbehandlingen till CFM:erna kan reduceras genom för hög selektivitet (t.ex. genom för stark lateral inhibering) och undertryckning av svagare delkomponenter (t.ex. genom felaktiga förstärkningsfunktioner dåliga volymkontroller ). Jag har i min modell visat att detta resulterar i just hårda och spatialt dåligt ordnade SOM-organisationer. Om mina resultat är överförbara till den mänskliga domänen, blir den klara slutsatsen att grundorsaken till autism inte står att finna i de kortikala kartorna i neocortex (CFM:erna) utan i tidigare steg just i dataförbehandlingen för de olika sinnena. För min slutsats talar också att de neurologiska avvikelser man funnit hos människor med autism främst ligger i cerebellum och hjärnstammen. C. Vidareutveckling av modellen Modellen kommer att byggas ut till flera SOM:ar i både in-konen och ut-konen. Detta kommer troligen att resultera i mer finstämdhet, mer lagom nedväxlingar (i in-konen) och uppväxlingar (i ut-konen). Oväsentligheter i stimulus rensas på så sätt bort, och större variationstålighet erhålls i de lägre nivåerna i in-konen. Sensoriken kommer dessutom att utökas genom att fler sinnen införs. Den Lilla Lyssnerskan kommer att få ett modellöga (redan implementerat med TV-kamera och videofångstkort). Även känselsinne kommer att implementeras. Motoriken kommer att utökas med en arm och hand (i praktiken med en robotarm med sensorik för muskelpositioner). I denna multisensoriska och multimotoriska dubbelkon utnyttjas dessutom dubbelkonsmodellens inneboende parallellitet. Vidare krävs mer bearbetning inom områdena statistik, informationsteori, kodningsteori och datarepresentation i neurala nätverk [Edelman 19XX, Balkenius 1994 & 1996]. 66 en datorexekverbar modell för lärande
D. Taligenkänning och det relativa gehöret Jag gjorde också en del enkla experiment med taligenkänning tydligt inspirerad av Kohonens fonetiska skrivmaskin [Kohonen 1988]. Anledningen var till en början mest för att testa programmet och undersöka SOM:arnas förmågor till självorganisation då stimulus var mänskligt tal. Experimenten gav framförallt en insikt i att det inte bara är statiska fonem som lagras i SOM:en, det är också alla variationer och framförallt övergångar mellan fonemen, kortikulationen. Vidare experimenterande visade att korttidsminne i INSOM ytterligare förbättrade taligenkänningen. Genom att använda en mer utvecklad in-kon bestående av fler SOMnivåer kan man arbeta vidare med taligenkänning och då använda den dataförbehandling som konstruerades för att självorganisera relativt gehör. På så vis hoppas jag att få till stånd en frekvensinvarians som eliminerar de absoluta frekvensskillnader som finns mellan mänskliga röster. Det är kanske det relativa gehöret som är nyckeln till människans goda taligenkänning. en datorexekverbar modell för lärande 67
68 en datorexekverbar modell för lärande