Handbok Sam. Peter H. Grasch

Relevanta dokument
Handbok Simond. Peter H. Grasch

Handbok SSC. Peter H. Grasch

Handbok KSystemLog. Nicolas Ternisien

Handbok Spectacle. Boudhayan Gupta Boudhayan Gupta Översättare: Stefan Asserhäll

Handbok Artikulate. Andreas Cord-Landwehr Ondrila Gupta Översättare: Stefan Asserhäll

Handbok Dela Skrivbord. Brad Hards Översättare: Stefan Asserhäll

Handbok Dumpa skärmen

Handbok Solitär. Graeme Gott Ronny Yabar Aizcorbe Översättare: Stefan Asserhäll

Handbok KWatchGnuPG. Marc Mutz Utvecklare: Steffen Hansen Utvecklare: David Faure Översättare: Stefan Asserhäll

Handbok KAppTemplate. Anne-Marie Mahfouf Översättare: Stefan Asserhäll

Handbok KSystemLog. Nicolas Ternisien

Handbok Nepomuk-WebMiner. Jörg Ehrichs Översättare: Stefan Asserhäll

Handbok KGet. Gaurav Chaturvedi Översättare: Stefan Asserhäll

Handbok Ark. Matt Johnston Översättare: Stefan Asserhäll

Handbok Kronometer. Elvis Angelaccio Översättare: Stefan Asserhäll

Handbok Kanagram. Danny Allen Översättare: Stefan Asserhäll

Handbok KMouseTool. Jeff Roush Översättare: Stefan Asserhäll

Handbok Förstoringsglaset. Sarang Lakare Olaf Schmidt Översättare: Stefan Asserhäll

Handbok KMix Gaurav Chaturvedi Utvecklare: Christian Esken Utvecklare: Helio Chissini de Castro Utvecklare: Brian Hanson Översättare: Stefan Asserhäll

Handbok SSCd. Peter H. Grasch

Handbok Artikulate. Andreas Cord-Landwehr Ondrila Gupta Översättare: Stefan Asserhäll

Handbok Kaffeine. Jürgen Kofler Christophe Thommeret Mauro Carvalho Chehab

Handbok Dela Skrivbord. Brad Hards Översättare: Stefan Asserhäll

Handbok för skrivbordsväljaren. Dirk Doerflinger Antonio Larrosa Jiménez Pino Toscano Matthias Elter Matthias Ettrich Översättare: Stefan Asserhäll

Administratörshandbok GCompris. Den här dokumentationen är konverterat från GCompris manualsida. Översättare: Stefan Asserhäll

Handbok Othello. Clay Pradarits Utvecklare: Mario Weilguni Granskare: Lauri Watts Översättare: Stefan Asserhäll

Handbok KBruch. Sebastian Stein Anne-Marie Mahfouf Översättare: Stefan Asserhäll

Handbok KDE:s Menyeditor. Milos Prudek Anne-Marie Mahfouf Lauri Watts Översättare: Stefan Asserhäll

Handbok Simon. Peter H. Grasch Översättare: Stefan Asserhäll Översättare: Arve Eriksson

Handbok Färgredigeraren. Artur Rataj Översättare: Stefan Asserhäll

Handbok Picmi. Jakob Gruber Översättare: Stefan Asserhäll

Handbok Choqok. Mehrdad Momeny Anne-Marie Mahfouf Andrea Scarpino Översättare: Stefan Asserhäll

Handbok KWrite. T.C. Hollingsworth Christoph Cullmann Översättare: Stefan Asserhäll

Handbok KBackup. Martin Koller

Handbok Svarta lådan. Nicolas Roffet Robert Cimrman Philip Rodrigues Lauri Watts Översättare: Stefan Asserhäll

Handbok Spectacle. Boudhayan Gupta Boudhayan Gupta Översättare: Stefan Asserhäll

Handbok Kdiamant. Stefan Majewsky Översättare: Stefan Asserhäll

Handbok Kollision. Paolo Capriotti Översättare: Stefan Asserhäll

Handbok Fjärranslutning till skrivbord. Brad Hards Urs Wolfer Översättare: Stefan Asserhäll

Handbok Kiriki. Albert Astals Cid Eugene Trounev Översättare: Stefan Asserhäll

Handbok Shisen-Sho. Dirk Doerflinger Eugene Trounev Frederik Schwarzer Granskare: Frerich Raabe

Handbok RSIbreak. Tom Albers Bram Schoenmakers Översättare: Stefan Asserhäll

Handbok KCM Tablet. Jörg Ehrichs Översättare: Stefan Asserhäll

Handbok KSnakeDuel. Fabian Dal Santo Stas Verberkt Granskare: Lauri Watts Översättare: Stefan Asserhäll

Handbok Fyra i rad. Martin Heni Eugene Trounev Benjamin Meyer Johann Ollivier Lapeyre Anton Brondz Översättare: Stefan Asserhäll

Handbok KMouseTool. Jeff Roush Översättare: Stefan Asserhäll

Handbok Kfloppy diskettformaterare

Handbok KBlocks. Mauricio Piacentini Översättare: Stefan Asserhäll

Egna genvägar. Subhashish Pradhan T.C. Hollingsworth Översättare: Stefan Asserhäll

Handbok för Klipper. Philip Rodrigues Carsten Pfeiffer Översättare: Stefan Asserhäll

Handbok Minröjaren. Nicolas Hadacek Michael McBride Anton Brondz Utvecklare: Nicolas Hadacek Granskare: Lauri Watts Översättare: Stefan Asserhäll

Handbok Kstuds. Tomasz Boczkowski Granskare: Eugene Trounev Översättare: Stefan Asserhäll

Handbok KGet. Gaurav Chaturvedi Översättare: Stefan Asserhäll

Handbok Importguide. Laurent Montel Översättare: Stefan Asserhäll

Handbok SymbolEditor. Stephen P. Allewell Översättare: Stefan Asserhäll

Handbok Hoppande kuben. Ian Wadham Eugene Trounev Matthias Kiefer Översättare: Stefan Asserhäll

Calligra. En allmän inledning. Raphael Langerhorst Jost Schenck Översättare: Stefan Asserhäll

Innehåll. 1 Inledning 5. 2 Förinställning 6. 3 Anpassa användargränssnittet 7. 4 Anpassa interna inställningar 9. 5 Förbereda att bränna en skiva 10

Handbok Kollision. Paolo Capriotti Översättare: Stefan Asserhäll

Handbok Kgeografi. Anne-Marie Mahfouf Kushal Das Översättare: Stefan Asserhäll

Handbok KsirK. Gael Kleag de Chalendar Nemanja Hirsl Översättare: Stefan Asserhäll

Handbok Potatismannen. Éric Bischoff Paul E. Ahlquist, Jr. Eugene Trounev Granskare: Lauri Watts Översättare: Stefan Asserhäll

Handbok KMouth. Gunnar Schmi Dt Översättare: Stefan Asserhäll

Handbok Kanagram. Danny Allen Översättare: Stefan Asserhäll

Handbok skärmlinjal. Lauri Watts Översättare: Stefan Asserhäll

Handbok Officersskat. Martin Heni Eugene Trounev Granskare: Mike McBride Översättare: Stefan Asserhäll

Handbok KFind. Dirk Doerflinger Översättare: Stefan Asserhäll

Handbok KXSLDbg. Keith Isdale Översättare: Stefan Asserhäll

Handbok Katom. Dirk Doerflinger Eugene Trounev Granskare: Mike McBride Översättare: Stefan Asserhäll

Handbok Sänka fartyg. Daniel Molkentin Nikolas Zimmermann Anton Brondz Frerich Raabe Översättare: Stefan Asserhäll

Handbok KMix Gaurav Chaturvedi Utvecklare: Christian Esken Utvecklare: Helio Chissini de Castro Utvecklare: Brian Hanson Översättare: Stefan Asserhäll

Handbok Minuet. Sandro S. Andrade Översättare: Stefan Asserhäll

Handbok KonsoleKalendar. Tuukka Pasanen Allen Winter Granskning: Malcolm Hunter Översättare: Stefan Asserhäll

Handbok KNetAttach. Orville Bennett Översättare: Stefan Asserhäll

Handbok KNetWalk. Fela Winkelmolen Eugene Trounev Översättare: Stefan Asserhäll

Handbok Systeminställningar. Richard A. Johnson Översättare: Stefan Asserhäll

Handbok Anteckningslappar. Fabian Dal Santo Greg M. Holmes Granskare: Lauri Watts Översättare: Stefan Asserhäll

Inställning av Nepomuk skrivbordssökning. Sebastian Trueg Anne-Marie Mahfouf Översättare: Stefan Asserhäll

Handbok Othello. Clay Pradarits Utvecklare: Mario Weilguni Granskare: Lauri Watts Översättare: Stefan Asserhäll

Författare Version Datum. Visi System AB

Handbok Minröjaren. Nicolas Hadacek Michael McBride Anton Brondz Utvecklare: Nicolas Hadacek Granskare: Lauri Watts Översättare: Stefan Asserhäll

Handbok KFind. Dirk Doerflinger Översättare: Stefan Asserhäll

Handbok Shisen-Sho. Dirk Doerflinger Eugene Trounev Frederik Schwarzer Granskare: Frerich Raabe Översättare: Stefan Asserhäll

Handbok Kdots. Minh Ngo Översättare: Stefan Asserhäll

Handbok Kapman. Thomas Gallinari Översättare: Stefan Asserhäll

Handbok SymbolEditor. Stephen P. Allewell

Handbok Anteckningslappar. Fabian Dal Santo Greg M. Holmes Granskare: Lauri Watts Översättare: Stefan Asserhäll

Handbok Filelight. Max Howell Martin Sandsmark Översättare: Stefan Asserhäll

Handbok Fyrkanter. Matt Williams Granskare: Eugene Trounev Översättare: Stefan Asserhäll

Handbok Plånbok. George Staikos Lauri Watts Utvecklare: George Staikos Översättare: Stefan Asserhäll

Nero AG SecurDisc Viewer

Handbok Dragon Player. Mike Diehl Ian Monroe Översättare: Stefan Asserhäll

Handbok Kigo. Sascha Peilicke Översättare: Stefan Asserhäll

Handbok Kiten. Jason Katz-Brown Daniel E. Moctezuma Översättare: Stefan Asserhäll

Krav: * Filen MpUpdate.exe får inte köras när du startar denna uppdatering.

FileCentral Desktop. Användarhandledning Version

Installationsanvisningar VISI Klient

Krav: * Filen MpUpdate.exe får inte köras när du startar denna uppdatering.

Software Translator 6.1 Manual

OBS! FÖRSÖK INTE INSTALLERA PROGRAMVARAN INNAN DU HAR LÄST DET HÄR DOKUMENTET.

Transkript:

Peter H. Grasch

2

Innehåll 1 Inledning 6 1.1 Bakgrund........................................... 6 1.1.1 Effektiv provning.................................. 6 2 Använda Sam 7 2.1 Indata- och utdatafiler................................... 7 2.2 Konservativ övning..................................... 9 2.3 Anpassa scenarier...................................... 10 2.4 Skapa modell........................................ 11 2.5 Prova modell......................................... 12 2.6 Provresultat......................................... 13 2.6.1 Värdering...................................... 13 2.6.2 Ord.......................................... 13 2.6.3 Meningar...................................... 14 2.6.4 Filer......................................... 15 2.6.5 Logg......................................... 15 2.7 Rapporter.......................................... 16 2.7.1 Mallar........................................ 16 2.7.2 Ange metainformation............................... 16 2.7.3 Utdata........................................ 18 2.8 Kommandoradsväljare................................... 19 3 Frågor och svar 20 4 Tack till och licens 21 A Installation 22

Tabeller 2.1 Kommandoradsväljare................................... 19 4

Sam är en akustisk modellhanterare. Sammanfattning

Kapitel 1 Inledning Sam är ett verktyg för att prova akustiska modeller. Det kan kompilera nya talmodeller, använda modeller som skapats av Simon och skapa modeller som senare kan användas av Simon. Det är avsett för användare som vill ha mer kontroll över sina akustiska modeller och tillhandahåller åtkomst till byggprocessen på mycket lägre nivå. Sam är främst inriktat på taligenkänningsproffs som vill förbättra och/eller prova sina akustiska modeller. För mer information om programvarusamlingen Simon se Handbok Simon. 1.1 Bakgrund Det här avsnittet tillhandahåller en del bakgrundsinformation om kompilerings- och provningsprocessen. 1.1.1 Effektiv provning En av huvudfunktionerna i Sam är att prova de skapade akustiska modellerna. Den grundläggande testproceduren är att köra igenkänning på samplingar där transkriberingen redan är känd och jämföra resultaten. Sam tar också hänsyn till igenkänningens konfidensvärde för att mäta hur robust det skapade systemet är. På grund av sättet som akustiska modeller skapas, blir både igenkänningens noggrannhet och konfidens mycket skeva när samma samplingar används både för inlärning och prov. Det kallas in corpus test (samplingarna som används för prov ingår också i inlärningsmaterialet). Även om in corpus prov kan avslöja om kompileringsprocessen misslyckades eller skapade undermåliga resultat, anger de inte den skapade modellens verkliga igenkänningsfrekvens. Därför rekommenderas att göra prov utanför inlärningsmaterialet: Använd olika samplingar för inlärning och prov. För prov utanför inlärningsmaterialet, dela helt enkelt frågefilen i två delar: En används för att kompilera modellen, och en för att prova den. Provdelen behöver förstås inte vara särskilt stor för att få ett representativt resultat. Om det inte finns en stor mängd inlärningsdata, kan du också dela hela materialet i tio delar. Kompilera 10 modeller, och utelämna en del av materialet i var och en av dem. Gör därefter individuella prov (alltid med provmängden som undantogs vid kompilering) och ta medelvärdet av resultaten. 6

Kapitel 2 Använda Sam Sam tillhandahåller ett grafiskt gränssnitt som är uppdelat i fem områden. Flikarnas ordning representerar ett fullständig arbetsflöde i Sam, från att skapa en modell till att prova den. 2.1 Indata- och utdatafiler Definiera vilka filer att arbeta med. Du kan spara och läsa in inställningen genom att använda respektive knappar Spara och Läs in. VARNING Menyerna Spara och Läs in sparar bara sökvägarna och alternativen som definieras här. De sparar inte de tillhörande filerna! 7

Här går det också att välja mellan modellkompilering som stöds och gränssnitt för igenkänning. Beroende på installationen av Simon, kanske inte alla är tillgängliga. Om du vill kompilera och/eller prova Simons model, kan du använda alternativet Ändra Simons modell för att läsa in lämpliga filer. Både scenarier och frågor serialiseras på lämpligt sätt. När Simon kompilerar modellen, kommer ord som inte lärts in automatiskt tas bort vid serialisering, samt anpassa frågorna i enlighet med det. Det sker också när Ändra Simons modell klickas. Om du dock serialiserar dem separat genom att använda Serialisera scenarier och Serialisera frågor kommer inte anpassningen utföras och du är själv ensam ansvarig för indatafilernas giltighet. Om du direkt anger filnamn gäller det naturligtvis i ännu högre grad. När en statisk modell som använd modelltyp väljes, kompilerar ändå Sam språkmodellen, precis som Simon skulle göra. Det kopierar också den givna basmodellens indatafiler till utdatasökvägarna. Sam ger användaren möjlighet att ange olika typer av frågefiler för att skapa och prova modellen. För mer information om hur funktionen används effektivt, se avsnittet om effektiv provning. 8

Användare kan ställa in ett godtyckligt antal provinställningar för att jämföra olika modellparametrar. Alla inställda prov kommer att köras och alla listas i eventuella rapporter som exporteras. Genom alternativet för att tillhandahålla andra indatafiler än den kompilerade modellen, kan referensmodeller (basmodeller) inkluderas i rapporten. Sedan Simon 0.4, är det primära filformatet för modeller den nyintroducerade SBM-formatet. Även om Sam också skapar SBM-modeller, kräver provningen fortfarande lågnivå-indatafiler. Det kan verka motsägelsefullt, men har vissa praktiska fördelar: Modellkompileringen i Simon (och sålunda också i Sam) skapar fortfarande lågnivå-utdatafiler för både modellkompilering med SPHINX och HTK innan de paketeras i SBM:er, så att ange dessa (tillfälliga) filer för Sam är inte svårt och är det normala när Ändra Simons modell används. Eftersom kompilering av akustiska modeller i de flesta fall är en iterativ process, skapar kompilatorn typiskt flera tillfälliga versioner av olika steg i parameteruppskattningen. Genom att tillåta lågnivå-indata, är det mycket enklare att prova och jämföra dessa mellanliggande resultat. Om du vill prova en modell som du tagit emot med SBM-format, kan du extrahera den med SAM via alternativet Extrahera Simon-modell för att kunna komma åt lågnivå-indatafilerna som krävs för prov med Sam. 2.2 Konservativ övning Om du har anpassat Simond att behålla igenkänningssamplingar, kan Sam importera denna data via alternativet Importera igenkänningssamplingar i sektionen Indata och utdata. 9

Frågefilens beteckning skapas automatiskt av det troligaste igenkänningsresultatet. Du kan begränsa urvalet till att bara inkludera samplingar som uppnått ett angivet konfidensvärde. Om inställningen i Simon som du importerar samplingarna från använder ett globalt filter för att inaktivera igenkänning, kan du tillhandahålla kommandot som aktiverar och inaktiverar filtret (pausar och återupptar igenkänningen) för att ignorera alla samplingar som skapats medan igenkänningen var inaktiverad. 2.3 Anpassa scenarier Simon lagrar språkmodellen i scenarier. När du ska använda dem för att kompilera modellen måste du först serialisera dem till filer som är läsbara av SPHINX eller Julius och HTK. 10

Klicka på knappen Serialisera scenarier under fliken In- och utdataflik. Simons scenarier serialiseras också när alternativet Ändra Simons modell används. På den här sidan hittar du statusinformation om anpassningen och kan läsa detaljerade felmeddelanden om ett fel uppstår. 2.4 Skapa modell Här kan modellen byggas genom att använda in- och utdatafilerna som definierades under inoch utdata. Kompileringsprocessen är identisk med den som används av Simond. I motsats till Simond, visas dock den fullständiga loggen över alla anropade externa program, deras utmatning samt förloppsinformation oberoende av om kompileringen lyckades eller inte. 11

Genom att använda denna detaljerade utmatning är det mycket lättare att hitta problem med indata. 2.5 Prova modell Här kan du prova talmodellen. Sam provar modellen som anges av Utdatafiler under In- och utdata. Under provet, körs igenkänningen i det valda gränssnittet för att känna igen indatafiler som anges av provfrågorna. Resulterade ord- och meningsfel räknas, samt den övergripande stabiliteten genom att analysera konfidensvärden från igenkänningen. Huvudskärmen för prov visar alla startade prov och rapporterar när de är färdiga. Själva proven körs i olika trådar (på samma gång). Hur mycket parallellism som bäst passar datorn avgörs automatiskt. 12

Så fort alla prov är klara, visas provresultaten automatiskt. 2.6 Provresultat Efter ett lyckat modellprov hittar du en detaljerad rapport av igenkänningens noggrannhet här. 2.6.1 Värdering För att ange igenkänningens prestanda, använder Sam multipla, rankade resultat i proven. Ett riktigt igenkänt ord eller igenkänd mening värdesätts med konfidensvärdet ordet uppnådde. Om ett ord känns igen på ett riktigt sätt medan ett annat, felaktigt, resultat rankas högre, blir igenkänningens noggrannhet 0 %. Den övergripande igenkänningsfrekvensen som visas är medelvärdet av alla konfidensvärden. Det övergripande noggranhetsvärdet som visas anger medelvärdet för alla noggranhetsvärden, vilket representerar sannolikheten att ett ord, givet vilket ord som helst i vilken mening som helst, har känts igen korrekt. 2.6.2 Ord Sam listar igenkänningens noggrannhet individuellt för varje ord. 13

Om du har samplingar som innehåller mer än ett ord, segmenteras de under igenkänningen. Varje ord ord värderas individuellt (även om de olika orden förstås ändå påverkar varandra). 2.6.3 Meningar Den här sektionen listar varje fråga som mening. Frågor som spelades in mer än en gång kombineras. 14

2.6.4 Filer Under filsektionen kan du se igenkänningsresultatet för varje fil. Varje fil listar de tio mest troliga resultaten i detaljinformationsrutan när du markerar den. När du identifierar problematiska samplingar kan du spela in dem igen (eller ta bort dem) genom att markera dem och klicka på Redigera sampling. Filerna kan sorteras enligt varje kolumn genom att helt enkelt klicka på kolumnrubriken. På så sätt är det mycket lätt att hitta felaktiga samplingar genom att sortera enligt igenkänningsfrekvens. 2.6.5 Logg Här kan du granska hela protokollet från det här delprovet. 15

2.7 Rapporter Sam kan exportera rapporter med provresultat. Export av en rapport kan startas genom att välja Exportera provresultat i Sams huvudfönster. 2.7.1 Mallar Rapporter skapas genom att fylla i mallar med information. I huvudsak är dessa mallar antingen vanliga textfiler eller Latex-filer. Tre Latex-mallar, två tyska och en engelsk, levereras med Sam, men det är enkelt att lägga till nya. Installera bara nya mallar på en av följande platser beroende på operativsystem: Linux: ~/.kde/share/apps/sam/reports/templates Windows: %appdata%\.kde\share\apps\sam\reports\templates De befintliga mallarna kan användas som referens. De finns under följande sökväg: Linux: /usr/share/apps/sam/reports/templates Windows: <installation path>\share\apps\sam\reports\templates 2.7.2 Ange metainformation Rapportverktyget tillåter att metainformation om använd indata samt provförhållanden, högtalar, etc. 16

Denna information kan matas in direkt via det grafiska användargränssnittet. Beroende på den använda mallen, kanske inte all information som tillhandahålls används i den exporterade rapporten. Information som matas in i dialogrutan sparas också i projektfilen för Sam. 17

Viss metainformation, som antal samplingar i prov- och inlärningsmaterialet samt systeminformation, kan antingen automatiskt fyllas i av Sam eller tillhandahållas manuellt. 2.7.3 Utdata Exporterade rapporter lagras i ZIP-arkiv. I fallet med Latex-mallar kan de dessutom innehålla grafik förutom den obehandlade.tex-filen. Nedan visas början av en exporterad fullständig Latex-rapport av ett enkelt prov av Amarokscenariet med den statiska Voxforge-basmodellen. 18

2.8 Kommandoradsväljare Sam tillhandahåller kommandoradsväljare för de vanligaste åtgärderna för att automatisera att skapa och prova modeller. Alla åtgärder som anges som kommandoradsväljare utförs omedelbart när Sam har laddats. Väljare som beror på varandra (som kompilering och prov) ordnas automatiskt om. Väljare Beskrivning Väljer använt gränssnitt. Ange antingen -m <typ> sphinx eller htk för att välja specifikt gränssnitt. Beroende på installationen, kanske spinx inte är tillgängligt. -s Hämtar alla sökvägar från Simon (ekvivalent till Ändra Simons modell). -c Startar modellkompileringen. -t Starta modellprovet. -e <filnamn> Exporterar en rapport till angivet filnamn. Möjliggör bakgrundsbehandling. Sam -b avslutas automatiskt efter att alla väljare har behandlats. Huvudfönstret visas inte. -l <filnamn> Exportera den fullständiga byggloggen till den angivna filen. -w Spara automatiskt en eventuell öppnad projektfil för Sam när programmet avslutas. <filnamn> Läser in den här projektfilen för Sam vid start. Tabell 2.1: Kommandoradsväljare 19

Kapitel 3 Frågor och svar För att alltid försöka hålla avsnittet uppdaterat är det tillgängligt på vår wiki. 20

Kapitel 4 Tack till och licens Sam Program copyright 2008-2010 Peter Grasch peter.grasch@bedahr.org Dokumentation Copyright (c) 2009-2010 Peter Grasch peter.grasch@bedahr.org Översättning Stefan Asserhäll stefan.asserhall@bredband.net Den här dokumentationen licensieras under villkoren i GNU Free Documentation License. Det här programmet licensieras under villkoren i GNU General Public License. 21

Bilaga A Installation Se vår wiki för installationsinstruktioner. 22