Fonetisk distansmätning av ord i lexikon

Storlek: px
Starta visningen från sidan:

Download "Fonetisk distansmätning av ord i lexikon"

Transkript

1 Examensarbete Fonetisk distansmätning av ord i lexikon Henrik Wache Språkteknologiprogrammet Institutionen för lingvistik Uppsala universitet Handledare: Hans Runehov, Telia Promotor AB Rolf Lindgren, Telia Telecom AB Huvudhandledare: Lars Borin, institutionen för lingvistik, Uppsala universitet

2

3 Under tiden jag har arbetat med mitt examensarbete har jag fått hjälp av en del personer som jag här skulle vilja passa på att tacka. Först och främst vill jag rikta ett stort tack till min handledare på Telia Promotor, Hans Runehov. Hans har under mitt arbete alltid haft tid för mina frågor och hjälpt mig mycket med det programmeringstekniska arbetet. Tack också till min handledare på Telia Telecom AB, Rolf Lindgren för intressanta diskussioner och nyttiga synpunkter på framför allt den fonetiska delen av mitt arbete. Huvudhandledare för mitt examensarbete har varit Lars Borin vid institutionen för lingvistik på Uppsala universitet. Lars har varit till stor hjälp under främst den senare delen av arbetet och har kommit med bra och konstruktiva kommentarer under rapportskrivningen. Det har alltid varit roligt och givande att diskutera med Lars, inte bara om rapporten och examensarbetet utan även om jiddisch, Slas och skillnaden mellan östgötar och västgötar. Stort tack! Henrik Wache, Uppsala i Mars 1999 i

4 Sammandrag Den här rapporten beskriver arbetet att ta fram ett program som kan mäta den fonetiska likheten mellan olika ord. Programmet kan t.ex. användas som ett hjälpmedel vid utformningen av ett röststyrt gränssnitt där man på förhand ska kunna upptäcka och undvika ord som låter lika och därmed riskerar att förväxlas av det röststyrda programmet. Mitt arbete har haft tre huvudmoment; dels att hitta ett sätt att beskriva den fonetiska likheten hos fonem, dels att hitta en lämplig metod att använda sig av för att kunna mäta den fonetiska distansen mellan ord, dvs hitta en metod med vilken man kan mäta hur fonetiskt lika ord är, och dels att implementera denna metod i form av ett datorprogram. Rapporten kommer att ta upp olika metoder för strängjämförelse och påvisa deras för- och nackdelar. Vidare kommer jag att mer utförligt beskriva den algoritm jag har använt mig av i mitt program och på vilket sätt jag har använt mig av den. Jag kommer också att redogöra för den fonetiska indelning jag har använt mig av för att gruppera ordens fonem. ii

5 SAMMANDRAG...ii 1 INLEDNING ÖVERSIKT SYFTE BAKGRUND STRÄNGJÄMFÖRELSE N-GRAM-TEKNIKER SOUNDEX-ALGORITMEN LEVENSHTEIN-ALGORITMEN OCH DYNAMISK PROGRAMMERING FONETIK, FONOLOGI OCH RELATERADE BEGREPP FONETISK TRANSKRIPTION IPA-notationen SAMPA-notationen FONETISKA SÄRDRAG Vokaler och deras särdrag...13 Främre vokaler...14 Mellanvokaler...14 Bakre vokaler...14 Höga vokaler...14 Medelhöga/medellåga vokaler...15 Låga vokaler Konsonanter och deras egenskaper Konsonanternas artikulationssätt Klusiler...16 Nasaler...17 Tremulanter...17 Frikativor...17 Lateraler...17 Approximanter Konsonanter och särdrag Vokalisk...18 Konsonantisk...18 Sonoranter...18 Nasaler...18 Lateraler...19 Kontinuanter...19 Koronaler...19 Anteriorer...19 Tonande STAVELSER BESKRIVNING AV PROGRAMMET PROGRAMMETS IN- OCH UTDATA PROGRAMMET OCH LEVENSHTEIN TESTRESULTAT TEST MOT ETT ANNAT PROGRAM TEST MED MÄNNISKOR SLUTSATSER FONETISK JÄMFÖRELSE OCH LEVENSHTEIN RESULTATET FRAMTIDA FÖRBÄTTRINGAR...40 iii

6 LITTERATURFÖRTECKNING...42 BILAGA 1: SAMPA-ALFABETET...43 BILAGA 2: IPA-SAMPA-TABELL...44 BILAGA 3: PROGRAMMETS NIVÅER OCH DE FONETISKA SÄRDRAG SOM DÄR ANVÄNDS:...45 BILAGA 4: LEVENSHTEIN-ALGORITMENS IMPLEMENTATION...46 iv

7 1 Inledning 1.1 Översikt Den här rapporten behandlar mitt examensarbete vilket jag har gjort på Telia Promotor i Uppsala under våren och sommaren Examensarbetet ingår som en obligatorisk kurs om 20 poäng på språkteknologiprogrammet vid Uppsala universitet. Rapporten är den ena av två delar av arbetet där den andra delen är en implementation i form av ett program för mätning av fonetisk likhet mellan ord. 1.2 Syfte Syftet med examensarbetet har varit dels att studera vilka metoder som finns att använda sig av vid fonetisk strängjämförelse, och dels att implementera en av dem i form av ett datorprogram. Detta gör att arbetet naturligt har indelats i en teoretisk och en praktisk del där den senare har bestått i implementationen av den förra. Den teoretiska delen innehåller en genomgång och sammanställning av olika tänkbara metoder för fonetisk jämförelse av strängar samt hur man kan definiera fonetisk distans. Detta innebär en inventering av befintliga metoder, bedömning av metodernas lämplighet för det specifika problemet, eventuellt modifiering av någon befintlig algoritm eller utveckling av egen metod. Syftet har varit att få en djupare kunskap om området samt att välja ut den mest lämpade algoritmen för implementationen. Den praktiska delen handlar om att utveckla ett program som med hjälp av vald algoritm beräknar den fonetiska distansen mellan det testade ordet och orden i ett befintligt uttalslexikon. Programmet returnerar en lista med de ord ur ett lexikon som har minst fonetisk distans till det testade ordet. 1.3 Bakgrund I all typ av kommunikation är det viktigt att budskapet mellan två eller flera parter uppfattas rätt, dvs. såsom avsändaren har tänkt sig att hans meddelande ska uppfattas. Det här gäller i alla typer av kommunikation och då både mellan människor eller mellan människor och datorer. I talad kommunikation mellan människor är ofta dialogen full av ofullständiga meningar, flertydiga ord och ogrammatisk meningsbyggnad. Anledningen till att vi ändå (oftast) förstår budskapet är att 1

8 vi använder oss av vår förmåga att ta ut det viktiga i en mening vilket gör att vi även kan förstå den. En mening som: Öhh ska vi kanske då ba säga ähh.. vid kiosken klockan sju va eller? skulle säkert ganska enkelt kunna tolkas som: ska vi träffas vid kiosken klockan sju?. Trots att meningen är ostrukturerad och relativt svår att tyda i skriven form, förstår vi ändå dess betydelse eftersom vi kan dra slutsatser av de enskilda orden och därmed även förstå betydelsen av meningen i sin helhet. Dialogsystem mellan människor och datorer där man använder sin röst som gränssnitt mot en dator är någonting relativt nytt och har de senaste åren kommit ut som kommersiella produkter på marknaden. På persondatormarknaden finns idag t.ex. ordbehandlare där man kan diktera sina brev med rösten istället för att använda tangentbordet. På mobiltelefonmarknaden är det numer vanligt med röstringning, dvs. istället för att manuellt slå det nummer man vill ringa, säger man helt enkelt namnet (eller liknande) på den man vill ringa upp, t.ex. ring mamma. Den här typen av program där en del av programmets uppgift bland annat är att känna igen det en människa säger, innehåller ofta någon slags modul där programmet ska matcha de ord den har uppfattat att människan har sagt mot ett lexikon. Eftersom programmets funktion normalt är att tillhandahålla den information som användaren har bett om, är det av största vikt att programmet rätt har uppfattat de ord som användaren har sagt. Om systemet har misstolkat ett ord kan det leda till att fel information blir presenterad för användaren varvid han kanske tappar intresset och avslutar programmet. Som exempel på ovan nämnda problem kan vi ta ett program där man kan ringa och fråga en dator om väderleken i olika delar av landet. När man har kört fast i programmet eller vill komma till början av programmet säger man helt enkelt börja om. Problemet med att använda den frasen är att den låter likt staden Borgholm, vilket gör att en person som ringer till programmet och med lite otydligt tal ber att få information om vädret i Borgholm, istället blir kopplad till början av programmet. Lösningen på det problemet skulle kunna ha varit att i förväg testa programmets kommandoord, såsom börja om för att på så sätt se om de var uttalsmässigt lika några av de andra lexikonorden. Om så visar sig vara fallet kan det vara bra att förutse den typen av krockar och då kanske välja andra kommandoord. 2

9 2 Strängjämförelse Med strängar menar vi här en sekvens av objekt där objekten kan vara av olika typer. För en datavetare kan strängar betyda en datatyp bestående av en följd av tecken (Engström 1995). I det fallet kan man tänka sig att datatyperna, eller strängarna, kan vara ettor och nollor. För en matematiker kan en sträng vara ett tal som består av en eller flera på varandra följande siffror, medan biologen pratar om arvsanlag i form av DNA- och RNA-strängar. Lingvisten kan uppfatta ord som strängar av bokstäver medan fonetikern kanske uppfattar ord som strängar av fonem. Då det här examensarbetet handlar om hur man kan jämföra strängar av fonem, dvs. fonetiskt transkriberade ord, med varandra innebär det att vi här talar om strängar som en sekvens av fonetiska tecken. Oavsett vilka typer av strängar man pratar om, kan skillnaderna strängarna emellan beskrivas på mer eller mindre samma sätt. Dessa skillnader kan då sägas bero på något av följande: -byte (substitution) av t.ex. en bokstav: (stav stad) -borttagning (deletion) (stål stå) -insättning (insertion) (stå stål) -omkastning (transposition) (åra råa) Ibland talar man om borttagning och insättning med ett och samma ord: indels (insertion eller deletion). Av dessa fyra operationer räcker det med borttagning och insättning för att beskriva skillnaden mellan två strängar eftersom ju de andra två operationerna kan beskrivas som en borttagning följd av en insättning. Alla fyra termerna förekommer dock och det är i dessa termer som Levenshtein-algoritmen (se nedan) beskriver skillnaden, eller distansen mellan två strängar. Inom datorlingvistiken kan strängjämförelse förekomma inom olika tillämpningsområden såsom t.ex. datamaskinell rättstavning (Kukich 1992; Vosse 1994) eller maskinöversättning. Gemensamt för de båda disciplinerna är att det gäller att jämföra en inputsträng med de ord som finns representerade i ett lexikon. Uppgiften för ett rättstavningsprogram skulle förenklat kunna beskrivas som: 3

10 1. Hitta ordet X i ett maskinläsbart lexikon Om 1. ovan lyckas: - slå upp nästa ord. Om 1. ovan misslyckas: 2. Hitta ett eller flera ord i lexikonet som liknar X så mycket som möjligt. Det här betyder att programmet tolkar ett ord som inte återfinns i lexikonet som felstavat vilket ju inte behöver vara fallet: ordet kan vara rätt stavat men ändå inte hittas då lexikonet kanske innehåller få ord. I svenskan har vi dessutom i princip obegränsad möjlighet till sammansättningar vilket gör att utbudet av ord blir näst intill oändligt stort och ett ord som strängjämförelsealgoritmer knappast återfinns i något lexikon. Det intressanta inträffar då jämförelsen misslyckas och programmet ska uppge alternativa stavningar/ord till det inskrivna ordet. I den här situationen måste alltså programmet ta hänsyn till faktorer som ordlängd, delsträngar och enstaka tecken för att avgöra vilka ord som är mest troliga som stavningskandidater, dvs. vilka ord som är mest lika det inskrivna ordet. Resultatet av dessa avvägningar är beroende av hur man jämför strängarna och vilken typ av jämförelsealgoritm man använder sig av. Syftet med det här arbetet har varit att ta fram ett verktyg som jämför två ordsträngar och som resultat ger någon form av likhetsmått. Det här har gjort att jag först var tvungen att undersöka om det fanns några metoder som var lämpliga att använda för den typ av strängjämförelse vi ville göra. Kravet för att använda sig av en redan existerande algoritm var att den skulle finnas väl dokumenterad, relativt enkel att implementera samt att man som resultat av jämförelsen skulle få ut ett mått som relaterar till strängarnas likhet på ett någorlunda bra sätt. Under mitt arbete har jag speciellt kommit i kontakt med tre metoder; n-gramtekniker, Soundexalgoritmen samt Levenshteinalgoritmen. Dessa tre metoder bygger alla på olika tekniker och har egentligen också olika användningsområden. Jag kommer här nedan att kort beskriva de olika metoderna tillsammans med dess för- och nackdelar. 2.1 N-gram-tekniker Bigram är en sekvens av två på varandra följande tecken och trigram är tre på varandra följande tecken. Både bi- och trigram har länge varit populära att använda sig av för att jämföra strängar av 4

11 olika slag. Om vi har två strängar i form av två ord som fonetik och fonem består således den första strängen av följande trigram: fon, one, net, eti och tik, medan den andra består av fon, one och nem. För att se ett konkret exempel på en implementation där man kan använda sig av den här tekniken kan vi gå tillbaka till automatisk rättstavning. Som antyddes i avsnitt 2 ovan kan problemet med rättstavning indelas i två deluppgifter. Den första är att hitta stavningsalternativ till det felstavade ordet, och den andra är att är att jämföra kandidaterna för att hitta det bästa av flera alternativ (Vosse 1994 s.71). För att åstadkomma detta och få fram ett mått på likheten mellan två strängar kan man använda sig av en formel som normalt benämns som The Dice Coefficient : 2P(x,y) Sim(x, y) = P(x) + P(y) Den här formeln beräknar alltså likheten (Sim) mellan två strängar x och y. P(x, y) är antalet gemensamma trigram för strängarna x och y och P(x) + P(y) är antalet unika trigram i respektive bokstavssträng. Skulle vi applicera formeln på våra exempelord fonetik och fonem skulle formeln få följande utseende: 2(2) Sim(fonetik, fonem) = = 0.5 (5)+(3) Resultatet av beräkningen är ett tal mellan 0 och 1 där värden närmare 1 påvisar en större likhet mellan strängarna och ett lägre värde det motsatta. Om exemplet ovan hade gällt för orden fonetik och fonetiken hade likhetsvärdet blivit 0.83 istället, vilket verkar rimligt då de strängarna uppvisar en större likhet än de två förra när det gäller antalet lika delsträngar. Nackdelen med den här tekniken är att ett ord med ett extra insatt tecken alltid är mer likt det ursprungliga ordet än vad ett ord med två insatta tecken är: (fonem, foneme, fonemet), detta oavsett vilka dessa två tecken är. Analogt kan man tänka sig att en sträng med ett insatt fonem inte nödvändigtvis behöver låta mer likt ursprungsordet än en sträng med två insatta fonem. Ett annat problem är att två ord som t.ex. fonemen och fonemet alltid får samma resultat när de jämförs med ordet fonem eftersom de orden båda har två extra tecken. Det här gör att metoden med n-gram- 5

12 teknik inte är lämplig att använda i sin grundform i mitt program eftersom den inte säger någonting om vilken av strängarna fonemen och fonemet som är mest fonetiskt lik strängen fonem. Det är den här statiska jämförelsen som gör att vi inte kan använda den tekniken för vårt ändamål där vi ska jämföra strängar som är fonetiskt transkriberade. I vår jämförelse måste vi kunna vikta de olika delarna i strängarna som jämförs eftersom varje del av strängen (fonemtecknen) representerar ett ljud som kan vara mer eller mindre likt ett annat ljud. Det här betyder att ett b måste anses vara mer likt ett p än vad det är ett s vilket måste komma fram av strängjämförelsen. 2.2 Soundex-algoritmen Soundex är en gammal teknik med anor från början av nittonhundratalet. Systemet utvecklades ursprungligen för att automatiskt kunna söka efter namn i namnregister. Algoritmens enkelhet (och dess resultat?) gör att den fortfarande används i vissa äldre system, även om nyare tekniker är på väg att ta över. Vad som ändå gör att Soundex är värd att nämnas i sammanhanget är att algoritmen bygger på en fonetisk grundtanke, nämligen den att det är svårare att stava vokalljud än vad det är att stava konsonantljud. Dessutom kan tilläggas att de flesta språk har fler konsonantfonem än vokalfonem. Vosse (1994 s. 88) påpekar dock att detta synsätt på svårstavade vokalljud är mer giltigt för engelska än vad det är för holländska. Jag kan också tänka mig att detta även gäller för svenska, dvs. att engelska vokalljud även är mer svårstavade än svenska dito. Detta gör dock inte Soundex-tekniken helt ointressant och tanken med svårstavade ord kan exemplifieras med en sökning i en databas efter en persons namn. Om namnet är Papadopoulos kan man förstå tveksamheten att placera vokalerna rätt och möjligheten att koda namnet från konsonanterna verkar som en bra idé. Grundtanken är alltså att ignorera vokalerna och ersätta konsonanterna (utom w och h) i en ordsträng med en sifferkod enligt följande indelning: B, F, P, V = 1 C, G, J, K, Q, S, X, Z = 2 D, T = 3 L = 4 M, N = 5 R = 6 6

13 Själva algoritmen för hela Soundex-kodningen kan sammanställas i följande punkter som exemplifieras på namnet Papadopoulos : 1. Ta bort alla vokaltecken samt bokstäverna w och h från den aktuella strängen: (p_p_d p_l s) 2. Behåll den första bokstaven i den aktuella strängen. 3. Ersätt resten av bokstäverna i strängen med motsvarande siffra (se listan ovan). (p13142) 4. Ta bort alla dubbla siffror. 5. Trunkera strängen till en längd av 4 tecken (dvs. initialbokstav + 3 siffror). (P131), eller om strängen är kortare än fyra tecken, fyll ut den med nollor. Som resultat av Papadopoulos får vi alltså koden P131. Det är ganska enkelt att se hur tanken bakom algoritmen ser ut: det räcker vid en namnsökning att skriva Papadopolus eller Pappadopolus för att namnet via koden ska kopplas ihop till rätt namn utan att man vet exakt hur namnet stavas. Problemet med den här tekniken borde vara ganska självklart eftersom man kan lätt kan hitta olika ord med samma kod. Vosse (1994 s.89) skriver att det finns 676 engelska ord med soundex-nyckeln 22 och ger bland andra orden acacia, cheque och whiskies som exempel på ord med samma soundex-värde. (Han har då inte tagit hänsyn till initialbokstaven utan bara beräknat konsonantvärdet.) Vosse beskriver vidare att det i det engelska språket i medeltal finns 10,8 ord per Soundex-värde. Tittar vi på svenskan har orden bagge, baka och boss alla värdet 120 och får således en Soundex-kod på B120, trots att orden inte alls är lika varandra. Det borde vara uppenbart att Soundex har en alltför grov kodning för att vara effektiv i en seriös strängjämförelse. Skulle man jämföra olika strängar skulle man bli tvungen att sortera orden efter sifferordning. Dessutom saknar även den här metoden ett effektivt sätt att mäta distansen mellan de jämförda strängarna. Sättet att dela in "liknande bokstäver" i siffergrupper är en alltför grov indelning och säger ingenting om varför s och g har samma värde. Dessutom behandlas alla vokaler likadant, dvs. ignoreras helt vilket gör att det är omöjligt att säga någonting om vokalernas inbördes likhet. 7

14 2.3 Levenshtein-algoritmen och dynamisk programmering Levenshtein-algoritmen är ett exempel på vad som kallas dynamisk programmering vilket är en vanlig metod inom datavetenskapen när man vill hitta kortaste vägen mellan två punkter i ett nätverk. Trots termen programmering har det inget med programmering i ordets vanliga betydelse att göra, utan innebär snarast planering (Lindgren 1991). Ett konkret exempel på detta är beräkningar av den optimala flygbanan över Atlanten där flygplanen kan välja mellan ett antal olika flygrutter och där faktorer såsom väder och annan flygtrafik påverkar resultatet. Levenshtein-metoden kan också användas för att jämföra två eller flera strängar. Denna metod lanserades första gången 1965 av Levenshtein som ett sätt att jämföra hur två strängar förhåller sig till varandra i fråga om de tidigare nämnda transformationerna: insättning, borttagning och byte av tecken (Sankoff 1983). Grundidén var att se hur många transformationer som behövdes för att få en sträng x att övergå till en annan sträng y. För att beräkna detta bygger man upp en matris av de strängar som ska jämföras. Matrisen fylls sedan med tal som är beroende av om det aktuella strängelementet är lika med det jämförda eller inte. Om vi ska jämföra strängarna 'satta' och 'snatta' kommer vår matris att se ut som följer: s a t t a s n a t t a Varje position, (x,y) i tabellen är beroende av tre andra positioner/värden, nämligen (x-1, y), (x, y- 1) och (x-1, y-1). När vi börjar traverseringen av tabellen sker det i det övre vänstra hörnet där vi börjar med att jämföra elementen s och s. När två tecken är lika blir värdet samma som det minsta värdet av de tre värden som (x,y) är beroende av. Om två tecken, x och y inte är lika blir värdet det minsta beroende värdet + 1. I det här fallet är s och s lika och värdet 0 erhålls. Efter detta flyttar vi oss en position nedåt på y-axeln och jämför s med n. Då dessa inte är lika ska man alltså lägga till 1 till det lägsta värdet på någon av positionerna (x-1, y), (x, y-1) eller (x-1, y- 1). Då endast en av dessa positioner (x, y-1) finns tillgänglig för jämförelsen mellan s och n, adderas 1 till detta värde (0) och summan sparas på den aktuella positionen. Sedan fortsätter man på samma sätt med en kolumn i taget till man når matrisens sista ruta vilket är den i det nedre högra hörnet. När man kommit ned hit har man också beräknat det antal tecken som skiljer de båda 8

15 strängarna åt. Om man använder sig av Levenshtein-termer kan man säga att man behöver sätta in ett (1) tecken ( n ) för att transformera strängen satta till snatta. Om man vill använda en formell beskrivning av Levenshteins algoritm, kan man se matrisen som en tabell bestående av n antal rader och m antal kolumner, och att distansen d mellan strängarna a och b beskrivs som d(a, b). Vid initieringen av matrisen har vi således värdet d(a 0, b 0 ) = 0. Resultatet efter att ha traverserat hela matrisen ges av värdet för positionen d(a n, b m ). Själva beräkningen av värdena i matriserna positioner beskrivas som: d(a i, b j ) = min d(a i-1, b j ) + w(a i, b j ) OR d(a i-1, b j-1 ) + w(a i, b j ) OR d(a i, b j-1 ) + w(a i, b j ) där w = 0 om a = b, och w = 1 om a!= b. På samma sätt som de två tidigare algoritmerna, n-gram och Soundex, har Levenshtein-algoritmen i sin ursprungliga version svårt att visa den fonetiska likheten mellan strängarna. Även om man använde sig av fonetiskt transkriberade strängar skulle metoden i sin nuvarande form bara säga om ett fonem är samma fonem som det jämförda. Jag har detta till trots ändå använt mig av Levenshteins metod för att jämföra strängar, dock med vissa modifikationer vilka förklaras senare i rapporten. 9

16 3 Fonetik, fonologi och relaterade begrepp Fonetik är det språkvetenskapliga studiet av mänskligt tal där man studerar talapparaten och talsignalen, medan fonologi är den vetenskap som beskriver och definierar våra språkljud. Gemensamt för både fonetiken och fonologin är beskrivningar som relaterar till fonembegreppet. Ett fonem brukar definieras som språkets minsta betydelseskiljande enhet. Huruvida man har med ett fonem att göra kan man testa genom att byta ut ett ljud mot ett annat i ett ord. Om ordet efter bytet har övergått till en annan betydelse än innan, har vi att göra med två olika fonem. Till exempel är ljuden /p/ och /b/ olika fonem eftersom orden bil och pil är två ord med olika betydelse. Eftersom fonem realiseras i skriven form som transkriberade symboler, kan det vara på sin plats att börja med att ge en beskrivning av de två fonetiska alfabet som är av betydelse för den här rapporten. Det är dels IPAs (International Phonetic Association) fonetiska alfabet som är den standard enligt vilken man idag transkriberar fonetisk text, och dels SAMPA som är en asciinotation av IPAs fonetiska teckenuppsättning och det alfabet som jag använder mig av i mitt program. 3.1 Fonetisk transkription Fonetisk transkription använder man för att kunna ge en ortografisk bild av hur ett ord låter. Detta gör att ord som låter lika men stavas olika (homofoner) har en och samma fonetiska transkription. Till exempel skulle orden gärna och hjärna båda transkriberas som [!Θ α] med IPA s fonetiska alfabet. Man kan helt enkelt säga att uppgiften för den fonetiska representationen med dess fonetiska tecken är att man ska kunna skriva som det låter. För att transkribera ett ljud eller ett helt ord fonetiskt använder man sig av något av de olika fonetiska teckensystem, eller alfabet som finns. Anledningen till att det finns olika system är att de ofta är framtagna för att kunna användas för olika ändamål. Det allmänt mest kända och använda fonetiska alfabetet är som nämndes tidigare IPA (International Phonetic Alphabet) vilket är en standard när det gäller fonetisk transkribering IPA-notationen IPA är som sagt en förkortning för International Phonetic Alphabet och är den standard man idag använder när man vill transkribera ljud och ord till en fonetisk representation. IPA har tagits fram 10

17 av International Phonetic Association (vilket också förkortas IPA) som är en organisation med gamla anor. Föreningen startades i Frankrike 1886 av språklärare och fick sitt nuvarande namn året därpå. Den första versionen av det fonetiska alfabet som idag är känt som IPA publicerades Alfabetet har genomgått ett antal revisioner genom åren, varav den senaste gjordes Syftet med IPAs alfabet har framför allt varit att ha ett universellt system med ljudsymboler som går att använda för att i skrift representera alla olika språkljud. Trots (eller kanske på grund av?) dess strävan att vara så universellt som möjligt, har man utgått från det latinska alfabetet för att beskriva de huvudsakliga ljuden, dvs man har t.ex. tilldelat det vanliga t-ljudet ett t som symbol för det ljudet osv. För de mer speciella ljuden finns en uppsättning diakritiska tecken vilka kan användas för att ytterligare särskilja vissa ljud från varandra. IPAs klassificering utgår från artikulatoriska principer vilket betyder att indelningen i fonem baserar sig på var och hur språkljuden bildas i talapparaten. Den huvudsakliga uppdelningen görs mellan konsonanter och vokaler och följer den indelning som beskrivs i avsnittet om fonetiska särdrag nedan. IPA-notationen är en bra och relativ enkel metod för att fonetiskt transkribera ord i skriftform. Problemet är att IPA använder sig av speciella tecken som inte ingår i den teckenuppsättning som en dator normalt använder, dvs de är inte normala så kallade ascii-tecken. I avsnittet nedan om fonetiska klasser och särdrag visas den uppställning av vokaler och konsonanter som IPA tillämpar i sitt alfabet SAMPA-notationen SAMPA är en förkortning av SAM Phonetic Alphabet där SAM står för Speech Assessment Methods. SAMPA är en ascii-notation av IPA vilket innebär att ljuden beskrivs med vanliga tecken, vilket förenklat kan sägas vara de tecken som vi normalt använder när vi skriver på en dator. Till detta används ascii-tecknen 37 till 126 i ascii-tabellen vilket motsvarar bokstäverna a till z, både som gemener och versaler, siffrorna 0 till 9 samt de tecken som normalt återfinns på tangentbordens siffertangenter såsom (&/()[]) etc. Till skillnad från IPA som är tänkt att vara ett generellt alfabet med tecken för alla ljud som finns i alla världens språk, är SAMPA mer språkberoende. Detta betyder att det inte finns en generell 11

18 uppsättning tecken, utan varje språk har sin uppsättning SAMPA-tecken för att täcka in det aktuella språkets behov. Till exempel är vokalerna för svenska uppdelade på långa, korta samt r-öppna vokaler. Denna sista grupp vokaler är de ä- och ö-ljud som i svenskan är mer öppna när de förekommer före ett r. Se bilaga 1 för en fullständig tabell över det svenska SAMPA-alfabetet. I SAMPAs teckenuppsättning för svenska finns även tecken för tonaccent, dvs variationer i tonhöjdsförloppet på ordnivå. Dessa tecken används dock inte i det Telia-lexikon som jag har använt och används därför heller inte i mitt program. Tonaccent är något som för vissa dialekter skulle kunna vara viktigt för att bestämma huruvida ett ord är mer eller mindre likt ett annat. T.ex. kan man tänka sig att ordet anden (fågeln) för vissa dialekter är mer likt ordet handen än vad det är likt ordet anden (~själen). I SAMPAs svenska fonemuppsättning markeras tonaccent med tecknet. Akut accent markeras med ett -tecken, medan grav accent markeras med två -tecken: anden (fågeln) anden (anden i flaskan) 3.2 Fonetiska särdrag Det är tänkt att man i mitt program ska kunna jämföra fonemen i två ordsträngar med tre olika finhetsgrader där man med finhetsgrad menar hur pass fin indelning av fonemen man gör. Anledningen till att vilja ha olika nivåer på jämförelsen är att man ibland inte vill bry sig om t.ex. skillnaden på ett s-ljud och ett sch-ljud, utan är intresserad av större skillnader utan att programmet ser den totala skillnaden som alltför stor. I verkligheten där man t.ex. använder taligenkänning som en applikation över en brusig telefonlinje kan bruset göra att applikationen inte uppfattar skillnaden mellan just s- och sch-ljud. Därför kan det vara bra att kunna jämföra fonem på ett mer eller mindre grovt sätt. På den finaste nivån är varje fonem unikt och varje fonem tilldelas en egen kombination av fonetiska särdrag. Med särdrag menar vi här en kvalitet som det aktuella fonemet antingen har eller inte har. Sådana särdrag brukar kallas binära. På denna nivå finns även allofoner vilka är uttalsvarianter av ett språkljud och som styrs av dess omgivande ljud. Här representeras de av de ä- och ö-ljud som normalt är mer öppna när de förekommer framför bokstaven r. I den här rapporten beskrivs dessa allofoner som r-öppna. På den näst finaste nivån delar två eller flera fonem samma fonetiska egenskaper, t.ex. ser man hos vokalerna inte längre till särdraget r-öppen vilket gör ä-ljudet i orden här och läs likadana. För 12

19 konsonanterna gäller den andra nivån att jag inte ser till tonalitet (se avsnitt ) vilket gör att fonemen /p/ och /b/ blir till samma språkljud, och därmed orden bara och para till samma ord. I den tredje och grövsta nivån ser jag för vokalerna bara till särdragen bakre, mellan och främre tillsammans med distinktionen lång/kort. För konsonanterna jämför jag då inte fonetiska särdrag, utan bara artikulationssätt vilket gör att flera konsonanter kommer att ses av programmet som samma fonem. De artikulationssätt som här används är: klusiler, frikativor, nasaler, lateraler, tremulanter och approximanter. Dessa klasser förklaras närmare i avsnitt Vokaler och deras särdrag Vid analysen av fonem gör man oftast den inte helt ovanliga distinktionen mellan vokaler och konsonanter. Konsonanterna delas traditionellt upp enligt artikulationsställe och artikulationssätt samt huruvida fonemet ifråga är tonande eller tonlöst. Vokalerna brukar beskrivas med en vokalfyrsiding vilket är en grafisk bild över munhålan och de positioner där de olika vokalljuden bildas. Vokalfyrsiding med IPAs fonetiska vokaltecken (MacMahon) Denna vokalfyrsiding visar vokalernas produktionsställe i form av tungryggens högsta punkt samt om det ligger längre fram eller bak i munhålan där front är främre delan av munnen och back är bakre delen av munhålan. Dessutom delar man in vokalerna i rundade och orundade vokaler vilket syftar på läpparnas inställning vid uttalet. Det är denna indelning jag utgår ifrån i mitt program för att dela in vokalerna i olika kategorier. De kategorier jag använder är bakre, främre, hög, låg, rund, lång och r-öppen. Se tabellen i bilaga 2 för 13

20 en fullständig översikt över de IPA-fonem, tillsammans med deras motsvarighet i SAMPA som jag använder. De flesta av de ovan nämnda kategorierna återfinns i vokalfyrsidingen ovan, dock inte alla, så för att få en förståelse för dessa begrepp ges här en kort beskrivning av dem: Främre vokaler Främre vokaler kallas de vokaler som uttalas då tungans högsta punkt befinner sig någonstans i den främre delen av munnen. Dessa vokaler återfinns på den vänstra sidan av vokalfyrsidingen och motsvaras av svenskans vokaler [ι]-vit, [ ]-vitt, [ε]-vet, [Ε]-väta, [α]-hall, [Θ]-kär, [ψ]-dyr, [Ψ]- trygg, [Ο]-sjö och [ ]-hör. Mellanvokaler Även om jag inte använder denna fonemgrupp explicit i mitt program, finns det naturligtvis vokaler som har denna kvalitet. Eftersom fonetiska särdrag är binära kan en mellanvokal beskrivas med särdragen bakre och främre, dvs. den är varken bakre eller främre vilket i sin tur gör den till en mellanvokal. De vokaler som räknas till denna grupp är de som uttalas med tungans högsta position i den mellersta delen av munnen. Dessa vokaler är [Π]-hund, [ ]-hus och [ ]-pojke. Bakre vokaler På samma sätt som de främre vokalerna bestäms även de bakre vokalerna av tungans högsta punkt, den här gången återfinns den i den bakre delen av munnen. Var exakt som dessa skiljelinjer går mellan bakre, mellersta, och främre delen av munhålan är svårt att definiera. Dock har man fastslagit vilka vokaler som traditionellt hör till vilken del. Vokaler som räknas som bakre vokaler är [Α]-hal, [Υ]-bott, [υ]-bo, [ο]-gå och [ ]-gått. Höga vokaler Denna vokalkvalitet kan också kallas för sluten vilket är den term som återges i vokalfyrsidingen ovan (close). Använder man distinktionen hög - låg som jag gör här, syftar man på om tungryggens högsta punkt är högt eller lågt placerad i munhålan. Om man istället använder distinktionen sluten öppen syftar man istället på passagen mellan tungans högsta punkt och gommen, dvs. om tungan är höjd blir utrymmet upp till gommen begränsat och vokalen därmed sluten. På samma sätt ökas utrymmet om tungans högsta punkt sänks och passagen då blir mer öppen. Jag använder mig av särdragen höga och låga vokaler i mitt program och får då även med mellanvokalerna på grund av 14

21 särdragens binära karaktär. Av svenskans vokaler är följande höga: [ι]-vit, [ ]-vitt, [ψ]-dyr, [Ψ]- trygg, [ ]-hund, [Υ]-bott, [υ]-bo. Medelhöga/medellåga vokaler Denna kategori är som sagt de vokaler som befinner sig mellan att vara höga och låga vokaler, dvs. vokaler producerade med tungans högsta punkt befäst på ett mellanhögt läge mot gomseglet. Dessa vokaler är följande: [ε]-vet, [Ε]-väta, [Θ]-kär, [Ο]-sjö, [ ]-hör, [ ]-pojke, [Π]-hund, [ο]-gå, [ ]- gått. Låga vokaler De låga vokalerna blir då de vars högsta tungpunkt befinner sig i ett lågt läge i munnen gentemot gomseglet. Dessa vokaler är: [α]-hall, [ ]- pöjk och [Α]-hal. Utöver dessa kvaliteter, använder jag särdragen rund, lång och r-öppen i mitt program. Särdraget rund syftar på om läpparna är rundade eller inte. Jämför det rundade fonemet [υ] som i bo med det orundade fonemet [ι] som i ordet vit. Denna distinktion kan naturligtvis ibland vara svår att göra eftersom gränserna är flytande. Även gränserna för särdragen lång och kort är mer eller mindre flytande. Lite krasst kan man säga att varje vokal i svenskan finns i två varianter; lång och kort. Som exempel kan nämnas fonemen [α] som i ordet matt, och [Α] som i ordet mat. Det sista särdraget är något som kallas för r-öppning och som jag har nämnt tidigare har detta att göra med att svenska språkljuden ä och ö ofta är mer öppna när de står framför ett r, som i orden här och hör Konsonanter och deras egenskaper Utmärkande för konsonanter, till skillnad från vokaler, är att de vid uttalet mer eller mindre blockerar luften i munhålan eller luftstrupen. Detta kan illustreras med skillnaden mellan ett p-ljud där luften helt blockeras innan den släpps ut (klusil), och ett v-ljud som bildas genom en betydligt svagare blockering av luften, och då med hjälp av tänderna och underläppen. Inom den artikulatoriska fonetiken, vilket är den inriktning inom fonetiken vi diskuterar här, är konsonanterna indelade i artikulationsställe och artikulationssätt, dvs i enlighet med var och på vilket sätt i talapparaten de produceras. IPA:s uppställning av konsonanterna bygger på dessa två kriterier och ser ut som följer: 15

22 IPAs uppställning över konsonantljuden. (MacMahon) Den översta raden visar artikulationsstället där den andra kolumnen från vänster (bilabial) betyder att fonemet uttalas med läpparna, dvs långt fram i munnen, medan den högra kolumnen innebär att uttalet sker långt bak i talapparaten med glottis (glottal), dvs stämläpparna. Där emellan sker en gradvis förskjutning framåt eller bakåt av fonemets produktionsställe. I kolumnen till vänster återfinns artikulationssättet, dvs. på vilket sätt fonemet i fråga har uttalats. Som man ser finns det både vita och gråa luckor i konsonanttabellen ovan. De vita luckorna visar en kombination av artikulationsställe och artikulationssätt som man inte har lyckats finna ett språkljud för. De färgade positionerna visar omöjliga kombinationer av artikulationsställe och artikulationssätt som alltså gör det omöjligt att producera ett sådant ljud över huvud taget Konsonanternas artikulationssätt Jag har tidigare bara nämnt konsonanternas artikulationssätt som allra hastigast i samband med presentationen av konsonanttabellen ovan. För att därför förstå jämförelsen på den grövsta nivån konsonanterna emellan, ska jag här bara helt kort redogöra för de artikulationssätt som är aktuella. Dessa är klusiler, nasaler, tremulanter, frikativor, lateraler och approximanter. Klusiler Klusilerna är en grupp konsonantfonem som innebär en fullständig avspärrning av utluften någonstans i talapparaten. Vid upphävningen av avspärrningen kan luften rusa ut varvid ett ljud uppstår. Svenskans klusiler är: " (pil), # (bil), $ (tåg), % (dag), & (bort), ' (bord), ( (kall) och ) (gå). 16

23 Nasaler Nasala språkljud är sådana vars uttal produceras genom att utluften passerar genom näsan istället för munnen vid uttalet. Svenskans nasaler är: * (mor), + (nog),, (barn), - (ange),. (sång) och / (symfoni). Tremulanter Tremulanter kallas den typ av fonem där någon del, t.ex. tungan eller tungspenen, börjar vibrera av luft-strömmen. Svenskans tremulanter är dels det vanliga svenska r-ljudet (0) som i riktigt. och dels ett mer bakre, grevligt r-ljud (1). Frikativor Frikativor är ljud som uppstår då artikulatorerna (t.ex. underläppen eller tungspetsen) närmar sig varandra och det uppstår en förträngning varvid en turbulens uppstår i luftströmmen. Svenskans frikativor är: 2 (far), 3 (var), 4 (sade), 5 (fors), 6 (kina), 7 ( stockholms-r ) samt 8(gilla). Lateraler Lateraler är fonem som uttalas genom att man vid uttalet låter luften passera längs tungans sida, eller sidor. De svenska lateralerna är 9 (lära) och : (pärla). Om man uttalar ordet pärla och håller ut på rl-ljudet, kan man tydligt känna luften passera på sidan av tungan. Om man dessutom tar i lite extra vid l-ljudets uttal, kan man lättare upptäcka vilken sida av tungan luften passerar på. Approximanter Approximanter är spåkljud som även de uppstår när artikulatorer närmar sig varandra, precis som med frikativa ljud. Skillnaden är att det för approximanter inte uppstår någon turbulens i luftströmmen. Exempel på en sådan approximant är svenskans j-ljud (!) Konsonanter och särdrag De fonetiska särdrag jag har använt mig av för att beskriva konsonantljud på den finaste nivån i mitt program är följande: vokalisk, konsonantisk, sonorant, nasal, lateral, kontinuant, koronal, anterior, och tonande. Dessa fonetiska särdrag gör att vi kan ställa upp en särdragslista för olika fonem. En sådan skulle då kunna se ut som följer för fonemen /p/, /s/ och /l/: 17

24 Fonem: /p/ /s/ /l/ Vokalisk Konsonant Sonorant Nasal Lateral Kontinuant Koronal Anterior Tonande Eftersom det är dessa 9 fonetiska särdrag som används i mitt program är det på sin plats att ge dem en kort beskrivning: Vokalisk Fonem som har detta särdrag kallas halvvokaler. De räknas sitt namn till trots till konsonanterna. Typiskt för de här fonemen är att luftströmmen inte stöter på något hinder vid uttalet, som annars är typiskt för konsonanter. Engelskans ord we inleds med en sådan halvvokal. I svenskan brukar man räkna j-ljudet i t.ex. ord som jag till den här typen av fonem. Konsonantisk Till skillnad från vokaliska ljud så stöter konsonantiska fonemljud (eller rättare sagt deras utluft) på ett mer eller mindre stort hinder när de uttalas. Till denna särdragsgrupp räknas alla vanliga konsonanter med undantag av så kallade likvidor (l- och r-ljud). Jämför dessa fonemljud med t.ex. ett p-ljud där utluften möter ett betydligt större motstånd vid uttalet. Sonoranter Den här gruppen av fonem innefattar egentligen både vokaler och konsonanter. Bland de sistnämnda räknas ovan nämnda halvvokaler, nasaler (m- och n-ljud) och likvidor (l- och r-ljud). Typiskt för sonoranterna är att luften har fri passage genom talapparaten när de uttalas, samt att de är tonande. Nasaler Nasaler beskrevs i avsnitt ovan. 18

25 Lateraler Lateraler beskrevs i avsnitt ovan. Kontinuanter Kontinuanter, eller kontinuerliga konsonanter är en grupp fonem som innefattar frikativor, likvidor (l- och r-ljud) samt j- och h-ljud. Man kan ibland se fonemgruppen kontinuanter lite slarvigt användas som skillnad mellan frikativor och klusiler där de förra är kontinuerliga konsonanter och de senare icke-kontinuerliga konsonanter. Denna fonemgrupp karaktäriseras av att ljudet pyser ut vid dess uttal. Koronaler Koronala språkljud är ljud som bildas med hjälp av främre delen av tungan. Ljuden bildas genom att denna del av tungan höjs mot baksidan av tänderna (dental) eller mot tandvallen (alveolar). Exempel på typiska koronala ljud är t.ex. l-, r- och s-ljud. Anteriorer Den här gruppen av fonem definieras av var någonstans i munhålan ljudet uppstår. Om ljudet produceras i den främre delen av munhålan (tandvallen och framåt), är konsonanten anterior, annars är fonemet, eller ljudet, icke-anteriort. Ljud som är anteriora är t.ex. m-, s- och p-ljud, medan k-, g- och ng-ljud då är icke-anteriora. Tonande Tonande ljud är helt enkelt ljud som uttalas med en vibration hos stämläpparna (stämbanden). Alla vokaler är tonande, medan ungefär hälften av konsonanterna har denna egenskap. Lite förenklat kan man säga att många konsonantpar bara skiljer sig genom att den ena medlemmen är tonande och den andra tonlös. Jämför t.ex. p- och b-ljuden där den förra är tonande och den senare tonlös. Den här genomgången av fonem och fonetiska grupper ska ses som en enkel översikt för att förenkla förståelsen för hur programmet fungerar i sin jämförelse av fonemsträngar. Den gör därför inte anspråk på att vara en heltäckande förklaring för hur fonetiska särdrag används inom fonologin. Vanligtvis används fonetiska särdrag för att beskriva olika fonetiska processer vilka jag har valt att inte gå in på i den här rapporten. 19

26 3.3 Stavelser Under arbetets gång har jag kontinuerligt testat olika sätt att förhålla sig till jämförelsen mellan fonemsträngarna. Det betyder att jag bl.a. har provat mig fram vad gäller vilka särdragslistor programmet skulle använda sig av, olika straffpoäng för jämförelser mellan vokaler och konsonanter osv. Något av det sista jag provade var att se till att programmet bara jämför ord som har lika många stavelser i sig. Anledningen till detta var att vi vid tester av programmet återkom till frågan vad som egentligen är fonetisk likhet och vad ord som låter lika har gemensamt med varandra. Det framkom då i dessa diskussioner att likalydande ord oftast har lika många stavelser i sig, och att det därför vore klokt att bara hålla sig till dessa. Stavelsen är en grundläggande fonotaktisk enhet vilken visar de minsta grammatiska kombinationer av vokaler och konsonanter som finns i ett ord. Stavelser är oftast uppbyggda kring en vokal som då fungerar som stavelsekärna kring vilken mindre sonora element hopar sig. Det finns flera olika metoder för hur man delar in ett ord i stavelser. En metod är att man först utgår från vokalerna i ordet varpå man sedan delar in konsonanterna i giltiga konsonantkluster. Hela processen skulle kunna beskrivas såsom följer: 1. Klassificera varje fonem i vokaler och konsonanter. 2. Dra en linje från vokalerna till stavelseskiktet (här markerat 3. För konsonanterna till stavelsekärnan till höger så länge som det är fonotaktiskt. (Vad som är fonotaktiskt eller inte, är språkberoende och ganska intuitivt, t.ex. kan klu sägas vara grammatiskt i svenska medan tklu inte är det.) 4. För övriga konsonanter till stavelsekärnan till vänster. (De streckade linjerna) Detta skulle med denna metod ge oss följande stavelseindelning för ordet konsonantkluster : k o n s o n a n t k l u s t e r Ord k v k k v k v k k k k v k k v @ Stavelsekärna Denna indelning gör att vi får stavelseindelningen kon-so-nant-klu-ster vilket gör att vi därmed har delat in ordet i 5 stavelser. 20

27 Jag har därför i mitt program utnyttjat vokalerna och räknat dessa som stavelser. Detta är egentligen att förenkla stavelsebegreppet lite. I vissa fall fungerar nämligen även konsonanter som stavelser. Exempel på detta kan vara de norrländska orden vattn, getn där det avslutande n-ljudet fungerar som stavelse. Detta är dock relativt ovanligt i svenskan och antagandet om att antalet vokaler stämmer med antalet stavelser är betydligt säkrare. 21

28 4 Beskrivning av programmet Nu när vi har beskrivit de grundläggande fonetiska begrepp och tekniker som används i mitt program, går vi vidare med att beskriva själva programmet och hur det fungerar. Som framkommit tidigare i rapporten ska mitt program mäta den fonetiska likheten mellan två ord och på så sätt producera ett likhetsmått. När vi här talar om ord handlar det om ord som på förhand har blivit fonetiskt transkriberade till en SAMPA-notation som används på Telia Promotor. Denna transkription bygger på den SAMPA-standard som finns för svenska (Wells 1995), men har dock några modifierade tecken. Dessa är de retroflexa ljuden /rd/ (bord), /rt/ (fort), /rs/ (fors), /rn/ (hörn) och /rl/ (pärla) som i Telias SAMPA-notation transkriberas med inledande versal; /Rd/, /Rt/ osv. Programmet i dess nuvarande form mäter alltså distansen mellan ett testord och alla ord som finns i ett lexikon. Detta lexikon innehåller ett antal lexikoningångar där varje rad innehåller ett ord. Varje rad börjar med ordets ortografiska representation, dvs ordet återgivet såsom det stavas. Därefter följer samma ord fast då transkriberat med den speciella SAMPA-notation som jag beskrev ovan. Om uppslagsordet i fråga har mer än en uttalsvariant visas detta genom ordet anges en gång till och att det andra uttalet anges (fonetiskt transkriberat) inom vinkelparenteser direkt efter den ortografiska representationen. Därpå följer samma fonetiska transkription en gång till, då i den högra kolumnen: almvik almvi:k alvesta alvesta andra andra andra<anra> anra aneby A:neby: ankomst ankomst ankomst<ankomst> ankomst Här kan vi se att lexikoningångarna andra och ankomst båda har två uttalsvarianter vardera; [andra] och [anra] respektive [ankomst] och [ankomst]. 22

29 4.1 Programmets in- och utdata Lexikonet som programmet arbetar mot ser i princip ut som listan med exempel ovan. Storleken kan vara allt från en rad, dvs ett ord, till en storlek där datorns arbetsminne sätter den övre gränsen. Programmet startas genom att det anropas med fyra argument där det första är det ord som ska mätas, dvs en i SAMPA transkriberad sträng av det ordet. Det andra argumentet är namnet på ett lexikon som ordet ska jämföras mot. Det tredje argumentet är graden av fonetisk finhet på jämförelsen. Denna anges som L1, L2 eller L3 där L1 är den finaste nivån och L3 den grövsta. Det fjärde och sista argumentet bestämmer hur många svar man vill att programmet ska returnera. Detta argument är frivilligt och kan hoppas över varvid programmet ger alla lexikonord som utdata. c:\ dist testord lex-fil nivå (antal) Formatet på programmets utdata är en numrerad lista med de mest lika orden i lexikonet tillsammans med deras likhetsvärde. Om vi skulle testa testordet testord mot lexikonet med namnet sts.txt för den finaste nivån och begära de fem bästa resultaten, skulle utdatat från programmet se ut så här: E:\EX-JOBB\KOD\Debug>Dist testu:rd sts.txt L1 5 Please wait while the distance is computed... 1 förstår (f2sto:r) Distance: 1.17 tisdag<tisdag> (tisdag) Distance: tisdag<tista> (tista) Distance: fästad (fe:sta:d) Distance: 1.33 tisdag<ti:sdag> (ti:sdag) Distance: 1.33 tisdagen<tistan> (tistan) Distance: sexton (sekston) Distance: pingstdag (pinstda:g) Distance: 1.43 Från listan kan vi se att programmet tyckte att orden förstår [f2sto:r] och tisdag (då med uttalsvarianten [tisdag]), var de ord som låter mest lika ordet testord [testu:rd]. Till höger i listan ser man alltså distansmåttet där ett lågt tal visar på en större likhet än ett stort tal. För att beräkna detta värde, använder programmet binära särdragsvektorer (se avsnitt 4.2) som innehåller en mängd fonetisk information om fonemen. Det ska i sammanhanget sägas att det lexikon som jag här testade ordet mot är ett lexikon med information om tågstationer och ortsnamn, alltså ett ganska specialiserat lexikon där allmänna ord saknas som i vanliga fall skulle låta mer likt testord än vad som visas här. Det bör också understrykas att programmet inte talar om huruvida ett ord är fonetiskt 23

30 likt ett annat ord eller inte, utan bara hur likt det är. Det här betyder att trots att förstår och tisdag enligt programmet är de ord som är mest fonetiskt lika ordet testord, betyder det inte att de är lika. 4.2 Programmet och Levenshtein Programmet använder Levenshtein-algoritmen för att traversera de två fonemsträngar som ska jämföras. Levenshtein-algoritmen beskrevs i avsnitt 2.3 ovan och principen att göra en matris av fonemsträngarna är densamma. Vad som skiljer mitt program från Levenshteins vanliga algoritm, är att istället för att jämföra de aktuella fonemen i matrisen, hämtar programmet ett värde som är jämförelsevärdet mellan de två fonemen. Detta fungerar så att varje fonem representeras av en binär sträng, dvs har en sträng av 1:or och 0:or knuten till sig: "r", " ", "f", " ", "s", " ", "t", " ", "Rd"," ", // rysa // far // sann // tik // bord Här ser man fonemet till vänster om binärsträngen, och längst till höger återfinns ett ordexempel för tydlighetens skull. Det exempel som visas ovan är binärsträngar från den finaste nivån, dvs. nivå L1 där varje fonem är unikt och därmed har en unik binärsträng. Den binära strängen visar huruvida fonemet har något av följande fonetiska särdrag: (från vänster till höger) vokalisk, konsonaniskt, sonorant, nasal, lateral, kontinuant, koronal, anterior, tonande och vokalmarkör. Detta sista särdrag (vokalmarkör) används bara av programmet för att skilja mellan vokaler och konsonanter. Detta sker i programmet genom att man vid jämförelsen av två fonem först tittar på fonemsträngarnas respektive högra tecken (etta eller nolla). Om dessa båda bitar antingen är nollor eller ettor kan en jämförelse ske. Om dessa två bitar är olika har man att göra med en konsonant och en vokal, vars jämförelse tilldelas ett fast värde istället för att man jämför deras respektive särdragssträng. På samma sätt representeras vokalerna även de av binära strängar: "e", " ", // vett "2", " ", // höst "o:"," ", // gå "u:"," ", // bo Vokalernas binärsträng är dock lite kortare vilket har att göra med att de har ett mindre antal särdrag som skall jämföras mot varandra. Vokalernas särdrag är från vänster till höger: bakre, främre, hög, låg, rund, lång, r-öppen samt vokalmarkör. 24

Fonetik. Dolores Meden

Fonetik. Dolores Meden Fonetik Dolores Meden Innehållsförteckning 1. Inledning...3 2. Allmänt...4 2.1 Vad är fonetik?...4 2.2 Talproduktion...4 2.2.1 Konsonanter...5 Stämbandston...5 Artikulationsställe...5 Artikulationssätt...5

Läs mer

man kan lyssna på vad de betyder man kan lyssna efter hur de låter utan att bry sig om vad de betyder.

man kan lyssna på vad de betyder man kan lyssna efter hur de låter utan att bry sig om vad de betyder. LJUDLEK Vad är språklig medvetenhet? Små barn använder språket för kommunikation HÄR och NU, och det viktiga är vad orden betyder. Man kan säga att orden är genomskinliga, man ser igenom dem på den bakomliggande

Läs mer

tentaplugg.nu av studenter för studenter

tentaplugg.nu av studenter för studenter tentaplugg.nu av studenter för studenter Kurskod Kursnamn UMU-14401 Spanish A1 Datum Material Sammanfattning Kursexaminator Betygsgränser Tentamenspoäng Övrig kommentar Innehåller frågor/ begrepp med svar

Läs mer

Uttalskorrigering med hjälp av Fonetisk text

Uttalskorrigering med hjälp av Fonetisk text Uttalskorrigering med hjälp av Fonetisk text Handitek Gewa AB BOX 92, MALMVÄGEN 55, 191 22 SOLLENTUNA TEL: 08-594 694 00 TEXTTEL: 08-594 694 18 FAX: 08-594 694 19 E-MAIL: info@gewa.se WEB: www.gewa.se

Läs mer

H LH L] fonologikompendium] (x.) (.x) Tomas Riad Sep.tem.ber mcmxcvii

H LH L] fonologikompendium] (x.) (.x) Tomas Riad Sep.tem.ber mcmxcvii σ µµ Svenskt H LH L] fonologikompendium] (x.) (.x) Tomas Riad Sep.tem.ber mcmxcvii Detta kompendium ger en introduktion till svensk fonologi. Förutom att presentera fonologins olika delar har jag har strävat

Läs mer

Artikulatorisk fonetik

Artikulatorisk fonetik Artikulatorisk fonetik Tomas Riad Detta kompendium riktar sig särskilt till studenter på grundnivå i nordiska språk. För den som vill läsa utförligare beskrivningar av fonetik hänvisas till de arbeten

Läs mer

>> Inledning. projektgrupp@lingolympiad.net

>> Inledning. projektgrupp@lingolympiad.net >> Inledning Det här är en liten broschyr om det internationella fonetiska alfabetet, IPA. Den får gärna användas i språkundervisning, den är framförallt riktad till gymnasiet. Vi rekommenderar starkt

Läs mer

Svenska språkets struktur: fonetik. kända svårigheter i svenska som andraspråk. Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.

Svenska språkets struktur: fonetik. kända svårigheter i svenska som andraspråk. Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu. Svenska språkets struktur: fonetik kända svårigheter i svenska som andraspråk Helen Winzell (rum 4315, Key-huset) 013-28 69 28 helen.winzell@liu.se Om läraren vet vilka uttalsfel som är frekventa och också

Läs mer

Microsoft Office Excel, Grundkurs 1. Introduktion

Microsoft Office Excel, Grundkurs 1. Introduktion Dokumentation - Kursmaterial Innehåll 1. Introduktion 1.1. Programfönster 1.2. Inskrift och redigering 1.3. Cellformat 1.4. Arbeta med formler Kursövning E1.xlsx Egna Övningar E1E.xlsx - OnePRO IT, Bengt

Läs mer

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1

Bakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1 Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut

Läs mer

3. Metoder för mätning av hörförmåga

3. Metoder för mätning av hörförmåga 3. Metoder för mätning av hörförmåga Sammanfattning Förekomst och grad av hörselnedsättning kan mätas med flera olika metoder. I kliniskt arbete används oftast tonaudiogram. Andra metoder är taluppfattningstest

Läs mer

UPPGIFT 1 TVÅPOTENSER. UPPGIFT 2 HISSEN I LUSTIGA HUSET.

UPPGIFT 1 TVÅPOTENSER. UPPGIFT 2 HISSEN I LUSTIGA HUSET. UPPGIFT 1 TVÅPOTENSER. 2 ½ ¾ = 5575186299632655785383929568162090376495104 n = 142 är det minsta värde på n för vilket 2 Ò inleds med siffrorna 55. Uppgiften består i att skriva ett program som tar emot

Läs mer

Excel Övning 1 ELEV: Datorkunskap Sida 1 Niklas Schilke

Excel Övning 1 ELEV: Datorkunskap Sida 1 Niklas Schilke Datorkunskap Sida 1 Niklas Schilke Excel Inledning Microsoft Excel är ett kalkylprogram som ingår i Microsoft Office. Kalkyl betyder här beräkning så vi kan säga att Excel är ett program som används för

Läs mer

Graärgning och kromatiska formler

Graärgning och kromatiska formler Graärgning och kromatiska formler Henrik Bäärnhielm, d98-hba 2 mars 2000 Sammanfattning I denna uppsats beskrivs, för en ickematematiker, färgning av grafer samt kromatiska formler för grafer. Det hela

Läs mer

Röstteknik och Läsmetod

Röstteknik och Läsmetod Röstteknik och Läsmetod Jan Alpsjö www.lentos.se tel: 0705-120206 RÖSTTEKNIK OCH LÄSMETOD Till vardags talar vi lite si och så. Ibland otydligt, ibland obegripligt, ibland hela meningar och ibland halva,

Läs mer

Genetisk programmering i Othello

Genetisk programmering i Othello LINKÖPINGS UNIVERSITET Första versionen Fördjupningsuppgift i kursen 729G11 2009-10-09 Genetisk programmering i Othello Kerstin Johansson kerjo104@student.liu.se Innehållsförteckning 1. Inledning... 1

Läs mer

Tommy Färnqvist, IDA, Linköpings universitet. 1 ADT Map/Dictionary 1 1.1 Definitioner... 1 1.2 Implementation... 2

Tommy Färnqvist, IDA, Linköpings universitet. 1 ADT Map/Dictionary 1 1.1 Definitioner... 1 1.2 Implementation... 2 Föreläsning 4 ADT Map/Dictionary, hashtabeller, skip-listor TDDC91: DALG Utskriftsversion av föreläsning i Datastrukturer och algoritmer 9 september 2015 Tommy Färnqvist, IDA, Linköpings universitet 4.1

Läs mer

Utveckling av simulator för ärendehanteringssystem

Utveckling av simulator för ärendehanteringssystem Datavetenskap Opponent(er): Emil Danielsson & Patrik Lundberg Respondent(er): Niclas Hanold & Samiar Saldjoghi Utveckling av simulator för ärendehanteringssystem Oppositionsrapport, C/D-nivå 2005:xx 1

Läs mer

Användarhandledning Version 1.2

Användarhandledning Version 1.2 Användarhandledning Version 1.2 Innehåll Bakgrund... 2 Börja programmera i Xtat... 3 Allmänna tips... 3 Grunderna... 3 Kommentarer i språket... 4 Variabler... 4 Matematik... 5 Arrayer... 5 på skärmen...

Läs mer

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000

TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Lars Ahrenberg, sid 1(5) TENTAMEN TDDA94 LINGVISTIK, 3 poäng tisdag 19 december 2000 Inga hjälpmedel är tillåtna. Maximal poäng är 36. 18 poäng ger säkert godkänt. Del A. Besvara alla frågor i denna del.

Läs mer

Guide till att använda Audacity för uttalsövningar

Guide till att använda Audacity för uttalsövningar Guide till att använda Audacity för uttalsövningar Victoria Johansson Humlabbet, SOL-center, Lund IT-pedagog@sol.lu.se 28 mars 2006 1 Inledning Audacity är ett program som kan användas för att spela in

Läs mer

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Word-guide Introduktion

Word-guide Introduktion Word-guide Introduktion På det kognitionsvetenskapliga programmet kommer du läsa kurser inom flera olika vetenskapsområden och för varje vetenskapsområde finns ett speciellt sätt att utforma rapporter.

Läs mer

Röstanatomisk översikt 1

Röstanatomisk översikt 1 Röstanatomisk översikt 1 Detta är en grundläggande (1) översikt över röstorganet och dess funktion, bestående av de tre delar som samspelar från inandning till färdig ton. Där den latinska eller engelska

Läs mer

Bruksanvisning AllTid

Bruksanvisning AllTid Bruksanvisning AllTid Flexénita Sunnerstavägen 58 186 70 Brottby 08-512 418 03 Rev F 2005-12-15 Innehållsförteckning 1 Innehållsförteckning...1 Introduktion...3 Utrustning...3 Installation...3 Terminologi...4

Läs mer

Att skriva på datorn

Att skriva på datorn Att skriva på datorn Innehåll: Inledning 1 Tangentbordet 2 Att skriva i Word 4 Att skriva på Internet 7 Övningar 8 2 Inledning Välkommen till steg 2 av Internetkursen för nybörjare! Vid detta kurstillfälle

Läs mer

Institutionen för lingvistik och filologi HT 2009

Institutionen för lingvistik och filologi HT 2009 Instruktioner: Du har 15 minuter på dig per prov. Varje fråga har enbart ett rätt svar. För godkänt krävs minst 6 rätta svar/prov. Facit finns i slutet av dokumentet. Miniprov för Dag 1, 1 september 2009:

Läs mer

Utveckling av ett grafiskt användargränssnitt

Utveckling av ett grafiskt användargränssnitt Datavetenskap Opponenter: Daniel Melani och Therese Axelsson Respondenter: Christoffer Karlsson och Jonas Östlund Utveckling av ett grafiskt användargränssnitt Oppositionsrapport, C-nivå 2010-06-08 1 Sammanfattat

Läs mer

Introduktion. Byggstenar TDBA63 2005-11-22

Introduktion. Byggstenar TDBA63 2005-11-22 Introduktion UML står för Unified Modeling Language. Det är tänkt att fungera som hjälpmedel vid modellering av alla tänkbara typer av utvecklingsarbeten, inte bara inom dataomdrådet. Det största värdet

Läs mer

Talsystem Teori. Vad är talsystem? Av Johan Johansson

Talsystem Teori. Vad är talsystem? Av Johan Johansson Talsystem Teori Av Johan Johansson Vad är talsystem? Talsystem är det sätt som vi använder oss av när vi läser, räknar och skriver ner tal. Exempelvis hade romarna ett talsystem som var baserat på de romerska

Läs mer

Ett enkelt OCR-system

Ett enkelt OCR-system P r o j e k t i B i l d a n a l y s Ett enkelt OCR-system av Anders Fredriksson F98 Fredrik Rosqvist F98 Handledare: Magnus Oskarsson Lunds Tekniska Högskola 2001-11-29 - Sida 1 - 1.Inledning Många människor

Läs mer

KALKYL OCH DIAGRAM. Kalkylbladet. 170 Datorkunskap Kalkyl och diagram

KALKYL OCH DIAGRAM. Kalkylbladet. 170 Datorkunskap Kalkyl och diagram 170 Datorkunskap Kalkyl och diagram KALKYL OCH DIAGRAM När du behöver göra beräkningar, diagram eller sammanställa större mängder data använder du Excel. Kalkylbladet Ett Excel-dokument kallas även för

Läs mer

Introduktion till programmering och Python Grundkurs i programmering med Python

Introduktion till programmering och Python Grundkurs i programmering med Python Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?

Läs mer

Flytta, koppla eller koppla loss personer i din databas (del 1 av 2)

Flytta, koppla eller koppla loss personer i din databas (del 1 av 2) Flytta, koppla eller koppla loss personer i din databas (del 1 av 2) Av Eva Dahlberg och Anders Larsson Flytta och koppla är den metod som används för att skapa en relation, dvs. länka samman personer

Läs mer

Genomgång utav KURT Kursvärderingssystemet för Linköpings Universitet

Genomgång utav KURT Kursvärderingssystemet för Linköpings Universitet Genomgång utav KURT Kursvärderingssystemet för Linköpings Universitet Överblick Varför kursvärdering? Samtliga kurser inom den grundläggande utbildningen vid LiU ska utvärderas med stöd av det elektroniska

Läs mer

Inför genomförandet av ThomasGIA

Inför genomförandet av ThomasGIA Inför genomförandet av ThomasGIA Innehåll Deltest 1: Slutlednings Deltest 2: Perceptuell snabbhet Deltest 3: Numerisk snabbhet Deltest 4: Ordförståelse Deltest 5: Spatial Introduktion ThomasGIA är ett

Läs mer

Vart tar språkteknologer vägen?

Vart tar språkteknologer vägen? Vart tar språkteknologer vägen? En miniundersökning av f.d. språkteknologstudenters arbeten och syn på sin utbildning Beáta B. Megyesi Institutionen för lingvistik och filologi Uppsala universitet bea@stp.ling.uu.se

Läs mer

Snabbguide för användare SourceTech Telllus

Snabbguide för användare SourceTech Telllus Snabbguide för användare SourceTech Telllus Copyright SourceTech AB 2000-2012 Innehållet i denna manual är skyddat enligt upphovsrättslagen och får varken helt eller delvis kopieras utan uttrycklig tillåtelse

Läs mer

efact Sök Sök/Rapporter (2008-04-18)

efact Sök Sök/Rapporter (2008-04-18) efact Sök Sök/Rapporter (2008-04-18) Sök För att söka efter fakturor, tryck Alt + Ö eller klicka på Sök i den övre menyraden. Man kan söka på tre olika typer av värden; 1. Fakturavärden. Information knutet

Läs mer

PROV I MATEMATIK Automatateori och formella språk DV1 4p

PROV I MATEMATIK Automatateori och formella språk DV1 4p UPPSALA UNIVERSITET Matematiska institutionen Salling (070-6527523) PROV I MATEMATIK Automatateori och formella språk DV1 4p 19 mars 2004 SKRIVTID: 15-20. POÄNGGRÄNSER: 18-27 G, 28-40 VG. MOTIVERA ALLA

Läs mer

Introduktion till MySQL

Introduktion till MySQL Introduktion till MySQL Vad är MySQL? MySQL är ett programmerings- och frågespråk för databaser. Med programmeringsspråk menas att du kan skapa och administrera databaser med hjälp av MySQL, och med frågespråk

Läs mer

UPPGIFT 1 PRESIDENTVALET

UPPGIFT 1 PRESIDENTVALET UPPGIFT 1 PRESIDENTVALET När man ska välja president i det lilla landet på andra sida jorden, görs det av några få röstberättigade väljare v, ett udda antal i intervallet 1 v 999. Dehark, 2 k 10 kandidater

Läs mer

Signalbehandling Röstigenkänning

Signalbehandling Röstigenkänning L A B O R A T I O N S R A P P O R T Kurs: Klass: Datum: I ämnet Signalbehandling ISI019 Enk3 011211 Signalbehandling Röstigenkänning Jonas Lindström Martin Bergström INSTITUTIONEN I SKELLEFTEÅ Sida: 1

Läs mer

Föreläsning 13. Dynamisk programmering

Föreläsning 13. Dynamisk programmering Föreläsning 13 Dynamisk programmering Föreläsning 13 Dynamisk programmering Fibonacci Myntväxling Floyd-Warshall Kappsäck Handelsresandeproblemet Uppgifter Dynamisk programmering Dynamisk programmering

Läs mer

Välkommen 2 Navigering 3 Bokstäverna 3 Övningar kopplade till boken 6 Ord 10

Välkommen 2 Navigering 3 Bokstäverna 3 Övningar kopplade till boken 6 Ord 10 Interaktiv skrivtavla (IST) IST-kort Tutti Frutti3.indd 1 08-06-18 15.27.19 Manual digitalt lärarstöd för Tutti Frutti Välkommen 2 Navigering 3 Bokstäverna 3 Övningar kopplade till boken 6 Ord 10 Välkommen!

Läs mer

getsmart Grå Regler för:

getsmart Grå Regler för: (x²) 1 2 Regler för: getsmart Grå Algebra 8 _ (x²) 1 2 Algebra 4 (2 2³) 1 4 _ xy (2 2³) 1 4 _ xy (x²) 1 2 _ (2 2³) 1 4 _ xy (x²) 1 2 _ (2 2³) 1 4 _ xy 4 Algebra Algebra _ 8 Det rekommenderas att man börjar

Läs mer

Words and Sentences Träna engelska!

Words and Sentences Träna engelska! Words and Sentences Träna engelska! Av LäraMera Program AB och Leripa AB Grafik Musik Röst Kristina Grundström Erik truedsson Helen Melhuish 1 Innehållsförteckning WORDS AND SENTENCES 1 Words and Sentences

Läs mer

Tove Andersson IT-Pedagoglinjen 09/10. hängande mot golvet, stå så några sekunder för att sträcka ut hela ryggen. Rulla sakta upp kota för kota.

Tove Andersson IT-Pedagoglinjen 09/10. hängande mot golvet, stå så några sekunder för att sträcka ut hela ryggen. Rulla sakta upp kota för kota. Pausgympa Rygg: Övning 1. Stå upp med fötterna en bit isär. Böj dig ner med armarna hängande mot golvet, stå så några sekunder för att sträcka ut hela ryggen. Rulla sakta upp kota för kota. Övning 2. Sträck

Läs mer

Analys av BI-system och utveckling av BIapplikationer

Analys av BI-system och utveckling av BIapplikationer Computer Science Fredrik Nilsson, Jonas Wånggren Daniel Strömberg Analys av BI-system och utveckling av BIapplikationer Opposition Report, C/D-level 2005:xx 1 Sammanfattat omdöme av examensarbetet Vi tycker

Läs mer

Termordlista. Olle Engstrand, Fonetikens grunder Författaren och Studentlitteratur 2004. aktiv artikulator Den artikulator som bildar avspärrning

Termordlista. Olle Engstrand, Fonetikens grunder Författaren och Studentlitteratur 2004. aktiv artikulator Den artikulator som bildar avspärrning Termordlista abducera dra isär (stämläpparna) accent 1) I svensk fonetik oftast i betydelsen tonal ordaccent (grav eller akut); även i betydelsen 2) prominensgrad, 3) regional uttalsvariant; ibland också

Läs mer

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning

ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning ENGA01: Engelska grundkurs, 30 högskolepoäng Studiebeskrivning Kursen består av följande delkurser vilka beskrivs nedan: Litteratur, 6 högskolepoäng Grammatik och översättning, 9 högskolepoäng Skriftlig

Läs mer

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data

5HVLVWHQVWDEHOO 'DWD3DUWQHU. Er partner inom data 5HVLVWHQVWDEHOO Tack för att du valde programmet 5HVLVWHQVWDEHOO! Vi hoppas att programmet ska vara till stor hjälp i ditt arbete. Har du synpunkter på programmet är du mycket välkommen att höra av dig

Läs mer

Allmän fonetik (och fonologi)

Allmän fonetik (och fonologi) Allmän fonetik (och fonologi) Med övningar på www.wordalist.com Gå med och gör övningarna under sökordet fonetik 2010 Milan Bílý Stockholm universitet Slaviska institutionen Sida 2 Innehållsförteckning

Läs mer

Microsoft Excel Grundkurs

Microsoft Excel Grundkurs Microsoft Excel Grundkurs Excelfönstret Excels menyrad. Excels Verrktygsfält: Den övre raden heter Standard och innehåller knappar för att öppna, stänga, skriva ut mm. Den undre heter Formatera och används

Läs mer

Datorövning 1 Calc i OpenOffice 1

Datorövning 1 Calc i OpenOffice 1 Datorövning 1 Calc i OpenOffice 1 1 OpenOffice Calc Till förmån för de som följer kursen Fysikexperiment för lärare skall vi här gå igenom några få exempel på hur OO Calc (motsvarar MS Excel) kan användas

Läs mer

Lär dig POWERPOINT. Lars Ericson datorkunskap.com

Lär dig POWERPOINT. Lars Ericson datorkunskap.com Lär dig POWERPOINT Lars Ericson datorkunskap.com POWERPOINT D A Programmet Microsoft PowerPoint används till att skapa grafiska presentationer till bildspel, presentationer mm. När du öppnar upp PowerPoint

Läs mer

SPRINT-HANDBOK (version 0.4)

SPRINT-HANDBOK (version 0.4) 1. FÄRG OCH FORM Detta är programmets startmeny. Texten överst på bilden (Avsluta, Ny användare, Om... och Välj användare) blir synlig då markören förs upp den blåa ramen. en ny användare. 6. 4. 5. får

Läs mer

2. Dels går det att klicka sig fram via appsamlingen (2a) (som liknar en rutig kvadrat). Klicka på E-post (2b). 2b.

2. Dels går det att klicka sig fram via appsamlingen (2a) (som liknar en rutig kvadrat). Klicka på E-post (2b). 2b. Google E-post I Google Apps for Education (GAFE) ingår motsvarande Googles G-mail som e-postprogram. Eftersom det är skolan som administrerar våra GAFE-konton samt att vi behåller vår gamla domän zonline.se

Läs mer

Linjära ekvationssystem. Avsnitt 1. Vi ska lära oss en metod som på ett systematiskt sätt löser alla linjära ekvationssystem. Linjära ekvationssystem

Linjära ekvationssystem. Avsnitt 1. Vi ska lära oss en metod som på ett systematiskt sätt löser alla linjära ekvationssystem. Linjära ekvationssystem Avsnitt Linjära ekvationssystem Elementära radoperationer Gausseliminering Exempel Räkneschema Exempel med exakt en lösning Exempel med parameterlösning Exempel utan lösning Slutschema Avläsa lösningen

Läs mer

Datastrukturer. föreläsning 6. Maps 1

Datastrukturer. föreläsning 6. Maps 1 Datastrukturer föreläsning 6 Maps 1 Avbildningar och lexika Maps 2 Vad är ett lexikon? Namn Telefonnummer Peter 031-405937 Peter 0736-341482 Paul 031-405937 Paul 0737-305459 Hannah 031-405937 Hannah 0730-732100

Läs mer

Nyheterna i Visma Tendsign 4.0

Nyheterna i Visma Tendsign 4.0 Användarmanual Nyheterna i Visma Tendsign 4.0 Uppdaterad 2014-05-21 VISMA COMMERCE AB +46 13 47 47 500 tendsignsupport@visma.com www.tendsign.com Innehållsförteckning 1. Visma TendSign 4.0... 2 2. Grafiskt

Läs mer

Maximanus. Tangenter med speciell betydelse på Maximanus. Uppkoppling

Maximanus. Tangenter med speciell betydelse på Maximanus. Uppkoppling Maximanus Uppkoppling Slå av spänningen till datorn. Koppla ur det normala tangentbordet. Koppla in Maximanus, där det normala tangentbordet var anslutet. Om även det normala tangentbordet ska användas,

Läs mer

Resledaren Användarguide Android Innehåll

Resledaren Användarguide Android Innehåll Resledaren Användarguide Android Innehåll Planera Ny Resa... 3 Visa Mina Resor... 13 Ta bort sparad resa... 14 Ändra planerad resa... 15 Påminnelser... 16 Under Resan... 17 Inaktivera Pågående Resa...

Läs mer

Bildbaskontoret Version 2

Bildbaskontoret Version 2 Bildfabriken Bildbaskontoret Version 2 BRUKSANVISNING Beställning och support: Trollreda Resurscenter info@trollreda.se Rev D 05-02-01 Innehållsförteckning 2 Introduktion... 3 Utrustning... 3 Om bildbaser...

Läs mer

Elements, säkerhetskopiering och dina bilder

Elements, säkerhetskopiering och dina bilder Elements, säkerhetskopiering och dina bilder Mattias Karlsson Sjöberg, december 2011. Moderskeppet.se Lär dig tänka rätt och använda rätt verktyg för att säkerhetskopiering, datorbyte och hårdiskbyte.

Läs mer

Färger. Matthew Woehlke Översättare: Stefan Asserhäll

Färger. Matthew Woehlke Översättare: Stefan Asserhäll Matthew Woehlke Översättare: Stefan Asserhäll 2 Innehåll 1 Färger 4 1.1 Inledning........................................... 4 1.2 Hantering av scheman................................... 4 1.2.1 Importerar

Läs mer

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4

Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 2014-2015. Lektion 4 Introduktion till algoritmer - Lektion 4 Matematikgymnasiet, Läsåret 014-015 Denna lektion ska vi studera rekursion. Lektion 4 Principen om induktion Principen om induktion är ett vanligt sätt att bevisa

Läs mer

Lyssna, läs och uttala. Eva Askling och Britt Wahlström-Ståhl

Lyssna, läs och uttala. Eva Askling och Britt Wahlström-Ståhl Lyssna, läs och uttala Eva Askling och Britt Wahlström-Ståhl OrdAF AB Postadress: Domherrevägen 16, 871 65 Härnösand Telefon: 0611-55 50 95 E-post: astrid.frylmark@telia.com Hemsidor: www.frylmark.net

Läs mer

Programmering. Den första datorn hette ENIAC.

Programmering. Den första datorn hette ENIAC. Programmering Datorn är bara en burk. Den kan inget själv. Hur får man den att göra saker? Man programmerar den. Människor som funderar ut program som fungerar. Datorn förstår bara ettor och nollor och

Läs mer

Kryptering. Av: Johan Westerlund Kurs: Utveckling av webbapplicationer Termin: VT2015 Lärare: Per Sahlin

Kryptering. Av: Johan Westerlund Kurs: Utveckling av webbapplicationer Termin: VT2015 Lärare: Per Sahlin Kryptering Av: Johan Westerlund Kurs: Utveckling av webbapplicationer Termin: VT2015 Lärare: Per Sahlin Inledning Den här rapporten ska hjälpa en att få insikt och förståelse om kryptering. Vad betyder

Läs mer

Använd WordFinder Pro för Mac optimalt! Snabbguide med nyttiga tips och trix.

Använd WordFinder Pro för Mac optimalt! Snabbguide med nyttiga tips och trix. Använd WordFinder Pro för Mac optimalt! Snabbguide med nyttiga tips och trix. Dokumentversion 2014-1 Tekniska förutsättningar För WordFinder 11 Pro för Mac krävs följande: Processor: Intel Mac OS X 10.8

Läs mer

KURSMÅL WINDOWS STARTA KURSEN

KURSMÅL WINDOWS STARTA KURSEN KURSMÅL WINDOWS Detta är en introduktionskurs för dig som är nybörjare. Du kommer att få bekanta dig med datorns viktigaste delar och lära dig grunderna i operativsystemet Windows, vilket är en förutsättning

Läs mer

Palette. Matchning fakturor mot order - Manual. Version 1.0 / 140530

Palette. Matchning fakturor mot order - Manual. Version 1.0 / 140530 Palette Matchning fakturor mot order - Manual 1 Innehållsförteckning TIPS:... 3 MATCHA FAKTURA... 4 OM FAKTURARADER FINNS I FÄLT 3... 6 Automatisk ommatchning... 6 Kvar att matcha... 7 Om rader får röd

Läs mer

EVALD manual. Evald version 2 2014-05-02

EVALD manual. Evald version 2 2014-05-02 EVALD manual Evald version 2 2014-05-02 Innehåll KURSVÄRDERING PÅ ENGELSKA... 1 Egna frågor på engelska...1 Sammanställning på engelska...1 KURSVÄRDERING GENERELLT... 2 Skapa kursvärdering...2 Ändra öppnings/stängningsdatum...5

Läs mer

Kom igång med. Windows 8. www.datautb.se DATAUTB MORIN AB

Kom igång med. Windows 8. www.datautb.se DATAUTB MORIN AB Kom igång med Windows 8 www.datautb.se DATAUTB MORIN AB Innehållsförteckning Grunderna i Windows.... 1 Miljön i Windows 8... 2 Startskärmen... 2 Zooma... 2 Snabbknappar... 3 Sök... 4 Dela... 4 Start...

Läs mer

RÖDA TRÅDEN SVENSKA F-KLASS ÅK

RÖDA TRÅDEN SVENSKA F-KLASS ÅK RÖDA TRÅDEN SVENSKA F-KLASS ÅK 5 F-KLASS Sambandet mellan ljud och bokstav Språket lyfter A3 läsa Alfabetet och alfabetisk ordning Lässtrategier för att förstå och tolka texter samt för att anpassa läsningen

Läs mer

En studie om fonetiska svårigheter hos andraspråksinlärare med grekiska som modersmål

En studie om fonetiska svårigheter hos andraspråksinlärare med grekiska som modersmål GÖTEBORGS UNIVERSITET Institutionen för svenska språket En studie om fonetiska svårigheter hos andraspråksinlärare med grekiska som modersmål Marianna Andersson Glinatsi Specialarbete, 15 hp Svenska som

Läs mer

Anpassningsbar applikationsstruktur för flerpunktsskärmar

Anpassningsbar applikationsstruktur för flerpunktsskärmar Datavetenskap Opponent(er): Rikard Boström Lars-Olof Moilanen Respondent(er): Mathias Andersson Henrik Bäck Anpassningsbar applikationsstruktur för flerpunktsskärmar Oppositionsrapport, C/D-nivå 2005:xx

Läs mer

Hammarbyskolan Reviderad februari 2009 Lokal kursplan i svenska/svenska som andra språk

Hammarbyskolan Reviderad februari 2009 Lokal kursplan i svenska/svenska som andra språk Lokal kursplan i svenska/svenska som andra språk Skriva alfabetets bokstavsformer t.ex. genom att forma eller att skriva bokstaven skriva sitt eget namn forma varje bokstav samt skriva samman bokstäver

Läs mer

PREMIUM COMAI WEBBKALENDER

PREMIUM COMAI WEBBKALENDER 1 PREMIUM COMAI WEBBKALENDER 2.0 ADMINISTRATÖR utvecklar och säljer anpassningsbara smartphone 2 Innehåll 1 Inledning... 3 1.1 Terminologi... 3 1.2 Teknisk kravspecifikation... 4 1.3 Behörigheter... 4

Läs mer

bilder för användning

bilder för användning Grundläggande guide i efterbehandling av bilder för användning på webben Innehåll Innehåll...2 Inledning...3 Beskärning...4 Att beskära en kvadratisk bild...5 Att beskära med bibehållna proportioner...5

Läs mer

Kursupplägg. Examination. Föreläsning 1: Intro till kursen och. Kursmaterial. programmering. Kursboken: Programmera med a multimedia approach

Kursupplägg. Examination. Föreläsning 1: Intro till kursen och. Kursmaterial. programmering. Kursboken: Programmera med a multimedia approach Föreläsning 1: Intro till kursen och Kursens hemsida http://www.it.uu.se/edu/course/homepage/prog1/esvt10 Studentportalen http://www.studentportalen.uu.se Kursmaterial Kursbok Kursprogramvara Tips: Installera

Läs mer

Inledning till OpenOffice Calculator Datorlära 2 FK2005

Inledning till OpenOffice Calculator Datorlära 2 FK2005 Inledning till OpenOffice Calculator Datorlära 2 FK2005 Mål Lära sig att skapa och använda ett räkneblad med OpenOffice Calculator Beräkna medelvärde och standardavvikelsen med räknebladet Producera en

Läs mer

Användarhandbok Svensk version:

Användarhandbok Svensk version: Användarhandbok Svensk version: Hargdata AB First Keys 3 Copyright Widgit Software 2012 För hjälp och support vänligen kontakta: Hargdata Tel: 01371270 Epost: info@hargdata.se Hemsida: www.hargdata.se

Läs mer

Innehållsförteckning. Installation Inledning Pedagogisk bakgrund Arbeta med Matematik Screening Basnivå Kalkylator Inställningar Namn Period.

Innehållsförteckning. Installation Inledning Pedagogisk bakgrund Arbeta med Matematik Screening Basnivå Kalkylator Inställningar Namn Period. 2 Resultat Innehållsförteckning Installation Inledning Pedagogisk bakgrund Arbeta med Matematik Screening Basnivå Kalkylator Inställningar Namn Period Screeningmoment Talserier Jämnt - udda Tal och obekanta

Läs mer

EXJOBBSOPPOSITION. Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh

EXJOBBSOPPOSITION. Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh EXJOBBSOPPOSITION Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh Rapportens titel: Domän-Webb-Applikations-Fuzzer(DWAP) introduktion och implementation Opponent: Viktor Gummesson Var det

Läs mer

Komma igång med MLTs Mobildata app.

Komma igång med MLTs Mobildata app. Komma igång med MLTs Mobildata app. Övriga uppstartspunkter. Vi börjar med det mest nödvändiga och ökar på funktionaliteten löpande. Inloggade som samma användare på fler enheter, fungerar inte nu. Lediglista.

Läs mer

Vad vill vi Vad kan vi Vad bör vi göra med uttalsundervisningen?

Vad vill vi Vad kan vi Vad bör vi göra med uttalsundervisningen? Vad vill vi Vad kan vi Vad bör vi göra med uttalsundervisningen? Uttalsbetraktelser för lärare i sfi och svenska som andraspråk i Gävle september 2009 Med er själva och Bosse Thorén, fil. dr i fonetik,

Läs mer

Tangentbord. Mike McBride Anne-Marie Mahfouf Översättare: Stefan Asserhäll

Tangentbord. Mike McBride Anne-Marie Mahfouf Översättare: Stefan Asserhäll Mike McBride Anne-Marie Mahfouf Översättare: Stefan Asserhäll 2 Innehåll 1 Fliken Hårdvara 4 2 Fliken Layouter 4 3 Fliken Avancerat 5 3 Den här modulen gör det möjligt att välja hur ditt tangentbord fungerar.

Läs mer

Inlämningsuppgift 1. Inlämningsuppgift 1. Metod. Tester. Högskolan i Kristianstad: Interaktionsdesign I. 2010-09-17, Per-Ola Olsson

Inlämningsuppgift 1. Inlämningsuppgift 1. Metod. Tester. Högskolan i Kristianstad: Interaktionsdesign I. 2010-09-17, Per-Ola Olsson Inlämningsuppgift 1 Metod Jag har valt att studera några av de vanliga funktionerna på en mobiltelefon, sk smartphone. Vi använde min iphone 3GS med ios 4.1 och språket inställt på svenska. Testerna genomfördes

Läs mer

Programmeringsolympiaden 2015

Programmeringsolympiaden 2015 Programmeringsolympiaden 2015 TÄVLINGSREGLER FÖR SKOLKVALET Tävlingen äger rum på av skolan bestämt datum under sex timmar effektiv tid. Eleven ska i förväg komma överens med läraren om att använda egen

Läs mer

Mind Express 3.0. Kort beskrivning. Systemkrav. Styrsätt

Mind Express 3.0. Kort beskrivning. Systemkrav. Styrsätt Mind Express 3.0 Kort beskrivning Mind Express är ett kommunikationsprogram för att tala och skriva med symboler. Det har inbyggda grammatiska funktioner och möjlighet att använda olika inställningar/nivåer

Läs mer

Programmeringsteknik med C och Matlab

Programmeringsteknik med C och Matlab Programmeringsteknik med C och Matlab Kapitel 6: Filhantering Henrik Björklund Umeå universitet 13 oktober 2009 Björklund (UmU) Programmeringsteknik 13 oktober 2009 1 / 22 Textfiler Filer är sekvenser

Läs mer

Programmets startmeny ser ut så här. För att få fram menyerna Avsluta, Inställningar och Användare måste du föra markören upp till det blåa fältet.

Programmets startmeny ser ut så här. För att få fram menyerna Avsluta, Inställningar och Användare måste du föra markören upp till det blåa fältet. Programmets startmeny ser ut så här. För att få fram menyerna Avsluta, Inställningar och Användare måste du föra markören upp till det blåa fältet. Då du klickar på Användare öppnas denna bläddringslista.

Läs mer

Examensarbete på STP

Examensarbete på STP UPPSALA UNIVERSITET Inst. f. lingvistik Mats Dahllöf (Grundversion: Lars Borin.) 25 november 2002 Examensarbete på STP Kommentarer och frågor till matsd@stp.ling.uu.se 1 Om kursplanerna Kursplanen för

Läs mer

Användarstudie utav GRIM på SFI (Svenska För Invandrare)

Användarstudie utav GRIM på SFI (Svenska För Invandrare) Användarstudie utav GRIM på SFI (Svenska För Invandrare) Per-Olof Gatter ing01@kth.se 1 ...Abstract This document is made as an assignment in the course Speech and Gramming checker tools. It is an continuation

Läs mer

En introduktion till. en webb baserad tjänst för enkäter av olika slag. version 4.4

En introduktion till. en webb baserad tjänst för enkäter av olika slag. version 4.4 En introduktion till en webb baserad tjänst för enkäter av olika slag version 4.4 Sida 1/26 - INNEHÅLL - 1 Allmänt...3 2 Allmänt om tjänsten...3 2.1 Strukturen...3 2.2 Vad behövs för att köra i gång?...3

Läs mer

Katedralskolan 2004-11-05 Lena Claesson MICROSOFT EXCEL

Katedralskolan 2004-11-05 Lena Claesson MICROSOFT EXCEL Katedralskolan 2004-11-05 MICROSOFT EXCEL Lös varje uppgift på ett separat blad inom samma excelarbetsbok. Bladen döper du till uppg1, uppg2 osv och hela arbetsboken döper du till ditt eget namn. Spara

Läs mer

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1

Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1 STOCKHOLMS UNIVERSITET 2004-11-04 MATEMATISK STATISTIK Sannolikhetslära och statistik för lärare Liten handledning i Excel och StarOffice Calc i anslutning till Datorövning 1 Programmet StarOffice Calc

Läs mer

Kryptering & Chiffer Del 2

Kryptering & Chiffer Del 2 Kryptering & Chiffer Del Vigenere Vigenere är en annan krypteringsmetod som är mer avancerad än de två föregående. Denna metod är säkrare men långt ifrån säker om man använder dåliga nycklar. Det finns

Läs mer