Språkteknologi och Open Source

Storlek: px
Starta visningen från sidan:

Download "Språkteknologi och Open Source"

Transkript

1 Språkteknologi och Open Source Erik Edin F01 15 oktober

2 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen. Rörelsen är besläktad och förknippad med termen Free Software [1]. Idén bakom Open Source är att göra källkoden till programvaran tillgänglig för alla. Alla har rätten att själv ändra i källkoden, för att förändra eller förbättra programmet. Källkoden får även användas i delar till andra program. Genom dessa idéer tillåts många människor, ofta i vitt skilda delar av världen, samarbeta för att skriva program. Istället för att låta en liten grupp människor, ofta knutna till ett företag eller kommersiellt intresse, skriva och testa ett program, låter man tusentals människor världen över testa programmet man skriver. En av de mest framgångsrika projektet inom Open Source-rörelsen är operativsystemet Linux. Projektet började i början av 1990-talet och blev snart det snabbast växande operativsystemet i historien. Bruce Perens har skrivit The Open Source Definition [2] som är en mer ingående beskrivning av Open Source. 2 Språkteknologi Språkteknologi syftar till att använda datorn för att behandla naturligt språk. Begreppet språkteknologi innefattar många olika delar där datorer och naturliga språk möts. Vissa delar överlappar med området artificiell intelligens, speciellt de områden där förståelse av språket är nödvändigt. Några av de olika områdena där språkteknologi används är informationssökning med naturligt språk, textanalys för att till exempel sammanfatta en text och skrivhjälpmedel, som till exempel grammatik- och stavningskontroll. Språkteknologi använder sig mycket av lingvistiken, men försöker brygga gapet mellan datalogi och lingvistik. Man använder sig av delar av lingvistiken som morfologi och grammatik, såsom kontextfri grammatik, men lägger även till nytt som till exempel statistiska metoder. I en vid definition av språkteknologi finns även de områden som sysslar med talat språk, men för denna uppsats låter vi språkteknologi mena behandling av skriven text. 3 Projekt inom språkteknologi 3.1 WordNet WordNet [3] beskrivs som "en lexikal databas för det engelska språket". Detta betyder att WordNet har en databas över ord och dess meningar. WordNets styrka ligger i att orden är relaterade till varandra. Dessa relationer kan vara bland annat 2

3 lexikala och semantiska. De olika relationerna som är möjliga beror på ordet man tittar på. WordNets databas är begränsad till ord som ligger i de öppna ordklasserna. Andra ordklasser, som till exempel pronomen, anses inte vara intressanta för Word- Nets användning. Denna uppbyggnad av databasen möjliggör att man till exempel kan titta på relationen mellan olika meningar eller ord i en skriven text Metoder WordNet använder ett antal olika språkteknologiska metoder i sin databas. På en lexikal nivå används morfologisk analys av sökorden för att passa in dem på de stammar som sparas i databasen. Detta måste man göra eftersom det är orimligt att spara alla olika böjningar av alla ord i engelskan i en och samma databas. På en semantisk nivå grupperar WordNet ihop olika typer av ord, efter deras mening. Denna typ av länkning går inte att göra automatiskt, eftersom det kräver kunskap om vår omvärld Användning WordNet har blivit en väldigt populär resurs för språkteknologer. WordNet-projekt för många andra språk har startats över hela världen. Många av dessa ligger nu under organisationen Global WordNet Assocation. Organisationen finns till för att standardisera uppbyggnaden av olika ordnät och uppmuntra delning av programkod och metoder. Detta kommer inte minst att göra det enklare att bygga ordnät för nya språk. WordNet används inom många delar av språkteknologin och många projekt. WordNet har visat sig vara användbart inom den semantiska webben, som nu har börjat utvecklas världen över Problem Som publik resurs har WordNet lyckats väldigt bra. Eftersom så många projekt använder sig av och beror på WordNet har den fått ekonomiskt stöd ifrån diverse organisationer. Att slippa kommersialisera projektet leder till att andra projekt av ekonomiska skäl väljer WordNet före andra. En av de stora målen med WordNet är möjligheten att kunna koppla ihop många WordNets av många olika språk. På detta sättet skulle man kunna göra informationssökningar över flera olika språk. 3

4 3.2 OpenNLP OpenNLP [4] är en paraplyorganisation för Open Source-projekt relaterade till språkteknologi. Syftet med projektet är att skapa ett gemensamt ramverk för programvaran. Ett gemensamt ramverk skulle betyda högre interoperabilitet mellan programvaran inom OpenNLP, men också enklare utveckling av forskningsprojekt. Utvecklar man ett eget kommersiellt system händer det lätt att komponenterna blir väldigt tätt integrerade. Det blir väldigt svårt att använda dessa komponenter till andra system än just de som de var avsedda för. OpenNLP försöker komma åt denna typ av problem genom att modularisera ramverket, så att projekt i möjligaste mån kan integreras med andra. Detta är i synnerhet viktigt för språkteknologi, för att de grundläggande metoderna används i så många olika sammanhang. OpenNLP är inte det enda projektet som syftar till att samla språkteknologiska projekt inom Open Source. Projektet GATE, General Architecture for Text Engineering, är ett liknande projekt som är byggt av en grupp inom Sheffields universitet. GATE är betydligt äldre och mer använt än OpenNLP. Fördelen med flera olika sådana projekt är mångfalden och möjligheten att välja ett passande ramverk för just det projekt man arbetar på. 3.3 SenseRelate Många ord i ett språk, såsom svenska eller engelska, är flertydiga. Med det menas att man har flera tolkningar av ett ords mening eller dess grammatiska roll. Detta är en av de stora problemen inom språkteknologin, eftersom semantik är ett väldigt svårformaliserat ämne. Grammatiken hos naturliga språk är dessutom omöjlig att beskriva komplett. På grund av detta har man metoder för att från en flertydighet göra en tolkning så att man får en entydig mening. SenseRelate [6] är ett projekt inom OpenNLP för disambiguering av meningen av ett ord Metoder För denna typ av disambiguering har man ett målord som man vill bestämma meningen hos. För att göra detta tittar man på meningen av omkringliggande ord och externa resurser, som till exempel ordlistor, för att bestämma vilken mening författaren avsåg. SenseRelate har arbetshypotesen att den implicerade meningen hos ett målord är mer relaterat till meningen hos de omkringliggande orden än de andra möjliga tolkningarna av målordet. För att bestämma de möjliga tolkningarna av ett ords mening använder sig SenseRelate av WordNet, som beskrivs ovan. Algoritmen tar som indata ett antal ord, varav ett är märkt som målordet. De andra orden är de omkringliggande orden. Till 4

5 varje ord läggs till ett antal möjliga tolkningar av det ordet. Det är dessa tolkningar som tas från WordNet. För varje tolkning av målordet beräknas sedan ett likhetsmått med tolkningarna av kontextorden. Det bästa likhetsmåttet används sedan som den mest sannolika tolkningen av målordet. På detta sätt är metoden probabilistisk Använding av SenseRelate Användningar av disambiguering av ord finns i många delar av språkteknologin. I informationssökning används det för att försäkra sig om att man söker på rätt mening av ett ord. Inom automatisk textsammanfattning är dessa metoder mycket viktiga för att vet vilken del av texten som innehåller information viktig för texten i helhet. Gemensamt för dessa områden är att kunskap om omvärlden egentligen vore nödvändigt, för att man med säkerhet ska kunna söka på eller behandla rätt textmängder. I väntan på en revolution inom kunskapsteori får vi dock nöja oss med statistiska metoder Problem och svagheter Semantisk analys av ord görs av människor i stort sett omedvetet. Ofta kan vi direkt se vad ordet betyder, genom att titta på sammanhanget. Detta kräver dock en utförlig kunskap om vår omvärld. Eftersom kunskap i sig är väldigt abstrakt så är det inte konstigt att datorer har mycket svårt för att hantera det. Det är detta som tvingar oss att använda statistiska metoder, som i många fall kommer misslyckas. I vissa fall är det omöjligt till och med för människor att veta vad som menas med en mening. I sådana fall måste man helt enkelt acceptera att det inte finns någon entydig lösning på problemet med disambiguering. Eftersom datorer dock omöjligen kan veta om så är fallet så kommer de naturligtvis försöka ge en lösning i alla fall. 3.4 nlpfarm nlpfarm [5] är ett projekt, också under OpenNLP, för att underlätta utvecklingen av språkteknologiska tillämpningar. Till skillnad från SenseRelate ovan är nlpfarm inte själv en tillämpning, utan snarare ett bibliotek med verktyg. Eftersom nlpfarm är en del av OpenNLP är det mycket modulariserat, där varje del tillhandahåller funktioner inom ett specifikt område Ordkontexter nlpfarm har modulen javaconlib som är ett verktyg för algoritmer som arbetar med kontexter runt ett ord. Detta har sin användning inte minst i projekt som SenseRelate där algoritmen för disambiguering av ord använder sig av ordets kontext. 5

6 Modulen implementerar stöd för att hämta kontexter ur textmängder, lägga dessa i effektiva strukturer. När detta är gjort kan man sortera eller söka i strukturerna. En annan viktig funktion är att beräkna olika typer av mått på dessa kontexter, som till exempel likhetsmåttet i SenseRelate Grammatiker nlpfarm har en module för hantering av kontextfri grammatik samt probabilistiska kontextfria grammatiker. Kontextfri grammatik används vid syntaxanalys och inte minst parsning. Kontextfria grammatiker har användning inte vara inom språkteknologi och lingvistik, utan även inom datalogin och dess beskrivning av formella språk. 4 Open Source och kommersiella intressen Företag har väldigt länge varit skeptiska till Open Source då det är svårt att se hur man kan tjäna pengar på ett sånt projekt. På senare tid har dock stora företag som till exempel IBM och Sun Microsystems i högre grad börjat stödja och till och med själva utveckla programvara som är Open Source. IBM släppte senast ett språkteknologisk system som Open Source. Det fanns förväntningar om att det skulle vara ett komplett taligenkänningssystem, men det visade sig att IBM valt att inte släppa hela systemet, utan bara utvalda delar av det. Många språkteknologiska resurser, som till exempel korpusar eller taggade textmängder, kräver väldigt mycket arbete och ekonomiska resurser. På grund av detta är det oftast företag eller organisationer, som har de resurser som krävs, som gör dessa arbeten. Problemet är att detta görs i vinstintresse, vilket hindrar Open Source-projekt från att använda dessa resurser. 5 Open Source och akademiska projekt Open Source har sina rötter i forskningsvärlden och har också haft ett större stöd där än i företagsvärlden. Eftersom forskning i den akademiska världen inte är driven i ekonomiskt intresse, eller i alla fall inte i lika hög grad som den forskning företag bedriver, så är användningen av Open Source mycket mer utbredd. Open Source är ett bra sätt att sprida sin forskning och sina idéer och på ett effektivt sätt på förslag på förbättringar. 6 Fördelar Open Source har traditionellt sett varit väldigt internationellt. Det är först och främst Internet som tillåtit personer i olika delar av världen att samarbeta på projekt. Just språkteknologiska projekt kan dra nytta av detta, då personer i olika delar 6

7 av världen kan anpassa programmet till deras eget språk. På detta sätt kan projektet få en mångfald av språk på ett annat sätt än en utvecklingsgrupp lokaliserad i ett speciellt land kan få. Med Open Source får man en mycket större möjlighet att integrera andra program i sitt eget, än vad man skulle få med ett kommersiellt slutet system. Har man till exempel ett program som SenseRelate kan man behöva läsa filer som är av ett annat format än det som stöds. Använder man sig då av ett kommersiellt system har man inget annat val än att försöka få företaget i fråga att lägga till stöd för detta format. Använder man sig av ett program som är Open Source har man däremot möjlighet att själv förändra programmet för att lägga till det stöd man behöver. 7 Nackdelar En nackdel med Open Source är svårigheten att använda kommersiellt material i programvaran. Korpusar, till exempel, är ofta kommersiella och kan därmed inte göras tillgängliga tilsammans med annan kod. På grund av detta är Open Sourceprojekt oftast hänvisade till att använda andra Open Source-projekt, eller material vars upphovsrätt har gått ut. Exempel på sådana projekt är Project Gutenberg och Projekt Runeberg, vilka båda två i stor utsträckning publicerar äldre litteratur. Ibland kan man använda kodning av det kommersiella materialet för att göra det användbart för programmet, men ändå inte öppet för annan användning. Ett exempel på detta är Stava, där Svenska Akademiens Ordlista finns kodad i en boolesk hashtabell. Man kan på detta sätt leta efter ett ord, för att se om man hittar det, men det är däremot orimligt att ur denna hashtabell skapa en egen ordlista. Ordlistan skulle innehålla alldeles för många fel. Referenser [1] Free Software Foundation, [2] B. Perens: The Open Source Definition (1997), [3] WordNet, wn [4] OpenNLP, [5] nlpfarm, [6] SenseRelate, 7

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1

Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1 Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:

Läs mer

Språkteknologi. Språkteknologi

Språkteknologi. Språkteknologi Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi

Läs mer

Svenska Linuxföreningen. Fri programvara Mer än bara gratis 1(17) Copyright 2006 Marcus Rejås <marcus@rejas.se>

Svenska Linuxföreningen. Fri programvara Mer än bara gratis 1(17) Copyright 2006 Marcus Rejås <marcus@rejas.se> Fri programvara Mer än bara gratis Copyright 2006 Marcus Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något

Läs mer

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi

Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1 2010 bakgrund och förutsättningar

Läs mer

Grundläggande textanalys. Joakim Nivre

Grundläggande textanalys. Joakim Nivre Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar

Läs mer

Open Source - Eller som vi säger, Fri programvara

Open Source - Eller som vi säger, Fri programvara Rejås 1(27) Open Source - Eller som vi säger, Fri programvara Copyright 2006 Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något

Läs mer

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster

Fil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck

Läs mer

Open Source - Eller som vi säger, Fri programvara

Open Source - Eller som vi säger, Fri programvara Open Source - Eller som vi säger, Fri programvara Copyright 2006, 2007 Marcus Rejås Rejås Datakonsult, http://www.rejas.se Jag ger härmed rätten till alla att nyttja denna presentation

Läs mer

Denna presentation är inte klar, kommentarer mottages tacksamt! CyberRymden

Denna presentation är inte klar, kommentarer mottages tacksamt! CyberRymden Öppen/Fri mjukvara, 11 december 2002 1(13) Öppen/Fri mjukvara CyberRymden 2002-09-10 Marcus Rejås $Id: slides.tex,v 1.10 2002/12/11 20:15:40 rejas Exp $ http://www.rejas.net Made with

Läs mer

Lösningsförslag till tentamen i Språkteknologi 2D1418,

Lösningsförslag till tentamen i Språkteknologi 2D1418, Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det

Läs mer

Tekniker för storskalig parsning: Grundbegrepp

Tekniker för storskalig parsning: Grundbegrepp Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)

Läs mer

2005-06-02 1 Open Source-licenser

2005-06-02 1 Open Source-licenser 2005-06-02 1 Open Source-licenser Open Source-licenser NEA Nätverket för Elektroniska Affärer Advokat Sofia Geilert 2005-06-02 2 Open Source-licenser Open Source-licenser Antal olika licenser för open

Läs mer

Teoretisk lingvistik och datalingvistik. Robin Cooper

Teoretisk lingvistik och datalingvistik. Robin Cooper Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska

Läs mer

Syntaktisk parsning (Jurafsky & Martin kapitel 13)

Syntaktisk parsning (Jurafsky & Martin kapitel 13) Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning

Läs mer

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO

bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1

Läs mer

Juridiska frågor kring fri programvara och öppen källkod

Juridiska frågor kring fri programvara och öppen källkod Juridiska frågor kring fri programvara och öppen källkod Daniel Westman Institutet för rättsinformatik Stockholms universitet http://www.juridicum.su.se/iri/dawe Fri programvara Bakgrund, ideologi och

Läs mer

Migrering av applikationen AMM till molnet

Migrering av applikationen AMM till molnet Datavetenskap Opponenter: Erik Andersson och Marcus Larsson Respondenter: Anders Nguyen och Linus Svensson Migrering av applikationen AMM till molnet Oppositionsrapport, C-nivå 2010:06 1 Sammanfattat omdöme

Läs mer

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng

HUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är

Läs mer

Öppen/Fri programvara

Öppen/Fri programvara Öppen/Fri programvara, 19 januari 2003 1(13) Öppen/Fri programvara DENNA PRESENTATION ÄR INTE KLAR, KOMMENTARER MOTTAGES TACKSAMT. CyberRymden 2002-09-10 Marcus Rejås $Id: slides.tex,v

Läs mer

Svenska Linuxföreningen. Fri programvara Mycket mer än gratis 1(36) Copyright 2005, 2006 Marcus Rejås <marcus@rejas.se>

Svenska Linuxföreningen. Fri programvara Mycket mer än gratis 1(36) Copyright 2005, 2006 Marcus Rejås <marcus@rejas.se> Fri programvara Mycket mer än gratis Copyright 2005, 2006 Marcus Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet

Läs mer

Språkpsykologi/psykolingvistik

Språkpsykologi/psykolingvistik Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande

Läs mer

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE Språteknologi på SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE digital kompetens kring ordböcker, språkkontroller, korpusar och söktjänster! Följer teknikens påverkan på språk och språkanvändning! Bevakar språkteknisk

Läs mer

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg

Väl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg Betygskriterier Examensuppsats 30 hp. Betygskriterier Tregradig betygsskala används med betygen icke godkänd (IG), godkänd (G) och väl godkänd (VG). VG - Lärandemål har uppfyllts i mycket hög utsträckning

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten

Läs mer

Open Source-licenser

Open Source-licenser 2005-12-02 1 Open Source-licenser Open Source NEA Nätverket för Elektroniska Affärer Advokat Sofia Geilert 2005-12-02 2 Open Source-licenser Vad är Open Source Software (OSS)? Öppen källkod Programvara

Läs mer

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008

Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Anders Ardö Elektro- och informationsteknik Lunds Universitet Box 118, 221 00 Lund June 18, 2009 1 Inledning Digitala bibliotek

Läs mer

Material från

Material från Svenska som andraspråk 7-9 Berättande texter Centralt innehåll och kunskapskrav I det centrala innehållet för svenska som andraspråk år 7-9 anges Skönlitteratur, lyrik, dramatik, sagor och myter från olika

Läs mer

SPRÅKTEKNOLOGIPROGRAMMET

SPRÅKTEKNOLOGIPROGRAMMET SPRÅKTEKNOLOGIPROGRAMMET Kandidatprogram, 3 år, 180 hp. Mats Dahllöf Institutionen för lingvistik och filologi Augusti 2012 1 Språkteknologer arbetar med... att utveckla, utvärdera och underhålla system

Läs mer

Symbolspråk som alternativa och kompletterande kommunikationsmedel

Symbolspråk som alternativa och kompletterande kommunikationsmedel Symbolspråk som alternativa och kompletterande kommunikationsmedel Paulina Modlitba Medieteknik-01 2D1418 Språkteknologi Kungliga tekniska högskolan, Stockholm Innehållsförteckning 1. Språkteknologi och

Läs mer

Programvaror - Jo, tack, det vill vi ha...

Programvaror - Jo, tack, det vill vi ha... Rejås 1(20) Programvaror - Jo, tack, det vill vi ha... Copyright 2006 Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något sätt

Läs mer

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg

Föreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten

Läs mer

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap

729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap 729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering

Läs mer

Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock

Inledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock Inledning Vad är ett datorprogram, egentligen? Olika språk Problemlösning och algoritmer 1 (14) Varför använda en dator? Genom att variera de program som styr datorn kan den användas för olika uppgifter.

Läs mer

Svenska Linuxföreningen. Fri programvara Mycket mer än bara gratis 1(29)

Svenska Linuxföreningen. Fri programvara Mycket mer än bara gratis 1(29) Fri programvara Mycket mer än bara gratis Copyright 2005,2006 Marcus Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet

Läs mer

UB:s sö ktjä nst - Söka artiklar och annan litteratur

UB:s sö ktjä nst - Söka artiklar och annan litteratur 1 UB:s sö ktjä nst - Söka artiklar och annan litteratur Innehåll Börja här... 2 Logga in... 2 Mitt konto... 3 Adressändring... 3 Spara sökresultat... 4 Sökhistorik & litteraturbevakning... 5 Söka, välja,

Läs mer

SPRÅKTEKNOLOGIPROGRAMMET

SPRÅKTEKNOLOGIPROGRAMMET SPRÅKTEKNOLOGIPROGRAMMET Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi Augusti 2013 (Mats Dahllöf) 1 Språkteknologer arbetar med... att utveckla, utvärdera och underhålla system

Läs mer

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator version 2014-09-10 Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator Studentens namn Handledares namn Examinerande

Läs mer

Kom igång med SpellRight

Kom igång med SpellRight Kom igång med SpellRight SpellRight är ett program som rättar engelska stavfel. Programmet är i första hand avsett för personer som har svenska som modersmål och skriver på engelska som andraspråk. Starta

Läs mer

SPRÅKTEKNOLOGIPROGRAMMET (STP)

SPRÅKTEKNOLOGIPROGRAMMET (STP) SPRÅKTEKNOLOGIPROGRAMMET (STP) Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi 1 Utbildningsprogram Kunskapsmässig progression och yrkesmässig relevans. Antagning till ett paket

Läs mer

Fråga bibliotekarien. Länkbiblioteket. Sökslussen. Metasökprogrammet Frank och Söksam. biblioteken.fi >

Fråga bibliotekarien. Länkbiblioteket. Sökslussen. Metasökprogrammet Frank och Söksam. biblioteken.fi > Fråga bibliotekarien Länkbiblioteket Sökslussen Metasökprogrammet Frank och Söksam biblioteken.fi > : Informationssökning { www.biblioteken.fi/informationssokning Centrala söktjänster för olika sökbehov

Läs mer

Inledande programmering med C# (1DV402) Introduktion till C#

Inledande programmering med C# (1DV402) Introduktion till C# Introduktion till C# Upphovsrätt för detta verk Detta verk är framtaget i anslutning till kursen Inledande programmering med C# vid Linnéuniversitetet. Du får använda detta verk så här: Allt innehåll i

Läs mer

Kort om World Wide Web (webben)

Kort om World Wide Web (webben) KAPITEL 1 Grunder I det här kapitlet ska jag gå igenom allmänt om vad Internet är och vad som krävs för att skapa en hemsida. Plus lite annat smått och gott som är bra att känna till innan vi kör igång.

Läs mer

Opponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg

Opponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg Datavetenskap Opponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg Oppositionsrapport, C-nivå 2006:12 1 Sammanfattat omdöme av examensarbetet Examensarbetet är intressant eftersom

Läs mer

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI Mats Lundälv Senior IKT-pedagog f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM Det fria ordet och AKK / ASK Kommunikativ och språklig tillgänglighet för alla...byggt på en infrastruktur av fria

Läs mer

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?

Innehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning? Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins

Läs mer

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas till examinator

Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas till examinator version 2017-08-21 Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas till examinator Studentens namn Handledares namn Examinerande lärare Uppsatsens titel

Läs mer

Kvantitativ samhällsanalys med språkteknologiska metoder.

Kvantitativ samhällsanalys med språkteknologiska metoder. Kvantitativ samhällsanalys med språkteknologiska metoder Hillevi Hägglöf hillevi.hagglof@gmail.com Myndigheten för samhällsskydd och beredskap (MSB) Bakgrund Alla rapporter, utredningar, utvärderingar

Läs mer

Riktlinjer för bedömning av examensarbeten

Riktlinjer för bedömning av examensarbeten Fastställda av Styrelsen för utbildning 2010-09-10 Dnr: 4603/10-300 Senast reviderade 2012-08-17 Riktlinjer för bedömning av Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga yrkesutbildningar

Läs mer

Semantik och pragmatik

Semantik och pragmatik Semantik och pragmatik Lingvistik 1 vt06 Uppsala universitet 1 Nyckelord idag Semantik Fras- och satssemantik Semantiska roller Kompositionalitetsprincipen Metaforer och idiom Pragmatik Språklig kontext

Läs mer

Introduktion till språkteknologi. Datorstöd för språkgranskning

Introduktion till språkteknologi. Datorstöd för språkgranskning Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter

Läs mer

Open Source - Utmaningar och fördelar

Open Source - Utmaningar och fördelar Open Source - Utmaningar och fördelar Johan Hübner Emil Dicksved 16 mars 2011 Agenda Vad är open source? Historik och utveckling över tid Krav på open source-licenser Översiktlig genomgång av några vanliga

Läs mer

Att använda Stava Rex i Word 2007

Att använda Stava Rex i Word 2007 Att använda Stava Rex i Word 2007 1. Skriva i Word Skriv av följande mening med fel och allt: Stänga av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer de ord som Word uppfattar

Läs mer

Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA

Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk

Läs mer

Föreläsning 6: Analys och tolkning från insamling till insikt

Föreläsning 6: Analys och tolkning från insamling till insikt Föreläsning 6: Analys och tolkning från insamling till insikt FSR: 1, 5, 6, 7 Rogers et al. Kapitel 8 Översikt Kvalitativ och kvantitativ analys Enkel kvantitativ analys Enkel kvalitativ analys Presentera

Läs mer

Språk, datorer och textbehandling

Språk, datorer och textbehandling Språk, datorer och textbehandling Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt Sökmotorer

Läs mer

Snabbguide till Cinahl

Snabbguide till Cinahl Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin

Läs mer

Open Source - Program och hur man väljer

Open Source - Program och hur man väljer Open Source - Program och hur man väljer Copyright 2007, 2008 Marcus Rejås Rejås Datakonsult Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga

Läs mer

Svensk nationell datatjänst, SND BAS Online

Svensk nationell datatjänst, SND BAS Online Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata

Läs mer

Parsning. TDP007 Konstruktion av datorspråk Föreläsning 6. Peter Dalenius Institutionen för datavetenskap

Parsning. TDP007 Konstruktion av datorspråk Föreläsning 6. Peter Dalenius Institutionen för datavetenskap Parsning TDP007 Konstruktion av datorspråk Föreläsning 6 Peter Dalenius Institutionen för datavetenskap 2017-02-14 2 Analys av källkod Lexikalisk analys Bildar tokensutifrån källkodens text. Syntaktisk

Läs mer

PROGRAMMERING. Ämnets syfte. Kurser i ämnet

PROGRAMMERING. Ämnets syfte. Kurser i ämnet PROGRAMMERING Ämnet programmering behandlar programmeringens roll i informationstekniska sammanhang som datorsimulering, animerad grafik, praktisk datoriserad problemlösning och användaranpassad konfiguration

Läs mer

ÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle

ÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle Humanistiska och teologiska fakulteterna ÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle Fastställande Kursplanen är fastställd av Prodekanen med ansvar för grundutbildning

Läs mer

Betydelse och betydelse

Betydelse och betydelse Betydelse och betydelse Ordbetydelsedisambiguering i praktiken Stian Rødven Eide stian@fripost.org Självständigt arbete i lingvistik, 15 hp Göteborgs universitet Institutionen för filosofi, lingvistik

Läs mer

Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk

Modellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri

Läs mer

Bilaga 1. Teknisk kravspecifikation

Bilaga 1. Teknisk kravspecifikation Bilaga 1 Teknisk kravspecifikation 5.5.2014 Webbplatsen 1. Allmänt Korsholms kommun arbetar aktivt för att vara en ledande tvåspråkig landskommun i Österbotten och har drygt 19 100 invånare varav 68,9

Läs mer

Nonogram

Nonogram Nonogram. Vad är nonogram? Nonogram är små enkla men fascinerande pyssel som ursprungligen kommer från Japan. De har också givits ut i söndagsbilagan i engelska dagstidningar under flera år. Idén bakom

Läs mer

Licenser - Jo, tack, men så få som möjligt

Licenser - Jo, tack, men så få som möjligt Rejås 1(22) Licenser - Jo, tack, men så få som möjligt Copyright 2006 Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något sätt

Läs mer

SÄRSKILD PRÖVNING I SVENSKA A

SÄRSKILD PRÖVNING I SVENSKA A SÄRSKILD PRÖVNING I SVENSKA A Följande färdigheter ska du uppvisa under prövningen för att få ett godkänt betyg på kursen: SKRIVANDE: Du ska kunna producera olika typer av texter som är anpassade till

Läs mer

Lingvistik 729G08 (6 hp) Mathias Broth Charlotta Plejert Therese Örnberg Berglund Mikael Svensson

Lingvistik 729G08 (6 hp) Mathias Broth Charlotta Plejert Therese Örnberg Berglund Mikael Svensson Lingvistik 729G08 (6 hp) Mathias Broth Charlotta Plejert Therese Örnberg Berglund Mikael Svensson Vad är lingvistik? Språkvetenskap: det vetenskapliga studiet av språk och språkande En spännande kurs!

Läs mer

Introduktion till programmering och Python Grundkurs i programmering med Python

Introduktion till programmering och Python Grundkurs i programmering med Python Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?

Läs mer

Språk och skrivande i årskurs 9 projektets huvudrapport Fokus på finlandssvenska elevtexter - fördjupande artiklar om skrivförmåga 15.9.

Språk och skrivande i årskurs 9 projektets huvudrapport Fokus på finlandssvenska elevtexter - fördjupande artiklar om skrivförmåga 15.9. Språk och skrivande i årskurs 9 projektets huvudrapport Fokus på finlandssvenska elevtexter - fördjupande artiklar om skrivförmåga Material Ca 1 700 elever i 30 skolor i Svenskfinland, april 2014 20 skolor

Läs mer

TDDD02 Språkteknologi för informationssökning / Textsammanfattning. Marco Kuhlmann Institutionen för datavetenskap

TDDD02 Språkteknologi för informationssökning / Textsammanfattning. Marco Kuhlmann Institutionen för datavetenskap TDDD02 Språkteknologi för informationssökning / 2015 Textsammanfattning Marco Kuhlmann Institutionen för datavetenskap Textsammanfattning Textsammanfattning går ut på att extrahera den mest relevanta informationen

Läs mer

EXJOBBSOPPOSITION. Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh

EXJOBBSOPPOSITION. Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh EXJOBBSOPPOSITION Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh Rapportens titel: Domän-Webb-Applikations-Fuzzer(DWAP) introduktion och implementation Opponent: Viktor Gummesson Var det

Läs mer

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003

Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används

Läs mer

Skäl för revideringarna är att kursplanerna tydligare ska spegla kursernas innehåll och mål.

Skäl för revideringarna är att kursplanerna tydligare ska spegla kursernas innehåll och mål. Ulla Veres viceprefekt för utbildning på grund- och avancerad nivå Prefekten 2013-10-28 FÖRSLAG till beslut Fastställande och revideringar av kursplaner Lingvistik Ärendet med förslag till beslut Prefekten

Läs mer

Semantik. Semantik och språkteknologi

Semantik. Semantik och språkteknologi Semantik Semantik studiet av innebörd(mening) Går tillbaka till Platon (dialogen Kratylos) Relationen språk verklighet Betydelsen av ett ord är dess användning i språket (Wittgenstein) Semantik och språkteknologi

Läs mer

Aristi Fernandes Examensarbete T6, Biomedicinska analytiker programmet

Aristi Fernandes Examensarbete T6, Biomedicinska analytiker programmet Kursens mål Efter avslutad kurs skall studenten kunna planera, genomföra, sammanställa och försvara ett eget projekt samt kunna granska och opponera på annan students projekt. Studenten ska även kunna

Läs mer

Frågor & Svar Öppna programvaror 2010

Frågor & Svar Öppna programvaror 2010 Frågor & Svar Öppna programvaror 2010 1 (6) Kompletteringar Inga Frågor & svar 1. Svarsdatum: 2010-11-12 15:35:44 Fråga: Fråga 1: 5.1.2, Hur viktigt är det att produktlistan är komplett vid avtalstillfället.

Läs mer

Datasäkerhet. Hur ska vi göra för att skydda våra datorer mot virus och andra hot?

Datasäkerhet. Hur ska vi göra för att skydda våra datorer mot virus och andra hot? Datasäkerhet Hur ska vi göra för att skydda våra datorer mot virus och andra hot? Eva Blommegård, Lars-Anders Westlin samt Bengt Wolff SeniorNet Tyresö Agenda och definitioner Virusskydd Lösenord. Säkra

Läs mer

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274

Kungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274 Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.

Läs mer

Datorlingvistisk grammatik

Datorlingvistisk grammatik Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,

Läs mer

SKOLFS. beslutade den -- maj 2015.

SKOLFS. beslutade den -- maj 2015. SKOLFS Föreskrifter om ändring i Skolverkets föreskrifter (SKOLFS 2010:247) om ämnesplan för ämnet programmering i gymnasieskolan och inom kommunal vuxenutbildning på gymnasial nivå; beslutade den -- maj

Läs mer

Tekniker för storskalig parsning

Tekniker för storskalig parsning Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning

Läs mer

Grammatik för språkteknologer

Grammatik för språkteknologer Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem

Läs mer

a White Paper by Idea2Innovation Vad är innovation?

a White Paper by Idea2Innovation Vad är innovation? a White Paper by Idea2Innovation Vad är innovation? Ordet innovation börjar för vissa kännas så uttjatat att det inte bara är luddigt utan rent av rinner genom fingrarna när man försöker greppa det. Alla

Läs mer

Examensarbete i språkteknologi

Examensarbete i språkteknologi Examensarbete i språkteknologi Beáta Bandmann Megyesi Institutionen för lingvistik och filologi Uppsala universitet Översikt Examensarbetets innehåll Regler och principer Lärare och handledare Lärandemål

Läs mer

Datorbaserade verktyg i humanistisk forskning

Datorbaserade verktyg i humanistisk forskning Datorbaserade verktyg i humanistisk forskning Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt

Läs mer

En arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ

En arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ DATORER Så klarar man språkkontrollen RICKARD DOMEIJ Är datorns språkkontroll skribentens bästa vän? Eller kommer den mest med löjliga förslag? I april gav Svenska språknämnden ut Datorn granskar språket,

Läs mer

Avslutning. Kapitel Komprimering av filer

Avslutning. Kapitel Komprimering av filer Kapitel 12 Avslutning I detta sista kapitel tittar vi på hur man kan installera program själv. I samband med det finns det anledning att titta på komprimering av filer och på filarkiv (som kan vara användbart

Läs mer

Installationsanvisningar HogiaLön Plus

Installationsanvisningar HogiaLön Plus Installationsanvisningar HogiaLön Plus Installation Med den här installationen kan du installera HogiaLön Plus på Windows XP, Vista, Windows 7 och Windows 8. Om du vill installera en MSI-installation finns

Läs mer

Informationssökning och -utvinning. Informationssökning och informationsutvinning. [IR & IE] Introduktion (1) [IR & IE] Introduktion (2)

Informationssökning och -utvinning. Informationssökning och informationsutvinning. [IR & IE] Introduktion (1) [IR & IE] Introduktion (2) Informationssökning och -utvinning Informationssökning och informationsutvinning Kristina Nilsson, kristina.nilsson@ling.su.se 2006-11-06: MOTIST, UU 1. Informationssökning (Information Retrieval, IR)

Läs mer

Grundläggande EndNote

Grundläggande EndNote Grundläggande EndNote Stephen Naron, februari, 2011 Uppdatering och översättning till svenska: Taeda Tomić, 2012, 2014 Korrekturläsning: Martina Andersson Löfqvist, september 2012 1. Lite information om

Läs mer

Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011

Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011 Institutionen för kultur och kommunikation Linköpings universitet Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011 Kursansvarig lärare: Richard Hirsch (281856) Richard.Hirsch@liu.se Vecka

Läs mer

Tentamen etjänster och webbprogrammering Institutionen för informatik och media, informattionssystem Datum 30/5 Tid

Tentamen etjänster och webbprogrammering Institutionen för informatik och media, informattionssystem Datum 30/5 Tid Tentamen etjänster och webbprogrammering Institutionen för informatik och media, informattionssystem Datum 30/5 Tid 8.00 12.00 Lärare Owen Eriksson Madelene Hermelin Johan Karlsson Mikael Fors Maxpoäng

Läs mer

Maskinöversättning möjligheter och gränser

Maskinöversättning möjligheter och gränser Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?

Läs mer

Inlämningsuppgift: Pronomenidentifierare

Inlämningsuppgift: Pronomenidentifierare 1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...

Läs mer

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning

Läs mer

Språkteknologi (SV2122) Föreläsning 3: Programmering i Python

Språkteknologi (SV2122) Föreläsning 3: Programmering i Python Språkteknologi (SV2122) Föreläsning 3: Programmering i Python Richard Johansson richard.johansson@svenska.gu.se 29 januari 2014 översikt inledning första stegen grundläggande begrepp större byggstenar

Läs mer

Använda SpellRight 2 i Word 2010

Använda SpellRight 2 i Word 2010 Använda SpellRight 2 i Word 2010 1. Skriva i Word 1. Öppna Word och skriv av följande mening med fel och allt: 2. Stäng av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer

Läs mer