Språkteknologi och Open Source
|
|
- Ludvig Andreasson
- för 5 år sedan
- Visningar:
Transkript
1 Språkteknologi och Open Source Erik Edin F01 15 oktober
2 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen. Rörelsen är besläktad och förknippad med termen Free Software [1]. Idén bakom Open Source är att göra källkoden till programvaran tillgänglig för alla. Alla har rätten att själv ändra i källkoden, för att förändra eller förbättra programmet. Källkoden får även användas i delar till andra program. Genom dessa idéer tillåts många människor, ofta i vitt skilda delar av världen, samarbeta för att skriva program. Istället för att låta en liten grupp människor, ofta knutna till ett företag eller kommersiellt intresse, skriva och testa ett program, låter man tusentals människor världen över testa programmet man skriver. En av de mest framgångsrika projektet inom Open Source-rörelsen är operativsystemet Linux. Projektet började i början av 1990-talet och blev snart det snabbast växande operativsystemet i historien. Bruce Perens har skrivit The Open Source Definition [2] som är en mer ingående beskrivning av Open Source. 2 Språkteknologi Språkteknologi syftar till att använda datorn för att behandla naturligt språk. Begreppet språkteknologi innefattar många olika delar där datorer och naturliga språk möts. Vissa delar överlappar med området artificiell intelligens, speciellt de områden där förståelse av språket är nödvändigt. Några av de olika områdena där språkteknologi används är informationssökning med naturligt språk, textanalys för att till exempel sammanfatta en text och skrivhjälpmedel, som till exempel grammatik- och stavningskontroll. Språkteknologi använder sig mycket av lingvistiken, men försöker brygga gapet mellan datalogi och lingvistik. Man använder sig av delar av lingvistiken som morfologi och grammatik, såsom kontextfri grammatik, men lägger även till nytt som till exempel statistiska metoder. I en vid definition av språkteknologi finns även de områden som sysslar med talat språk, men för denna uppsats låter vi språkteknologi mena behandling av skriven text. 3 Projekt inom språkteknologi 3.1 WordNet WordNet [3] beskrivs som "en lexikal databas för det engelska språket". Detta betyder att WordNet har en databas över ord och dess meningar. WordNets styrka ligger i att orden är relaterade till varandra. Dessa relationer kan vara bland annat 2
3 lexikala och semantiska. De olika relationerna som är möjliga beror på ordet man tittar på. WordNets databas är begränsad till ord som ligger i de öppna ordklasserna. Andra ordklasser, som till exempel pronomen, anses inte vara intressanta för Word- Nets användning. Denna uppbyggnad av databasen möjliggör att man till exempel kan titta på relationen mellan olika meningar eller ord i en skriven text Metoder WordNet använder ett antal olika språkteknologiska metoder i sin databas. På en lexikal nivå används morfologisk analys av sökorden för att passa in dem på de stammar som sparas i databasen. Detta måste man göra eftersom det är orimligt att spara alla olika böjningar av alla ord i engelskan i en och samma databas. På en semantisk nivå grupperar WordNet ihop olika typer av ord, efter deras mening. Denna typ av länkning går inte att göra automatiskt, eftersom det kräver kunskap om vår omvärld Användning WordNet har blivit en väldigt populär resurs för språkteknologer. WordNet-projekt för många andra språk har startats över hela världen. Många av dessa ligger nu under organisationen Global WordNet Assocation. Organisationen finns till för att standardisera uppbyggnaden av olika ordnät och uppmuntra delning av programkod och metoder. Detta kommer inte minst att göra det enklare att bygga ordnät för nya språk. WordNet används inom många delar av språkteknologin och många projekt. WordNet har visat sig vara användbart inom den semantiska webben, som nu har börjat utvecklas världen över Problem Som publik resurs har WordNet lyckats väldigt bra. Eftersom så många projekt använder sig av och beror på WordNet har den fått ekonomiskt stöd ifrån diverse organisationer. Att slippa kommersialisera projektet leder till att andra projekt av ekonomiska skäl väljer WordNet före andra. En av de stora målen med WordNet är möjligheten att kunna koppla ihop många WordNets av många olika språk. På detta sättet skulle man kunna göra informationssökningar över flera olika språk. 3
4 3.2 OpenNLP OpenNLP [4] är en paraplyorganisation för Open Source-projekt relaterade till språkteknologi. Syftet med projektet är att skapa ett gemensamt ramverk för programvaran. Ett gemensamt ramverk skulle betyda högre interoperabilitet mellan programvaran inom OpenNLP, men också enklare utveckling av forskningsprojekt. Utvecklar man ett eget kommersiellt system händer det lätt att komponenterna blir väldigt tätt integrerade. Det blir väldigt svårt att använda dessa komponenter till andra system än just de som de var avsedda för. OpenNLP försöker komma åt denna typ av problem genom att modularisera ramverket, så att projekt i möjligaste mån kan integreras med andra. Detta är i synnerhet viktigt för språkteknologi, för att de grundläggande metoderna används i så många olika sammanhang. OpenNLP är inte det enda projektet som syftar till att samla språkteknologiska projekt inom Open Source. Projektet GATE, General Architecture for Text Engineering, är ett liknande projekt som är byggt av en grupp inom Sheffields universitet. GATE är betydligt äldre och mer använt än OpenNLP. Fördelen med flera olika sådana projekt är mångfalden och möjligheten att välja ett passande ramverk för just det projekt man arbetar på. 3.3 SenseRelate Många ord i ett språk, såsom svenska eller engelska, är flertydiga. Med det menas att man har flera tolkningar av ett ords mening eller dess grammatiska roll. Detta är en av de stora problemen inom språkteknologin, eftersom semantik är ett väldigt svårformaliserat ämne. Grammatiken hos naturliga språk är dessutom omöjlig att beskriva komplett. På grund av detta har man metoder för att från en flertydighet göra en tolkning så att man får en entydig mening. SenseRelate [6] är ett projekt inom OpenNLP för disambiguering av meningen av ett ord Metoder För denna typ av disambiguering har man ett målord som man vill bestämma meningen hos. För att göra detta tittar man på meningen av omkringliggande ord och externa resurser, som till exempel ordlistor, för att bestämma vilken mening författaren avsåg. SenseRelate har arbetshypotesen att den implicerade meningen hos ett målord är mer relaterat till meningen hos de omkringliggande orden än de andra möjliga tolkningarna av målordet. För att bestämma de möjliga tolkningarna av ett ords mening använder sig SenseRelate av WordNet, som beskrivs ovan. Algoritmen tar som indata ett antal ord, varav ett är märkt som målordet. De andra orden är de omkringliggande orden. Till 4
5 varje ord läggs till ett antal möjliga tolkningar av det ordet. Det är dessa tolkningar som tas från WordNet. För varje tolkning av målordet beräknas sedan ett likhetsmått med tolkningarna av kontextorden. Det bästa likhetsmåttet används sedan som den mest sannolika tolkningen av målordet. På detta sätt är metoden probabilistisk Använding av SenseRelate Användningar av disambiguering av ord finns i många delar av språkteknologin. I informationssökning används det för att försäkra sig om att man söker på rätt mening av ett ord. Inom automatisk textsammanfattning är dessa metoder mycket viktiga för att vet vilken del av texten som innehåller information viktig för texten i helhet. Gemensamt för dessa områden är att kunskap om omvärlden egentligen vore nödvändigt, för att man med säkerhet ska kunna söka på eller behandla rätt textmängder. I väntan på en revolution inom kunskapsteori får vi dock nöja oss med statistiska metoder Problem och svagheter Semantisk analys av ord görs av människor i stort sett omedvetet. Ofta kan vi direkt se vad ordet betyder, genom att titta på sammanhanget. Detta kräver dock en utförlig kunskap om vår omvärld. Eftersom kunskap i sig är väldigt abstrakt så är det inte konstigt att datorer har mycket svårt för att hantera det. Det är detta som tvingar oss att använda statistiska metoder, som i många fall kommer misslyckas. I vissa fall är det omöjligt till och med för människor att veta vad som menas med en mening. I sådana fall måste man helt enkelt acceptera att det inte finns någon entydig lösning på problemet med disambiguering. Eftersom datorer dock omöjligen kan veta om så är fallet så kommer de naturligtvis försöka ge en lösning i alla fall. 3.4 nlpfarm nlpfarm [5] är ett projekt, också under OpenNLP, för att underlätta utvecklingen av språkteknologiska tillämpningar. Till skillnad från SenseRelate ovan är nlpfarm inte själv en tillämpning, utan snarare ett bibliotek med verktyg. Eftersom nlpfarm är en del av OpenNLP är det mycket modulariserat, där varje del tillhandahåller funktioner inom ett specifikt område Ordkontexter nlpfarm har modulen javaconlib som är ett verktyg för algoritmer som arbetar med kontexter runt ett ord. Detta har sin användning inte minst i projekt som SenseRelate där algoritmen för disambiguering av ord använder sig av ordets kontext. 5
6 Modulen implementerar stöd för att hämta kontexter ur textmängder, lägga dessa i effektiva strukturer. När detta är gjort kan man sortera eller söka i strukturerna. En annan viktig funktion är att beräkna olika typer av mått på dessa kontexter, som till exempel likhetsmåttet i SenseRelate Grammatiker nlpfarm har en module för hantering av kontextfri grammatik samt probabilistiska kontextfria grammatiker. Kontextfri grammatik används vid syntaxanalys och inte minst parsning. Kontextfria grammatiker har användning inte vara inom språkteknologi och lingvistik, utan även inom datalogin och dess beskrivning av formella språk. 4 Open Source och kommersiella intressen Företag har väldigt länge varit skeptiska till Open Source då det är svårt att se hur man kan tjäna pengar på ett sånt projekt. På senare tid har dock stora företag som till exempel IBM och Sun Microsystems i högre grad börjat stödja och till och med själva utveckla programvara som är Open Source. IBM släppte senast ett språkteknologisk system som Open Source. Det fanns förväntningar om att det skulle vara ett komplett taligenkänningssystem, men det visade sig att IBM valt att inte släppa hela systemet, utan bara utvalda delar av det. Många språkteknologiska resurser, som till exempel korpusar eller taggade textmängder, kräver väldigt mycket arbete och ekonomiska resurser. På grund av detta är det oftast företag eller organisationer, som har de resurser som krävs, som gör dessa arbeten. Problemet är att detta görs i vinstintresse, vilket hindrar Open Source-projekt från att använda dessa resurser. 5 Open Source och akademiska projekt Open Source har sina rötter i forskningsvärlden och har också haft ett större stöd där än i företagsvärlden. Eftersom forskning i den akademiska världen inte är driven i ekonomiskt intresse, eller i alla fall inte i lika hög grad som den forskning företag bedriver, så är användningen av Open Source mycket mer utbredd. Open Source är ett bra sätt att sprida sin forskning och sina idéer och på ett effektivt sätt på förslag på förbättringar. 6 Fördelar Open Source har traditionellt sett varit väldigt internationellt. Det är först och främst Internet som tillåtit personer i olika delar av världen att samarbeta på projekt. Just språkteknologiska projekt kan dra nytta av detta, då personer i olika delar 6
7 av världen kan anpassa programmet till deras eget språk. På detta sätt kan projektet få en mångfald av språk på ett annat sätt än en utvecklingsgrupp lokaliserad i ett speciellt land kan få. Med Open Source får man en mycket större möjlighet att integrera andra program i sitt eget, än vad man skulle få med ett kommersiellt slutet system. Har man till exempel ett program som SenseRelate kan man behöva läsa filer som är av ett annat format än det som stöds. Använder man sig då av ett kommersiellt system har man inget annat val än att försöka få företaget i fråga att lägga till stöd för detta format. Använder man sig av ett program som är Open Source har man däremot möjlighet att själv förändra programmet för att lägga till det stöd man behöver. 7 Nackdelar En nackdel med Open Source är svårigheten att använda kommersiellt material i programvaran. Korpusar, till exempel, är ofta kommersiella och kan därmed inte göras tillgängliga tilsammans med annan kod. På grund av detta är Open Sourceprojekt oftast hänvisade till att använda andra Open Source-projekt, eller material vars upphovsrätt har gått ut. Exempel på sådana projekt är Project Gutenberg och Projekt Runeberg, vilka båda två i stor utsträckning publicerar äldre litteratur. Ibland kan man använda kodning av det kommersiella materialet för att göra det användbart för programmet, men ändå inte öppet för annan användning. Ett exempel på detta är Stava, där Svenska Akademiens Ordlista finns kodad i en boolesk hashtabell. Man kan på detta sätt leta efter ett ord, för att se om man hittar det, men det är däremot orimligt att ur denna hashtabell skapa en egen ordlista. Ordlistan skulle innehålla alldeles för många fel. Referenser [1] Free Software Foundation, [2] B. Perens: The Open Source Definition (1997), [3] WordNet, wn [4] OpenNLP, [5] nlpfarm, [6] SenseRelate, 7
Inlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Introduktion Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning 1(18) Kursöversikt Kursnamn:
Läs merSpråkteknologi. Språkteknologi
Språkteknologi Denna kurs handlar om naturliga språk (svenska, engelska, japanska, arabiska ), och hur vi kan få datorer att utföra användbara och intressanta uppgifter med naturliga språk. Språkteknologi
Läs merSvenska Linuxföreningen. Fri programvara Mer än bara gratis 1(17) Copyright 2006 Marcus Rejås <marcus@rejas.se>
Fri programvara Mer än bara gratis Copyright 2006 Marcus Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något
Läs merMed Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi
Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1 2010 bakgrund och förutsättningar
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merOpen Source - Eller som vi säger, Fri programvara
Rejås 1(27) Open Source - Eller som vi säger, Fri programvara Copyright 2006 Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något
Läs merFil: /home/lah/undervisning/sprakteknologi/ohbilder/oh1_kv.odp. Tjänster
Taligenkänning 729G17/729G66 Språkteknologi 1 Vad är språkteknologi? Vad är språkteknologi? Kursens mål och uppläggning Att analysera textdata Korpusar och korpusarbete Textanalys med reguljära uttryck
Läs merOpen Source - Eller som vi säger, Fri programvara
Open Source - Eller som vi säger, Fri programvara Copyright 2006, 2007 Marcus Rejås Rejås Datakonsult, http://www.rejas.se Jag ger härmed rätten till alla att nyttja denna presentation
Läs merDenna presentation är inte klar, kommentarer mottages tacksamt! CyberRymden
Öppen/Fri mjukvara, 11 december 2002 1(13) Öppen/Fri mjukvara CyberRymden 2002-09-10 Marcus Rejås $Id: slides.tex,v 1.10 2002/12/11 20:15:40 rejas Exp $ http://www.rejas.net Made with
Läs merLösningsförslag till tentamen i Språkteknologi 2D1418,
Lösningsförslag till tentamen i Språkteknologi 2D1418, 2004-10-18 1. Stavningskontroll utan ordlista (10 poäng) a) Med 29 bokstäver i alfabetet och en specialbokstav för ordbörjan/ordslut så finns det
Läs merTekniker för storskalig parsning: Grundbegrepp
Tekniker för storskalig parsning: Grundbegrepp Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning: Grundbegrepp 1(17)
Läs mer2005-06-02 1 Open Source-licenser
2005-06-02 1 Open Source-licenser Open Source-licenser NEA Nätverket för Elektroniska Affärer Advokat Sofia Geilert 2005-06-02 2 Open Source-licenser Open Source-licenser Antal olika licenser för open
Läs merTeoretisk lingvistik och datalingvistik. Robin Cooper
Teoretisk lingvistik och datalingvistik Robin Cooper Syftet med dagens föreläsning Sammanfattning av lingvistisk teori och datalingvistik/språkteknologi Diskussion av teorins roll i olika språkteknologiska
Läs merSyntaktisk parsning (Jurafsky & Martin kapitel 13)
Syntaktisk parsning (Jurafsky & Martin kapitel 13) Mats Wirén Institutionen för lingvistik Stockholms universitet mats.wiren@ling.su.se DH2418 Språkteknologi DA3010 Språkteknologi för datorlingvister Föreläsning
Läs merbakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi återanvändning av befintliga resurser SALDO
bakgrund och förutsättningar Med Zipf mot framtiden En integrerad lexikonresurs för svensk språkteknologi Lars Borin Språkbanken Inst. för svenska språket Göteborgs universitet Schæffergårdssymposiet 30/1
Läs merJuridiska frågor kring fri programvara och öppen källkod
Juridiska frågor kring fri programvara och öppen källkod Daniel Westman Institutet för rättsinformatik Stockholms universitet http://www.juridicum.su.se/iri/dawe Fri programvara Bakgrund, ideologi och
Läs merMigrering av applikationen AMM till molnet
Datavetenskap Opponenter: Erik Andersson och Marcus Larsson Respondenter: Anders Nguyen och Linus Svensson Migrering av applikationen AMM till molnet Oppositionsrapport, C-nivå 2010:06 1 Sammanfattat omdöme
Läs merHUMANISTISKA FAKULTETEN. Språkteknologi, masterprogram, högskolepoäng
Utbildningsplan Dnr G 2017/293 HUMANISTISKA FAKULTETEN Språkteknologi, masterprogram, 60-120 högskolepoäng Master in Language Technology (One year Programkod: H2MLT 1. Fastställande Utbildningsplanen är
Läs merÖppen/Fri programvara
Öppen/Fri programvara, 19 januari 2003 1(13) Öppen/Fri programvara DENNA PRESENTATION ÄR INTE KLAR, KOMMENTARER MOTTAGES TACKSAMT. CyberRymden 2002-09-10 Marcus Rejås $Id: slides.tex,v
Läs merSvenska Linuxföreningen. Fri programvara Mycket mer än gratis 1(36) Copyright 2005, 2006 Marcus Rejås <marcus@rejas.se>
Fri programvara Mycket mer än gratis Copyright 2005, 2006 Marcus Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet
Läs merSpråkpsykologi/psykolingvistik
Kognitiv psykologi HT09 Språk Ingrid Björk Språkpsykologi/psykolingvistik Fokuserar på individers språkanvändning Språkprocessning Lagring och åtkomst, minnet Förståelse Språket och hjärnan Språk och tänkande
Läs merInledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE
Språteknologi på SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE digital kompetens kring ordböcker, språkkontroller, korpusar och söktjänster! Följer teknikens påverkan på språk och språkanvändning! Bevakar språkteknisk
Läs merVäl godkänt (VG) Godkänt (G) Icke Godkänt (IG) Betyg
Betygskriterier Examensuppsats 30 hp. Betygskriterier Tregradig betygsskala används med betygen icke godkänd (IG), godkänd (G) och väl godkänd (VG). VG - Lärandemål har uppfyllts i mycket hög utsträckning
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 1 Lärandemål Efter avslutad kurs skall studenten
Läs merOpen Source-licenser
2005-12-02 1 Open Source-licenser Open Source NEA Nätverket för Elektroniska Affärer Advokat Sofia Geilert 2005-12-02 2 Open Source-licenser Vad är Open Source Software (OSS)? Öppen källkod Programvara
Läs merSlutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008
Slutrapport Vertikala Sökmotorer Uppdrag från.se:s Internetfond Våren 2008 Anders Ardö Elektro- och informationsteknik Lunds Universitet Box 118, 221 00 Lund June 18, 2009 1 Inledning Digitala bibliotek
Läs merMaterial från
Svenska som andraspråk 7-9 Berättande texter Centralt innehåll och kunskapskrav I det centrala innehållet för svenska som andraspråk år 7-9 anges Skönlitteratur, lyrik, dramatik, sagor och myter från olika
Läs merSPRÅKTEKNOLOGIPROGRAMMET
SPRÅKTEKNOLOGIPROGRAMMET Kandidatprogram, 3 år, 180 hp. Mats Dahllöf Institutionen för lingvistik och filologi Augusti 2012 1 Språkteknologer arbetar med... att utveckla, utvärdera och underhålla system
Läs merSymbolspråk som alternativa och kompletterande kommunikationsmedel
Symbolspråk som alternativa och kompletterande kommunikationsmedel Paulina Modlitba Medieteknik-01 2D1418 Språkteknologi Kungliga tekniska högskolan, Stockholm Innehållsförteckning 1. Språkteknologi och
Läs merProgramvaror - Jo, tack, det vill vi ha...
Rejås 1(20) Programvaror - Jo, tack, det vill vi ha... Copyright 2006 Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något sätt
Läs merFöreläsning 5: Modellering av frasstruktur. 729G09 Språkvetenskaplig databehandling Lars Ahrenberg
Föreläsning 5: Modellering av frasstruktur 729G09 Språkvetenskaplig databehandling Lars Ahrenberg 2014-05-05 1 Översikt Introduktion generativ grammatik och annan syntaxforskning Att hitta mönster i satser
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Introduktion http://stp.lingfil.uu.se/~matsd/uv/uv11/gfst/ Mats Dahllöf Institutionen för lingvistik och filologi Oktober 2011 Lärandemål Efter avslutad kurs skall studenten
Läs mer729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Läs merInledning. Vad är ett datorprogram, egentligen? Olika språk. Problemlösning och algoritmer. 1DV433 Strukturerad programmering med C Mats Loock
Inledning Vad är ett datorprogram, egentligen? Olika språk Problemlösning och algoritmer 1 (14) Varför använda en dator? Genom att variera de program som styr datorn kan den användas för olika uppgifter.
Läs merSvenska Linuxföreningen. Fri programvara Mycket mer än bara gratis 1(29)
Fri programvara Mycket mer än bara gratis Copyright 2005,2006 Marcus Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet
Läs merUB:s sö ktjä nst - Söka artiklar och annan litteratur
1 UB:s sö ktjä nst - Söka artiklar och annan litteratur Innehåll Börja här... 2 Logga in... 2 Mitt konto... 3 Adressändring... 3 Spara sökresultat... 4 Sökhistorik & litteraturbevakning... 5 Söka, välja,
Läs merSPRÅKTEKNOLOGIPROGRAMMET
SPRÅKTEKNOLOGIPROGRAMMET Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi Augusti 2013 (Mats Dahllöf) 1 Språkteknologer arbetar med... att utveckla, utvärdera och underhålla system
Läs merBedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator
version 2014-09-10 Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas i signerad slutversion till examinator Studentens namn Handledares namn Examinerande
Läs merKom igång med SpellRight
Kom igång med SpellRight SpellRight är ett program som rättar engelska stavfel. Programmet är i första hand avsett för personer som har svenska som modersmål och skriver på engelska som andraspråk. Starta
Läs merSPRÅKTEKNOLOGIPROGRAMMET (STP)
SPRÅKTEKNOLOGIPROGRAMMET (STP) Kandidatprogram, 3 år, 180 hp. Institutionen för lingvistik och filologi 1 Utbildningsprogram Kunskapsmässig progression och yrkesmässig relevans. Antagning till ett paket
Läs merFråga bibliotekarien. Länkbiblioteket. Sökslussen. Metasökprogrammet Frank och Söksam. biblioteken.fi >
Fråga bibliotekarien Länkbiblioteket Sökslussen Metasökprogrammet Frank och Söksam biblioteken.fi > : Informationssökning { www.biblioteken.fi/informationssokning Centrala söktjänster för olika sökbehov
Läs merInledande programmering med C# (1DV402) Introduktion till C#
Introduktion till C# Upphovsrätt för detta verk Detta verk är framtaget i anslutning till kursen Inledande programmering med C# vid Linnéuniversitetet. Du får använda detta verk så här: Allt innehåll i
Läs merKort om World Wide Web (webben)
KAPITEL 1 Grunder I det här kapitlet ska jag gå igenom allmänt om vad Internet är och vad som krävs för att skapa en hemsida. Plus lite annat smått och gott som är bra att känna till innan vi kör igång.
Läs merOpponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg
Datavetenskap Opponenter: Erik Hansen Mats Almgren Respondent: Martin Landälv ioftpd-verktyg Oppositionsrapport, C-nivå 2006:12 1 Sammanfattat omdöme av examensarbetet Examensarbetet är intressant eftersom
Läs merBCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI
Mats Lundälv Senior IKT-pedagog f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM Det fria ordet och AKK / ASK Kommunikativ och språklig tillgänglighet för alla...byggt på en infrastruktur av fria
Läs merInnehåll. Språkinlärning: mänsklig och datorstödd. Olika typer av program för datorstödd språkinlärning. Varför datorer i språkutbildning?
Språkinlärning: mänsklig och datorstödd Ola Knutsson knutsson@csc.kth.se Språkteknologikursen KTH Innehåll Några olika typer av system för datorstödd språkinlärning Vad handlar språkinlärning om? Språkteknologins
Läs merBedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas till examinator
version 2017-08-21 Bedömning av Examensarbete (30 hp) vid Logopedprogrammet Fylls i av examinerande lärare och lämnas till examinator Studentens namn Handledares namn Examinerande lärare Uppsatsens titel
Läs merKvantitativ samhällsanalys med språkteknologiska metoder.
Kvantitativ samhällsanalys med språkteknologiska metoder Hillevi Hägglöf hillevi.hagglof@gmail.com Myndigheten för samhällsskydd och beredskap (MSB) Bakgrund Alla rapporter, utredningar, utvärderingar
Läs merRiktlinjer för bedömning av examensarbeten
Fastställda av Styrelsen för utbildning 2010-09-10 Dnr: 4603/10-300 Senast reviderade 2012-08-17 Riktlinjer för bedömning av Sedan 1 juli 2007 ska enligt högskoleförordningen samtliga yrkesutbildningar
Läs merSemantik och pragmatik
Semantik och pragmatik Lingvistik 1 vt06 Uppsala universitet 1 Nyckelord idag Semantik Fras- och satssemantik Semantiska roller Kompositionalitetsprincipen Metaforer och idiom Pragmatik Språklig kontext
Läs merIntroduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
Läs merOpen Source - Utmaningar och fördelar
Open Source - Utmaningar och fördelar Johan Hübner Emil Dicksved 16 mars 2011 Agenda Vad är open source? Historik och utveckling över tid Krav på open source-licenser Översiktlig genomgång av några vanliga
Läs merAtt använda Stava Rex i Word 2007
Att använda Stava Rex i Word 2007 1. Skriva i Word Skriv av följande mening med fel och allt: Stänga av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer de ord som Word uppfattar
Läs merForskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA
Forskning och utveckling inom språkteknologi Uppgift 3: Projektförslag Parallelliserad dependensparsning i CUDA Evelina Andersson 18 maj 2011 1 Introduktion Att träna mycket för att bli duktig på ett språk
Läs merFöreläsning 6: Analys och tolkning från insamling till insikt
Föreläsning 6: Analys och tolkning från insamling till insikt FSR: 1, 5, 6, 7 Rogers et al. Kapitel 8 Översikt Kvalitativ och kvantitativ analys Enkel kvantitativ analys Enkel kvalitativ analys Presentera
Läs merSpråk, datorer och textbehandling
Språk, datorer och textbehandling Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt Sökmotorer
Läs merSnabbguide till Cinahl
Christel Olsson, BLR 2008-09-26 Snabbguide till Cinahl Vad är Cinahl? Cinahl Cumulative Index to Nursing and Allied Health Literature är en databas som innehåller omvårdnad, biomedicin, alternativ medicin
Läs merOpen Source - Program och hur man väljer
Open Source - Program och hur man väljer Copyright 2007, 2008 Marcus Rejås Rejås Datakonsult Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga
Läs merSvensk nationell datatjänst, SND BAS Online
Pass 3: Metadata Vad är metadata? I den här presentationen kommer jag ge en introduktion till metadata och forskningsdata på ett principiellt plan. Vi kommer bland annat titta lite närmare på vad metadata
Läs merParsning. TDP007 Konstruktion av datorspråk Föreläsning 6. Peter Dalenius Institutionen för datavetenskap
Parsning TDP007 Konstruktion av datorspråk Föreläsning 6 Peter Dalenius Institutionen för datavetenskap 2017-02-14 2 Analys av källkod Lexikalisk analys Bildar tokensutifrån källkodens text. Syntaktisk
Läs merPROGRAMMERING. Ämnets syfte. Kurser i ämnet
PROGRAMMERING Ämnet programmering behandlar programmeringens roll i informationstekniska sammanhang som datorsimulering, animerad grafik, praktisk datoriserad problemlösning och användaranpassad konfiguration
Läs merÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle
Humanistiska och teologiska fakulteterna ÄENA23, Engelska II, 15 högskolepoäng English II, 15 credits Grundnivå / First Cycle Fastställande Kursplanen är fastställd av Prodekanen med ansvar för grundutbildning
Läs merBetydelse och betydelse
Betydelse och betydelse Ordbetydelsedisambiguering i praktiken Stian Rødven Eide stian@fripost.org Självständigt arbete i lingvistik, 15 hp Göteborgs universitet Institutionen för filosofi, lingvistik
Läs merModellering med kontextfri grammatik Kontextfri grammatik - definition En enkel kontextfri grammatik Klasser av formella språk
Modellering med kontextfri grammatik Kontextfri grammatik - definition Kontextfri grammatik (CFG) definition modellering av frasstruktur andra exempel Dependensgrammatik Trädbanker Varianter av kontextfri
Läs merBilaga 1. Teknisk kravspecifikation
Bilaga 1 Teknisk kravspecifikation 5.5.2014 Webbplatsen 1. Allmänt Korsholms kommun arbetar aktivt för att vara en ledande tvåspråkig landskommun i Österbotten och har drygt 19 100 invånare varav 68,9
Läs merNonogram
Nonogram. Vad är nonogram? Nonogram är små enkla men fascinerande pyssel som ursprungligen kommer från Japan. De har också givits ut i söndagsbilagan i engelska dagstidningar under flera år. Idén bakom
Läs merLicenser - Jo, tack, men så få som möjligt
Rejås 1(22) Licenser - Jo, tack, men så få som möjligt Copyright 2006 Rejås Jag ger härmed rätten till alla att nyttja denna presentation på alla sätt som anses lämpliga så länge som syftet på något sätt
Läs merSÄRSKILD PRÖVNING I SVENSKA A
SÄRSKILD PRÖVNING I SVENSKA A Följande färdigheter ska du uppvisa under prövningen för att få ett godkänt betyg på kursen: SKRIVANDE: Du ska kunna producera olika typer av texter som är anpassade till
Läs merLingvistik 729G08 (6 hp) Mathias Broth Charlotta Plejert Therese Örnberg Berglund Mikael Svensson
Lingvistik 729G08 (6 hp) Mathias Broth Charlotta Plejert Therese Örnberg Berglund Mikael Svensson Vad är lingvistik? Språkvetenskap: det vetenskapliga studiet av språk och språkande En spännande kurs!
Läs merIntroduktion till programmering och Python Grundkurs i programmering med Python
Introduktion till programmering och Python Hösten 2009 Dagens lektion Vad är programmering? Vad är en dator? Filer Att tala med datorer En första titt på Python 2 Vad är programmering? 3 VAD ÄR PROGRAMMERING?
Läs merSpråk och skrivande i årskurs 9 projektets huvudrapport Fokus på finlandssvenska elevtexter - fördjupande artiklar om skrivförmåga 15.9.
Språk och skrivande i årskurs 9 projektets huvudrapport Fokus på finlandssvenska elevtexter - fördjupande artiklar om skrivförmåga Material Ca 1 700 elever i 30 skolor i Svenskfinland, april 2014 20 skolor
Läs merTDDD02 Språkteknologi för informationssökning / Textsammanfattning. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning / 2015 Textsammanfattning Marco Kuhlmann Institutionen för datavetenskap Textsammanfattning Textsammanfattning går ut på att extrahera den mest relevanta informationen
Läs merEXJOBBSOPPOSITION. Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh
EXJOBBSOPPOSITION Rapportförfattare: Hanif Farahmand Mokarremi Ashkan Jahanbakhsh Rapportens titel: Domän-Webb-Applikations-Fuzzer(DWAP) introduktion och implementation Opponent: Viktor Gummesson Var det
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merSkäl för revideringarna är att kursplanerna tydligare ska spegla kursernas innehåll och mål.
Ulla Veres viceprefekt för utbildning på grund- och avancerad nivå Prefekten 2013-10-28 FÖRSLAG till beslut Fastställande och revideringar av kursplaner Lingvistik Ärendet med förslag till beslut Prefekten
Läs merSemantik. Semantik och språkteknologi
Semantik Semantik studiet av innebörd(mening) Går tillbaka till Platon (dialogen Kratylos) Relationen språk verklighet Betydelsen av ett ord är dess användning i språket (Wittgenstein) Semantik och språkteknologi
Läs merAristi Fernandes Examensarbete T6, Biomedicinska analytiker programmet
Kursens mål Efter avslutad kurs skall studenten kunna planera, genomföra, sammanställa och försvara ett eget projekt samt kunna granska och opponera på annan students projekt. Studenten ska även kunna
Läs merFrågor & Svar Öppna programvaror 2010
Frågor & Svar Öppna programvaror 2010 1 (6) Kompletteringar Inga Frågor & svar 1. Svarsdatum: 2010-11-12 15:35:44 Fråga: Fråga 1: 5.1.2, Hur viktigt är det att produktlistan är komplett vid avtalstillfället.
Läs merDatasäkerhet. Hur ska vi göra för att skydda våra datorer mot virus och andra hot?
Datasäkerhet Hur ska vi göra för att skydda våra datorer mot virus och andra hot? Eva Blommegård, Lars-Anders Westlin samt Bengt Wolff SeniorNet Tyresö Agenda och definitioner Virusskydd Lösenord. Säkra
Läs merKungliga Tekniska Högskolan 2006-03-26. Patrik Dallmann 821107-0274
Kungliga Tekniska Högskolan 2006-03-26 Patrik Dallmann 821107-0274 Patrik Dallmann dallmann@kth.se Inledning Syftet med detta arbete är att undersöka metoder för att upptäcka syftningsfel i vanlig text.
Läs merDatorlingvistisk grammatik
Datorlingvistisk grammatik Kontextfri grammatik, m.m. http://stp.lingfil.uu.se/~matsd/uv/uv11/dg/ Mats Dahllöf Institutionen för lingvistik och filologi Februari 2011 Denna serie Formella grammatiker,
Läs merSKOLFS. beslutade den -- maj 2015.
SKOLFS Föreskrifter om ändring i Skolverkets föreskrifter (SKOLFS 2010:247) om ämnesplan för ämnet programmering i gymnasieskolan och inom kommunal vuxenutbildning på gymnasial nivå; beslutade den -- maj
Läs merTekniker för storskalig parsning
Tekniker för storskalig parsning Grundläggande begrepp och metoder Joakim Nivre Uppsala Universitet Institutionen för lingvistik och filologi joakim.nivre@lingfil.uu.se Tekniker för storskalig parsning
Läs merGrammatik för språkteknologer
Grammatik för språkteknologer Fraser http://stp.lingfil.uu.se/~matsd/uv/uv12/gfs/ Språkteknologiska grammatikkomponenter Tokenisering urskilja graford. Ordklasstaggning och annan taggning tilldela dem
Läs mera White Paper by Idea2Innovation Vad är innovation?
a White Paper by Idea2Innovation Vad är innovation? Ordet innovation börjar för vissa kännas så uttjatat att det inte bara är luddigt utan rent av rinner genom fingrarna när man försöker greppa det. Alla
Läs merExamensarbete i språkteknologi
Examensarbete i språkteknologi Beáta Bandmann Megyesi Institutionen för lingvistik och filologi Uppsala universitet Översikt Examensarbetets innehåll Regler och principer Lärare och handledare Lärandemål
Läs merDatorbaserade verktyg i humanistisk forskning
Datorbaserade verktyg i humanistisk forskning Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt
Läs merEn arbetsdag på kontoret kan innehålla. Så klarar man språkkontrollen DATORER RICKARD DOMEIJ
DATORER Så klarar man språkkontrollen RICKARD DOMEIJ Är datorns språkkontroll skribentens bästa vän? Eller kommer den mest med löjliga förslag? I april gav Svenska språknämnden ut Datorn granskar språket,
Läs merAvslutning. Kapitel Komprimering av filer
Kapitel 12 Avslutning I detta sista kapitel tittar vi på hur man kan installera program själv. I samband med det finns det anledning att titta på komprimering av filer och på filarkiv (som kan vara användbart
Läs merInstallationsanvisningar HogiaLön Plus
Installationsanvisningar HogiaLön Plus Installation Med den här installationen kan du installera HogiaLön Plus på Windows XP, Vista, Windows 7 och Windows 8. Om du vill installera en MSI-installation finns
Läs merInformationssökning och -utvinning. Informationssökning och informationsutvinning. [IR & IE] Introduktion (1) [IR & IE] Introduktion (2)
Informationssökning och -utvinning Informationssökning och informationsutvinning Kristina Nilsson, kristina.nilsson@ling.su.se 2006-11-06: MOTIST, UU 1. Informationssökning (Information Retrieval, IR)
Läs merGrundläggande EndNote
Grundläggande EndNote Stephen Naron, februari, 2011 Uppdatering och översättning till svenska: Taeda Tomić, 2012, 2014 Korrekturläsning: Martina Andersson Löfqvist, september 2012 1. Lite information om
Läs merKursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011
Institutionen för kultur och kommunikation Linköpings universitet Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2011 Kursansvarig lärare: Richard Hirsch (281856) Richard.Hirsch@liu.se Vecka
Läs merTentamen etjänster och webbprogrammering Institutionen för informatik och media, informattionssystem Datum 30/5 Tid
Tentamen etjänster och webbprogrammering Institutionen för informatik och media, informattionssystem Datum 30/5 Tid 8.00 12.00 Lärare Owen Eriksson Madelene Hermelin Johan Karlsson Mikael Fors Maxpoäng
Läs merMaskinöversättning möjligheter och gränser
Maskinöversättning möjligheter och gränser Anna Sågvall Hein 2015-02-17 Tisdagsföreläsning USU 2015-02-17 Anna Sågvall Hein Översikt Vad är maskinöversättning? Kort tillbakablick Varför är det så svårt?
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merGrammatiska morfem kan också vara egna ord, som t ex: och på emellertid
Stockholms universitet Institutionen för lingvistik Språkteori grammatik VT 1994 Robert Eklund MORFEMANAYS Vi kan dela in ord i mindre enheter, segmentera orden. Här följer en liten kortfattad beskrivning
Läs merSpråkteknologi (SV2122) Föreläsning 3: Programmering i Python
Språkteknologi (SV2122) Föreläsning 3: Programmering i Python Richard Johansson richard.johansson@svenska.gu.se 29 januari 2014 översikt inledning första stegen grundläggande begrepp större byggstenar
Läs merAnvända SpellRight 2 i Word 2010
Använda SpellRight 2 i Word 2010 1. Skriva i Word 1. Öppna Word och skriv av följande mening med fel och allt: 2. Stäng av Words rättstavningsfunktion Om stavningskontrollen i Word är aktiverad kommer
Läs mer