Random Indexing. - med större korpus. Olof Stange & Claes Toll Handledare: Johan Boye DD Språkteknologi
|
|
- Viktor Persson
- för 8 år sedan
- Visningar:
Transkript
1 - med större korpus Olof Stange & Claes Toll - Språkteknologi
2 Innehållsförteckning Inledning s. 3 Bakgrund s. 3 Metod s. 3-4 Problem s. 4 Resultat s. 4-5 Analys s. 6-8 Sammanfattning s. 8 Källförteckning s. 9 Bilagor s. 9 2
3 Inledning är ett tillvägagångssätt för att relatera ord till varandra. Genom att gå igenom fritext kan metoden skapa samband mellan liknande ord med hjälp av deras omgivning. Hur bra metoden fungerar beror på ett antal olika variabler. Resultat man uppnår kan exempelvis ha sin grund i hur stor textmängd man arbetar med, hur stort kontextfönster man väljer att sätta upp för varje ord eller dokument samt hur många dimensioner man arbetar med. I det här arbetet ska vi undersöka hur storleken på textmängden påverkar resultatet. Vi kommer att utgå från ett större textmaterial och jämföra hur mycket varje ny textmängd som läggs till förbättrar utfallet. Resultatet testas med hjälp av orddelen på högskoleprovet där det ord som är närmast i betydelse är det rätta svaret (se kurshemsidan för mer information). Uppgiften bygger på laborationen Statistisk lexikal semantik i. Vi har använt oss av javaprogrammet OrdHP med de inställningar som visade upp de bästa resultaten på Laboration 3. 1 Bakgrund (RI) är en metod för att utvinna relaterade ord ur fritext. Inledningsvis förknippas varje ord eller dokument med en unik och mångdimensionell slumpvektor där ett antal 1:or och -1:or placeras ut. Resten av elementen i vektorn är 0. Metoden går sedan igenom texten och skapar en kontextvektor för varje ord. När ett ord befinner sig i fokus sätts ett kontextfönster upp som innehåller det fokuserade ordet samt ett antal ord före och efter. De omkringliggande ordens slumpvektorer läggs till i det fokuserade ordets kontextvektor. Detta innebär att liknande ord kommer att få likartade kontextvektorer. Måttet av likhet kan sedan mätas genom att ta det kartesiska avståndet mellan dessa vektorer. 2 Metod Till en början valde vi ut två olika korpus Parole (ca 19 miljoner ord) samt ett annat svenskt korpus från kurshemsidan (ca 3,3 miljoner ord). Parole är uppbyggt av romaner, dagstidningar, tidskrifter och texter från mitten av 1970-talet och ca 20 år framåt 3 medan korpuset från kurshemsidan består av okända texter. Orden i Parole var ordklasstaggade, men eftersom detta inte var av intresse för oss, inledde vi med att plocka ut orden med hjälp av ett egenprogrammerat Pythonprogram. Orden kopierades istället till nya filer med löptext om max tecken. Filernas storlek bestämdes med utgångspunkt i att allt material också behövde lemmatiseras, då orden på högskoleprovet är representerade i grundform. Vid liknande tester tidigare har det också visat sig ge bättre resultat med lemmatiserade texter än utan. 4 Det lemmatiseringsverktyg vi använde oss av var ett program på KTH-servern Skrutten 2 som ordklasstaggar och lemmatiserar alla ord. Uppkopplingen till Skrutten 2 sker via protokollet telnet och teckenbegränsningen var just tecken för varje uppkoppling. Utifrån svaret från servern plockade vi återigen ut orden utan ordklasstaggarna och skapade nya lemmatiserade filer i löptext. På detta sätt genererade vi ca filer från Parole och ca 3600 filer från vårt mindre korpus. Därefter tränade vi datorn på vår träningsmängd och testade mot 1 Bilaga 2 2 Sahlgren, sid Bilaga 1 4 Sahlgren, sid 7 3
4 orddelen på högskoleprovet. Vi skapade avslutningsvis ett eget korpus med utgångspunkt i de resultat vi fick från våra andra korpus. De ord som ingick i detta korpus var de ord vi inte hade tillräckligt med information om i vårt textmaterial. Vi skapade detta nya korpus med hjälp av google-sökningar. Problem Vi har inte råkat ut för några större problem under vårt arbete. Något som vi dock upplevde som en begränsning var skolans datorer. Vi har som studenter i grunden 350 mb lagringsutrymme och enbart Parole-textfilen var på nästan 500 mb. Vi löste detta genom att generera filerna på egna datorer. När vi sedan skulle träna datorn på vår träningsmängd var vi begränsade i minne och återigen fick vi använda oss av våra privata datorer. Uppkopplingen via telnet mot skrutten2 har fungerat relativt bra. I några filer har det funnits annorlunda tecken (_ i ett ord, ex. ord_1, citattecken och tre punkter i rad) vilka inte har accepterats av lemmatiseringsverktyget. Dessa filer ligger jämt fördelade över korpuset (Parole) och blev inte lemmatiserade och används därför inte i vår träningsmängd. Vi bedömer att ca 1,5 miljon ord från Parole inte har använts i vår träningsmängd på grund av detta. Vi råkade även ut för ett strömavbrott på KTH som gjorde det omöjligt att få kontakt med skolans servrar. Detta strömavbrott pågick i drygt två timmar men servrarna var inte uppe i drift förrän efter ytterligare några timmar, vilket gjorde att vi förlorade nästan en arbetsdag. Resultat Med våra tre korpus fick vi följande resultat: Correct Missed Unsufficient Total Mellankorpus Parole Eget korpus Tabell 1. För att kunna jämföra siffrorna i en graf har vi multiplicerat resultat i Eget korpus så att totalsumman blir 59 även här. Hur detta påverkar tolkningen av resultatet diskuterar vi nedan i analysen. Med de nya värdena får vi resultaten: Correct Missed Unsufficient Total Mellankorpus Parole Eget korpus 33,71 25, Tabell 2. 4
5 Mellankorpus Parole Eget korpus Graf till tabell 2. Correct Missed Unsufficient Vi har delat upp Parole i sju lika stora delar à 3000 filer som vi har testat mot orddelen, resultatet presenteras nedan med antal rätt svar i varje delkorpus. Filnummer Antal rätt Tabell Delkorpus av Parole Antal rätt Graf till tabell 3. Vi jämför resultaten på alla delmängder och tar ut antal unika rätt på varje delmängd och då får vi totalt 26 unika rätt. Detta kan jämföras med resultatet från tabell 1 då vi fick 11 rätt på hela korpuset (Parole). 5
6 Analys Inledningsvis bör vi omnämna att Parole är ett äldre korpus med texter från 1975 fram till Detta tror vi dock inte har påverkat resultatet då lejonparten av frågorna på högskoleprovets orddel behandlar äldre ord och uttryck. Däremot har det bristfälliga resultatet till viss del grund i att variablerna i inlärningen inte är anpassade till vår datamängd. Stopplistan som användes i programmet är delvis anpassad till en mycket mindre mängd text än vad vi har använt och är dessutom utformad för de ord som var frekvent representerade i just den texten den var avsedd för. Det är därutöver troligt att ett bättre resultat hade uppnåtts med hjälp av att modifiera övriga variabler i programmet såsom kontextfönstrets storlek, antalet dimensioner på vektorerna och hur viktningsschemat är formulerat. För att vårt program skall kunna svara på en fråga krävs det att det finns information om alla ord, d.v.s. att de har dykt upp tillräckligt många gånger i vårt korpus. Utan den informationen går det inte att ta det kartesiska avståndet mellan vektorerna vilket medför att våra ord och kontexter inte kan jämföras med varandra. I ett balanserat korpus är det inte säkert att orden som finns på just högskoleprovet är vanligt förekommande och således är det svårt för programmet att införskaffa tillräckligt med information för att kunna besvara frågorna korrekt. Vid liknande tester tidigare har det allmänt visat sig att det är viktigt att ha ett korpus representativt för uppgiften, d.v.s. ett korpus vars inriktning överensstämmer med det vi vill testa. 5 Detta kan anses självklart men kan förbättra resultatet avsevärt. Om du exempelvis vill plocka fram information om medicinska ord är det vägande att välja ett korpus som helt eller delvis innehåller medicinska texter. På så sätt är det större chans att hitta relevanta ord och kontexter som är betydelsefulla vilket förenklar inlärningen och följaktligen också resultatet. RI är en metod som lämpar sig bra för stora textmängder eftersom den är både snabbare och kräver mindre lagringsutrymme än liknande metoder såsom LSA (Latent Semantic Analysis). 6 Metoden är också effektiv i den bemärkelsen att den börjar hitta samband mellan ord och kontexter redan innan hela textmaterialet är bearbetat. 7 I våra tester kan vi tydligt se att antalet rätt blir fler och antalet ord som saknar information blir färre i takt med att vi ökar textmängden. Däremot är resultaten inte så tillfredställande som vi hade trott och hoppats på. En förklaring till detta kan vara att viktningsschemat inte är tillämpat för storleken på våra korpus. I takt med att man använder större textmängder krävs det ett utökat fokus på ett relevant viktningsschema för att förbättra precisionen. Gorman och Curran har utfört tester som visar att olika viktningsscheman lämpar sig olika bra beroende på hur stort korpus man använder. 8 Eftersom vi inte har anpassat vårt viktningsschema finns det en risk att det vi har använt oss av inte lämpar sig för vår storlek på korpus. När vi tittar på resultaten från de olika delmängderna av Parole 9 ser vi att vi får ganska dåliga resultat i början och att det sedan ökar och ligger konstant i mitten för att öka något på slutet igen. För att förstå dessa variationer måste vi se hur Parole är 5 Gorman, Curran, sid Cohen et al, sid Gorman, Curran, sid Gorman, Curran, sid tabell 3 6
7 uppbyggt. Som vi nämnt ovan är den uppbyggd av romaner, dagstidningar, tidskrifter och webbtexter. Med den fördelning vi ser i Parole 10 kan vi direkt göra en koppling till våra resultat. När vi använder oss av romantexterna som träningsmängd blir resultatet dåligt, med dagstidningarna något bättre för att med tidskrifter och webbtexter uppnå de bästa resultaten. Med informationen om att resultatet blir bättre med ett relevant korpus 11 kan vi konstatera att för vår testmängd (orddelen på högskoleprovet) verkar vetenskapliga tidskrifter och webbtexter vara de mest relevanta texterna i ett korpus. För varje delmängd har vi fått ett visst antal rätt och när vi jämför alla delmängder får vi totalt 26 unika rätt. Detta kan jämföras med de 11 rätt vi fick när vi tränade på hela Parole. Skillnaden i antal rätt kan bero på att språkbruket och innehållet ser helt olika ut i t.ex. en roman och en vetenskaplig text. En del ord förekommer mer frekvent i romaner och förekommer inte alls i vetenskapliga texter och vice versa. Att resultatet blir så mycket sämre med romaner som träningsmängd än dagstidningar och vetenskapliga texter beror på hur ordet används. I en vetenskaplig text används ordet ofta i sin grundläggande och korrekta betydelse medan det i en roman används i en bredare mening och därför återfinns det i olika kontexter. 12 Detta förklarar också varför vi inte får 26 rätt när vi tränar på hela korpuset. Även om ett ord blir rätt i en delmängd kan det användas i fel kontext eller betydelse i en annan och kontextvektorn hamnar längre ifrån än en annan kontextvektor och vi får således ett fel svar. I dagstidningar eller webtexter kan ett ord hamna i helt olika kontexter beroende på vid vilket år eller tidpunkt man väljer att hämta informationen. I oktober 2006 gjorde Nordkorea kärnvapentester och om man tittade på ett blogkorpus fram till oktober hamnade ordet nuclear i kontext med Iran och kärnkraft, för att under oktober månad hamna i kontext med Korea, sanktion och bomb. 13 Detta är också en förklaring till varför delmängderna får fler unika rätt tillsammans än hela korpuset. Med vårt eget korpus fick vi över 50% rätta svar och vi kan återigen konstatera att ett relevant korpus förbättrar resultaten. Dock vill vi inte dra för stora slutsatser om den exakta andelen rätt då testmängden varit betydligt mindre än i de övriga fallen, 7 ord jämfört med 59 ord. levererar inte ett hundraprocentigt resultat när det kommer till högskoleprovet. I liknande tester som har utförts tidigare har de bästa resultaten varit uppemot tre fjärdedelar rätta svar. 14 Trots att resultaten inte är perfekta finns det mycket metoden kan bidra med. Inom 'information retrieval' kan flera olika metoder och tekniker samfällt bidra till att urskilja relevant information från olika textmängder. Informationssökning handlar i slutändan inte om att gissa rätt på högskoleprovet utan att lyfta fram information som är verkligt viktig i olika sammanhang. Genom RI kan man utvinna relationer mellan ord på ett enkelt och effektivt sätt vilket kan bidra till en utökad förståelse av olika texters koherens. 15 Trots att metoden gissade fel på många ord på högskoleprovet kan vi ändå dra vissa 10 Bilaga 1 11 Gorman, Curran, sid Chatterjee, Mohan, sid Jurgens, Stevens, sid Sahlgren, sid 7 15 Rosell, föreläsning 7
8 slutsatser utifrån resultatet. Om vi exempelvis tittar på det missade ordet 'otidighet' så kan vi se att metoden visserligen gissade fel men att den rätta synonymen oförskämdhets kontext ligger betydligt närmare än de två övriga förslagen. otidighet => oförskämdhet [oärlighet(0,135), oförskämdhet(0,114), ombytlighet(0,008), osjälvständighet(-0,014)] Genom denna information kan vi sedan dra ett antal olika slutsatser. Vi kan till exempel använda metoden som hjälp för att utesluta de ord vars kontextvektorer ligger längst ifrån det rätta svaret. Inom informationssökning vill man effektivisera inhämtningen så mycket som möjligt och att begränsa valmöjligheter på detta sätt kan vara bidragande till att uppnå ökad effektivitet. Det kan också vara semantiskt intressant att studera felaktiga svar för att få fram information om ords användning i förhållande till deras originalbetydelser. Sammanfattning är en metod för att utvinna relaterade ord ur fritext. Vi har testat hur mängden text påverkar resultatet genom att låta metoden svara på orddelen på högskoleprovet. I takt med att vi ökat textmängderna har vi erhållit mer information om orden vilket gradvis har lett till ett bättre resultat. Prestationen har dock inte varit lika bra som vi förväntat oss vilket kan härledas till ett antal olika faktorer. Delvis är det viktigt att ha ett korpus och därmed texter som är relevanta för uppgiften. Därtill måste metodens variabelinställningar, stopplista och viktningsschema anpassas till den rådande textmängden. Vi kan alltså konstatera att det inte enbart räcker med att öka textmängderna för att uppnå förbättrade resultat inom RI. 8
9 Källförteckning N. Chatterjee, S. Mohan. Discovering Word Senses from Text Using Random Indexing, CICLing, 2008 J. Gorman, J. Curran. Random indexing using Statistical Weight Functions, University of Sidney, 2006 M. Sahlgren. An introduction to, SICS, 2005 T. Cohen, R. Schvaneveldt, D. Widdows. Reflective and indirect inference: A scalable method for discovery of implicit connections, Journal of Biomedical Informatics, Volume 43, Issue 2, April 2010 D Jurgens, K Stevens. Event Detection in Blogs using Temporal, University of California, Los Angeles 2006 M. Rosell. Förläsning: Statistisk Lexikal Semantik, KTH, Parole (hämtad från Korpus från kursen (hämtad från kurskatalogen /info/sprakt12/korpus) Bilagor Bilaga 1, Textfördelning av Parole samt årtal Romaner 4,4 miljoner ord ( ) Dagstidningar 13,6 miljoner ord ( ) Tidskrifter 0,4 miljoner ord ( ) Webbtexter 1 miljon ord (1997) Bilaga 2, Kopia av inställningar från OrdHP dimensionality = 1800 random_degree = 8 seed = left_window_size = 4 right_window_size = 4 weighting_scheme = moj.ri.weighting.mangesws stoplist = True stoplist_name = Stoplist.txt shortest_word = 3 longest_word = 25 minimum_words_per_file = 2 9
Random Indexing för vektorbaserad semantisk analys
Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk
Läs merInlämningsuppgift : Finn. 2D1418 Språkteknologi. Christoffer Sabel E-post: csabel@kth.se 1
Inlämningsuppgift : Finn 2D1418 Språkteknologi Christoffer Sabel E-post: csabel@kth.se 1 1. Inledning...3 2. Teori...3 2.1 Termdokumentmatrisen...3 2.2 Finn...4 3. Implementation...4 3.1 Databasen...4
Läs merCogSum. Ett försök att med dagens automatiska informationsextraheringsmetoder och rankningsalgoritmer skapa sammanfattningar i skumläsningssyfte
CogSum Ett försök att med dagens automatiska informationsextraheringsmetoder och rankningsalgoritmer skapa sammanfattningar i skumläsningssyfte Mimi Axelsson, Erica Bergenholm, Bertil Carlsson, Gro Dahlbom,
Läs merMaskininlärning med boostrapping. Maskininlärningslabb i Språkteknologi
Maskininlärning med boostrapping Maskininlärningslabb i Språkteknologi Abstrakt Vi undersöker, med hjälp av maskininlärningslabben från denna kurs, hur pass bra resultat bootstrapping ger i samband med
Läs merGränssnitt för FakeGranska. Lars Mattsson
Gränssnitt för FakeGranska av Lars Mattsson (larsmatt@kth.se) Innehållsförteckning 1 Introduktion...3 2 Genomförande:...3 3 Användning...5 4 Kända buggar:...6 5 Källförteckning...6 2 1 Introduktion Taken
Läs merDen räta linjens ekvation
Den räta linjens ekvation Här följer en dialog mellan studenten Tor-Björn (hädanefter kallad TB) och hans lärare i matematik Karl-Ture Hansson (nedan kallad KTH). När vi möter dem för första gången är
Läs merFriendlyReader. Språkteknologi för sammanfattningar och ökad läsbarhet. Målgruppsegmentering. Arbetsgång
FriendlyReader Språkteknologi för sammanfattningar och ökad läsbarhet Mål:! Öka den digitala delaktigheten genom att underlätta för personer med lässvårigheter att tillgodogöra sig textuellt baserad information
Läs merAutomatisk textsammanfattning
Språkteknologi 2001-10-14 Nada Kungliga Tekniska högskolan Automatisk textsammanfattning Per Karefelt (d98-pka) Marcus Hjelm (d98-mhj) Sammanfattning (manuell) Denna rapport belyser en del av de problem
Läs merDen räta linjens ekvation
Den räta linjens ekvation Här följer en dialog mellan studenten Tor-Björn (hädanefter kallad TB) och hans lärare i matematik Karl-Ture Hansson (nedan kallad KTH). När vi möter dem för första gången är
Läs merOptimering av depåpositioner för den minimala bensinförbrukningen i öknen
Optimering av depåpositioner för den minimala bensinförbrukningen i öknen Frågeställning: En jeep kan sammanlagt ha 200 liter bensin i tanken samt i lösa dunkar. Jeepen kommer 2,5 km på 1 liter bensin.
Läs merSpråkteknologi och Open Source
Språkteknologi och Open Source Erik Edin F01 erikedin@kth.se 15 oktober 2004 1 1 Open Source Open Source är en rörelse som syftar till att skriva datorprogram som släpps fria utan kommersiella intressen.
Läs merSF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011
Avd. Matematisk statistik Tobias Rydén 2011-09-30 SF1905 Sannolikhetsteori och statistik: Lab 2 ht 2011 Förberedelser. Innan du går till laborationen, läs igenom den här handledningen. Repetera också i
Läs merBakgrund och motivation. Definition av algoritmer Beskrivningssätt Algoritmanalys. Algoritmer. Lars Larsson VT 2007. Lars Larsson Algoritmer 1
Algoritmer Lars Larsson VT 2007 Lars Larsson Algoritmer 1 1 2 3 4 5 Lars Larsson Algoritmer 2 Ni som går denna kurs är framtidens projektledare inom mjukvaruutveckling. Som ledare måste ni göra svåra beslut
Läs merUPPGIFT 1 V75 FIGUR 1.
UPPGIFT 1 V75 FIGUR 1. Varje lördag året om spelar tusentals svenskar på travspelet V75. Spelet går ut på att finna sju vinnande hästar i lika många lopp. Lopp 1: 5 7 Lopp 2: 1 3 5 7 8 11 Lopp 3: 2 9 Lopp
Läs merHandhavande manual problemhantering
av Handhavande manual problemhantering 1(9) av Flytta dina dokument från H: till OneDrive I och med att Norrtälje kommun går över till Office 365 för skolverksamheten så kommer den egna lagringsplatsen
Läs merKlustring av svenska tidningsartiklar
Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier
Läs merBeräkna standardavvikelser för ledtider
Handbok i materialstyrning - Del B Parametrar och variabler B 4 Beräkna standardavvikelser för ledtider De formler som traditionellt används för beräkning av standardavvikelser för efterfrågevariationer
Läs merBootstrapping för substantivtaggning
Kungliga Tekniska Högskolan NADA Bootstrapping för substantivtaggning -Djur eller icke djur Hösten 2004 Kurs: Språkteknologi 2D1418 Jonathan Johnson j0j0@kth.se Mikael Melin mime@kth.se Handledare: Jonas
Läs merTDDD02 Språkteknologi för informationssökning (2016) Ordpredicering. Marco Kuhlmann Institutionen för datavetenskap
TDDD02 Språkteknologi för informationssökning (2016) Ordpredicering Marco Kuhlmann Institutionen för datavetenskap Ordpredicering Ordpredicering innebär att föreslå eller välja ord i en given kontext.
Läs merHI1024 Programmering, grundkurs TEN
HI1024 Programmering, grundkurs TEN2 2016-12-22 KTH STH Flemingsberg 8.15-13.00 Tillåtna hjälpmedel: Kursboken C PROGRAMMING A Modern Approach K. N. King helt utan anteckningar Alternativt C från början
Läs merFunktioner. Räta linjen
Sidor i boken 14-143, 145-147 Funktioner. Räta linjen Här följer en dialog mellan studenten Tor-Björn (hädanefter kallad TB) och hans lärare i matematik Karl-Ture Hansson (nedan kallad KTH). När vi möter
Läs merSynkronisering av kalenderdata
Datavetenskap Jonas Lindelöw, Richard Löfberg Sten Hansson Bjerke, Anders Friberg Synkronisering av kalenderdata Oppositionsrapport, C/D-nivå 2006:07 1 Sammanfattat omdöme av examensarbetet Vi tycker att
Läs merThree Monkeys Trading. Tärningar och risk-reward
Three Monkeys Trading Tärningar och risk-reward I en bok vid namn A random walk down Wall Street tar Burton Malkiel upp det omtalade exemplet på hur en apa som kastar pil på en tavla genererar lika bra
Läs merVarför behöver man vara källkritisk?
Med den här lektionen får du möjlighet att introducera en enkel metod för källkritisk granskning. Christina Löfving har som ansvarig för skolbiblioteket arbetat fram ett material tillsammans med elever
Läs merBästa skottläge på en fotbollsplan längs långsidan
Bästa skottläge på en fotbollsplan längs långsidan Frågeställningen lyder: Vad är det bästa skottläget? för en spelare som befinner sig på en rak linje på en fotbollsplan. Det är alltså en vinkel som söks,
Läs merHemuppgift 2, SF1861 Optimeringslära för T, VT-10
Hemuppgift 2, SF1861 Optimeringslära för T, VT-1 Kursansvarig: Per Enqvist, tel: 79 6298, penqvist@math.kth.se. Assistenter: Mikael Fallgren, werty@kth.se, Amol Sasane, sasane@math.kth.se. I denna uppgift
Läs merqwertyuiopasdfghjklzxcvbnmq ertyuiopasdfghjklzxcvbnmqwer tyuiopasdfghjklzxcvbnmqwerty uiopasdfghjklzxcvbnmqwertyui opasdfghjklzxcvbnmqwertyuiop
qwertyuiopasdfghjklzxcvbnmq wertyuiopasdfghjklzxcvbnmqw ertyuiopasdfghjklzxcvbnmqwer tyuiopasdfghjklzxcvbnmqwerty Mall för rapport En hjälp för dig som skriver gymnasiearbete inom ett yrkesförberedande
Läs merFår jag använda Wikipedia?
Får jag använda Wikipedia? Wikipedia är ett unikt uppslagsverk som skapas av sina läsare. Det innebär att vem som helst kan skriva och redigera artiklar. Informationen på Wikipedia kan vara vinklad eller
Läs mer[Introduktion till programmering ]
KUNGLIGA TEKNISKA HÖGSKOLAN [Introduktion till programmering ] [Laboration med NXC] Tobias Johansson 05/09/13 tobiaj@kth.se Introduktionskurs i datateknik, II1310 Sammanfattning Vad som gör en ingenjör
Läs merPC-teknik, 5 p LABORATION ASSEMBLERINTRODUKTION
PC-teknik, 5 p LABORATION ASSEMBLERINTRODUKTION Laborationsansvarig: Anders Arvidsson Utskriftsdatum: 2005-08-31 Laborant(er): 1 Syfte Laborationen ska ge studenten möjlighet att genom assemblerinlägg
Läs merBeräkning med ord. -hur en dator hanterar perception. Linköpings universitet Artificiell intelligens 2 2010-10-03 Erik Claesson 880816-1692
Beräkning med ord -hur en dator hanterar perception 2010-10-03 Erik Claesson 880816-1692 Innehåll Inledning... 3 Syfte... 3 Kan datorer hantera perception?... 4 Naturligt språk... 4 Fuzzy Granulation...
Läs merVad beror benägenheten att återvinna på? Annett Persson
Vad beror benägenheten att återvinna på? Annett Persson 12 mars 2011 Innehåll 1 Inledning 2 1.1 Bakgrund............................... 2 1.2 Syfte.................................. 2 1.3 Metod.................................
Läs merHär är två korta exempel på situationer då vi tillämpar den distributiva lagen:
Modul: Algebra Del 8: Avslutande reflektion och utvärdering Distributiva lagen Cecilia Kilhamn, Göteborgs Universitet Distributiva lagen a (b + c) = a b + a c Den distributiva lagen kallas den räknelag
Läs merFilformat / bildformat
Filformat / bildformat Filformat/bildformat är olika modeller för att spara bilden. När du sparar ett foto finns det en uppsjö av olika filformat att välja bland. Först och främst har programmet (ex. Adobe
Läs mer1(15) Bilaga 1. Av Projekt Neuronnätverk, ABB Industrigymnasium, Västerås Vt-05
1(15) Bilaga 1 2(15) Neuronnätslaboration Räknare Denna laboration riktar sig till gymnasieelever som går en teknisk utbildning och som helst har läst digitalteknik samt någon form av styrteknik eller
Läs merInformation till användaren att han/hon måste aktivera mjukvaran.
Produktaktivering Startfönster Information till användaren att han/hon måste aktivera mjukvaran. Denna guide visas efter att installationen avslutats och first time setup är slutförd. Guiden kommer att
Läs merNär man vill definiera en matris i MATLAB kan man skriva på flera olika sätt.
"!$#"%'&)(*,&.-0/ 177 Syftet med denna övning är att ge en introduktion till hur man arbetar med programsystemet MATLAB så att du kan använda det i andra kurser. Det blir således inga matematiska djupdykningar,
Läs merSKYDD 800 är ett kopieringsskydd för flexskivor till ABC 800, ABC 802 och ABC 806.
Förord SKYDD 800 är ett kopieringsskydd för flexskivor till ABC 800, ABC 802 och ABC 806. Programmet SKYDD 800 är framtaget för att Du som programmerare eller programförsäljare ska kunna leverera program
Läs merDisciplinära diskurser i naturvetenskap och matematik
Disciplinära diskurser i naturvetenskap och matematik Jonas Forsman, Staffan Andersson, Jannika Andersson Chronholm, Cedric Linder Avdelningen för fysikens didaktik, Institutionen för fysik och materialvetenskap,
Läs merOm Mappar... 2. Uppgift 1: Skapa en mapp på Skrivbordet... 2 Om enheter... 3 Uppgift 2: Byt namn på din nya Höst -mapp till Vår...
RIGMOR SANDER WINDOWS-ÖVN Sid 1 (9) Om Mappar... 2 Om mappars namn... 2 Uppgift 1: Skapa en mapp på Skrivbordet... 2 Om enheter... 3 Uppgift 2: Byt namn på din nya Höst -mapp till Vår... 3 Öva mer på att
Läs merVanliga frågor för VoiceXpress
Vanliga frågor för VoiceXpress 1) Hur stort ordförråd (vokabulär) innehåller VoiceXpress? VoiceXpress innehåller ett mycket omfattande ordförråd, och svaret på frågan varierar en aning beroende på hur
Läs merInformation efter genomgång av Microsoft Word 2010
Information efter genomgång av Microsoft Word 2010 I går (måndagen den 21 januari 2013) visade vi lite hur Word fungerar och lovade då att skriva samman ett dokument som visar vad vi anser att man kan
Läs merI Skapa Hej.java och skriv programmet. I Kompilera med javac Hej.java. I Rätta fel och repetera tills du lyckas kompilera ditt program
Kompilera och köra programmet Objektorienterad Programmering (TDDC77) Föreläsning II: utmatning, variabler, typer Ahmed Rezine IDA, Linköpings Universitet Hösttermin 2016 under terminal 2: I Skapa Hej.java
Läs merObjektorienterad Programmering (TDDC77)
Objektorienterad Programmering (TDDC77) Föreläsning II: utmatning, variabler, typer Ahmed Rezine IDA, Linköpings Universitet Hösttermin 2016 Kompilera och köra programmet under terminal 2: I Skapa Hej.java
Läs merProjektanvisning. Webbsideprojekt. Författare: Johan Leitet Version: 2 Datum: 2012-10-09
Projektanvisning Webbsideprojekt Författare: Johan Leitet Version: 2 Datum: 2012-10-09 Inledning Du har nu under ett antal laborationer i webbteknik fått relativt styrda uppgifter där du ensam fått lösa
Läs merKursrapport för WEBBDIST12: Textproduktion 2 V14 7,5 hp (31RTX2)
Kursrapport för WEBBDIST12: Textproduktion 2 V14 7,5 hp (31RTX2) Kursansvariga: Charlotte von Essen Anna Vörös Lindén Övriga medverkande lärare: Karin Dessne David Gunnarsson Linda Rydh Jonas Söderholm
Läs merEn sammanfattning Implementeringsutvärdering av Beslutsstöd i tre kommuner
En sammanfattning Implementeringsutvärdering av Beslutsstöd i tre kommuner - Examensarbete av Lina Smith och Petra Hansson, socionomprogrammet inriktning verksamhetsutveckling, Malmö Högskola Kontakt:
Läs merProgrammering av NXT Lego- robot Labbrapport för programmering av en Lego- robot
KUNGLIGA TEKNISKA HÖGSKOLAN Programmering av NXT Lego- robot Labbrapport för programmering av en Lego- robot Josef Karlsson Malik 2015-09- 02 jkmalik@kth.se Introduktionskurs i datateknik (II0310) Sammanfattning
Läs merFöreläsninsanteckningar till föreläsning 3: Entropi
Föreläsninsanteckningar till föreläsning 3: Entropi Johan Håstad, transkriberat av Pehr Söderman 2006-01-20 1 Entropi Entropi är, inom kryptografin, ett mått på informationsinnehållet i en slumpvariabel.
Läs merFörsta hjälpen år. Nyhetsrapportering s. 9 Enkätundersökning s. 10
Första hjälpen år 7 Innehåller regler och mallar för: Muntligt framförande s. 2 Intervju s. 3 Datorskrivna arbeten s. 4 Bokrecension s. 5 Fördjupningsarbeten s. 6 Labbrapporter s. 7 Källor s. 8 Nyhetsrapportering
Läs merPass 2: Datahantering och datahanteringsplaner
Pass 2: Datahantering och datahanteringsplaner Centrala områden inom datahantering I den här presentationen ska jag ta upp tre huvudsakliga områden inom datahantering och några centrala delar av dessa.
Läs mer729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Läs merLinuxadministration I 1DV417 - Laboration 3 Installation av ny hårddisk, RAID och logisk volymhantering
Linuxadministration I 1DV417 - Laboration 3 Installation av ny hårddisk, RAID och logisk volymhantering Marcus Wilhelmsson marcus.wilhelmsson@lnu.se 17 december 2013 Innehåll 1 Inledning och mål 3 2 Material
Läs mer5B1146 med Matlab. Laborationsr. Laborationsgrupp: Sebastian Johnson Erik Lundberg, Ann-Sofi Åhn ( endst tal1-3
1 Revision 4 2006-12-16 2. SIDFÖRTECKNING 5B1146 med Matlab Laborationsr Laborationsgrupp: Sebastian Johnson, Ann-Sofi Åhn ( endst tal1-3 Titel Sida 1. Uppgift 1.8.1....3 2. Uppgift 1.8.2....6 3. Uppgift
Läs merNUMPROG, 2D1212, vt Föreläsning 9, Numme-delen. Stabilitet vid numerisk behandling av diffekvationer Linjära och icke-linjära ekvationssystem
NUMPROG, 2D1212, vt 2005 Föreläsning 9, Numme-delen Stabilitet vid numerisk behandling av diffekvationer Linjära och icke-linjära ekvationssystem Då steglängden h är tillräckligt liten erhålles en noggrann
Läs mery y 1 = k(x x 1 ) f(x) = 3 x
Räta linjen på olika former Här ska vi bara påpeka att förutom k-form, den som vi är mest vana vid y = k y + m finns också allmän form: ax + by + c = 0 där a och b är konstanter, som inte någon står för
Läs merEnchipsdatorer med tillämpningar LABORATION 7, ROBOT
Enchipsdatorer med tillämpningar LABORATION 7, ROBOT Laborationsansvariga: Anders Arvidsson Utskriftsdatum: 2005-05-14 Laboranter: 1 Syfte Denna laboration syftar till att introducera interrupt och watchdog
Läs mer729G74 IT och programmering, grundkurs. Tema 2. Föreläsning 3 Jody Foo,
729G74 IT och programmering, grundkurs Tema 2. Föreläsning 3 Jody Foo, jody.foo@liu.se Föreläsningsöversikt Information i grafstrukturer Diskret matematik Relationer: kopplingar mellan mängder Funktioner
Läs merHur man skapar elevvänlig text
Hur man skapar elevvänlig text Jenny Sylvin Helsingfors universitet 7.4.2015 1 Vad ska skolböckerna göra? 7.4.2015 2 1 Samband: Kohesion och koherens Koherens = de djupt liggande innehållssamband som bildar
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merUochM Kundsupport 1. Du har fått ett e-mail från UochM med följande information (har du inte fått det så kontaktar du UochM):
UochM Kundsupport 1 Lägg till ett nytt e-postkonto Du har fått ett e-mail från UochM med följande information (har du inte fått det så kontaktar du UochM): E-postkonto (t.ex. demo@uochm.com) Användarnamn
Läs merEasyReader (FriendlyReader)
EasyReader (FriendlyReader) Arne Jönsson, Sture Hägglund Mål Ø Öka den digitala delaktigheten genom att underlätta för personer med lässvårigheter att tillgodogöra sig textuellt baserad information på
Läs mer5Chans och risk. Mål. Grunddel K 5. Ingressen
Chans och risk ål När eleverna har studerat det här kapitlet ska de kunna: förklara vad som menas med begreppet sannolikhet räkna ut sannolikheten för att en händelse ska inträffa känna till hur sannolikhet
Läs merCogmed Arbetsminnesträning vetenskaplig beprövad metod för ökad koncentrationsförmåga
Cogmed Arbetsminnesträning vetenskaplig beprövad metod för ökad koncentrationsförmåga Tidigare trodde man att arbetsminnet var konstant för varje människa, idag vet man att det kan förbättras Om Cogmed
Läs merStudent 2012. Uppföljning av projektet Student 2011. En rapport från Miljöförvaltningen Robert Wedin MILJÖFÖRVALTNINGEN. Maj 2012
MILJÖFÖRVALTNINGEN Student 2012 Uppföljning av projektet Student 2011 En rapport från Miljöförvaltningen Robert Wedin Maj 2012 www.stockholm.se/miljoforvaltningen BAKGRUND OCH SYFTE År 2011genomförde
Läs merEkvationslösning genom substitution, rotekvationer
Sidor i boken -3, 70-73 Ekvationslösning genom substitution, rotekvationer Rotekvationer Med en rotekvation menas en ekvation, i vilken den obekanta förekommer under ett rotmärke. Observera att betecknar
Läs merAnvisningar till rapporter i psykologi på B-nivå
Anvisningar till rapporter i psykologi på B-nivå En rapport i psykologi är det enklaste formatet för att rapportera en vetenskaplig undersökning inom psykologins forskningsfält. Något som kännetecknar
Läs merFilöverföring i Windowsmiljö
Linnéuniversitetet Projektrapport Grundläggande Operativsystem 1DV415 Filöverföring i Windowsmiljö Erik Ljungqvist, Viktor Hjertman 10 januari 2014 Sammanfattning I detta projekt undersöks skillnaden i
Läs merkl Tentaupplägg
entaupplägg IP 1: Läs igenom ALLA uppgifterna. Välj den du känner är lättast först. Det kan gärna ta 10-20 minuter. Försök skriva saker som kan vara problem i uppgifterna. Är det något du absolut kommer
Läs merHF0010. Introduktionskurs i datateknik 1,5 hp
HF0010 Introduktionskurs i datateknik 1,5 hp Välkommna - till KTH, Haninge, Datateknik, kursen och till första steget mot att bli programmerare! Er lärare och kursansvarig: Nicklas Brandefelt, bfelt@kth.se
Läs merLaboration i datateknik
KUNGLIGA TEKNISKA HÖGSKOLAN Laboration i datateknik Felsökning och programmering av LEGO NXT robot Daniel Willén 2012 09 06 dwill@kth.se Introduktionskurs i datateknik II1310 Sammanfattning Syftet med
Läs merMattekungen åk 6-9 vers. 1.0
Presentation av programvara våren 2008 Bodil Holmström Anna Holmström Bearbetat av Karolina Höglund Mattekungen åk 6-9 vers. 1.0 Allmänt om programmet Mattekungen är ett undervisningsprogram som produceras
Läs mer1. Inledning Syfte Struktur Automatisk textsammanfattning Input Syfte Output...
!"#""$% Abstract Mängden information på internet är enorm och bara forsätter att öka på både gott och ont. Framförallt kan det vara svårt för grupper såsom synskadade och personer med språksvårigheter
Läs merJavaScript del 3 If, Operatorer och Confirm
JavaScript del 3 If, Operatorer och Confirm Under förra uppgiften så kollade vi på hur användaren kan ge oss information via promt(), vi använde den informationen både för att skriva ut den och för att
Läs merKryptering. Av: Johan Westerlund Kurs: Utveckling av webbapplicationer Termin: VT2015 Lärare: Per Sahlin
Kryptering Av: Johan Westerlund Kurs: Utveckling av webbapplicationer Termin: VT2015 Lärare: Per Sahlin Inledning Den här rapporten ska hjälpa en att få insikt och förståelse om kryptering. Vad betyder
Läs merTentamen i Beräkningsvetenskap I och KF, 5.0 hp,
Uppsala universitet Institutionen för informationsteknologi Avdelningen för beräkningsvetenskap Tentamen i Beräkningsvetenskap I och KF, 5.0 hp, 2015-12-17 Skrivtid: 14 00 17 00 (OBS! Tre timmars skrivtid!)
Läs merFörbered rökstoppet 1
Förbered rökstoppet I denna broschyrserie ingår: Vad vinner du på att sluta röka? Förbered rökstoppet Läkemedel vid rökstopp Stopp och Håll ut! Tobak och vikt Snus Ett material av Sluta-Röka-Linjen Grafisk
Läs merEn naturvetenskaplig undersökning i fyra steg
En naturvetenskaplig undersökning i fyra steg Pär Leijonhufvud 2016-11-12 Det här är en (fiktiv) naturvetenskaplig undersökning som t.ex. skulle kunna vara någons gymnasiearbete. Alla data är påhittade,
Läs merKUNGLIGA TEKNISKA HÖGSKOLAN KISTA. Lego Linefollower. Få en robot att följa linjen på golvet!
KUNGLIGA TEKNISKA HÖGSKOLAN KISTA Lego Linefollower Få en robot att följa linjen på golvet! Felix Ringberg 2012-08-09 felixri@kth.se Introduktionskurs i datateknik II1310 Sammanfattning I den här laborationen
Läs merLaboration: Grunderna i MATLAB
Laboration: Grunderna i MATLAB 25 augusti 2005 Grunderna i MATLAB Vad är MATLAB? MATLAB är ett interaktivt program för vetenskapliga beräkningar. Som användare ger du enkla kommandon och MATLAB levererar
Läs merDetta dokument skall ge en kortfattad introduktion till Jasmine installationen vid DSV.
Detta dokument skall ge en kortfattad introduktion till Jasmine installationen vid DSV. Kortfattat skall ni lära er följande. - Ni skall lära er att koppla upp er mot den lokala Jasmine databasen - Köra
Läs merHur skriver man en vetenskaplig uppsats?
Kullagymnasiet Projektarbete PA1201 Höganäs 2005-01-19 Hur skriver man en vetenskaplig uppsats? Anna Svensson, Sp3A Handledare: Erik Eriksson Innehållsförteckning 1. Inledning sid. 1 - Bakgrund - Syfte
Läs merSkapa modeller i Vikingen
Skapa modeller i Vikingen Generellt En modell är egentligen ett datorprogram som utför saker åt dig. Det börjar med att du har en idé som du vill testa om den är lönsam eller inte. Du behöver skriva ned
Läs mer14 Utvärdering och kvalitetsarbete
14 Utvärdering och kvalitetsarbete Vad är en utvärdering och vilken nytta har du som distanslärare av en sådan? I Högskoleförordningen 1 kap 14 finns följande text angående kursutvärderingar: 14 Högskolan
Läs merLAB 4. ORDINÄRA DIFFERENTIALEKVATIONER. 1 Inledning. 2 Eulers metod och Runge-Kuttas metod
TANA21+22/ 30 september 2016 LAB 4. ORDINÄRA DIFFERENTIALEKVATIONER 1 Inledning Vi skall studera begynnelsevärdesproblem, både med avseende på stabilitet och noggrannhetens beroende av steglängden. Vi
Läs merLaboration - Programmering av LEGO Mindstorm robot
Laboration - Programmering av LEGO Mindstorm robot Ayumi Sjöbergh Miyake 1 september 2012 miyake@kth.se II1310 Introduktionskurs i datateknik 1 Sammanfattning Laborationen gick ut på att hitta och rätta
Läs merProgrammering på papper. Datorer, programmering och instruktioner
Programmering på papper Lektion 1 av Valentina Chapovalova, valentina.chapovalova@gmail.com Datorer, programmering och instruktioner Uppskattningen är att lektionen kommer ta 40-50 minuter, men det beror
Läs merKOMMUNIKATIVT LEDARSKAP
KOMMUNIKATIVT LEDARSKAP EN ANALYS AV INTERVJUER MED CHEFER OCH MEDARBETARE I FEM FÖRETAG NORRMEJERIER SAAB SANDVIK SPENDRUPS VOLVO Mittuniversitetet Avdelningen för medieoch kommunikationsvetenskap Catrin
Läs merGrundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
Läs merInternational Olympiad in Informatics 2011 22 29 July 2011, Pattaya City, Thailand Tävlingsuppgifter Dag 2 Svenska 1.3. Papegojor
Papegojor Yanee är fågelentusiast. Sedan hon läst om IP over Avian Carriers (IPoAC), har hon spenderat mycket tid med att träna en flock papegojor att leverera meddelanden över långa avstånd. Yanees dröm
Läs merTentamen PC-teknik 5 p Lösningar och kommentarer
Tentamen PC-teknik 5 p Lösningar och kommentarer Program: Di2, Em3, Et3 Datum: 04-08-10 Tid: 13:30-18:30 Lokal E171 Hjälpmedel: Linjal, miniräknare, Instruktionsrepertoar för 8086 (utdelas), Lathund, Pacific
Läs merAlla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata.
Att förstå variabler Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata. Vad är en variabel? En variabel är en plats att lagra information. Precis
Läs merÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET?
ÄMNESMODELLERING AV TEXT MED ICKE-NEGATIV MATRISFAKTORISERING ELLER VAD DISKUTERAR DE I HIMMELRIKET? JOHAN FRID, HUMANISTLABORATORIET Lunds Matematiska Sällskap, Lund 7 November 2017 Humanistlaboratoriet
Läs merUndersök Google. Sida 1 av 9. En digital lektion från
Syftet med lektionen är att prata om Google och göra elever medvetna om att de behöver ställa kritiska frågor kring sina sökningar i Google. Lektionen grundar sig på material som vuxit fram och använts
Läs merBisektionsalgoritmen. Kapitel Kvadratroten ur 2
Kapitel 4 Bisektionsalgoritmen Vi ska konstruera lösningar till algebraiska ekvationer av formen f(x) = 0 med hjälp av bisektionsalgoritmen (intervallhalveringsmetoden). På samma gång ska vi se hur man
Läs merTENTA: TDDD11 & TDDC68. Tillåtna hjälpmedel. Starta Emacs, terminal och tentakommunikationsfönster. Skicka in frågor och uppgifter
TENTA: TDDD11 & TDDC68 Tillåtna hjälpmedel Det är tillåtet att ha böcker (t.ex. Ada-bok, formelsamlingar, lexikon,...) med sig samt utdelade lathundar (finns på kurshemsidan) för Ada, Unix och Emacs. Utdraget
Läs merFöreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts.
Föreläsning 7: Klassificering, minsta kvadratproblem, SVD, forts. Berkant Savas Tillämpad matematik i natur och teknikvetenskap, TNA5 Institutionen för teknik och naturvetenskap Linköpings universitet
Läs merAnsiktsigenkänning med MATLAB
Ansiktsigenkänning med MATLAB Avancerad bildbehandling Christoffer Dahl, Johannes Dahlgren, Semone Kallin Clarke, Michaela Ulvhammar 12/2/2012 Sammanfattning Uppgiften som gavs var att skapa ett system
Läs merLösning till tentamensskrivning på kursen Diskret Matematik, moment A, för D2 och F, SF1631 och SF1630, den 10 januari 2011 kl
1 Matematiska Institutionen KTH Lösning till tentamensskrivning på kursen Diskret Matematik, moment A, för D2 och F, SF131 och SF130, den 10 januari 2011 kl 14.00-19.00. Examinator: Olof Heden, tel. 0730547891.
Läs merDN1212/numpm Numeriska metoder och grundläggande programmering Laboration 1 Introduktion
Staffan Romberger 2008-10-31 DN1212/numpm Numeriska metoder och grundläggande programmering Laboration 1 Introduktion Efter den här laborationen ska du kunna hantera vektorer och matriser, villkorssatser
Läs mer