Språk, datorer och textbehandling



Relevanta dokument
Datorbaserade verktyg i humanistisk forskning

Datorbaserade verktyg i humanistisk forskning

BCI. Mats Lundälv. Senior IKT-pedagog. f.d. DART (Sahlgrenska universitetssjukhuset) och SPSM BCI

Inledning. Hur få hjälp? Språkkontroller. Grim. Språteknologi på Språkrådet SPRÅKTEKNOLOGI FÖR SPRÅKVÅRDARE

Laborationer i kursmomentet Datoranvändning E1. Laboration nr 5: Mer om FrameMaker

Så får du Microsofts Office-paket gratis

SENIORER SENIORER. Grundläggande IT för. Windows 7. Grundläggande IT för. Windows 7. Eva Ansell Marianne Ahlgren. Eva Ansell Marianne Ahlgren

Lathund för webbpublicering av bilder

Lathund i informationssökning

Detta dokument innehåller anvisningar för upprättande av en sökplan i kursen TDDD39 Perspektiv på informationsteknologi.

Hermundstad Östlund Ansell. Grundläggande IT för SENIORER

Kom igång-guide: Spara tusenlappar med Libreoffice - IDG.se

KN - Seminarium. (Litteratursökning)

Marie Gustafsson. Forskning och publicering Olika typer av publikationer och informationskällor Vetenskapliga artiklar.

Installationsmanual OpenOffice 3.0

PIM Lärresurser

Det FRIA ORDET - ska det vara något - också för användare av AKK?

Internets historia Tillämpningar

KARLSTADS UNIVERSITETSBIBLIOTEK

En handledning för studerande på Högskolan Kristianstad

Kartläggning gällande IT i undervisning

Informationssökning och bibliotekets resurser Uddevalla Gymnasieskolas bibliotek

Upphovsrätten sätter maten på upphovsmannens bord

INFOKOLL. Formulera frågor Söka information

LABORATION 1 Pingpong och Installation av Server 2008 R2

Språk, datorer och textbehandling

Internet En enkel introduktion

LABBINTRODUKTION. Laboranter: Kurs: - Sonny Johansson, Sigurd Israelsson. Utskriftsdatum:

Instruktioner för studenter

Språkteknologi och Open Source

KARTLÄGGNING AV 9-KLASSARNAS FÄRDIGHETER I INFORMATIONS- OCH KOMMUNIKATIONSTEKNIK I ÅBO 2007 Yhteenvetoraportti N=132 Julkaistu: 14.5.

Skapa en pdf-fil med hög kvalitet, lämpad för tryckning Skapa pdf-filen i en PC med Windows Skapa pdf-filen i en Mac

INSTALLATIONS ANVISNING

Guide ÖVERBLICK UTBILDNINGSFÖRVALTNINGEN SID 1 (5)

EclipseCrossword GÖR DITT EGET KORSORD. Av: Anders Wihlgaard Sundsvalls kommun

Språk, datorer och textbehandling

- LATHUND MED Tips och exempel för dig som ska skriva en källförteckning

Adobe Acrobat 7.0. Få jobbet gjort med kraftfulla intelligenta dokument

STEG 1 Samla referenser till ditt EndNote-bibliotek

Skriva och skapa med datorn

Använd WordFinder optimalt! Lathund med nyttiga tips och trix.

Word-guide Introduktion

Mer information om RefWorks, andra referenshanteringsprogram och hur man refererar hittar du på Linköpings universitetsbiblioteks webbsidor.

Karlstads universitetsbibliotek

Registrera och publicera i DiVA

Registrera och publicera i DiVA

1. Hur öppnar jag Polisens blanketter / formulär, trycksaker och annat som är i PDF-format?

Använd WordFinder optimalt! Lathund med nyttiga tips och trix.

Inledande programmering med C# (1DV402) Introduktion till C#

Att söka information (med betoning på Internet)

Kursvärdering. Denna manual beskriver hur du kan skapa en mapp i Fronter som heter Kursvärdering där du ladda upp reslutat från kursutvärderingar.

Använd WordFinder optimalt! Lathund med nyttiga tips och trix.

Referenshantering med Zotero 1

Språk, datorer och textbehandling

Redovisa i e-möten via Adobe Connect

Att söka vetenskapliga artiklar inom vård och medicin -

Välkommen till informationssökning via webben. Tips om sökningar inför uppsatsskrivandet med klickbara länkar.

VADÅ UPPHOVSRÄTT? Att använda andras material i skolarbete

Motion om fri mjukvara

Referenshantering med Zotero Introduktion

Lathund Office online

Hemsideskolan - Cheklistor

Introduktion till biblioteket och informationssökning Språk och litteraturer

Lathund Claro Read Plus

Lägga in filer i filarkivet

Marie Gustafsson. Böcker. Böcker. Tidningar och. Utskrifter

Wordpress och Sociala medier av Sanna Ohlander Guide till hur du skapar och förändrar inlägg och sidor på staffanstorp.se

Eget arbete 15 Poäng. Rubrik Underrubrik

Datakurs, grund. Thor Stone Education. Datakurs, grund. (Windows 7) Copyright Torsten Nilsson

svenska kurskod: sgrsve7 50

SELLOUT. Version 2.5. eyescream information ab

Komma igång med Learnify - snabbmanual

Internet. En enkel introduktion. Innehåll:

Lathund för Gustavas ordböcker

Att skriva på datorn

Titel: Undertitel: Författarens namn och e-postadress. Framsidans utseende kan variera mellan olika institutioner

Informationssökning - att söka och finna vetenskapliga artiklar! Linköpings Universitetsbibliotek

Datakörkortet. Dataföreningen Det Europeiska Datakörkortet, Maj 2003

Undersök Google. Sida 1 av 9. En digital lektion från

CD-ORD 8 elevdata.se

Guide till Zotero för Ersta Sköndal Bräcke högskola. Senast ändrad

Fria upphovsrättslicenser underlättar kunskapsdelning och lärande

Pocketengelska : svensk-engelsk, engelsk-svensk ordbok PDF ladda ner

Frontermanual för Rektorsprogrammet

Ephorus. Denna manual beskriver Ephorus som är Högskolan Dalarnas plagiatkontrollsystem.

It-strategi för Väddöenheten

(Förskollärarprofilen och Förskollärarprogrammet på Avdelningen för förskoledidaktik, BUV, Stockholms universitet)

Registrera och publicera i DiVA manuell registrering

Wordpress och Sociala medier av Sanna Ohlander Guide till hur du skapar och förändrar inlägg och sidor på staffanstorp.se

Dags att skriva uppsats?

Det bästa är att kombinera flera olika metoder och källor. TIPS - för informationssökning på webben!

Kurskompendium Distansutbildning 5p Ht-00

Sammanfattning av informationssökning VT19

Lärarsidan Lathund. En produkt från Procogno AB

Lathund för att hantera kongresshandlingar

Beslut Denna utbildningsplan är fastställd av Humanistiska fakultetsnämnden

Registrera och publicera i DiVA. 1. Sök i DiVA för att kontrollera om publikationen redan är registrerad.

Transkript:

Språk, datorer och textbehandling Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se

Föreläsningsöversikt Sökmotorer och korpussökning på Internet Upphovsrätt Nätresurser (ordböcker och online-databaser) Dagens labb Att skriva labbrapport Seminarieuppgiften Kort om olika filformat

Hur hittar man korpusar på Internet? Sökning med hjälp av sökmotor o lämpliga sökord o lämplig sökmotor Leta hos tillgänglig korpusdistributör, t.ex. Linguistic Data Consortium Samla ihop texter till en egen korpus...

Avancerad sökning med Google www.google.se

Informationssökning hur fungerar det? Ledtrådar som sökmotorer använder för att få fram och rangordna dokument: o nyckelord och frekvensberäkningar i de hittade texterna o automatisk morfologisk analys för att hitta alla ordformer, t.ex. flicka-flickor-flickornas o automatisk stavningskontroll

Korpusdistributörer Linguistic Data Consortium (LDC): http://www.ldc.upenn.edu o stödjer språkrelaterad forskning, utbildning och teknologi genom att skapa och distribuera lingvistiska resurser: data, verktyg och standarder o distribuerar korpusar (text och tal för många olika språk), lexikon etc. Oxford Text Archive (OTA): http://ota.ahds.ac.uk/ o samlar in, katalogiserar och bevarar elektroniska texter av hög kvalitet för forskning och undervisning o distribuerar mer än 2000 resurser för över 20 språk.

Korpusdistributörer Evaluations and Language Resources Distribution Agency (ELDA): http://www.elda.org o Distribuerar, producerar, standardiserar och utvärderar språkresurser (lexikon, korpusar etc) o Organiserar konferenser: The Language Resources and Evaluation Conference, LREC o Ger underlag för utvärdering av olika applikationer

Korpusdistributörer International Computer Archive of Modern English (ICAME): http://nora.hd.uib.no/whatis.html osamordnar och underlättar distribution av korpusar oorganiserar konferens, ger ut tidskriften ICAME Journal Trans-European Language Resources Infrastructure (TELRI): http://telri.nytud.hu/ osamlar in och distribuerar en- och flerspråkiga språkresurser med speciellt fokus på central- och östeuropeiska språk.

Användbara länkar för den korpusintresserade CORPORA-listan: http://nora.hd.uib.no/fileserv.html oelektronisk mejlinglista för alla som är intresserade av korpusar ohär kan man få tips och svar på frågor ACL SIGLEX: http://www.clres.com/siglex.html Special Interest Group on the Lexicon of the Association for Computational Linguistics olänkar till elektroniska lexikon, korpusar etc.

Bygg din egen korpus Välj ut lämpliga nyckelord och kombinera dessa på bästa sätt i lämplig sökmotor Samla ihop de webbadresser du fått fram och sätt ihop dem till din egen korpus Ordklasstagga gärna din korpus med allmänt tillgänglig taggare Var laglig: Tänk på upphovsrätten!

Tänk på upphovsrätten! Vilka lagar gäller för material som man hittar på nätet? Bara för att en text är publicerad på Internet, så betyder det inte att den är fri att använda och sprida vidare! Upphovsrätt till ett verk gäller intill utgången av sjuttionde året efter det år då upphovsmannen avled eller [...] efter den sist avlidne upphovsmannens dödsår. Många korpusar som finns på Internet kräver licens för att man ska få tillgång till dem

Vad säger lagen? Du kan alltid ladda hem ett verk som finns tillgängligt på Internet, kopiera från digital till digital form och/eller skriva ut det om du endast gör det för ditt privata bruk. Förlagan du kopierar från får inte vara en olovlig förlaga (piratkopia). Du får inte sprida det kopierade exemplaret utanför din närmaste familj eller vänkrets. Du får aldrig, inte ens för privat bruk, kopiera datorprogram eller databaser.

Upphovsrätt på Internet Problem med lagtolkningen: Internet är internationellt, medan upphovsrättslagarna ser olika ut i olika länder Indien: Ett verk är skyddat i 60 år efter upphovsmannens död (jmf Sverige 70 år) Internationella överenskommelser om upphovsrätt, t.ex. Bernkonventionen Kuba: Har ej skrivit under Bernkonventionen, upphovsrätten inget skydd

Ordböcker och online-databaser (1) Ontologier o Betydelsebaserade lexikon o Visar de semantiska relationerna mellan ord (synonymi, antonymi, hyponymi och meronymi) o WordNet: http://wordnet.princeton.edu/ o Svenskt OrdNät: http://www.lingfil.uu.se/ling/swn.html o EuroWordNet: http://www.illc.uva.nl/eurowordnet/ holländska, italienska, spanska, tyska, franska, tjeckiska och estniska

Ur Svenskt Ordnät av Åke Viberg: Grundläggande semantiska relationer i ordnät

Svenskt OrdNät http://www.lingfil.uu.se/ling/swn.html

WordNet http://wordnet.princeton.edu/

Ordböcker och online-databaser (2) Thesaurusar/synonymordböcker http://www.synonymer.se Flerspråkiga lexikon Lexin: http://lexin.nada.kth.se/ o Framtaget av Myndigheten för skolutveckling för användning i invandrarundervisningen o Cirka 30 000 svenska uppslagsord o Fjorton olika språk o De svenska orden kan man få upplästa (öva uttal)

synonymer.se http://www.synonymer.se

Lexin http://lexin.nada.kth.se/

Ordböcker och online-databaser (3) Enspråkiga lexikon Nationalencyklopedin: http://www.ne.se o ca 172 000 uppslagsord o kräver licens Oxford English Dictionary: http://www.oed.com/ o ca 500 000 uppslagsord o innehåller ord från hela engelskspråkiga världen o visar etymologi, uttal och stavning o autentiska exempel från texter o kräver licens

Nationalencyklopedin (NE) http://www.ne.se

Oxford English Dictionary (OED) http://www.oed.com/

Ordböcker och online-databaser (4) Databaser med samlat material Språkbanken: http://spraakbanken.gu.se/ outvecklat av Göteborgs universitet otillhandahåller referensmaterial i form av lexikon, korpusar och verktyg för sökning i korpusarna m.m. oinnehåller bl.a. Lexin, SUC-korpusen och Svenska Akademiens Ordbok i datorläsbar form

Språkbanken http://spraakbanken.gu.se/

Ordböcker och online-databaser (4) Korpussamlingar Gutenberg: http://www.gutenberg.org/ o innehåller ca 20 000 fritt nedladdbara e-böcker o när författaren har varit död i 70 år skyddas verket inte längre av upphovsrättslagarna Runeberg: http://runeberg.org/ o som Gutenberg, fast för nordisk litteratur o skapat av Linköpings universitet Gallica: http://gallica.bnf.fr/ o fransk motsvarighet

Runeberg http://runeberg.org/

Gallica http://gallica.bnf.fr/

Ordböcker och online-databaser (5) Wikipedia Flerspråkig internetbaserad encyklopedi med öppet innehåll som utvecklas av sina användare. Innehåller ofta lättfattliga beskrivningar av olika begrepp Eftersom vem som helst har möjlighet att skriva in något på Wikipedia är informationen man får därifrån inte helt tillförlitlig http://wikipedia.org/

Labben Arbeta i grupper om 1-3 personer, efter eget val Samma grupp kan med fördel jobba tillsammans under flera av kursens labbar, då labbarna i viss mån bygger vidare på varandra Deluppgift 1: Ta reda på mer om några av de mest kända korpusdistributörerna Deluppgift 2: Hitta korpusar på Internet för det språk ni är intresserade av Labbinstruktioner: http://stp.lingfil.uu.se/~evapet/undervisning/sdt07/labb1.html

Att skriva labbrapport Labbrapporten ska på ett överskådligt sätt dokumentera vad du har gjort (uppgift), varför du har gjort det (syfte) och hur du har gjort det (metod) I arbetslivet är det viktigt att man dokumenterar vad man har gjort, så att andra kan ta del av dina resultat och arbeta vidare på dem All forskning bygger på tidigare forskning. För att forskningen ska gå framåt är det viktigt att det som har gjorts tidigare är väl dokumenterat

Labbrapportens innehåll Labbrapporten bör vara upplagd ungefär som en uppsats: o Titel med tydlig information om vilken laboration rapporten gäller och vem/vilka som har skrivit rapporten samt datum o Inledning (syfte) o Metod och resultat o Slutsatser/diskussion o Referenser Man kan välja att ha andra rubriker, men ovan beskrivna information bör finnas med i rapporten

Att skriva referenser Referenslistan ska för varje verk innehålla uppgift om: o titel o författare o publikation (antologi, tidskrift, nätplats) o förlag o år Tony McEnery, Richard Xiao och Yukio Tono, 2006. Corpus-Based Language Studies - an advanced resource book. Routledge Applied Linguistics. Spärck Jones, K. 1999. Automatic Summarization: Factors and Directions, i Mani, I. och Maybury, M. T., Advances in Automatic Text Summarization Cambridge, Massachusetts: MIT Press, 1-12.

Nätburna referenser Om man vill referera till en webbsida, måste man ange hela webbadressen samt datum. Webbsidor kan uppdateras och förändras, så den information som finns där det datum du refererar till den kanske inte finns där nästa dag. Referera aldrig till Wikipedia eller dylikt! Wiki-sidor är öppna för vem som helst att skriva in information på, vilket gör att informationen kan vara felaktig.

Seminarium 5 november Arbeta i grupper om 1-3 personer Välj ut någon av de tre första laborationerna på kursen, och ge en mer detaljerad redogörelse för de resultat ni har kommit fram till Utöka gärna den ursprungliga labbuppgiften på lämpligt sätt Muntlig presentation inför resten av klassen Presentationen genomförs med hjälp av dator kopplad till projektor Använd Powerpoint, OpenOffice Impress, PDF eller motsvarande för presentationen

Powerpoint Powerpoint ingår i Office-paketet, dvs när man köper en dator med operativsystemet Windows på ingår oftast även program som Word (för ordbehandling), Excel (kalkylprogram) och Powerpoint (presentationsprogram) Powerpoint används för att skapa ljusbilder inför muntliga presentationer En lathund till Powerpoint finns här: http://www.iml.umu.se/stod/program/power_point/index.html

OpenOffice Om man inte har tillgång till Powerpoint (och inte råd att köpa programmet) finns likvärdiga program att tillgå gratis Ett av de mest kända är OpenOffice OpenOffice innehåller samma typer av program som Microsofts Office-paket, dvs ordbehandlingsprogram, kalkylprogram, presentationsprogram m.m. I OpenOffice heter presentationsprogrammet Impress OpenOffice finns att ladda hem gratis här: http://www.openoffice.org/

PDF Portable Document Format Format som ser likadant ut på alla datorer, oavsett vilket operativsystem man har installerat PDF-dokument kan skapas automatiskt från många olika program, t.ex. från OpenOffice En PDF-fil är sparad på samma sätt som en bild, vilket gör att man inte kan redigera texten i den Praktiskt om man t.ex. vill lägga upp ett dokument så att andra kan läsa det, men inte vill att andra ska kunna ta texten och modifiera den

Vi ses på labben!