NyS. NyS og artiklens forfattere
|
|
- Cecilia Mattsson
- för 8 år sedan
- Visningar:
Transkript
1 NyS Titel: Forfatter: Göteborgskorpusen för talspråk Jens Allwood, Leif Grönqvist, Elisabeth Ahlsén og Magnus Gunnarsson Kilde: Udgivet af: URL: NyS Nydanske Sprogstudier 30. Korpuslingvistik, 2002, s Akademisk Forlag A/S NyS og artiklens forfattere Betingelser for brug af denne artikel Denne artikel er omfattet af ophavsretsloven, og der må citeres fra den. Følgende betingelser skal dog være opfyldt: Citatet skal være i overensstemmelse med god skik Der må kun citeres i det omfang, som betinges af formålet Ophavsmanden til teksten skal krediteres, og kilden skal angives, jf. ovenstående bibliografiske oplysninger. Søgbarhed Artiklerne i de ældre NyS-numre (NyS 1-36) er skannet og OCR-behandlet. OCR står for optical character recognition og kan ved tegngenkendelse konvertere et billede til tekst. Dermed kan man søge i teksten. Imidlertid kan der opstå fejl i tegngenkendelsen, og når man søger på fx navne, skal man være forberedt på at søgningen ikke er 100 % pålidelig.
2 Goteborgskorpusen for talspråk (The Gateborg Spoken Language Corpus, GSLC) JENS ALLWOOD, LEIF GRONQVIST, ELISABETH AHLSEN OG MAGNUS GUNNARSSON l. INLEDNING Denna uppsats innehåller en beskrivning av talspråkskorpusen (GSLC) vid institutionen for lingvistik, Gateborgs universitet, samt en sammanfattning av de olikatyper av analys och verktyg som har utvecklats for arbete med denna korpus. Arbete på korpusen inleddes under sent tal (det finns dock aven material från 1960-talet) och har inkrementellt byggts på sedan dess. Idag innehåller korpusen ca. 1,3 millioner ord från omkring 25 olika sociala verksamheter. Korpusen har byggts upp for att tillgodose det vaxande intresset inom lingvistik for naturalistiska talspråksdata. En utgångspunkt ar har att talspråk i stor utstrackning varierar i olika sociala verksamheter med avseende på uttal, ordforråd, grammatik ochkommunikativa funktioner. Målsattningen for korpusen ar att inkluderatalspråk från så många typer av social verksamhet som mojligt for att få en mera fullstandig forståelse av den roll språk och kommunikation spelar i manskligt socialt liv. Denna typ av talspråkskorpus ar fortfarande relativt unik, t.o.m. for engelska, eftersom många talspråkskorpora har insamlats for speciella syften såsom taligenkanning, fonetik, dialektal variation eller interaktion med ett datorst6tt dialogsystem. Oftast kommer också inspelningarna från en mycket begransad verksamhet eller doman, se t.ex. Edinburgh Map Task (Isard och Carletta (1995), TRAINS (Heeman och Allen (1994), Waxholm, Blomberg m.fl. (1993) Jamfort med engelska korpora liknar Goteborgskorpusen kanske mest den nya zeelandska Wellington Corpus o f Spoken New Zealand English (Holmes, Vine och Johnson 1998), men den har också gemensaroma drag med BNC (British National Corpus) och London/Lund-korpusen (Svartvik 1990). Likheter finns också med den danska BySoc-korpusen 39
3 ( Gregersen 1991, Henrichsen 1997). Nar det galler inspelningar baseras korpusen tilisoo/o på audio- och tilisoo/o på videoinspelningar av naturalistiskt forekommande interaktion. Inspelningarna har transkriberats enligt en transkriptionsstandard, GTS 6.2 (Nivre 1999b), (den har testats på kinesiska, arabiska, engelska, spanska, bulgariska och finska) och en språkspecifik del som galler svenska- Modifierad Standard-Ortografi, MSO, f.n. version 6 (Nivre 1999a). Båda delarna har gått igenom 6 stora revisioner och flera mindre. For att forbattra reliabiliteten kantrolleras alla transkriptioner av en person u tover transkriptoren. De kantrolleras också automatiskt så att deras format blir korrekt innan de inkluderas i korpusen. I MSO anvands standardortografi om det inte finns flera konventionella talspråksvarianter av ett ord. Nar det finns flera varianter hålls de isar grafiskt. Å ven om målet ar att hålla transkriptionerna enkla, innehåller standarden talspråksdrag såsom kontrastiv betoning, overlapp och pauser. Den innehåller också procedurer for att anonymisera transkriptioner och for att introducera kommentarer gallande delar av transkriptionen. Parallelit med att korpusen insamlats och transkriberats har kontinuerligt olika daterbaserad verktyg utvecklats for att underlatta arbetet med korpusen. Dessa beskrivs korfattat nedan. Genom att anvanda korpusen och dessa verktyg har vi kunnat gora olika typer av kvalitativ och kvantitativ analys, ett exempel på detta ar en bok med jamforelser av frekvenser for svenskt tal- och skriftspråk (Allwood 1998). Boken innehåller ordfrekvenser både for ord skrivna i MSO-format och skrivna i standardortografiskt format. Den innehåller vidare statistik gallande ordklasser i tal och skrift, grundade på en automatisk probabilistisk taggning som ger 97% korrekt klassifikation. Korpusen har in te bara bearbetats automatiskt utan har också anvants for olika typer av manuell kod-.. ning, t.ex. "kommunikationsreglering" (innefattande tvekljud, talandringar, återkoppling och turtagande), talakter, åtaganden, missforstånd etc. (Allwood 2001). Korpusen kan också utnyttjas for andra typer av kvalitativ analys, t. ex. for CA-relaterad sekventiell analys. Inspelningarna i korpusen digitaliseras kontinuerligt på digitala band eller CD med mpeg-kompression. Varje CD innehåller både transkriptioner och inspelningar. 40 NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
4 2. GSLC OCH ANDRA KORPORA I GOTBBORG Talspråkskorpora vid institutionen for lingvistik vid Goteborgs universitet innehåller forutom GSLC flera andra typer av korpora, se tabell l nedan. Dessutom arbetar vi också med talspråkskorpora som insamlats av andra forskargrupper. TABEL 1. Talspråkskorpora vid <Wteborgs universitet, institutionen tor lingvistik Giiteborgskorpusen fiir talspråk- GSLC (karnkorpusen -- vuxna fiirstaspråkstalare av svenska), 1,3 millionerord Talare med afasi Barnspråkskorpus (svenska och andra nordiska språk), O, 75 millioner ord inkluderande vuxna deltagare Utbildningsprocess, 416 longitudinella intervjuer, 2 millioner ord Talspråkskorpora med icke-svenska vuxna - Kinesiska ( ord) - Bulgariska ( ord) -Arabiska - Engelska ( ord)+ BNC - Finska - ltalienska (3 000 ord) - Norska ( ord) - Spanska Wizard-of -Qz och Bionisk korpus lnterkulturell kommunikationskorpus Det ar klirnkorpusen (GSLC) vi kommer att fokusera på i denna artikel. I tabell 2 nedan presenterar vi några data om denna korpus. Som nlirnnts ovan lir korpusen baserad på sociala verksamheter snarare ån på t. ex. dialekter eller kategoriseringar av talare som socialklass eller kon. Broellertid kan omgrupperingar eller urval från korpusen goras på basis av sådana kriterier. De begrånsningar som finns for våra mojligheter att skapa subkorpora år beroende av att vi inte alltid har den information som skulle behovas om individuella talare. 41
5 TABEL2 Auktion 2 6, :14:11 Bussfiirare/ 1 33, :13:33 passagerare Konsultation 16 3, :44:25 Rattegång 6 5, :58:33 Middag 5 8, :49:54 Diskussion 34 5, :19:24 Fabrik :19:47 Formelit mote :45:54 Hoteli 9 19, :47:50 lnformellt samtal :48:41 Informationsservice 32 2, :13:40 lntervju 58 2, :34:27 Foreliisning 2 3, :38:00 Marknad 4 24, :18:37 Hiigmassa 2 3, :10:45 Återbreattande 7 2, :42:00 av artikel Rollspel 2 2, :39:16 Affar :40:46 Typ av social Antal Genomt- Antal Ordfiire- Hiirbara Duration** verksamhet inspel- sniltlig sektioner* kornster (in ordfor e- ningar antal talare klusive pau- kornster ser och kommentarer) Uppgiftscentrerad dialog 26 2, :05:20 Terapi 2 7, :04:07 Massa 16 2, :12:46 Resebyrå :53:57 Totalt 353 4, :15:53 * En sektion ar en ]angre fas av en verksamhet med ett distinktivt underordnat syfte. Bussfiirar-/passagerarinspelningarna har t.ex. 30 sektioner dar varje sektion innehåller tal med en ny passagerare. ** For vissa inspelningar saknas uppgift om duration. Vi uppskattar att siffran ovan understiger den faktiska durationen med ungefår 30 timmar. 42 NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
6 3. LAGRING Omkring 50% av de 1,3 millioner Ordforekomsterna ar lagrade på audioband och resten finns på videoband (Umatic, VHS eller BetaCAM). For att kunna hevara inspelningarna, håller vi på att digitalisera dem genom att kopiera dem till digitala band. Ett mini-dv-band rymmer 60 minuter eller ett DVCam-band 180 minuter. Detta format kraver en snabb dator. Vid Mpeg-kompression har vi forsokt att anvanda en konstant datahastighet på omkring 200 Kb per sekund. Dettager en bra kvalitet och formatet kan anvandas på de tlesta PC/Mac-maskiner. 4. BESKRIVNING AV KORPUSENS TRANSKRIPTIONSSTANDARD Transkriptionsstandarden ( GTS + MSO) vi har anvant kan kanske lattast forkiaras genom ett exempel. EXEMPEL l. Thanskription enligt GTS + MSO 1. Small talk $D: sager du de{t} a{r} de{t} a{r} de{t} så besvarlit då $P: $D: ja ja m 11 ha l de{ t} kan j u bl i så se{ r} du $P: <jaha $D: <ingressive> du ta{r} den på morrenen $P: nej inte på MORRONEN kan ja{g} ju tar allti en promenad på formiddan [1 åo ]1 då vill ja{g} inte ha [2 den )2 medicinen åo sen na ja{g} kommer hem majligtvis $D: [1 Q}a ]1 $D: [2 na 12 Exemplet visar foljande egenskaper hos transkriptionsstandarden: (i) Sektionsgranser markeras med paragrafrecken ( ) och delar upp en verksamhet i subaktiviteter. En lakar-patient-konsultation kan t.ex. ha foljande subaktiviteter: (i) halsning och introduktion, (ii) anledning tin besoket, (iii) undersokning, (iv) diagnos, (v) forslagtillbehandling 43
7 (ii) (iii) (iv) (v) (vi) Ord och mellanrum mellan orden Dollartecken ($) foljt av stor bodstav, foljd av kolon(:) anvånds for att indikera ny talare och ett nytt yttrande. Dubbla snedstreck (li) anvånds for att indikera pauser. Snedstreck l, li eller III anvånds for att indikera pauser av olika långd. Stora bokståver anvånds for att indikera kontrastiv betoning. Ordindex anvånds for att indikera vilket skriftspråksord som motsvarar den talspråksform som anges i transkriptionen. (åo) motsvarar skriftspråkets och. I de fall då talspråksvarianterna kan ses som forkortade former av skriftspråk, anvånder vi krullparenteser ( { } ) for att visa vad den standardortografiska formen skulle vara, t.ex. de{ t}. (vii) Overlapp indikeras med hakparenteser ([ ]) med index, vilket tillåter disambiguering om flera talare overlappar samtidigt. (viii) Kommentarer kan skrivas in genom att anvånda vinkelparenteser ( < >) for att markera råckvidden på kommentaren i transkriptionen och >) for att skriva in den aktuella kommentaren. Kommentarer kan t.ex. galla håndelser som år viktiga for interaktionen eller sådana fenomen som rostkvalitet och gester. 5. VERKTYG SOM HAR UTVECKLATS Under den tid som korpusen har insamlats och transkriberats har många verktyg for att arbeta med korpusen utvecklats. Foljande år fortfarande aktuella TRANSTOOL TransTool (Nivre m.fl. 1998) år ett datorverktyg for att transkribera talspråk i enlighet med transkriptionsstandarden (Nivre 1999a,b ). Det hjål- 44 NYS 30 GOTEBORGKORPUSBN FOR TALSPRÅK
8 per den anvandare att transkribera korrekt och go r det lattare att hålla reda på index for overlapp och kommentarer (se Nivre et al1998). 5.2 KORPUS-BROWSERN Korpusbmwsem ar ett verktyg som gor det mojligt att via internet soka på ord, ordkombinationer och fraser (som reguljara uttryck) i Goteborgskorpusen for talspråk. Resuhaten kan presenteras som konkordanser eller listor av uttryck med så mycket kontext man vill ha och med direkta lankar till transkriptionen. 5.3 TRACTOR TRACTOR ar ett kodningsverktyg som go r det mojligt att skapa nya kodningsscheman och att koda transkriptioner. De segment i transkriptionen som kodas kan vara kontinuerliga eller diskontinuerliga och det ar aven mojligt att koda relationer. Ett kodningsschema kan representeras som ett trad med strangar på allanoder och lov och ett kodningsvarde ar en "stig" genom tradet. Modellen liknar fil- och mappstrukturen på en datorhårddisk. Denna struktur gor det lattare att analysera kodningarna i ett prologsystem, men det ar in te mojligt att ordna koderna eller att koda en kodning, eftersom en kod alltid består enbart av två diskontinuerliga intervall och ett kodat varde (Larsson 1997). 5.4 VISUALISERING AV KODER MED FRAMEMAKER Vi har också skapat en verktygslåda som gor det mojligt att visualisera kodningsscheman och kodade varden med fårg, fetstil, kursiv stil etc. direkt i transkriptionerna som ett FrameMaker-dokument. Olika delar av transkriptionen kan också markeras (eller uteslutas!) for att få en overskådlig bild utan de detaljer man kanske inte for tillfillet ar intresserad av (Gronqvist 1999). 5.5 TRASA Om man har en korpus som ar transkriberad enligt Gt>teborgsstandarden for transkription kan man genom att anvanda TraSA ( Gronqvist 2000b) 45
9 relativt enkelt erhålla ett 30-tal statistiska mått for olika egenskaper, verksamheter, sektioner eller talare. Man kan t. ex. rakna antal ordforekomster, ordtyper, yttranden eller mer komplexa mått som ordrikedom. 5.6 SYNCTOOL SyncTool (Nivre m.fl. 1998) iir en prototyp for MultiTool nedan, som mojliggor synkronisering av transkriptioner med digitaliserade audiooch videoinspelningar. Den iir också avsedd att vara ett "vyverktyg" som tillåter anviindaren att se transkriptionen och att spela upp det relaterade inspelade materialet, utan att behova manuellt lokalisera de aktuella passagen i inspelningen. 5.7 ARBETE PÅ ETT SYNKRONISERINGSVERKTYG- MULTITOOL Många av de ovan beskrivna verktygen skulle vara mer anviindbara om man kunde utnyttja de olika funktionernasimultant i ett verktyg. Multi Tool iir ett forsok att bygga ett sådant verktyg for transkription och kodning av talspråk, liksom for "browsing", sokning och rakning. Systemet kan hantera ett godtyckligt antal talare, overlappande tal, hierarkiska kodningsscheman, diskontinuerliga kodningsintervall, relationer och synkronisering mellan kodningar och mediafiler (Gronqvist 2000a). Den grundliiggande iden iir att samla all information i ett internt tillstånd som iir en lågnivå-representation av alla typer av annotering (kodning), inklusive transkription. Tillståndet innehåller de abstrakta objekten kodning och synkroniseringar. Detta iir de typer av grundliiggande information datorpmgrammet behover. For anviindare som utnyttjar audio- och videoinspelningarna i korpusen iir transkriptionerna enbart en kodning av inspelningarna. En viktig detalj iir att alla vyer (t.ex "partitur" eller andra vyer av transkriptionen, vyer av kodningar och akustisk analys, liksom iiven videofiler) som iir kopplade till samma tidpunkt kan synkroniseras for att visa samma sekvens från olika perspektiv narhelst en anviindare utnyttjar en av dem. Det interna tillståndet innehåller all information, så det iir mojligt att ha flera olika vyer på samma sekvens i en dialog. Foriindringar av något i en vy kommer ornedelbart att foriindra det inre tillståndet och som en konsekvens hiirav de andra vyerna. NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
10 MultiTool ar skrivet i JAVA+ JMF, vilket gor programmet forhållandevis plattformsoberoende och eftersom interpretatorerna snabbt blir m er effektiva, kommer troligen prestanda att bli tillrackligt bra på alla viktiga plattformar inom den narmaste framtiden. En ny egenskap vi håller på att lagga till ar import- och exportformat for våra lokala transkriptionsformat, TRACTOR-filer och troligen också for CA- transkriptioner (CA = Conversation Analys is). Vår ambition ar att de nya versionerna av MultiTool i framtiden for många anvandare kommer att ersatta de olika verktygen vi har beskrivit ovan. Emellertid kommer TraSA och Korpusbmwsem fortfarande att behovas nar man arbetar på storadelarav korpusen samtidigt. Med adekvata import/exportfunktioner kommer olika anvandare att kunna anvanda sina egna transkriptions- och kodningsformat i MultiTool. På så satt hoppas vi att MultiTool kommer att utgora en god basnivåfor analys av mutlimodala talspråkskorpora: transkription, annotering/kodning, konversion, soklning, rakning, "browsing" och visualisering. For anvandare med andra intressen finns dock battre verktyg, som t.ex. Waves for fonetiker och MediaTagger for enklare kodningar av audio/videofiler. 6. TYPER AV KVANTITATIV ANALYS På grundval av den information som ges av transkriptioner enligt Goteborgsstandarden har vi definierat en uppsattning egenskaper som kan hadedas automatisktur transkriptionerna. Några av dessa egenskaper ar foljande (seallwood och Hagman 1994, Allwood 1996): (i) (ii) Volym: Volym omfattar mått som antal ord, ordlangd, pauser, betoning, yttranden och turer relativt talare, verksamhet och subaktivitet. Kvoter: Ifrån volymmåtten kan sedan olika kvoter raknas fram. T. ex.: MLU = ord l yttrande o/o pauser= 100 x pauser l (ord+ pauser) o/o betoning= 100 x betonade ord l ord o/o overlapp = 100 x overlappade ord l ord hastighet = ord l duration 47
11 Alternativt kan pauser, betoning och overlapp heraknas per yttrande. Alla dessa kvoter kan sedan relateras till talare, verksamhet eller subaktivitet (sektion). (iii) Specieila deskriptorer: Ett exempel på en "speciell deskriptor" ar "ordrikedom", som kan matas genom ordforekomst l ordtyp. Guiraud, iiber, Herdan eller "teoretisk vokabular", cf. Van Hout och Rietvel d ( 1993 ). Andra deskriptorer som vi har konstruerat ar "stereotypiskhet, som raknar ut h ur ofta ord och fraser upprepas i en verksamhet, "verbal dominans" och verbal jarnlikhet", "livlighet" och "forsiktighet" samt "overlapp" i olika yttrandepositioner. (iv) Lemma: Vi har också implementerat en enkel "stam"-algoritm som go r det mojligt for oss att gruppera regelbundet boj da former med sin ordstam. (v) Ordklasser: Orden i korpusen kan tilidelas ordklasser genom att anvanda en sannolikhetsbaserad statistisk (Viterbi-trigram) ordklasstaggare som har anpassats till talspråk. Genomatt anvanda denna har ordklasstaggning gjorts for hela GSLC ( ungefår 1,3 millioner transkriberade ord). Korrektheten ar ungefår 97o/o (cf. N ivre och Gronqvist 200 1). Ord som taggats for ordklass kan sedan tilidelas talare, verksamhet och subaktivitet. (vi) Kollokationer: Alla talare, verksamheter och subaktiviteter kan beskrivas med avseende på vilka kollokationer som forekommer. Dessa kan sorteras efter frekvens, efter forekomst som fullstandiga yttranden eller efter "mutual information" (Manning och Schiitze 1999). (vii) Frekvenslistor: Frekvenslistor kan gora for ord, lemman, ordklasser, kollokationer och yttrandetyper. (viii) Sekvenser av ordklasser: Yttranden av olika langd kan beskrivas med avseende på vilka ordklassekvenser de innehåller. Detta tillåter en forsta analys av grammatiska skilinader mellan talare, verksamheter och subaktiviteter. NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
12 (ix) Likheter: Likheter mellan verksamheter kan fångas genom att analysera i hur stor utstrackning ord och kollokationer delas mellan verksamheter. Validitets- och reliabilitetskontroll gors manuellt av alla automatiska mått. 7. TYPER AV KVALITATIV ANALYS 7.1 OVERSIKT For att oka reliabiliteten i kodning, har kvalitativ analys i Gateborg ofta resulterat i utvecklandet av kodningsscheman, dvs. scheman for annotation ovanpå transkriptioner. De kodningsscheman som utvecklats i Goteborg kan jamforas med andra scheman och då kan vi se att några av dessaligger ovanpå transkription, t.ex. DAMSL (Core and Allen 1997) and DRI, medan andra ar integrerade med transkriptionsstandarden, t.ex. uppmarkningsramen i MATE (Dybkjaer m.fl. 1998). En rattvis jamforeise mellan de viktigaste, for att inte saga alla scheman ligger utanfor ramarna for denna redogorelse. De kodningsscheman som presenteras nedan reflekterarsåledes de intresseområden Gateborgs-gruppen har fokuserat på. Den underliggande transkriptionsstandarden begransar på ett naturligt satt finkornigheten for alla nya kodningsscheman, men de två kodningsverktyg som utvecklats i Goteborg, MultiTool och TRAC TOR, ar avsedda att vara så o beroende av alla individuella kodningsscheman och transkriptionsstandarder som mojligt. Foljande lista ger en oversikt av kodningsscheman från Gateborg (cf. Allwood 2001). Kodning relaterad till: l. Social verksamhet och kommunikativa akter 1.1 Social verksamhet 1.2 Kommunikativa akter 1.3 Expressiva och evokativa funktioner 1.4 Forpliktelser (åtaganden) 49
13 2. Kodning relaterad till kommunikationsreglering 2.1 Aterkoppling (feedback) 2.2 Tur- och sekvensreglering 2.3 Egen kommunikationsreglering 3. Grammatisk kodning 3.1 Ordklasser (automatisk, probabilistisk) 3.2 Maximala grammatiska enheter 4. Semantisk kodning Kontrollav reliabilitet ar planerad att inkluderas i utvecklingen av alla kodningsscheman. Hittills har sådan kontroll gjortsav kodning for "återkoppling" och "egen kommunikationsreglering" (med hjalp av Cohens kappa). 7.2 BIDRAG, YTTRANDEN OCH TURER I enlighet med Grice (1975), Allwood, Nivre och Ahlsen (1990) och Allwood (2000), antas de grundlaggande enheterna i dialog vara gestuella eller vokala bidrag från deltagarna. Termen bidrag anvands istallet for yttrande, nar vi vill inkludera inte bara muntlig vokal input till kommunikationen utan också gester eller skriftlig input. Verbala bidrag kan bestå av enstaka morfem eller vara flera satser långa. Termen tur anvands for "ratten att bidra" snarare lin for det bidrag som produceras genom anvandande av denna ratt. Man kan "gora ett bidrag" utan att "ha turen" och man kan "ha turen" utan att anvanda den for ett aktivt bidrag. Ett exempel på detta ges nedan, dar B:s forsta bidrag innebar givande av positiv återkoppling utan att ha turen (hakparenteser indikerar overlapp) och B:s ~ andra bidrag innebar att han/hon under sin tur ar tyst och inte gestikulerar. A: titta glass [vill] du ha en glass 81: [ja] 82: (tystnad och ingen handling) Bidrag, yttranden och turer kodas inte eftersom de kan fås direkt ur GTS, den Goteborgska transkriptionsstandarden. 50 NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
14 7.3 KODNING RELATERAD TILL SOCIAL VERKSAMHET OCH KOMMUNIKATIV A AKTER Social verksamhet Varje transkription ar lankad tillen databaspost och ett "huvud" (header) som innehåller information om: (i) (ii) Syfte(n), funktion( er) och procedurer i verksamheten Verksamhetens roller (iii) Artefakterna, dvs. objekt, mobler, instrument och media som utnyttjas i verksamheten (iv) (v) Den sociala och fysiska omgivningen Data om deltagarna (anonymiserade), såsom ålder, kon, dialekt och etnicitet Dessutom anges de viktigaste subaktiviteterna for varje verksamhet Kommunikativa akter Varje bidrag kan kodas med hansyn till vilka kommunikativa akter den innehåller simultant eller sekventiellt. De kommunikativa akterna finns på en lista som kan utvidgas. De flesta typer har idag definitioner och operationalisering. Några av de typer som anvands ofta ar foljande: Uppmaning, Påstående, Tvekan, Fråga, Svar, Specifikation, Konfirmation (Bekraftelse), Affirmation (Bekraftelse), Avslutande av interaktion, Avbrott, Slutsats och Erbjudande Expressiva och evokativa funktioner I enlighet med Allwood {1976, 1978, 2000) anses varje bidrag ha en expressiv och en evokativ funktion. Dessa funktioner explicitgor några av de funktioner som impliceras av kodningen av kommunikativa akter. Den expressiva funktionen lter sandaren uttrycka trosuppfattningar och 51
15 andra kognitiva attityder och kanslor. Vad som "uttrycks" består av en kombination av reaktioner på foregående bidrag och nya initiativ. Den evokativa funktionen ar den reaktion sandaren avser att "framkalla" hos lyssnaren. På så satt ar den evokativa funktionen hos ett påstående normalt att "framkalla" samma uppfattning som "uttryckts" i påståendet hos lyssnaren. Den evokativa funktionen hos en fråga ar att framkalla ett svar, medan den evokativa funktionen hos en uppmaning ar att framkalla en onskad handling Forpliktelser (åtaganden) Om dialog och kommunikation skall fungera på eu kooperativt sau, oavseu om dettasker sommedel for en annan verksamhet eller ej, nodvandiggors vissa forpliktelser och åtaganden for både talare (sandare) och lyssnare (mouagare). Med avseende på både expressiva och evokativa funktioner, bor sandaren ta hansyn tillmouagarens perceptuella, kognitiva och beteendemassiga formåga och bor in te vilseleda, skada eller onodigtvis inskranka mouagarens frihet. Mouagaren bor tillmotesgå med en vardering av huruvida hon/han kan hora, forstå och utfora det som ges av sandarens evokativa avsikter och signalera deua till sandaren. Sandarens och mouagarens forpliktelser och åtaganden kan summeras på foljande satt (se också Allwood 1994): Sandaren (åtaganden): l. Uppriktighet, 2. Motivation, 3. Hansyn (se ~ Allwood 1976). Mottagaren (forpliktelser): l. Vardering, 2. Rapport, 3. Handling. 7.4 KODNING RELATERAD TILL KOMMUNIKATIONSREGLERING Inledning Termen "kommunikationsreglering" syftar på de medel som talare kan anviinda for att reglera interaktionen eller sin egen kommunikation. Det finnstre kodningsscheman som ar relaterade till kommunikationsreglermg (se Allwood m.fl. 1999): 52 NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
16 --~----~-~ ~- ~----- l) Kodning av återkoppling 2) Kodning av tur- och sekvensreglering 3) Kodning av egen kommunikationsreglering Kodningsschema for återkoppling En återkopplingsenhet kan beskrivas som "en maximal kontinuerlig utstrackning av ett yttrande ( forekommande sjalvstandigt eller som del av ett langre yttrande), vars primara funktion ar att ge och/eller framkalla återkoppling rorande kontakt, perception, forståelse och acceptans av evokativ funktion" (Allwood 1993). Aila återkopplingsenheter kodas med avseende på "Struktur", "Position/Status", och "Funktion". Att koda struktur betyder att kodagrammatisk kategori (satsdel, fras eller mening) och aven "strukturella operationer". "Strukturella operationer" indelas i "fonologiska", "morfologiska" och kontextuella" operationer, vilka var och en har olika varden Kodning av tur- och sekvensreglering Tur- och sekvensreglering omfattar foljan de fenomen: (A) (B) Overlapp och avbrott: Overlapp kodas i transkriptionerna och kan extraheras automatiskt. Avbrott ar en kod for de overlapp som syftar till att eller lyckas byta amne eller ta turen från en annan talare. Avsedd mottagare: Denna typ av kodning har 4 sjalvforklarande varden: (i) en viss deltagare (ii) en viss grupp av deltagare (iii) alla deltagare (iv) ingen annan deltagare ( att tala till sig sjal v) 53
17 (C) Markerande av inledande och avslutande av subaktiviteter och/eller interaktionen som helhet Kodningsschema for egen kommunikations-regiering (EKR) EKR betyder "Egen kommunikations-reglering" och står for processer som talare anvander for att reglera sina egna bidrag i kommunikativ interaktion. Att koda EKR-funktion innebar att klassificera om EKR-enheten ar: Val-relaterad- hjålper talaren att vinnatid for processer som beror fortlopande val av innehåll och typer av Strukturella uttryck, eller: Åndrings-relaterad- hjålper n att andra innehåll, struktur eller uttryck som redan producerats. EKR-enheter kodas också med avseende på det EKR-relaterade uttryckets struktur. Denna struktur kan indelas i "grundlaggande EKR-drag", "grundlaggande EKR-operationer" och "komplexa EKR-operationer". Pauser, enkla EKR-uttryck som tvekljud etc. och explicita EKR-fraser raknas som grundllaggande EKR-drag. Grundlaggande EKR-operationer ar: "forlangning av kontinuanter", "sjålv-avbrott" och "sjålvupprepning". Kategorin "komplexa EKR-operationer" står for olika satt att modifiera den språkliga strukturen. EKR-kodningsschemat beskrivs i Allwood m.fl. (1997). 7.5 GRAMMATISK KODNING Det finns också mojligheter att koda grammatisk struktur. En av dessa ar den ovannamnda automatiska ordklasstaggningen. En annanar kodning av "maximala grammatiska enheter"- ett kodningsschema som finns beskrivet i Allwood (2001). Nar mankodat "maximala grammatiska enheterd" bor man i forsta hand forsoka hitta såstora enheter som mojligt, den storsta enheten ar harvidlag "fullstandiga satser". Satser kan subklassificeras genom att anvanda schemat "satser". I talspråk finnsdet många yttranden som inte ar satser, så i andra hand bor man forsoka hitta "fullstandiga fraser". Dessa borkodasmed schemat "fraser". Om det inte ar mojligt att finna vare sig fullstandiga satser eller fullstandiga fraser, kodas 54 NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
18 enskilda ord med schemat "ordklasser". Vart och ett av de tre namnda schemana innehåller flera underkatego rier. 8. SLUTSATSER OCH FRAMTIDA ARBETE I denna uppsats har vi beskrivit en del av det arbete som gjorts vid institutionen for lingvistik vid Gateborgs universitet for att samla, transkribera och lagra talspråksmaterial. Vi har också beskrivit några av de verktyg som har utvecklats for att underlagga arbetet med att analysera data, både automatiskt och manuellt. Slutligen har vi beskrivit några av de resultat vi hittilis erhållit. Frarutida arbete kommer att inkludera en inkrementen utvidgning av korpusen både for att få data från nyasocial verksamheter och for att utjamna storleken på inspelat och transkriberat material från olika verksamhetstyper. Vi kommer också att gora flera anstrangningar att gora korpusen mera multimodal genom att gora de audio- och videoinspelningar som transkriptionerna bygger på mera tillgangliga. Arbete på verktyg for att analysera korpusen kommer att fortsatta. Det mest orneddbara målet ar att komplettera MultiTool, vilket forhoppningsvis kommer at ge oss battre mojligheter att arbeta med multimodala data. Parallelit med detta kommer arbete på kvalitativ och kvantitativ analys att fortsatta. Ett ambitiost mål ar att arbeta mot en grammatisk beskrivning av talspråk och mot en systematisk beskrivning (aven om detta kanske inte skall vara en grammatik) av multimodal ansikte-mot -ansikte-kommunikation. Jens Allwood Institutionen for Lingvistik, Geteborg Universitet jens@ling.gu.se Leif Gronqvist Institutionen for Lingvistik, Geteborg Universitet leifg@ling.gu.se Elisabeth Ahlsen Institutionen for Lingvistik, Geteborg Universitet elisa@ling.gu.se Magnus Gunnarsson Institutionen for Lingvistik, Geteborg Universitet mgunnar@ling.gu.se 55
19 LITTERATUR Allwood, J. (1976): Linguistic Communication as Action and Cooperation. Gothenburg Monographs in Linguistics 2. Gateborgs universitet, institutionen for lingvistik. Allwood, J. (1978): On the Analysis of Communicative Action. M. Brenner (red.): The Structure of Action: Oxford: Basil Blackwell. Allwood, J. ( 1993): Feedback in Second Language Acquisition. C. Perdue (red.): Adult Language Acquisition. Cross Linguistic Perspectives, Vol. II: Cambridge: Cambridge University Press. Allwood, J. (1994): Obligations and Options in Dialogue. Think, Vol3, May: ITK, Tilburg University. Allwood, J. (red.) (1996 and later editions): Talspråksfrekvenser, Ny och utvidgad upplaga. Gothenburg Papers in Theoretical Linguistics S21. Gateborgs universitet, institutionen for lingvistik. Allwood, J. (1998): Some Frequency based Differences between Spoken and Written Swedish. T. Haukioja (red.): Proceedings of the 16th Scandinavian Conference of Linguistics: Turku University, Department of Linguistics. Allwood, J. (2000): An Activity Based Approach to Pragmatics. H. Bunt, & B. Black (red.): Abduction, Belief and Contextin Dialogue; Studies in Computational Pragmatics: Amsterdam: John Benjamins. Allwood, J. (red.) (200 l): Dialog Coding- Function and Grammar: Gateborg God in g Schemas. Gothenburg Papers in Theoretical Linguistics; GPTL 85. Gateborgs universitet, institutionen for lingvistik. Allwood, J. & Hagman, J. ( 1994): Som e Simple Measures o f Spoken Interaction. F. Gregersen & J. Allwood (red.): Spoken Language, Proceedings of the XIV Conference of Scandinavian Linguistics: Allwood, J.,Ahlsen, E., Nivre, J. & Larsson, S. (200 1): Own communication management. Allwood, J. (red.) ( 200 l): Dialog God in g- Function and Grammar: Gateborg Coding Schemas: Gothenburg Papers in Theoretical Linguistics; GPTL 85. Gateborgs universitet, institutionen for lingvistik. Allwood, J., Nivre, J. & Ahlsen, E. (1990): Speech Management: On the Non Written Life of Speech. Nordie journal of Linguistics 13: Blomberg, M., Carlson, R., Elenius, K., Granstrom, B., Gustafson, J, Hunnicutt, S., Lindell, R. & Neovius, L (1993): An experimental dialogue system: WAXHOLM. Proceedings of EUROSPEECH 93: NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
20 Core, M. G. &Allen, J, F. (1997): Coding Dialogs with the DAMSLAnnotation Scheme. Working Notes of AAAI Pall Symposium on Communicative Action in Humans and Machines. Boston, MA, November Dybkjær, L., Bernsen, N.O., Dybkjær, H., McKelvie, D. & Mengel, A. ( 1998 ): The MATE Markup Framework. MATE Deliverable Dl.2, November Gregersen, F. (1991): The Capenhagen Studyin Urban Sociolinguistics København: Reitzel. Grice, H.P. ( 1975): Logic and conversation. Syntax and Semantics, Vol. 3: P. Cole & J. L. Morgan (red.): Speech Acts: New York: Seminar Press. Gronqvist, L. (1999): Kodningsvisualisering med Framemaker. Gateborgs universitet, institutionen for lingvistik. Gronqvist, L (2000a): The MultiTool User's Manual. A tool for browsing and synchronizing transeribed dialogues and corresponding video recordings. Go teborgs universitet, institutionen for lingvistik. Gronqvist, L. (2000b): The TraSA v0.8 Users Manual. A user friend/y graphical tool for au tomatic transcription statistics. Gateborgs universitet, institutionen for lingvistik. Heeman, P.A. & Allen, J.F. (1994): The TRAINS 93 Dialogues. TRAINS Technical Note Henrichsen, P.J. (1997): Talesprog med Ansigtsløftning. IAAS, Univ. of Copenhagen, Instrumentalis 10/97. Holmes, J., Vine, B. & Johnson, G. (1998): Guide to the Wellington Corpus of Spaken New Zealand English. Victoria University of Wellington, Wellington. H out, R. v. & Rietvel d, T. ( 1993 ): Statistical Techniques for the Study of Language and Language Behaviour. Berlin & New York: Mouton de Gruyter. Isard, A. & Carletta, J, (1995): Transaction and action coding in the Map Task Corpus. Research Paper HCRC/RP-65. Larsson, S. (1997): TRACTOR vl.obl anviindarmanual. Gateborgs universitet, institutionen for lingvistik. Manning, C. D. & Schutze, H. (1999): Faundations ofstatistical Natura[ Language Processing. Boston, Mass.: The MIT Press. Nivre, J. ( 1999a): Transcription Standard. Version 6.2. Gateborgs universitet, institutionen for lingvistik. Nivre, J, (1999b): Modifierad StandardOrtografi (MSO) Version 6. Gateborgs universitet, institutionen for lingvistik. 57
21 Nivre, J., Tullgren, K., Allwood, J., Ahlsen, E., Holm, J., Gronqvist, L., Lopez Kiisten, D. & Sotkova, S. ( 1998 ): Towards multimodal spoken language corpora: TransTool and SyncTool. Proceedings of ACL-COLING 1998, June Nivre, J. & Gronqvist, L. (2001): Tagging a corpus ofspoken Swedish. International Journal of Corpus Linguistics. Svartvik, J, (red.) (1990): The London Corpus ofspoken English: Description and Research. Lund Studies in English 82. Lund University Press. NYS 30 GOTEBORGKORPUSEN FOR TALSPRÅK
(The Göteborg Spoken Language Corpus, GSLC) Jens Allwood, Leif Grönqvist, Elisabeth Ahlsén och Magnus Gunnarsson
Copenhagen. Akademisk Forlag. Nydanske Studier 30, 2002, pp. 39-58. (The Göteborg Spoken Language Corpus, GSLC) Jens Allwood, Leif Grönqvist, Elisabeth Ahlsén och Magnus Gunnarsson 1. Inledning Denna uppsats
Sprog i Norden. Titel: Internordisk kommunikation kurs i skandinaviska vid Islands universitet. våren 1999. Forfatter: Elisabeth Alm.
Sprog i Norden Titel: Forfatter: Kilde: URL: Internordisk kommunikation kurs i skandinaviska vid Islands universitet våren 1999 Elisabeth Alm Sprog i Norden, 2000, s. 45-49 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: En svensk medicinsk språknämnd Bertil Molde Sprog i Norden, 1978, s. 51-53 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn Betingelser
Sprog i Norden Titel: Forfatter: Kilde: URL: Prosjekter i skolene. Tema Modersmål Paula Ehrnebo Sprog i Norden, 2004, s. 133-137 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Isländsk svenska och svensk isländska Þórarinn Eldjárn Sprog i Norden, 1995, s. 59-62 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språksekretariat
Sprog i Norden. Händelser på det språkpolitiska området i Norden. Kilde: Sprog i Norden, 2005, s
Sprog i Norden Titel: Forfatter: Händelser på det språkpolitiska området i Norden Birgitta Lindgren Kilde: Sprog i Norden, 2005, s. 49-53 URL: http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Språklagstiftningen i Finland Henrik Grönqvist Sprog i Norden, 1981, s. 5-9 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn Betingelser
Sprog i Norden Titel: Forfatter: Kilde: URL: Finsk språkvård i Finland i dag Osmo Ikola Sprog i Norden, 1988, s. 17-20 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språksekretariat
Sprog i Norden Titel: Forfatter: Kilde: URL: Språksituationen på Åland Folke Woivalin Sprog i Norden, 1981, s. 16-19 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn Betingelser
Sprog i Norden. Titel: Det språksosiologiska klimatet för svensk språkvård i Finland. Christer Laurén. Forfatter: Kilde:
Sprog i Norden Titel: Forfatter: Kilde: URL: Det språksosiologiska klimatet för svensk språkvård i Finland Christer Laurén Sprog i Norden, 1986, s. 50-53 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Samarbetsgruppen Nordspråk Elisabeth Lindmark Sprog i Norden, 1980, s. 131-134 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn Betingelser
Sprog i Norden. Titel: Informationsteknik och skrivande. Forfatter: Pirjo Hiidenmaa. Kilde: Sprog i Norden, 1999, s URL:
Sprog i Norden Titel: Forfatter: Kilde: URL: Informationsteknik och skrivande Pirjo Hiidenmaa Sprog i Norden, 1999, s. 33-36 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd
Maureen Sundin, Patent- och registreringsverket, bolagsavdelningen (PRV Bolag)
Klart språk i Norden Titel: Forfatter: Ett språkvårdsprojekt vid PRV Bolag Maureen Sundin, Patent- och registreringsverket, bolagsavdelningen (PRV Bolag) Kilde: Klart språk i Norden, 1999, s. 42-46 URL:
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Från svensk-engelsk till svensk-nederländsk Hans de Groot Kilde: Nordiske Studier i Leksikografi 1, 1992 2001, s. 473-477 Rapport fra Konferanse om leksikografi
Sprog i Norden Titel: Forfatter: Kilde: URL: Isländska språkbyrån Baldur Jónsson Sprog i Norden, 1986, s. 65-68 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språksekretariat Betingelser
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Några tankar kring tekniskt terminologiarbete i praktiken Egil Nicklin Sprog i Norden, 1972, s. 79-84 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009.
Ordtavlor och Talspråksfrekvenser från GSLC, sammanställda med tanke på användning i talande samtalsjälpmedel. Arbetsmaterial, Bitte Rydeman 2009. Listorna i det här dokumentet kommer från Göteborgs Talspråkskorpus
OWN COMMUNICATION MANAGEMENT. Kodningsmanual v1.0. Jens Allwood, Elisabeth Ahlsen, Joakim Nivre, Staan Larsson. October 10, 1997
OWN COMMUNICATION MANAGEMENT Kodningsmanual v1.0 Jens Allwood, Elisabeth Ahlsen, Joakim Nivre, Staan Larsson October 10, 1997 1 Inledning Syftet med detta dokument ar att formulera principer for kodning
Sprog i Norden Titel: Forfatter: Kilde: URL: Forskningscentral för språken i Finland Lars Huldén Sprog i Norden, 1976, s. 31-35 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn
Sprog i Norden. Behovet av en ny nordisk språkkonvention. Kilde: Sprog i Norden, 2015, s
Sprog i Norden Titel: Forfatter: Behovet av en ny nordisk språkkonvention Sten Palmgren Kilde: Sprog i Norden, 2015, s. 125-130 URL: http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Forfatterne
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Om finnarnas svårigheter i att förstå danska Tove Skutnabb-Kangas Sprog i Norden, 1975, s. 77-83 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden. Titel: Om film- och nyhetsöversättning och skillnarderna mellan dem. Riina Heikkilä. Forfatter: Kilde:
Sprog i Norden Titel: Forfatter: Kilde: URL: Om film- och nyhetsöversättning och skillnarderna mellan dem Riina Heikkilä Sprog i Norden, 2013, s. 1-6 [i hæftet: s. 21-26] http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Den svenska språknämnden och myndigheternas språk Bertil Molde Sprog i Norden, 1973, s. 55-60 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Nydigitalisering av SAOB Erik Bäckerud Kilde: Nordiske Studier i Leksikografi 12, 2013, s. 95-105 Rapport fra Konferanse om leksikografi i Norden, Oslo
Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga
Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga data Används traditionellt om alla verk av en viss typ,
LexicoNordica. Peter Jagers [Matematikens ord]
LexicoNordica Forfatter: Anmeldt værk: Peter Jagers [Matematikens ord] Christer Kiselman och Lars Mouwitz: Matematiktermer för skolan. Nationellt Centrum för Matematikutbildning 2008. Kilde: LexicoNordica
Sprog i Norden Titel: Forfatter: Kilde: URL: Kommunen och skolan som språkvårdare Gunborg Gayer Sprog i Norden, 2004, s. 125-131 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd
Sprog i Norden Titel: Forfatter: Kilde: URL: Nordisk språkkonvention Lars Dufholm Sprog i Norden, 1981, s. 64-69 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn Betingelser for
Den nordiska språkgemenskapen Några möjliga pragmatikinriktade studier. Jens Allwood Kollegium SSKKII Göteborgs universitet
Den nordiska språkgemenskapen Några möjliga pragmatikinriktade studier Jens Allwood Kollegium SSKKII Göteborgs universitet Innehåll 1. Varför intressant? 1. Vad är pragmatik? 3. Fyra pragmatiska områden
Kommentar till Sven-Göran Malmgrens recension En ny svensk konstruktionsordbok i LexicoNordica 11
LexicoNordica Forfatter: Ulla Clausén Titel: Kommentar till Sven-Göran Malmgrens recension En ny svensk konstruktionsordbok i LexicoNordica 11 Kilde: URL: LexicoNordica 12, 2005, s. 361-367 [NB. Fejl i
Sprog i Norden Titel: Forfatter: Kilde: URL: Språkvård och textvariation Pirjo Hiidenmaa Sprog i Norden, 2004, s. 103-109 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd Betingelser
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Handlingsprogram för finska språket Pirkko Nuolijärvi Sprog i Norden, 2010, s. 39-44 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Finnarna och svenska språket i det nordiska samarbetet Aino Piehl Sprog i Norden, 2000, s. 24-33 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Inhemskt och främmande. Inlägg till Jón Hilmar Jónssons föredrag Tendenser og tradisjoner i islandsk orddannelse
Sprog i Norden Titel: Forfatter: Inhemskt och främmande. Inlägg till Jón Hilmar Jónssons föredrag Tendenser og tradisjoner i islandsk orddannelse Birgitta Lindgren Kilde: Sprog i Norden, 1988, s. 34-38
Sprog i Norden Titel: Forfatter: Kilde: URL: Livet på två språk. Konflikter och kompromisser Mikael Reuter Sprog i Norden, 1998, s. 165-169 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk
MODIFIERAD STANDARDORTOGRAFI (MSO6)
MODIFIERAD STANDARDORTOGRAFI (MSO6) Version 6 Januari 1999 Institutionen för lingvistik Göteborgs universitet Joakim Nivre 1 1 Allmänna principer MSO6 är en modifierad standardortografi för svenska avsedd
Sprog i Norden. Färre förskolor för teckenspråkiga barn. Titel: Forfatter: Tommy Lyxell. Kilde: Sprog i Norden, 2012, s. 1-14 [i hæftet: s.
Sprog i Norden Titel: Forfatter: Kilde: URL: Färre förskolor för teckenspråkiga barn Tommy Lyxell Sprog i Norden, 2012, s. 1-14 [i hæftet: s. 91-104] http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Klart språk i Norden. Texten - organisationen - kulturen. Britt-Louise Gunnarsson. Kilde: Klart språk i Norden, 2003, s. 48-54
Klart språk i Norden Titel: Forfatter: Texten - organisationen - kulturen Britt-Louise Gunnarsson Kilde: Klart språk i Norden, 2003, s. 48-54 URL: http://ojs.statsbiblioteket.dk/index.php/ksn/issue/archive
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Skandinavisk ordbok Birgitta Lindgren Sprog i Norden, 1995, s. 91-99 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språksekretariat Betingelser
Sprog i Norden Titel: Forfatter: Kilde: URL: CD-Perussanakirja som ett hjälpmedel i språkvården Marja Lehtinen Sprog i Norden, 1999, s. 44-50 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Femtio år med Svenska språknämnden och sedan då? Margareta Westman Sprog i Norden, 1995, s. 77-82 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Mot bättre service utveckling av Folkpensionsanstaltens e-tjänster
Klart språk i Norden Titel: Forfatter: Mot bättre service utveckling av Folkpensionsanstaltens e-tjänster Marjukka Turunen Kilde: Klart språk i Norden, 2014, s. 23-26 URL: http://ojs.statsbiblioteket.dk/index.php/ksn/issue/archive
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Sammansättningsmorfologi och lexikografi Sven-Göran Malmgren Kilde: Nordiske Studier i Leksikografi 2, 1993, s. 179-184 Rapport fra Konference om leksikografi
Carl-Erik Lundbladh: Handledning till Svenska Akademiens ordbok. Stockholm: Norstedts 1992.
LexicoNordica Forfatter: Anmeldt værk: Sven-Göran Malmgren Carl-Erik Lundbladh: Handledning till Svenska Akademiens ordbok. Stockholm: Norstedts 1992. Kilde: LexicoNordica 1, 1994, s. 263-266 URL: http://ojs.statsbiblioteket.dk/index.php/lexn/issue/archive
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Finlands invandrarspråk Pirkko Nuolijärvi Sprog i Norden, 2003, s. 41-50 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd Betingelser
Kursinformation och schema Lingvistik 729G08 (6 hp)
LINKÖPINGS UNIVERSITET Institutionen för kultur och kommunikation Kognitionsvetenskapliga kandidatprogrammet V1 Kursinformation och schema Lingvistik 729G08 (6 hp) HT 2016 Lärare och examinatorer: Mathias
Sprog i Norden. Titel: Finska, svenska, samiska och andra språk i det tvåspråkiga Finland. Pirkko Nuolijärvi. Forfatter: Kilde:
Sprog i Norden Titel: Forfatter: Kilde: URL: Finska, svenska, samiska och andra språk i det tvåspråkiga Finland Pirkko Nuolijärvi Sprog i Norden, 2000, s. 96-103 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Ny språklag i Finland Mikael Reuter Sprog i Norden, 2003, s. 105-116 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd Betingelser
LexicoNordica Forfatter: Anmeldt værk: Krista Varantola Raija Hurme, Riitta-Leena Malin og Olli Syväoja. 1998. Suomi-englanti opiskelusanakirja. Helsingfors: WSOY. Kilde: LexicoNordica 5, 1998, s. 281-284
Sprog i Norden Titel: Forfatter: Kilde: URL: Språkvården och det språksociologiska klimatet i Finland Paavo Pulkkinen Sprog i Norden, 1986, s. 46-49 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Skandinavisk ordbok - rapport från ett pågående projekt Birgitta Lindgren Kilde: Nordiske Studier i Leksikografi 2, 1993, s. 159-165 Rapport fra Konference
Sprog i Norden. Titel: Det nordiska språksamarbetet Kilde: Sprog i Norden, 2009, s
Sprog i Norden Titel: Det nordiska språksamarbetet 2008 Forfatter: Hannele Ennab Kilde: Sprog i Norden, 2009, s. 259-264 URL: http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Forfatterne og Netværket
Sprog i Norden. Språkpolitik genom lagstiftning exemplet Finland. Kilde: Sprog i Norden, 2006, s
Sprog i Norden Titel: Forfatter: Språkpolitik genom lagstiftning exemplet Finland Sten Palmgren Kilde: Sprog i Norden, 2006, s. 35-41 URL: http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Forfatterne
Jämförelse av interaktion i tre olika typer av butiksmiljö
Jämförelse av interaktion i tre olika typer av butiksmiljö Abstrakt Göteborgskorpusen för talspråk (Gothenburg Spoken Language Corpus) (Allwood 1999) består av samtal inspelade i en mängd olika sammanhang
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Behovet av språkinfrastruktur för direkttextad tv Rickard Domeij Sprog i Norden, 2013, s. 1-8 [i hæftet: s. 59-66] http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
LexicoNordica. Lars Törnqvist [En modern bildordbok] Norstedts bildordbok: Svenska, engelska, tyska, franska. Stockholm: Norstedts Förlag AB, 1997.
LexicoNordica Forfatter: Anmeldt værk: Lars Törnqvist [En modern bildordbok] Norstedts bildordbok: Svenska, engelska, tyska, franska. Stockholm: Norstedts Förlag AB, 1997. Kilde: LexicoNordica 6, 1999,
LexicoNordica. Gunnar Bergh Kejsare, huliganer och pappenheimare. En utflykt bland ord och uttryck bildade på personnamn. Stockholm: Carlsson.
LexicoNordica Forfatter: Anmeldt værk: Martin Gellerstam Gunnar Bergh. 1996. Kejsare, huliganer och pappenheimare. En utflykt bland ord och uttryck bildade på personnamn. Stockholm: Carlsson. Kilde: LexicoNordica
Sprog i Norden. Språkdeklarationens mål och Importordsprojektets resultat. Kilde: Sprog i Norden, 2009, s
Sprog i Norden Titel: Forfatter: Språkdeklarationens mål och Importordsprojektets resultat Pirkko Nuolijärvi Kilde: Sprog i Norden, 2009, s. 37-44 URL: http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
LexicoNordica. Annika Karlholm [Kortare presentation av Ordbok över Finlands svenska folkmål. Band 4]
LexicoNordica Forfatter: Anmeldt værk: Annika Karlholm [Kortare presentation av Ordbok över Finlands svenska folkmål. Band 4] Ordbok över Finlands svenska folkmål. Band 4: kyssa och. Helsingfors: Forskningscentralen
Föreläsning 6: Analys och tolkning från insamling till insikt
Föreläsning 6: Analys och tolkning från insamling till insikt FSR: 1, 5, 6, 7 Rogers et al. Kapitel 8 Översikt Kvalitativ och kvantitativ analys Enkel kvantitativ analys Enkel kvalitativ analys Presentera
KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual
KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual Jens Allwood Maria Björnberg Alexandra Weilenmann Version 1, januari 1999 1. Principer för kodning av maximala grammatiska enheter När man kodar maximala
Kursinformation och schema för Lingvistik 6 hp 729G08
LINKÖPINGS UNIVERSITET Institutionen för kultur och kommunikation Kognitionsvetenskapliga programmet 2012-10-29 Kursinformation och schema för Lingvistik 6 hp 729G08 Ht 2012 Lärare: Mathias Broth (281851)
Sprog i Norden Titel: Forfatter: Kilde: URL: Den finländska språklagstiftningen i praktiken Mikael Reuter Sprog i Norden, 1981, s. 10-15 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Språkvård i en internationell värld Pirjo Hiidenmaa Sprog i Norden, 2010, s. 9-18 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn
Introduktion till språkteknologi. Datorstöd för språkgranskning
Introduktion till språkteknologi OH-serie 2: Datorstöd för språkgranskning oktober 2008 Mats Dahllöf (efter Sofia Gustafson-Capková) Institutionen för lingvistik och filologi UPPSALA UNIVERSITET Huvudpunkter
Sprog i Norden Titel: Forfatter: Kilde: URL: Språklagar i Sverige Lena Ekberg Sprog i Norden, 2011, s. 15-24 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Dansk Sprognævn Betingelser for brug
Presentation av bok om svenskt och danskt talspråk skillnader och likheter utifrån korpusdata Projekt SweDanes
Presentation av bok om svenskt och danskt talspråk skillnader och likheter utifrån korpusdata Projekt SweDanes Jens Allwood, Peter Juel Henrichsen, Elisabeth Ahlsén, Magnus Gunnarsson, Leif Grönqvist,
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Registrering och nybildning av tekniska ord i Island Sigurður Briem Sprog i Norden, 1972, s. 85-87 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
LexicoNordica Forfatter: Anmeldt værk: Nina Martola Pia Virtanen. 1993. Zur Geschichte der finnisch-deutschen Lexikographie 1888-1991. Studien zur Makrostruktur. Hildesheim: Olms. Kilde: LexicoNordica
Sprog i Norden. Titel: Informationsåtkomst på flera språk. Forfatter: Jussi Karlgren. Kilde: Sprog i Norden, 1999, s URL:
Sprog i Norden Titel: Forfatter: Kilde: URL: Informationsåtkomst på flera språk Jussi Karlgren Sprog i Norden, 1999, s. 37-43 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd
Litteraturlista ALLMÄN SPRÅKVETENSKAP och FONETIK. Period 1:
Litteraturlista ALLMÄN SPRÅKVETENSKAP och FONETIK Period 1: 090119-080325 Språket, individen och samhället 7,5 hp Dahl, Ö. Språkets enhet och mångfald. 2007. 2 uppl. Lund: Studentlitteratur. Steinberg,
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Språkteoriers avtryck i SAOB Pär Nilsson Kilde: Nordiska Studier i Lexikografi 11, 2012, s. 479-487 Rapport från Konferens om lexikografi i Norden, Lund
LexicoNordica Forfatter: Krista Varantola Anmeldt værk: Englanti-suomi suursanakirja (Engelsk-finsk ordbog). Juva 2003 Kilde: LexicoNordica 11, 2004, s. 333-337 URL: http://ojs.statsbiblioteket.dk/index.php/lexn/issue/archive
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Ordboksredaktör i dag - personliga reflexioner kring en yrkesroll Inger Hesslin Rider Kilde: Nordiske Studier i Leksikografi 2, 1993, s. 257-262 Rapport
Kort och gott Svenskt basordförråd. Katarina Mühlenbock, DART
Kort och gott Svenskt basordförråd Katarina Mühlenbock, DART Vad är ett ord? Vi kan göra pauser då vi uttalar ett ord Ett ord kan oftast bytas ut mot ett annat med liknande funktion och betydelse Kan (oftast)
Litteraturlista HT09 ALLMÄN SPRÅKVETENSKAP och FONETIK GRUNDKURS. Period
Litteraturlista HT09 ALLMÄN SPRÅKVETENSKAP och FONETIK GRUNDKURS Period 1 090901-091103 Fonetik, fonologi och grafonomi 7,5 hp Engstrand, Olle. 2004. Fonetikens grunder. Lund: Studentlitteratur. Fromkin,
The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide
The National Institute of Child Health and Human Development (NICHD) Protocol: Intervjuguide This Swedish version is based on the English version available on the NICHD Protocol website (www.nichdprotocol.com).
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Tolkordlistor på invandrarspråk Helge Niska og Jorunn Frøili Kilde: Nordiske Studier i Leksikografi 1, 1992 2001, s. 357-369 Rapport fra Konferanse om
Klart språk i Norden. Socialförmåner med klarspråk. Mia Helle, planerare, Folkpensionsanstalten, Finland. Kilde: Klart språk i Norden, 2005, s.
Klart språk i Norden Titel: Forfatter: Socialförmåner med klarspråk Mia Helle, planerare, Folkpensionsanstalten, Finland Kilde: Klart språk i Norden, 2005, s. 64-69 URL: http://ojs.statsbiblioteket.dk/index.php/ksn/issue/archive
Föreläsningens upplägg. Språket, individen och samhället HT07. 1. Döva och språk. Internationell manifestation för teckenspråket (29 september 2007)
Föreläsningens upplägg Språket, individen och samhället HT07 Döva och språk Skriftsystem och läsning 1. Döva och språk 2. Skriftsystem och läsning Stina Ericsson Internationell manifestation för teckenspråket
Föreläsning 5: Analys och tolkning från insamling till insikt. Rogers et al. Kapitel 8
Föreläsning 5: Analys och tolkning från insamling till insikt Rogers et al. Kapitel 8 Översikt Kvalitativ och kvantitativ analys Enkel kvantitativ analys Enkel kvalitativ analys Presentera resultat: noggrann
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Lexikografiska principer för alfabetisk filering med dator Rolf Gavare Kilde: Nordiske Studier i Leksikografi 1, 1992 2001, s. 184-189 Rapport fra Konferanse
VAD LÄR MAN SIG NÄR MAN TILLÄGNAR SIG ETT ANDRASPRÅK? ANDERS AGEBJÖRN DOKTORAND I SVENSKA SOM ANDRASPRÅK INSTITUTET FÖR SVENSKA SOM ANDRASPRÅK
VAD LÄR MAN SIG NÄR MAN TILLÄGNAR SIG ETT ANDRASPRÅK? ANDERS AGEBJÖRN DOKTORAND I SVENSKA SOM ANDRASPRÅK INSTITUTET FÖR SVENSKA SOM ANDRASPRÅK C2 Bild: Wikipedia C1 B2 B1 A2 Bild: Wikipedia A1 inläraren
Virtuell språkundervisning Distans- och hybridkurser
I. Hur presterade studenterna på Skype? Virtuell språkundervisning Distans- och hybridkurser Personliga erfarenheter och reflek
Det skandinaviska argumentets roll i språknämndernas rådgivning.
Sprog i Norden Titel: Forfatter: Kilde: URL: Det skandinaviska argumentets roll i språknämndernas rådgivning Andreas Bunkus Sprog i Norden, 1997, s. 98-105 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Litteracitet på flera språk. Professor Monica Axelsson Institutionen för Språkdidaktik, Stockholms universitet monica.axelsson@isd.su.
Litteracitet på flera språk Professor Monica Axelsson Institutionen för Språkdidaktik, Stockholms universitet monica.axelsson@isd.su.se Brian Street 1984, 1993 New Literacy Studies (tidigt 80 tal) New
Nedan listas ett antal portaler och länkbibiliotek, svenska och internationella. Prova dem och jämför med kritierierna ovan.
Workshop Portaler och länkbibliotek Resurserna på Internet är om inte oändliga så åtminstone väldigt många. Att välja blir då ett bekymmer i sig. Portaler och länkbibliotek specialiserar sig på att samla
Finnarna i det nordiska samarbetet Språkliga synpunkter.
Sprog i Norden Titel: Forfatter: Kilde: URL: Finnarna i det nordiska samarbetet Språkliga synpunkter Pirkko Ruotsalainen Sprog i Norden, 1982, s. 35-43 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Litet grand, jodå, nej! Om uppföljningen av Deklaration om nordisk språkpolitik
Sprog i Norden Titel: Forfatter: Litet grand, jodå, nej! Om uppföljningen av Deklaration om nordisk språkpolitik Olle Josephson Kilde: Sprog i Norden, 2008, s. 235-240 URL: http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden. Titel: Finska språkets ställning i Sverige. Forfatter: Paula Ehrnebo. Kilde: Sprog i Norden, 1997, s URL:
Sprog i Norden Titel: Forfatter: Kilde: URL: Finska språkets ställning i Sverige Paula Ehrnebo Sprog i Norden, 1997, s. 67-77 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd
NORDISKE STUDIER I LEKSIKOGRAFI
NORDISKE STUDIER I LEKSIKOGRAFI Titel: Forfatter: Jämförelsekonstruktioner i Svensk konstruktionsordbok struktur, variation och funktion Ulla Clausén Kilde: Nordiske Studier i Leksikografi 6, 2003, s.
FTEA21:3 Spr akfilosofi F orel asning I Martin J onsson
FTEA21:3 Språkfilosofi Föreläsning I Martin Jönsson Att lära Varför Frege varken tror att ett ords mening är dess referens eller något mentalt. Freges egen teori om mening Tre semantiska principer Kompositionalitetsprincipen,
Artikelskrivandets konst, 7.5 hp
Institutionen för pedagogik, didaktik och utbildningsstudier HT 2014 KURSPLAN Artikelskrivandets konst, 7.5 hp Huvudområde: Pedagogik Utbildningsnivå: Forskarutbildning Betygsskala: För denna kurs ges
Litteraturlista ht10 ALLMÄN SPRÅKVETENSKAP och FONETIK. GRUNDKURS Period Period 1
Litteraturlista ht10 ALLMÄN SPRÅKVETENSKAP och FONETIK GRUNDKURS 100901-101103 101104-110118 Språket, individen och samhället 7,5 hp Sundgren, Eva. 2007. Sociolingvistik. Liber. Steinberg, D, H. Nagata
Grundläggande textanalys. Joakim Nivre
Grundläggande textanalys Joakim Nivre Om kursen Ni har hittills läst Lingvistik Datorteknik Matematik Språkteknologiska tillämpningar Nu ska vi börja med språkteknologi på allvar Hur gör man text hanterbar
STOCKHOLMS UNIVERSITET Sociologiska institutionen
STOCKHOLMS UNIVERSITET Sociologiska institutionen Anvisningar till momentet Ekonomisk sociologi (6 p.), Sociologi I och Sociologi II, VT-14 Kursansvarig lärare Tiziana Sardiello Rum B944 Tel: 163164 E-mail:
KURSPLAN Engelska, 31-60 hp, 30 högskolepoäng
1(6) KURSPLAN Engelska, 31-60 hp, 30 högskolepoäng English, 31-60 credits, 30 credits Kurskod: LENB17 Fastställd av: Utbildningsledare 2013-11-01 Gäller fr.o.m.: Hösten 2015 Version: 8 Diarienummer: HLK
http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive
Sprog i Norden Titel: Forfatter: Kilde: URL: Språkvård på en dagstidning Catharina Grünbaum Sprog i Norden, 1998, s. 43-51 http://ojs.statsbiblioteket.dk/index.php/sin/issue/archive Nordisk språkråd Betingelser
LexicoNordica Forfatter: Anmeldt værk: Martin Gellerstam Bo Seltén. 1993. Ny svengelsk ordbok. Lund: Studentlitteratur. Kilde: LexicoNordica 2, 1995, s. 173-176 URL: http://ojs.statsbiblioteket.dk/index.php/lexn/issue/archive