Hur göra artikelkritik Gemensam diskussion om artikel Litteraturtips Datalingvistisk metod- och fördjupningskurs höstterminen 2006 Kritisk granskning presentera innehåll neutralt koncentrera dig på en särskild punkt eller detalj i artikeln diskutera problem de viktigaste först Granskning Innehållsrelaterad Täckning Teori Metod Data Argumentation Originalitet Formell Disposition Språk och stil Formalia Innehåll - Täckning God täckning samt explicit och motiverad avgränsning av: problemområde beaktade teorier och metoder relevant litteratur Innehåll - Teori Visar förtrogenhet med teoribildningen inom det valda området Utnyttjande av relevanta referenser Teorianknytning: Koppla den egna undersökningen till teoretiska frågeställningar Innehåll - Metod Lämpliga metoder för uppgiften har använts Redovisningen av metod följer vetenskaplig standard T ex tillräckligt detaljerad för att t ex möjliggöra replikering av experiment Visar förståelse för kopplingen mellan problemställning och vald metod 1
Innehåll - Data Relevant empiriskt material redovisas på ett adekvat sätt Möjliggöra för läsaren att bedöma materialets roll i argumentationen Databehandling Urval Insamling Systematisering Klassifikation Innehåll - Argumentation Följs frågeställningarna upp? knyta ihop säcken Hur väl är slutsatser underbyggda? D v s om läsaren kan se hur slutsatserna följer ur teori och empiri Argumentationen bör vara objektiv : ej stödja sig på tyckanden utan på teoretiska resonemang och empiriska fakta Balanserad: belyser olika sidor av problemställningen, ej ensidigt argumenterande som i t ex politisk text Innehåll - Originalitet Ej enbart referat av andras forskning Egna bidrag av ngt slag Data ur egen undersökning Egna tolkningar av tidigare resultat Det ska framgå vad som är egna bidrag och vad som hämtats ur litteraturen Formell - Disposition Klar övergripande struktur Ordning på kapitel, sektioner etc. Formen ska vara anpassad efter innehållet Några generella kriterier: Varje avsnitt ska ha en funktion i helheten Det ska vara lätt att orientera sig i texten Bestämmelser angående formalia följs Formell - Språk och stil Följer språkligt och stilmässigt vetenskaplig standard Grammatik, stavning Välformulerat, elegant Läs skönlitteratur, poesi, dramatik för att göra din prosa mer njutbar Formell - Formalia De formella reglerna följs Rubricering Definitioner Referenser Citat Bilder Siffror 2
!!!! ARTIKELKRITIK Gemensam diskussion Incremental Finite-State Parsing Ait-Mokhtar & Chanod, 1997 Kritisk granskning presentera innehåll koncentrera dig på en särskild punkt eller detalj i artikeln diskutera problem Artikelns innehåll ny shallow parser finite-state teknik kombination av konstruktiva (constructive) och reduktionistiska (reductionist) metoder Konstruktiva vs. Reduktionistiska metoder konstruktiva metoder lexikala beskrivningar av syntaktiska mönster chunking: NP, PP, VP, S reduktionistiska metoder stor mängd alternativa analyser reduktion via constraints (begränsningar, vilkorsregler) Nya metoden kombination av konstruktiva och reduktionistiska metoder segmenten definieras via constraints inte mönster bredare täckning försiktiga definitioner satsgränser och syntaktiska funktioner kan definieras med hög precision 3
Inkrementell parser taggat text som input, enkla taggar sekvens av transduktorer bi-direktionella finita automater (analys, generering) varje transduktor utför en specifik lingvistisk uppgift output (resultat) från en transduktor används som input till nästa transduktor de enkla operationerna anropas först Incrementell och icke-monotonic bygger på föregående analys av en transduktor täcker endast vissa förekomster av språkliga fenomen kan omarbetas eller ändras vid senare tillfälle Parser konstruktiv gör inkrementella beslut reduktionistisk constraints eliminerar eller rättar delar av tidigare analys Performans teknisk manual (2 320 ord, 157 satser) precision 99,2%, recall 97,8% träningstext tidningsartikel (5 872 ord, 249 satser) precision 92,6%, recall 82,6% rikare syntax Fyra huvudmoduler Primary segmentation AP, NP, PP, VP Subject tagging Segment expansion (Optional) VCs (verbkedjor) Other syntactic functions tagging subjekt, direkt objekt, verb modifier (?) Uppmärkning potentiella början och slut av ett segment dessa temporära tag används för att identifiera ett segment associerar varje börjantag med en sluttag om vissa interna villkor uppfylls tar bort temporära tag 4
Något mer om innehållet?... AP Segmentation kap. 4.1 ett komplext reguljärt uttryck inga exempel eller motexempel inget sätt att testa eller evaluera NP Segmentation kap. 4.2 temporära början och slut på NP markeras början - Det, Num, Pro, etc. slut - N, Num, Pro, etc. sedan markeras NP längsta sekvensen av minst en temporär början av NP följt av en temporär slut på NP NP Segmentation - Problem svårt att applicera på svenska i svenska är ALLT mer eller mindre början eller slut på en NP de stora båtarna är fina de är fina stora är fina båtarna är fina Vad tyckte ni om artikeln?... Kritik notationen förklaras inte alltid saknas exempel exempel inte alltid relaterade till reglerna endast franska endast professionell text oklart hur applicerbar på andra språk och texter sidnumrering saknas 5
Artikelkritik - metodkursen leta upp en artikel gärna med anknytning till examensarbete bra tillfälle att testa olika ämnen och tillämpningar Artikelkritik - metodkursen Ha en idé lättare att välja lättare att granska artikeln Ställ frågor Vad är det för teknik/metod du behöver ta reda mer om? Hur skulle kunna samma algoritm/metod användas på dina data? Artikelkritik - metodkursen presentera innehållet koncentrera dig på en särskild punkt eller detalj i artikeln testa gärna på egna (svenska) exempel definiera problem diskutera problem förklara varför något inte fungerade utvärdera pappret Artikelkritik - metodkursen omvandla din text till latex-format introduktion 19 oktober spara texten i pdf maila till sylvana@ling.gu.se sista dag 26 oktober LITTERATURTIPS WWW allmänt Google dock: uppsatser på nätet är inte alltid färdiga CiteSeer Amazon UB 6
Websajter om datalingvistik Language Technology World ELSNET: European Network of Excellence in Human Language Technologies Språkteknologi.se (SLATE) Survey of the state of the art in Human Language Technology Tidskrifter Natural Language Engineering Computational Linguistics... Proceedings från konferenser och liknande ACL/EACL SigDial SemDial IJCAI ESSLLI... Övrigt examensarbete förslag tidigare examensarbeten 7