Obesvarade frågor från F1 Antal ord i sista upplaga av SAOL Ex. på ord som försvunnit Ex. på nyord Varför är SAOL bättre som norm för stavningskontroll än SAOB?
Språkgranskningsverktyg F4: Grammatikkontroll i Word
Grammatikkontroll Fel vars igenkänning kräver granskning av kontexter som omfattar mer än ett ord, en token Inriktad mot igenkänning av i förväg definierade feltyper Mycket svårare än stavningskontroll
Grammatifix Svarar för den svenska grammatikkontrollen i Word Huvudtyper av fel Grammatiska fel SWECG Typografiska fel Mönsterigenkänning med reguljära uttryck Stilistiskt markerade ord stilmarkering i lexikon
SWECG Constraint Grammar, CG, för Svenska (Karlsson et al. 1995) Ursprungligen utvecklad för analys av korrekt språk Anpassad för grammatikkontroll
Grundversionen av CG Förberedande bearbetning Lexikal analys Morfologisk disambiguering Morfosyntaktisk mappning Tilldelning av möjliga syntaktiska funktioner Syntaktisk disambiguering Se vidare Birn 1998, http://www.lingsoft.fi/doc/swecg/intro/
Förberedande bearbetning Tokenisering Ord Förkortningar Skiljetecken Fasta förbindelser som man vill behandla som enheter, t.ex. till hands, så snart som, som fungerar som adverb resp. konjunktion
Lexikal analys Morfologisk analys SWETWOL SVENSK TVÅNIVÅGRAMMATIK (Karlsson 1992) Tillståndsgrammatik (finite state) http://www.nada.kth.se/kurser/kth/2d1418/uppsats er04/lisa_lagerkvist.pdf Morfologisk heuristik t.ex. entreprenöriella
Anpassning av SWECG för grammatikkontroll Förberedande bearbetning Lexikal analys Morfologisk disambiguering Taggning av varje ord: @ERR och @OK Feligenkänningsregler, dvs. regler som arbetar på taggarna och väljer ut felen
Ett exempel Det finns många engelska lånord vilkas diskontinuerliga stavningen inte tycks bereda språkbrukarna några problem. Vad är fel? Finns feltypen med i Scarrie-typologin?
Morfologisk analys många mången <ID> DET UTR/NEU INDEF PL NOM mången PRON UTR/NEU INDEF PL NOM engelska engelsk A UTR/NEU DEF SG NOM engelsk A UTR/NEU DEF/INDEF PL NOM engelska N UTR INDEF SG NOM lånord lån-ord N NEU INDEF SG/PL NOM vilkas vilken <WH><CLB><MD> DET UTR/NEU INDEF PL GEN vilken <WH> <CLB> PRON UTR/NEU INDEF PL GEN diskontinuerliga diskontinuerlig A UTR/NEU DEF SG NOM diskontinuerlig A UTR/NEU DEF/INDEF PL NOM stavningen stavning N UTR DEF SG NOM
Disambiguering många mången <ID> DET UTR/NEU INDEF PL NOM engelska engelsk A UTR/NEU DEF/INDEF PL NOM lånord lån-ord N NEU INDEF SG/PL NOM vilkas vilken <WH> <CLB> PRON UTR/NEU INDEF PL GEN diskontinuerliga diskontinuerlig A UTR/NEU DEF SG NOM stavningen stavning N UTR DEF SG NOM
Taggning Varje läsning (analys) tilldelas två taggar: en feltagg och en ok-tagg många mången <ID> DET UTR/NEU INDEF PL NOM @ERR@OK
Tillämpning av feligenkänningsregler många mången <ID> DET UTR/NEU INDEF PL NOM @OK engelska engelsk A UTR/NEU DEF/INDEF PL NOM @OK lånord lån-ord N NEU INDEF SG/PL NOM @OK vilkas vilken <WH> <CLB> PRON UTR/NEU INDEF PL GEN @OK diskontinuerliga diskontinuerlig A UTR/NEU DEF/INDEF PL NOM @OK stavningen stavning N UTR DEF SG NOM @ERR
Ex. på regler (@w=s!(@err) ;For a word in focus, select the error tag (0 N-DEF) ;if the word itself is a noun in definite form (-2 GEN) ;if the second word to the left is a genitive (-1 A-DEF)) ;if the first word to the left is an adjective in ;definite form (@w=s!(@ok) (Not 0 DUMMY) ;For a word in focus, select the OK tag ;if the word does not have the feature DUMMY ================================= @w the word itself s! select @ERR error tag
Feligenkänningsgrammatiken Totalt 659 regler Till varje regel kopplas ett felmeddelande, som omfattar benämning på felet förklaring rättelse
Ett felmeddelande Benämning: Substantivets bestämdhetsform Förklaring: Kontrollera ordformen (0). Om ett substantiv styrs av en genitiv, t.ex. (-2), bör det stå i obestämd form Rättelse: (0 N DEF)=>(0 N INDEF) ==================================== Förklaring och rättelse i det aktuella exemplet: Förklaring: Kontrollera ordformen stavningen. Om ett substantiv styrs av en genitiv, t.ex. vilkas, bör det stå i obestämd form. Rättelse: stavningen => stavning
En felregel i CG Regeln har fyra delar Domän @w el. <..> /ett speciellt ord/ Operator =s! (select) el. =s0 (remove) Måltavla @ERR el. @OK Kontextvillkor
Kontextvillkor Polaritet Positiv el. negativ Position Target 0 Absolut 1,2.., -1, -2 Obunden *1, *2..,-1*, -2* Länkad (flera villkor..) R+1, R+2, *R. L-1,L-2,..*L Försiktig läsning villkoret är uppfyllt bara om läsningen är entydig Mängd Allt som refereras till i kontextvillkoren måste deklareras som en mängd, t.ex. set set elements (N-NEU (N NEU))
Ytterligare exempel Ett@ERR högtrycksrygg förskjuts norrut. ( <ett> =s!@err (1C N-UTR))
Möjligheter och problem Fel i mycket lokala kontexter kan beskrivas enkelt och väl Grundläggande konflikt mellan disambiguering och feligenkänning, vilket gör formalismen som helhet svår att överblicka Svårt att beskriva fel som spänner över längre kontexter Svårt att fånga alla specifika kontexter för ett visst fel
Ett exempel Femtiofem brunsmutsiga tygbitar kanske inte verkar vara mycket för världen, men när textilfragmenten är drygt 300 år gamla och härrör från drottning Kristinas kläder ser det bruna trasorna genast mycket intressantare ut. Det bruna trasorna ser intressanta ut.
Feltyper 1. Bestämdhetsform hos substantiv:... samhällets utvecklingen(@err)... 2. Bestämdhetsform hos adjektiv:... sin egna(@err) energi... 3. Numeruskongruens: determinerare och substantiv:... de(@err) statliga monopolet... 4. Numeruskongruens: adjektiv och substantiv: Ny(@ERR) upplagor... 5. Genuskongruens: determinerare och substantiv:... vardera(@err) laget... 6. Genuskongruens: adjektiv och substantiv: Effektiv(@ERR) ledarskap... 7. Maskulinform hos adjektiv:... den rödhårige(@err) kvinnan. 8. Predikativkongruens: Den nya apparaturen är inte praktiska(@err) att använda. 9. Supinum utan ''ha'': Där borde nog polisen ryckt(@err) in med detsamma. 10. Dubbelt supinum: Vi hade velat sett(@err)... 11. Dubbelt passiv: Saken har försökts att tystas(@err) ner. 12. S-passiv efter vissa verb: Huset ämnar byggas(@err). 13. Infinitiv utan ''att'': Han kunde inte undvika möta(@err) hennes blick.
Feltyper, forts 14. Infinitiv med ''att'': Sverige började att(@err) klassa... 15. Antalet finita verb: I Ryssland är betalar(@err) nästan ingen någon skatt... 16. Inget finit verb: Det bli(@err) viktigt. 17. Inget verb: Ingenting här.(@err) 18. Placering av adverb i bisats:... att den lär knappast(@err) gå över... 19. Placering av negerat led i bisats:... påstår att lite stryk gör ingen(@err) skada. 20. Ordföljd i indirekt frågesats: Jag undrar vad gör(@err) de de unga männen i Finland. 21. Genuskongruens: pronomen och substantiv:... en(@err) av de tre aggregaten 22. Pronomenets form efter preposition: Jag tänker på de(@err) som kommer sist. 23. Infinitiv efter preposition:... för stödja(@err) myndigheters och företags miljöarbete. 24. Dubbel negation:... om man inte har varken(@err) pengar eller familj... 25. Prepositionsbruk vid tvåledad konjunktion:... vare sig i Lund eller Malmö(@ERR). 26. Konstruktionen ''möjligast'' + adjektiv: Han körde med möjligast(@err) stora snabbhet.
Språklig norm Finns det några grammatiska feltyper i SWECG som inte finns med i Scarrietypologin? Vilka? Är det skillnader i den språkliga normen?
VP i svenska? Nu skärper kommunerna kraven på föräldrar som inte betalar daghemsavgifter. Ända sedan 70-talet har kommunerna haft rätt att stänga av barn om avgiften uteblivit - men först nu har man börjat göra det. Orsaken till den hårdnande attityden är kommunernas försämrade ekonomi.