Persiska. Albin Finne. Mark Peldius. 2002-10-10 2D1418 Språkteknologi



Relevanta dokument
Ordklasser och satsdelar

Grammatik för språkteknologer

Grim. Några förslag på hur du kan använda Grim. Version 0.8

ORDKLASSERNA I. Ett sätt att sortera våra ord

Datorlingvistisk grammatik

Datum: Date: Provkodr: KTR1 Exam code:

Ordbok arabiska - svenska. Denna ordboks webbadress är:

Ryska pronomen. Pronomen är en sluten ordklass som består av många undergrupper. Pronomina kan fungera självständigt eller förenat

Hemtentamen HT13 Inlämning senast Lärare: Tora Hedin

Grammatisk teori II Attributvärdesgrammatik

2. Substantiv kan man sätta en, ett, flera eller all, allt, alla framför.

Ordklasser. Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv.

Satser och satsdelar. 1 Satser och satsdelar inledning. 2 Primära satsdelar predikatet. 2.1 Översikt. Grammatik för språkteknologer

Förord. Elevfacit och Test för kopiering utges till varje del av Grammatikövningar för Sfi, del 1 2.

Datum: Date: Provkodr: KTR1 Exam code:

grammatik Ordklasser, nominalfraser, substantiv

Datum: Date: Provkodr: KTR1 Exam code:

ANDREAS ISSA SVENSKA SPRÅKET

SUBSTANTIV = namn på saker, personer, känslor

Förord KERSTIN BALLARDINI

Hammarbyskolan Reviderad februari 2009 Lokal kursplan i svenska/svenska som andra språk

Fraser, huvuden och bestämningar

Förord KERSTIN BALLARDINI

Välkommen att träna skriva!

Kongruensböjningen av adjektivet påverkas av substantivets genus och numerus.

Språkliga strategier för att minnas och lära, till exempel tankekartor och stödord. Mål:

Instuderingsmaterial: Adjektiv, Substantiv och Verb

Svensk minigrammatik

Grammatik för språkteknologer

Datorlingvistisk grammatik

Kort grammatisk översikt tänkt att fungera som studiehandledning till Stroh-Wollin, Koncentrerad nusvensk formlära och syntax, 1998

Grundläggande syntaktiska funktioner och roller

Flex Sv2gr Planering T1 Flex: Svenska som andraspråk grundläggande. Planering: del 1 Tider: 16:00-18:00

Grammatik för språkteknologer

Vokaler beskrivs som: främre/centrala/bakre -- rundade/orundade -- slutna/halvslutna/halvöppna/öppna

Datum: Date: Provkodr: KTR1 Exam code:

729G09 Språkvetenskaplig databehandling

Några skillnader mellan svenska och engelska

Övningstillfälle 1, Kognitionsvetenskapliga programmet. Ordklasser och fraser. Facit. 2. lyftes VERB 28. överseende PARTICIP

Praktisk Svenska 2. Jag kan Skapa och använda olika minnesknep Studieteknik 1

Pilen 2:1-2:2 O / OO. Steg 2:1 Dator Laborativ övning Arbetsblad. Steg 2:2 Dator Laborativ övning Arbetsblad

Grammatik skillnader mellan svenska och engelska

Först lite rester...

Svenska språket 1, delkurs 2 Språkets byggstenar 714G47 Svenska språket Svenska språkets byggstenar 714G57

Att analysera andraspråkstexter

1 Vilka ord är substantiv? Läs texten.

b) Ge minst ett exempel på en tonlös konsonant och dess tonande motsvarighet.

Ordbok arabiska - svenska

En byggmodell över språket fonemet morfemet

ORDKLASSERNA I SVENSKA SPRÅKET

Syntax, Ordklasser och Satsdelar. Allmän Grammatik och Fonetik HT10 Dag 3

Världens språk, 7,5hp vt 2012

Bedömning av språklig nivå utifrån processbarhetsteorin - Har andraspråksinlärare på Komvux utvecklats språkligt mellan olika kurser?

Extramaterial 3 Morfologi

Grammatik för språkteknologer

Bedömda elevexempel i årskurs 1 3

Kursbeskrivning med litteraturlista HT-13

Grammatisk teori III Praktisk analys

Huvudordklasser. ursinnig, god, glad äta, dricka, cykla. Övriga ordklasser. fort, borta, ute

Dåtid:'' Perfekt'' Beskriver'att' något'har'skett.' Bildas'med' hjälpverbet' har.'

Facit för diagnostiska provet i grammatik

Grammatik för språkteknologer

MÅL OCH BETYGSKRITERIER I SVENSKA

Svenskan i tvärspråkligt perspektiv. Språktypologi. Solveig Malmsten

Studiebrev 13. Háskóli Íslands Svenska lektoratet Höstterminen. Grammatik I (2,5 p) H [ects: 5] Lärare: Maria Riska mar@hi.is.

Några skillnader mellan svenska och engelska

Syntax Fras, sats, mening

DEL 1 Svara på svenska, men med exempel på somaliska. 4 stycken: yaal, ooyin, reduplikation, o

KODNING AV MAXIMALA GRAMMATISKA ENHETER Manual

Substantiv är benämningar på människor, djur, växter och föremål. Du kan sätta en, ett eller flera framför substantiv.

Sfi-läromedel ur ett processbarhetsperspektiv

PROTOKOLL 2:1 2:2 O / OO Steg 2:1 Lyssning Laborativ övning Arbetsblad. Steg 2:2 Lyssning Laborativ övning Arbetsblad

SYNTAKTISKA FUNKTIONER (forts.) Attribut o Attribut ger ytterligare information om det som nominalfrasen refererar till.

Det görar ingenting om du frågar mycket. SFI-elevers semantiska och morfologiska utveckling

Harry Potter och De Vises Sten, den spännande ungdomsboken, skriven av den engelska författaren J.K. Rowling, har blivit en succé över hela världen.

Svenskans struktur, 7,5 hp Tentamensexempel 1

Svenska 4 ANSWER KEY MÅL Presens perfekt. 1. har använt (har haft) 2. har varit 3. har haft 4. har åkt. 2 - Preteritum

Delkurs grammatik (5 hp, 7,5 hp) - studiehandledning vt 2015

Plan d étude = studieplan

ENGELSKA. Årskurs Mål att uppnå Eleven skall:

Språk i världen (och på Institutionen för Lingvistik och Filologi) - ett minikompendium om skriftsystem och språkstrukturer

ENGELSKA ÅRSKURS 3 ÅRSKURS 4

glad simma luft koka barnslig pojke moln lycka jord överenskommelse Pelle femte varför arg ropa

Svenska GRAMMATIK

Lingvistik IV Konstituenter och frasstruktur

Arbetsuppgift Skrivning och Grammatik v.2

Morfologiska kriterier. Svenska adjektiv har två slags böjningar: kongruensböjning och komparationsböjning.

Svenskans struktur, 7,5 hp Tentamensexempel 3

Mening. Sats. Huvudsats. En mening: Jag gillar kaffe men jag gillar inte te. En mening börjar med stor bokstav och slutar med.! eller?

Till alla som läser Introduktionskurs i persiska 15hp. 2a. Markera species och numerus för substantiven i texten.

Grammatiska morfem kan också vara egna ord, som t ex: och på emellertid

Uppsala universitet Institutionen för nordiska språk. TENTAMEN: Svenskans struktur, 7,5 högskolepoäng för Svenska språket/nordiska språk A

Valet är ditt ORDLISTA CHRISTINA WAHLDÉN ARBETSMATERIAL FÖR LÄSAREN

Satslära introduktion

Kursplan i svenska som andra språk på Alsalamskolan enligt kursplan 2011

Pilen 2:1-2:2 Steg 2:1 Dator Laborativ övning Arbetsblad Hitta rätt Steg 2:2 Dator Laborativ övning Arbetsblad Ordspråk

PROTOKOLL 2:1 2:2 Steg 2:1 Lyssning Laborativ övning Arbetsblad. Steg 2:2 Lyssning Laborativ övning Arbetsblad

Fundamentet vad som helst kan vara i fundamentet (men regleras av viktprincipen).

Eleven Eleven är 11 år och går i åk 5. Modersmålet är arabiska. Eleven har haft en normal skolgång.

!!! Några verb är oregelbundna vara är var!!!

Transkript:

Persiska Albin Finne 2002-10-10

Sammanfattning Den här uppsatsen beskriver det persiska språket. Språkets historia, morfologi, syntax och ordförråd behandlas. Tonvikten läggs på morfologi och syntax. Avslutningsvis dras några slutsatser om datoranalys av språket. Syftet med uppsatsen är att få en djupare inblick i något språkteknologiskt ämne. Uppsatsen baseras på information från Nationalencyklopedin och material från Internet. Morfologin i persiska är ett system baserat på affix. Korta vokaler skrivs inte ut i skriven text vilket gör ordanalys svår. Det finns inget skiljetecken för fras- och meningsslut. Det innebär att språket är svårt att analysera för en dator. Persiska är ett SOV-språk vilket innebär att ordföljden är Subjekt-Objekt-Verb. Många av orden i språket är arabiska lånord.

Innehållsförteckning BAKGRUND...1 INLEDNING...2 HISTORIA...2 MORFOLOGI...3 SYNTAX...4 ORDFÖRRÅD...5 SLUTSATSER...5 KÄLLFÖRTECKNING...6

Bakgrund Den här uppsatsen har skrivits på uppdrag av kursledaren i. Uppsatsen handlar om det persiska språket med tonvikten lagd på dess morfologi och syntax. Syftet med rapporten är att få en djupare förståelse för ett ämne med anknytning till språkteknologi. Dessutom har uppgiften gett övning i muntlig och skriftlig framställan. För att kunna skriva uppsatsen samlade vi först in information och litteratur om det persiska språket. Vi sökte information på KTHB (KTH:s Bibliotek) och på Internet. Vi använde oss även av delar av kursens föreläsningsanteckningar. Vi läste in oss på materialet och skrev sedan ihop denna uppsats. Dessutom presenterade vi uppsatsen vid ett seminarium den 7 oktober. 1

Inledning Persiska, som även kallas Farsi, är det officiella språket i den islamska republiken Iran. Det talas även av en stor del av befolkningen i Afghanistan och Tadzjikistan. Det finns dock lokala skillnader och dialekter i språket mellan dessa tre länder. Dessutom talas språket av minoriteter i exempelvis Bahrain, Irak, Oman, Yemen och Förenade Arabemiraten. * Historia Persiskan härstammar från de Indo-Iranska språken som i sin tur är en förgrening från de Indo-Europeiska språken. De Indo-Iranska språken delades upp i Iranska språk och Indo-Aryanska språk omkring 1500 f.kr. De Indo-Aryanska språken utvecklades senare till de olika språken som talas i Indien nuförtiden. Fornpersiska är ett av de Iranska språken och började talas och skrivas omkring 550 f.kr under den Akemenidiska dynastin. Därefter kom Medelpersiskan under det Sasanidiska riket som uppstod efter att Alexander den Stores erövring av Persien var över. Kurdiska, Pashto och Baluchi är andra förgreningar från de Iranska språken. Bild : http://crl.nmsu.edu/research/projects/shiraz/ling/introduction.html Det moderna persiska språket kom omkring 600 e.kr. i samband med den arabiska erövringen av Persien. Trots att den moderna persiskan är nära besläktad med fornpersiskan och medelpersiskan är det inte säkert att den är en direkt följd av de båda språken. Det kan istället vara så att en dialekt av medelpersiskan som talades i nordöstra Persien är den främsta föregångaren till modern persiska. Det arabiska inflytandet har varit stort på det persiska språket vilket gör att många ord lånats in från arabiskan. Dessutom skrivs persiska med det arabiska alfabetet. ** * Fakta i detta avsnitt baseras på material från The Shiraz Project ** Historiematerialet är hämtat från The Shiraz Project och Language Materials Project. 2

Morfologi Morfologin i persiska är ett system baserat på affix och består främst av suffix och mindre av prefix. Det finns inte särskilt många olika typer av affix och persiska är ett relativt formfattigt språk. Inom persiskan förekommer affix både som fria och bundna morfem. När persiska ska analyseras med datoriserade metoder finns det ofta tvetydigheter på grund av att olika morfem kan ha samma grundform. Dessutom skrivs inte korta vokaler ut i skriven text vilket gör att flera olika tolkningar är möjliga vid en analys. Exempelvis kan ett ord skrivas mrdm och få olika betydelser beroende på vilka vokaler som sätts in i ordet. Om a och o sätts in bildas substantivet mardom (folk) eller alternativt verbet mordam (jag dör). Substantiv i persiska skiljer varken på kasus eller på genus. Istället är det partiklar eller prepositioner som gör det. Bestämd och obestämd form används bara när det behövs. Det finns inget sätt i persiska att markera att en fras är slut. Däremot finns suffix som beskriver att ett adjektiv eller ett substantiv inte är slutet på en mening eller en fras. Det finns flera sätt att markera att ett substantiv är i pluralis. Dels finns det sätt som följer det persiska viset och dels finns det sätt som följer det arabiska viset att markera pluralis. Orden i en nominalfras sätts samman med en påhängd partikel som kallas ezafe (ez) som uttalas ye. Den kan markera flera olika saker. Oftast markerar den bestämd form eller ägande form. Den utelämnas dock i skriven text vilket gör det svårt att avgöra när en fras är slut. ru-ye miz på-ez bord `på bordet' Morfologin för adjektiv fungerar som för substantiv men de kan dessutom ha komparativa och superlativa former. Personliga pronomen kan både stå fria i en mening eller vara bundna till ett ord. Exempel på ett bundet; ketâb-at bok + 2sg `din bok' Verben i persiskan kan böjas med antingen enkel böjning eller sammansatt böjning. Den enkla böjningen delas in i två olika grupper beroende på vilken stam verbet har. En grupp består av de verb där stammen står i presens och den andra gruppen av de verb som står i preteritum. Verb med sammansatt böjning kräver ett extra verb för att böjas. Det kan röra sig om extra verb som budan (vara), khâstan (vilja) eller shodan (bli). 3

Många verb i det persiska språket bildas med hjälp av ett substantiv, adjektiv eller en preposition följt av ett enkelt verb (exempelvis kardan 'göra', dâdan 'ge', eller zadan 'slå'). Det enkla verbet förlorar oftast hela eller delar av sin betydelse. Den här typen av konstruktion är mycket produktiv i persiska och de flesta nya verb bildas på det viset. * zamyn xordan "golv äta" att falla fekr kardan "tänkte göra" att tänka dust dâshtan "vän ha" att älska gush dâdan "öra ge" att lyssna jâru zadan "kvast slå" att sopa Syntax Det persiska språket är ett så kallat SOV-språk vilket innebär att ordföljden är subjektobjekt-verb. Denna ordföljd används både i huvudsatser, bisatser, frågande satser och jakande satser. I verbet anges tempus och syftning. Personsubjekt kan anges i verbändelsen och därför kan dessa utelämnas. Trots att persiska är ett SOV-språk är ordföljden fri och satsdelarna i en mening kan i viss mån kastas om. Verbet i en mening brukar oftast ändå stå sist. Det finns bland annat verbfraser (VP), nominalfraser (NP) och prepositionsfraser (PP) i det persiska språket. I en nominalfras kan huvudet vara antingen ett substantiv, ett verb i infinitiv form eller ett pronomen. Om det är ett pronomen fungerar det som ägandeform (exempelvis ketâb-e Hushang 'Hushangs bok'). Ordföljden i en nominalfras är vanligtvis; determinerare specificerare huvud modifierare. Exempel på dessa är; Determinerare: Determinerare ex. in (den här, de här) Specificerare: Numerus ex. do milion nafar (två miljoner människor) Ordningsnumerus ex. dovomin (den andra) Superlativ ex. bozorgtarin (den största) Kvantifierare ex. ba'zi (några) Modifierare: Adverb/Adjektiv ex. kheyli kohne (väldigt gammal) * Morfologin baseras på Nationalencyklopedin och The Shiraz Project 4

I en verbfras kan den relativa ordningen mellan det direkta objektet och ett indirekt objekt eller en prepositionsfras variera beroende på om det direkta objektet har bestämd form *. Exempelvis; Hushang be bache-hâ nân dâd Hushang till barn-plur bröd gav/3sg `Hushang gav bröd till barnen.' Hushang nân râ be bache-hâ dâd Hushang bröd Obj till barn-plur gav/3sg `Hushang gav brödet till barnen.' Ordförråd Persiskans ordförråd rymmer ord med många olika sorters ursprung. Uppemot hälften av alla ord är lånade från det arabiska språket. Men eftersom de flesta vanliga orden har iranskt ursprung är andelen arabiska lånord i löpande text uppskattningsvis bara en fjärdedel. Persiska ord har även lånats i många europeiska språk. Ordet risk kommer från medelpersiskans roziko (dagligt bröd eller öde), kiosk från koshk (palats), pyjamas från pei-jama (benkläder) och khaki från just khaki (jordfärgad). ** Slutsatser Persiska verkar vara ett svårhanterligt språk när det gäller att analysera det med hjälp av datorkraft. Eftersom alla vokaler i ett ord inte skrivs ut är det svårt att avgöra vilket ord som avses. Det innebär att datorn måste tolka i vilket sammanhang ett ord står och därefter göra en bedömning av det. Utöver detta är det svårt för datorn att veta när en mening eller en fras är slut eftersom det inte finns något särskilt meningsavslut. Det kan lösas genom att leta efter ett verb i en mening om ett sådant finns, eftersom ordföljden oftast placerar verbet sist. * Syntaxavsnittet baseras på material från The Shiraz project. ** Ordförrådsdelen grundar sig på Nationalencyklopedin. 5

Källförteckning Nationalencyklopedin Shiraz Project: http://crl.nmsu.edu/research/projects/shiraz/ling/index.html The UCLA, Language Materials Project: http://www.lmp.ucla.edu/profiles/profp01.htm 6