Dimensionsreducerande vektorrumsmetoder för språkbehandling

Storlek: px
Starta visningen från sidan:

Download "Dimensionsreducerande vektorrumsmetoder för språkbehandling"

Transkript

1 Läskurs: Dimensionsreducerande vektorrumsmetoder för språkbehandling Magnus Rosell KTH Nada SE Stockholm, Sweden Jonas Sjöbergh KTH Nada SE Stockholm, Sweden Abstract Detta är en kort rapport om vår läskurs om Latent Semantic Analysis (LSA) eller Latent Semantic Indexing (LSI), samt Random Indexing (RI) och Random Mapping (RM). 1 Kursens utveckling Vi ville prova LSA. Därför implementerade vi det m.h.a. ett matematikpaket som tillhandahåller Singular Value Decomposition (SVD). Senare har vi fått tillgång till en äldre version av ett numera kommersiellt LSI-paket från Leif Grönqvist, som han själv använder i sin LSAforskning. Vi har även använt och förbättrat Martin Hassels Java-implementation av RI. 2 Teori De tre metoder vi studerat har mycket gemensamt, men skiljer sig åt en hel del. LSA och RM utgår från en matris, ofta med termer och dokument, och reducerar matrisen medan RI bygger sin vektorrepresentation med få dimensioner från början. Alla metoderna har som mål att reducera antalet dimensioner i representationen av de objekt som behandlas, för det mesta ord och dokument. LSA är en optimal dimensionsreducering av den ursprungliga matrisen avseende kvadratavståndet till de ursprungliga vektorerna, medan RM är en slumpmässig dimensionsreducering som visar sig vara nära nog optimal. De i LSA resulterande dimensionerna är de viktigaste dimensionerna (som svarar för så stor del av variansen i datat som möjligt), medan man i RM får ett antal godtyckliga dimensioner. RI och RM bygger båda två på observationen att slumpvektorer i en mångdimensionell rymd är nära nog ortogonala. RI ger varje ord en gles slumpvektor som tack vare detta förhållande blir i princip unik. RM projicerar hela term-dokument-matrisen på enslumpmässig bas som av samma anledning blir nästan ortogonal. I sammanhanget vill vi också passa på att beskriva ytterligare en relaterad metod, HAL Hyperspace Analogous to Language. 2.1 Latent Semantic Analysis LSA (Latent Semantic Analysis) är en metod för att upptäcka vilka ord som är relaterade till vilka andra ord. Grundidén är att om ord X och ord Y ofta förekommer i samma sammanhang så är de relaterade. Om ord Y och ord Z också ofta förekommer gemensamt är förmodligen X och Z också relaterade. Ursprungligen användes LSA för att få ökad täckning i sökmotorer (Dumais et al., 1988). Idén var att det inte räcker att söka efter endast dokument med orden i sökfrågan utan man ville expandera sökfrågan automatiskt. I detta sammanhang brukar metoden kallas LSI (Latent Semantic Indexing) och den har visat sig kunna förbättra resultaten. (Faktum är att de flesta försök att inkorporera någon form av disambiguering av ords betydelse i informationssökning gett dåliga resultat medan statistiska metoder som tittar på samförekomst visats kunna tillföra något.(sanderson, 2000)) För att hitta relaterade ord ställer man upp en matris med frekvenser, med ord i den ena dimensionen och kontexter i den andra. Kontexten är ofta dokument, dvs vi får den vanliga term-dokumentmatrisen från informationssökning. Sen gör man singulärvärdesfaktorisering (SVD, Singular Value Decomposition) och krymper antalet dimensioner. En bra egenskap hos SVD är att den bevarar avstånden mellan ord (definerat som tex cosinus av vinkeln mellan dem) i den meningen att om det var längre mellan A och B änmellanbochcsåkommer det fortfarande vara längre mellan A och B efter reduktionen. En mindre bra egenskap är att det är beräkningsmässigt tungt att utföra SVD om man inte går ner till väldigt få dimensioner. Det finns diverse varianter på ovanstående metod, tex:

2 frekvenserna kan viktas på olika sätt 1 man kan använda andra dimensioner än just ord och dokument (ord och ord som förekommer inom X ord därifrån är ett exempel) antalet dimensioner man reducerar till varierar också. LSA kan användas till lite av varje. Det är vanligt att man använder det för att försöka hitta synonymer, eftersom synonymer kommer att betraktas som väldigt lika enligt LSA. Dock är det många sorters relationer mellan ord som har denna egenskap, och det är ofta svårt att (automatiskt) se precis vilken relation två ord har som gör att de anses lika. Värt att notera för LSA kan vara att matrisen man börjar med ofta är väldigt gles. Efter SVD är det i princip inte några element alls som har värdet LSA, SVD, PCA, FA - Vad är skillnaden? LSA använder sig av SVD som är en utvidgning av PCA (Principal Component Analysis) för ickekvadratiska matriser. PCA hittar de dimensioner, i tur och ordning, som svarar för störst del av variansen i datat (ibland räcker färre dimensioner än man hade från början för att fullständigt förklara data). FA (Factor Analysis) baseras också på PCA. Här används en människas omdöme för att modifiera resultatet så att dimensionerna blir mer intuitiva under det att man söker hålla den förklarade variansen konstant. (Oakes, 1998) 2.3 Random Indexing En metod som liknar LSA men som inte är fullt så beräkningstung, och som dessutom sägs vara baserad på teorier om hur hjärnan fungerar, är Random Indexing (RI). I RI utgår man inte från en matrisen, utan bestämmer sig påförhand för att använda ett visst antal dimensioner, typiskt Man ger varje kontext en (gles) vektor i denna nya rymd. En kontext är oftast ett annat ord som förekommer i närheten, men det kan lika gärna vara ett dokument som i normalfallet för LSA. Varje ord erhåller sen en kontextvektor som är summan 2 av vektorerna för kontexterna det förekommer i. Ord med liknande kontextvektorer (mätt med något avståndsmått) förekommer i liknande sammanhang och kan antas vara relaterade. 1 I (Berry et al., 1995) hävdas att den bästa viktningen är logaritmisk lokal vikt och en entropibaserad global vikt. 2 Summeringen av kontexterna är ofta viktad så att kontexter längre från ordet bidrar mindre. Ordet random i RI kommer ifrån att man oftast slumpar ut vilken vektor en viss kontext får (men den får naturligtvis samma vektor vid varje förekomst). Ofta brukar man välja att använda glesa vektorer, med tex åtta element av 2000 nollskiljda, fyra element med värde ett och fyra med minus ett. Det går förstås lika bra att inte ha slump, t.ex. kan man ha en hash-funktion istället. Huvudsaken är att man får nästan linjärt oberoende vektorer, vilket får till följd att de enskilda orden får genomslag i kontextvektorerna. Glesa slumpvektorer i en mångdimensionell rymd tenderar att vara nära nog ortogonala. Naturligtvis kan man även konstruera en modell med helt unika vektorer (tex unära vektorer så att första ordet får en vektor med en etta i första positionen och nollor i övrigt, den andra en ett i andra positionen etc) för varje ord, men då missar man en av poängerna dimensionsreduceringen. Som tidigare nämnts varierar vad man anser vara en kontext. Även olika viktningsförfaranden och parameterval (t.ex. längden på vektorerna) är möjliga. Precis som för LSA är det ofta oklart vilka ord som har vilken sorts relation till varandra även om man vet att de är relaterade på något sätt. Olika parameterval kan favorisera olika sorters relationer, ett enkelt exempel är att smala fönster som kontext ger syntaktisk likhet, medan breda fönster ger semantiskt relaterade ord. 2.4 Random Mapping Random Mapping (RM) använder samma iakttagelse som RI; det finns många nästan ortogonala vektorer i en mångdimensionell rymd. En uppsättning slumpmässiga vektorer är därför ofta en tillräckligt god approximation av en bas. Detta avsnitt baseras på (Kaski, 1998). RM är en projektion till ett underrum. Om n R N är den ursprungliga representationen av ett objekt och R är en d N-slumpmatris med normaliserade kolumner, där d<n, ger oss projektionen: x = Rn, (1) den nya representationen. Likheten mellan objekten i den nya representationen följer likheten mellan dem i den ursprungliga. Avvikelsen blir statistiskt (över flera slumpprojektioner) allt mindre ju fler dimensioner som används i den nya representationen. Denna metod är mycket snabb jämfört med LSA (SVD); vi behöver bara göra matrismultiplikationer. Vi förlorar emellertid den rangordning av de nya dimensionerna som LSA (SVD) ger oss. Vi vet inget om hur de förhåller sig var och en till fördelningen

3 i den ursprungliga rymden, bara att de tillsammans ger en god approximation. Om vi inte är intresserade av de enskilda dimensionernas bidrag till approximationen är den här metoden att föredra. 2.5 LSA RI Latent i Latent Semantic Analysis syftar påatt man med hjälp av metoden anses hitta latenta semantiska relationer; ord som inte är enkelt relaterade. Term-dokument-matrisen erbjuder en möjlighet att jämföra ord på samma sätt som texter kan jämföras. Här missar man att ord som är relaterade till ett gemensamt ord utan att vara direkt relaterade kan anses relaterade (se inledningen på avsnitt 2.1). Både LSA och RI försöker hitta sådana latenta samband men baseras på underliggande mer eller mindre uttalade antaganden. Om man använder helt unika vektorer i RI kommer ord att anses relaterade bara om de delar minst ett ord i sina totala kontexter. Då man använder kortare slumpmässiga ej unika vektorer lägger man på ett brus som får till följd att vissa ord anses relaterade även om de inte delar något ord i sina kontexter. LSA projicerar term-vektorerna från termdokument-matrisen (eller dokument-vektorerna beroende på vadmanär intreserad av) på ett underrum så att kvadrat-avståndet minimeras. Exakt den bas som åstadkommer detta väljs alltså för projektionen och ingen annan, tex slumpmässig som i Random Mapping. Därför kommer ord som ligger nära de mest varianta riktningarna (de som i underrummet fungerar som basriktningar) i den ursprungliga term-dokument-matrisen att betraktas som relaterade även om de inte delar gemensamma ord i sina kontexter (dokument i LSA). I LSA utgår man alltså från, till skillnad från i RI, att det finns latent semantisk information i ordens fördelningar över dokumenten även om det inte finns någon direkt koppling via gemensamma ord. LSA och RI relaterar alltså båda ord som inte har en direkt koppling via gemensamma ord. RI på grund av att metoden infört brus och LSA på grund av att man valt ett specifikt underrum. Den här skillnaden spelar nog oftast ingen större roll. Detta underbyggs av att Random Mapping och LSA verkar ge fullständigt likvärdiga resultat (se avsnitt 2.4). Random Indexing och Random Mapping är väldigt lika. Både LSA och RI (och även Random Mapping) har parametrar som måste väljas, främst kanske dimensionen på vektorerna. Empiriska undersökningar har visat att LSA fungerar bäst vid dimensioner och RI vid knappt Vi har inte hittat någon förklaring till varför just dessa värden fungerar bäst. 2.6 Hyperspace Analogous to Language Vi passar på att beskriva en relaterad metod som liksom LSA använts till allt möjligt: HAL, eller Hyperspace Analogous to Language (Lund et al., 1995). Här bygger man upp en ord-ord-matris samtidigt som man går igenom textmängden. Man bestämmer sig för ett kontextfönster, tex 10 ord före och 10 ord efter varje ord. Om ord a föregår ett ord b ökar man värdet 3 av elementet i a:s kolumn och b:s rad, såatt b:s rad representerar hur alla ord används före b. På motsvarande sätt låter man b:s kolumn representera hur alla ord används efter b. Ord representeras sedan av en vektor bestående av sina båda vektorer (kolumn och rad) efter varandra. Dimensionsreducering av denna åstadkoms genom att bara behålla de dimensioner som har högst varians. I (Lund et al., 1995) reduceras dimensioner till 200 på detta vis, eftersom variansen är mycket låg i de borttagna. 3 Experiment Följande experiment har skett under kursens gång. 3.1 LSA för sångtexter En kort (och därför inte så värst bra) implementation av LSA skrevs ihop. Det mesta man behöver finns i diverse färdiga programmeringsbibliotek. Vår implementation använde LAPACK, då den finns på Nada med extra optimeringar för Sun-hårdvara. Implementationen testades sen på sångtexter från engelskspråkig populärmusik, som laddades ned från en webbsajt med sångtexter. En ord-sång-matris ställdes upp. Sedan kunde man välja hur många dimensioner LSA skulle reducera till och man kunde använda programmet för att se: vilka ord som var relaterade till vilka ( vanlig LSA) vilka sånger som var relaterade ( vanlig LSA) vilka sånger som bäst passade till ett ord (vanlig sökmotor, med LSA-expanderad sökfråga) vilka ord som var mest relevanta för en sång (sökmotor på andra ledden, med LSAexpanderad sökfråga) Då LSA ger lite oväntade kopplingar kunde man t.ex. få veta att Beatles och Destiny s Child är ungefär samma sak, eftersom båda har framfört sånger 3 Tex proportionellt mot inversen av avståndet dem emellan.

4 med hög frekvens av ordet night. Experimentet var mer roligt än praktiskt användbart. 3.2 Kontextkänslig uppdelning av sammansättningar I tidigare experiment användes en metod för uppdelning av sammansatta ord som prioriterade uppdelningar vars ordled förekom som ord i närheten av sammansättningen. Den metoden fungerade inte speciellt bra, eftersom ordled sällan förekom i kontexten vare sig från korrekta eller felaktiga uppdelningsförslag. En idé var att leta efter ord i kontexten som var relaterade till ordleden, istället för att leta efter ordleden själva. Detta prövades med både LSA och RI. Ordrelationerna byggdes från diverse källor, t.ex. SUC, NE och nyhetsartiklar. Dock blev resultaten fortfarande dåliga, p.g.a. att relationerna kunde vara av väldigt konstig art. Såsmåningom framkom att om man använder en heuristik för att gallra bort många uppdelningsförslag som med hög sannolikhet är fel kan man med gott resultat använda kontextmetoden för att avgöra resterande tvetydigheter. Om man då även lägger till RI blir resultatet ännu bättre. De uppdelningsförslag man framförallt vill gallra bort tidigt är de med väldigt många ordled. RI och LSA hittar för sådana nästan alltid något ordled som av någon anledning är starkt kopplat till den nuvarande kontexten. Tillsammans med en heuristik för detta finns alltså en praktisk tillämpning där RI är användbart, vilket är trevligt. Tyvärr är RI tämligen resurskrävande jämfört med andra metoder för uppdelning av sammansättningar, så i praktiken låter man nog ändå gärna bli att använda RI för detta. 3.3 Högskoleprovets ORD-del med Random Indexing Det är populärt att använda LSA och liknande metoder för att lösa TOEFL-test (Test Of English as a Foreign Language). De delar av proven man löser då är synonymfrågor av typen i meningen bla bla, vilket av följande alternativ är det bästa ordet att ersätta ord X med? (det finns även andra typer av uppgifter på TOEFL-testen). På det svenska högskoleprovet finns liknande frågor (ORD-delen). Vi har provat RI för att göra denna del av provet (det har blivit en labb i språkteknologikursen). Varje fråga i ORD-delen består av ett ord och fem möjliga synonymer. Testdeltagaren ska ange vilket av alternativen som är mest synonymt. För att få tagpålämpliga texter har vi använt Googles API för Java. För alla ord i testet 4 gjorde vi en sökning och skapade med hjälp av resultatet två textmängder: mängd1 - alla snippetar från de 20 första söksvaren (då såmånga fanns för ordet). mängd2 - hela texter från de 10 första söksvaren från Googles cacheminne (då så många fanns för ordet). Vi plockade bort html-taggar så gott det gick och lemmatiserade alla ord. En hel del texter togs sedan bort pga av besvärlig textkodning. Efter allt detta var mängd1 900kB och mängd2 9MB. Vi tog sedan bort de testfrågor vars ord förekom färre än tio gånger i träningsmängderna. Det gav oss två test (ett för vardera träningsmängd): test1 med 59 frågor och test2 med 48 frågor. Ett tredje test (test3) består av alla texter från mängd1 och mängd2 och frågorna från test1. För att få så bra resultat som möjligt har vi varierat en mängd parametrar (inom parentes de värden vi provat): dimensionalitet - storleken på slumpvektorerna (1000,2000) antal 1:or och -1:or (4, 8, 100) kontextfönstrets storlek, åt vänster (2, 4, 10) och åt höger (2, 4, 10) att använda stopplista för ord och att inte göra det (vi tar alltid bort ord som är kortare än 3 bokstäver och längre än 25) viktningsschema, dvs vikten för kontexterna i summeringen till kontextvektorn Totalt 108 varianter per viktningsschema och test. De två viktningsscheman vi provat beskrivs av följande två vikter, där d är avståndet till fokusordet och sim är den redan funna likheten mellan kontexten och fokusordet: MS = 2 1 d (2) MR = ( sim)MS (3) Den första är den viktning som använts av Magnus Sahlgren och den andra är vår variant som förstärker redan existerande samband. Vår variant gav likvärdiga resultat, men är betydligt 4 Vi behöll inte de frågor som innehåll synonymer med fler än ett ord.

5 långsammare eftersom man måste jämföra fokusordet med alla ord i kontextfönstret. Därför presenterar vi bara resultat från försök med det första viktningsschemat. De bästa och sämsta resultaten på de olika testen syns i tabell 1. För att utröna vilka parametrar som är viktiga för resultatet har vi beräknat medelvärde och standardavvikelse på resultatet för varje enskild parameter över de 108 försöken, se tabellerna 2 och 3 (motsvarande värden för test2). Den enda tydliga tendensen över alla försök är att stopplista ger förbättrade resultat. Utan den blir resultatet till och med sämre än slumpen (20%) i vissa fall. Bäst Sämst Antal rätt Procent Antal rätt Procent test1 26/59 44% 16/59 27% test2 15/33 45% 7/33 21% test3 22/59 37% 9/59 15% Tabell 1: Resultat Parameter Värde Medel stdv Dimensionalitet Antal 1/ Vänsterfönster Högerfönster Stopplista på av Tabell 2: Parametrarnas inverkan: test1 Motsvarande har provats för TOEFL-testet med goda resultat: 70% rätt! (Sahlgren, 2001) (Med en kombination av flera metoder har över 90% uppnåtts.) Vi presterade betydligt sämre, lägre än 50%, men har också haft mycket sämre förutsättningar. Högskoleprovets ORD-del är inriktat på modersmålstalare och är därför antagligen svårare än TOEFL-testet. Det var inte helt enkelt att skaffa bra textmängder med dessa ganska ovanliga ord. Alla våra resultat bör ses i ljuset av de små datamängder vi använt. Att vi inte kunnat hitta några Parameter Värde Medel stdv Dimensionalitet Antal 1/ Vänsterfönster Högerfönster Stopplista på av Tabell 3: Parametrarnas inverkan: test3 tydliga tendenser i hur parametrarna påverkar resultatet kan mycket väl bero påattdeär för små. 3.4 Högskoleprovets läsförståelse Vi provade också attanvända LSA för att göra läsförståelsetestet från högskoleprovet. Lite olika metoder testades. Ett exempel var att låta varje mening i texten frågan hör till vara en kontext. Sedan valdes det svar som var mest likt frågan, med texten som utgångspunkt för vad som var likt vad. Samtliga metoder som prövades fungerade väldigt dåligt (sämre än slumpen), så det gjordes inte så mycket experiment på detta tema. 3.5 Klustring Vi har gjort ett antal försök med klustring och olika representationer. I avsnitt jämför vi Random Mapping och trunkering av klustercentroider och i avsnitt provar vi några olika representationer baserade på Random Indexing. Vi har använt 2500 artiklar från Aftonbladet ur KTH News Corpus och utvärderar mot tidningens fem egna kategorier. Tabellerna 4 och 5 visar resultat vid klustring till 10 kluster med algoritmerna K-means och Bisecting K-means med vanlig vektorrymdsrepresentation. Tvåförsök med vardera 20 klustringar ges för varje algoritm 5. Alla värden i detta avsnitt avser 20 klustringar till 10 kluster. Att vi valt just 10 kluster kan naturligtvis påverka resultaten. Vi representerar texterna i den vanliga vektorrymdsmodellen med cosinus som likhetsmått och tf w,d idf w -vikt enligt: f w,d tf w,d = c 1 +(1 c 1 ) (4) max w f w,d 5 De första används senare i graferna.

6 idf w = c 2 +log n n w n w (5) där f w,d är antalet gånger ordet w förekommer i dokumentet d, n är antalet texter, n w är antalet texter ordet w förekommer i. Vi har satt c 1 =0.5 och c 2 =0.5. De 2500 artiklarna har efter bearbetning (sammansättningsuppdelning, stemming och stoppordsborttagning) 7265 olika ord. Enskilda artiklar har i snitt olika ord (min: 7, max: 191). I de följande avsnitten tillämpas olika former av representationer. Resultaten från dessa försök är naturligtvis beroende av den nu beskrivna ursprungliga representationen, men vi har inte provat olika sådana. Försök Mått medel stdav. Info Gain Precision F-measure Info Gain Precision F-measure Tabell 4: K-means utan projektion Försök Mått medel stdav. Info Gain Precision F-measure Info Gain Precision F-measure Tabell 5: Bisecting K-means utan projektion Global eller lokal projektion Vi ville verifiera resultaten i (Schütze and Silverstein, 1997) där trunkering av klustercentroider visas ge lika bra resultat som global projektion via LSI och att båda ger lika bra resultat som då man inte projicerar alls. Eftersom det inte är möjligt att fåde ursprungliga vektorerna från LSI-paketet kunde vi inte göra den jämförelsen. Istället har vi använt Random Mapping som global projiceringsmetod. Dessutom gör de i artikeln jämförelsen i en informationssökningskontext, medan vi använder tidningskategorier som referens. Figurerna 1 till 4 ger Information Gain vid klustercentroidtrunkering respektive dimensionsreducering mha Random Mapping till 10, 20, 30, 40, Info Gain Antal dimensioner Figur 1: K-means med Random Mapping (Info Gain) 50, 100, 200, 300, 400, 500 och 1000 dimensioner 6. Motsvarande figurer för precision och F- measure ger liknande grafer. De horisontella linjerna är värdena för motsvarande klustringar utan projektion (försök 1 i tabellerna 4 och 5). Trunkering av klustercentroider verkar inte påverka resultatet menligt för någon av algoritmerna bara man inte trunkerar för hårt (se figurerna 3 och 4). För K-means tycks till och med resultatet kunna förbättras vid trunkering precis som rapporterats i (Schütze and Silverstein, 1997). Anledningen skulle kunna vara att de lägst viktade orden i centroiderna bara tillför brus. Random Mapping verkar inte motsvara LSA tillräckligt väl för K-means (figur 1). Våra försök ger klart försämrade resultat medan (Schütze and Silverstein, 1997) rapporterar oförsämrade resultat medlsa. Det är väldigt märkligt att algoritmen inte ger lika goda resultat med flera hundra dimensioner som med den ursprungliga representationen. Bisecting K-means verkar fullständigt stabil för Random Mapping. Den ger lika goda resultat ned till några tiotal dimensioner Random Indexing Vi ville också prova om Random Indexing (RI) kan förbättra klustringsresultat. Två olika textrepresentationer skapade mha av RI har provats. Vi har provat att representera en text med en RI-kontextvektor som är summan av alla de i texten förekommande ordens RI-kontextvektorer viktat ordvis med tf*idf-vikten för orden i texten, RIvektorer. Likhet har beräknats enligt cosinus-måttet mellan dessa vektorer. Vi provade även att ta bort 6 För att göra figurerna mer lättlästa har punkterna oegentligt sammanfogats med räta linjer. Heldragna linjer motsvarar medelvärden, medan de streckade ligger på en standardavvikelses avstånd från dessa.

7 Info Gain Antal dimensioner Figur 2: Bisecting K-means med Random Mapping (Info Gain) Info Gain Antal dimensioner Figur 3: K-means med trunkering (Info Gain) stopporden vid RI-indexeringen (ej stoppord). Tabellerna 6 och 7 ger resultaten för de bägge algoritmerna. K-means fungerar inte bra med denna representation medan Bisecting K-means ger lika goda resultat Info Gain Antal dimensioner Figur 4: Bisecting K-means med trunkering (Info Gain) som vid normal representation och ingen projektion. Bisecting K-means hittade tillräckligt med information vid projektion med Random Mapping ner till några tiotals dimensioner sådetsäger bara att det finns lika mycket för klustring användbar information i de här representationerna. Att K-means fungerar bättre då stopporden tagits bort vid RI-indexeringen kan kanske tolkas som att RI blir mindre fokuserad på syntaktisk information då ochdärmed bättre på att representera innehållet. Den andra textrepresentationen vi provat utvidgar den vanliga vektorrymdsmodellen. Alla texters representation har tillförts de n (i nästan alla försök har vi använt n = 5) mest lika RI-synonymerna (och sig självt) för varje ord som ingår i dem. Vikten för ord har naturligtvis ackumulerats. Likhet mellan de resulterande vektorerna har beräknats med cosinus-måttet. Vi har provat olika viktningar av orden som lagts till. Först provade vi produkten av vikten för det ursprungliga ordet och likheten dem emellan (mellan ordet och RI- synonymen ). Resultaten för detta syns även det i tabellerna 6 och 7 med beteckningen Utvidgad n. Resultatet är minst sagt nedslående och vi har provat många olika varianter av viktning vid utvidgningen (bland annat genom ge ord med högre idfvikt högre vikt). Det har förbättrat resultaten en del, men inte alls nått upp till den vanliga vektorrymdsrepresentationen. Det är förvånande att den med RI-synonymer utvidgade vanliga representationen fungerar sådåligt. Kanske är den godtyckligt tagna mängden RIsynonymer (5 eller 10 stycken) dålig; kanske borde man prova någon likhetströskel istället. Men det kan också varaså att RI-synonymerna inte lämpar sig för innehållsrepresentation. Projektion har inte tillämpats i något RI-försök. Det hade varit nästa steg om dessa oprojicerade försök gett goda resultat. En stor och viktig invändning mot de här RIförsöken är att RI-indexeringen bara gjorts på denna lilla textmängd. Kanske hade RI-synonymerna varit bättre om de tagits fram från en större eller rent av en helt annan textmängd. Att skapa den utvidgade vanliga representationen tar lång tid eftersom alla ord måste jämföras med alla andra Diskussion Det är intressant att Bisecting K-means fungerar så stabilt. Även då algoritmen uppenbarligen har väldigt få dimensioner att behandla (projektion med Random Mapping till några få tiotal dimensioner) klarar den av att urskilja 10 bra kluster. Man frågar

8 Representation Mått medel stdav. Info Gain RI-vektorer Precision F-measure Info Gain RI-vektorer Precision (ej stoppord) F-measure Info Gain Utvidgad 10 Precision F-measure Info Gain Utvidgad 5 Precision F-measure Tabell 6: K-means Random Indexing Representation Mått medel stdav. Info Gain RI-vektorer Precision F-measure Info Gain RI-vektorer Precision (ej stoppord) F-measure Info Gain Utvidgad 10 Precision F-measure Info Gain Utvidgad 5 Precision F-measure Tabell 7: Bisecting K-means Random Indexing sig om det betyder att klustren ofta, även vid representation med fler dimensioner, kan beskrivas väl med några få dimensioner. Det känns inte helt otroligt om man tänker på de magiska dimensionerna vid LSA... Det är anmärkningsvärt att det är så svårt att få bättre klustringsresultat mha RI. Det kanske inte går. RI hittar statistiska samband i ords användning. Klustring gör också det;två liknande texter som uteslutande använder var sin synonym för något ord blir ändå lika varandra tack vare övriga ord. Att försöka införa detta påtvåsätt kanske inte är en bra ide. Genomgående för de försök som gjorts för disambiguering av ords betydelse för informationssökning har varit att ju längre sökfrågan och texterna är desto mindre (alternativt sämre) inverkan har det (Sanderson, 2000). I klustring har man bara hela texter, så våra resultat är kanske inte så märkliga. 4 Litteratur Utöver de referenser som finns i texten har vi läst mycket annat, bland annat följande: LSA/LSI: (Berry et al., 1999), (Landauer, 2003) RI: (Sahlgren, 2004), (Sahlgren et al., 2002) RM:(Kohonen et al., 2000) 5 Tack till Leif Grönqvist, Magnus Sahlgren och Martin Hassel. References Michael W. Berry, Susan T. Dumais, and Gavin W. O Brien Using linear algebra for intelligent information retrieval. M.W. Berry, Z. Drmac, and E.R. Jessup Matrices, vector spaces, and information retrieval. S. T. Dumais, G. W. Furnas, T. K. Landauer, and S. Deerwester Using latent semantic analysis to improve information retrieval. In Proceedings of CHI 88: Conference on Human Factors in Computing, pages , New York. Samuel Kaski Dimensionality reduction by random mapping: Fast similarity computation for clustering. In Proceedings of IJCNN 98, International Joint Conference on Neural Networks, volume 1, pages IEEE Service Center, Piscataway, NJ. T. Kohonen, S. Kaski, K. Lagus, J. Salojrvi, J. Honkela, V. Paatero, and A. Saarela Self organization of a massive document collection. Thomas Landauer Pasteur s quadrant: Computational linguistics, lsa, and education. In Jill Burstein and Claudia Leacock, editors, HLT- NAACL 2003 Workshop: Building Educational Applications Using Natural Language Processing, pages 46 52, Edmonton, Alberta, Canada, May 31. Association for Computational Linguistics. K. Lund, C. Burgess, and R.A. Atchley Semantic and associative priming in highdimensional semantic space. In Proceedings of the Cognitive Science Society, pages Hillsdale, N.J.: Erlbaum Publishers. Michael P. Oakes, editor Statistics for Corpus Linguistics. Edinburgh University Press. Magnus Sahlgren, Preben Hansen, and Jussi Karlgren English-Japanese cross-lingual query expansion using random indexing of aligned bilingual text data. In The Third NTCIR Workshop, Tokyo, Japan.

9 M. Sahlgren Representing word meanings based on random labels. In The 23rd Annual Conf. of the Cognitive Science Society. Magnus Sahlgren Automatic bilingual lexicon acquisition using random indexing of aligned bilingual data. In Proceedings of LREC-2004, pages , Lisbon, Portugal. Mark Sanderson Retrieving with good sense. Inf. Retr., 2(1): H. Schütze and C. Silverstein Projections for efficient document clustering. In Proceedings of SIGIR 97, pages

Vi skall skriva uppsats

Vi skall skriva uppsats Vi skall skriva uppsats E n vacker dag får du höra att du skall skriva uppsats. I den här texten får du veta vad en uppsats är, vad den skall innehålla och hur den bör se ut. En uppsats är en text som

Läs mer

Klustring av svenska tidningsartiklar

Klustring av svenska tidningsartiklar Klustring av svenska tidningsartiklar Magnus Rosell rosell@nada.kth.se http://www.nada.kth.se/ rosell/ Klustring Kategorisering eller klassificering att föra texter till på förhand bestämda kategorier

Läs mer

Individuellt Mjukvaruutvecklingsprojekt

Individuellt Mjukvaruutvecklingsprojekt Individuellt Mjukvaruutvecklingsprojekt RPG-spel med JavaScript Författare Robin Bertram Datum 2013 06 10 1 Abstrakt Den här rapporten är en post mortem -rapport som handlar om utvecklandet av ett RPG-spel

Läs mer

Erfarenheter från ett pilotprojekt med barn i åldrarna 1 5 år och deras lärare

Erfarenheter från ett pilotprojekt med barn i åldrarna 1 5 år och deras lärare Erfarenheter från ett pilotprojekt med barn i åldrarna 1 5 år och deras lärare I boken får vi följa hur barn tillsammans med sina lärare gör spännande matematikupptäckter - i rutinsituationer - i leken

Läs mer

Lathund, procent med bråk, åk 8

Lathund, procent med bråk, åk 8 Lathund, procent med bråk, åk 8 Procent betyder hundradel, men man kan också säga en av hundra. Ni ska kunna omvandla mellan bråkform, decimalform och procentform. Nedan kan ni se några omvandlingar. Bråkform

Läs mer

Mätningar på op-förstärkare. Del 3, växelspänningsförstärkning med balanserad ingång.

Mätningar på op-förstärkare. Del 3, växelspänningsförstärkning med balanserad ingång. Mätningar på op-förstärkare. Del 3, växelspänningsförstärkning med balanserad ingång. Denna gång skall vi titta närmare på en förstärkare med balanserad ingång och obalanserad utgång. Normalt använder

Läs mer

Presentationsövningar

Presentationsövningar Varje möte då temadialog används bör inledas med en presentationsövning. har flera syften. Både föräldrar och ledare har nytta av att gå igenom samtliga deltagares namn och dessutom få en tydlig bild av

Läs mer

Skriva B gammalt nationellt prov

Skriva B gammalt nationellt prov Skriva B gammalt nationellt prov Skriva B.wma Då fortsätter vi skrivträningen. Detta avsnitt handlar om att anpassa sin text till en särskild situation, en speciell texttyp och särskilda läsare. Nu ska

Läs mer

Får nyanlända samma chans i den svenska skolan?

Får nyanlända samma chans i den svenska skolan? Får nyanlända samma chans i den svenska skolan? Sammanställning oktober 2015 De nyanlända eleverna (varit här högst fyra år) klarar den svenska skolan sämre än andra elever. Ett tydligt tecken är att för

Läs mer

Gruppenkät. Lycka till! Kommun: Stadsdel: (Gäller endast Göteborg)

Gruppenkät. Lycka till! Kommun: Stadsdel: (Gäller endast Göteborg) Gruppenkät Du har deltagit i en gruppaktivitet! Det kan ha varit en tjej- / killgrupp, ett läger eller ett internationellt ungdomsutbyte. Eller så har ni kanske ordnat ett musikarrangemang, skött ett café,

Läs mer

Idag. Hur vet vi att vår databas är tillräckligt bra?

Idag. Hur vet vi att vår databas är tillräckligt bra? Idag Hur vet vi att vår databas är tillräckligt bra? Vad är ett beroende? Vad gör man om det blivit fel? Vad är en normalform? Hur når man de olika normalformerna? DD1370 (Föreläsning 6) Databasteknik

Läs mer

Vetenskapliga begrepp. Studieobjekt, metod, resultat, bidrag

Vetenskapliga begrepp. Studieobjekt, metod, resultat, bidrag Vetenskapliga begrepp Studieobjekt, metod, resultat, bidrag Studieobjekt Det man väljer att studera i sin forskning Nära sammankopplat med syftet Kan vara (fysiska) ting och objekt: Datorspel, Affärssystem,

Läs mer

4-3 Vinklar Namn: Inledning. Vad är en vinkel?

4-3 Vinklar Namn: Inledning. Vad är en vinkel? 4-3 Vinklar Namn: Inledning I det här kapitlet skall du lära dig allt om vinklar: spetsiga, trubbiga och räta vinklar. Och inte minst hur man mäter vinklar. Att mäta vinklar och sträckor är grundläggande

Läs mer

Svenska Du kan med flyt läsa texter som handlar om saker du känner till. Du använder metoder som fungerar. Du kan förstå vad du läser.

Svenska Du kan med flyt läsa texter som handlar om saker du känner till. Du använder metoder som fungerar. Du kan förstå vad du läser. Svenska Du kan med flyt läsa texter som handlar om saker du känner till. Du använder metoder som fungerar. Du kan förstå vad du läser. Du berättar på ett enkelt sätt om det du tycker är viktigt i texten.

Läs mer

DEMOKRATI 3 DEMOKRATINS VILLKOR

DEMOKRATI 3 DEMOKRATINS VILLKOR SIDA 1/8 WORKSHOP I KLASSRUMMET TEMA: DEMOKRATI LÄRARMANUAL I det här dokumentet finns allt du behöver veta för att hålla workshopen. Här ser du också tydligt i vilka moment du använder det arbets- och

Läs mer

Systematiskt kvalitetsarbete

Systematiskt kvalitetsarbete Systematiskt kvalitetsarbete Rapport År: 2016 Organisationsenhet: NYEFSK/FSK Nye Förskola Fokusområde: Demokrati och värdegrund Övergripande mål: Normer och värden Deluppgift: Klassens kvalitetsrapport

Läs mer

Algebra, polynom & andragradsekvationer en pampig rubrik på ett annars relativt obetydligt dokument

Algebra, polynom & andragradsekvationer en pampig rubrik på ett annars relativt obetydligt dokument Algebra, polynom & andragradsekvationer en pampig rubrik på ett annars relativt obetydligt dokument Distributiva lagen a(b + c) = ab + ac 3(x + 4) = 3 x + 3 4 = 3x + 12 3(2x + 4) = 3 2x + 3 4 = 6x + 12

Läs mer

HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem

HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem HT 2011 FK2004 Tenta Lärare delen 4 problem 6 poäng / problem Problem 1 (6p) En undersökning utfördes med målet att besvara frågan Hur stor andel av den vuxna befolkningen i Sverige äger ett skjutvapen?.

Läs mer

Facit med lösningsförslag kommer att anslås på vår hemsida www.ebersteinska.norrkoping.se. Du kan dessutom få dem via e-post, se nedan.

Facit med lösningsförslag kommer att anslås på vår hemsida www.ebersteinska.norrkoping.se. Du kan dessutom få dem via e-post, se nedan. Detta häfte innehåller uppgifter från fyra olika områden inom matematiken. Meningen är att de ska tjäna som en självtest inför gymnasiet. Klarar du dessa uppgifter så är du väl förberedd inför gymnasiestudier

Läs mer

Varför är det så viktigt hur vi bedömer?! Christian Lundahl!

Varför är det så viktigt hur vi bedömer?! Christian Lundahl! Varför är det så viktigt hur vi bedömer?! Christian Lundahl! Fyra olika aspekter! Rättvisa! Reflektion och utvärdering av vår egen undervisning! Motivation för lärande! Metalärande (kunskapssyn)! 1. Rättvisa!

Läs mer

De två första korten Tidig position

De två första korten Tidig position De två första korten Tidig position Hold em är ett positionsspel, och förmodligen mer än någon annan form av poker. Det beror på att knappen anger spelarnas turordning under satsningsrundorna. (Enda undantaget

Läs mer

Så kan du arbeta med medarbetarenkäten. Guide för chefer i Göteborgs Stad

Så kan du arbeta med medarbetarenkäten. Guide för chefer i Göteborgs Stad Så kan du arbeta med medarbetarenkäten Guide för chefer i Göteborgs Stad Till dig som är chef i Göteborgs Stad Medarbetarenkäten är ett redskap för dig som chef. Resultaten levererar förstås inte hela

Läs mer

Snabbslumpade uppgifter från flera moment.

Snabbslumpade uppgifter från flera moment. Snabbslumpade uppgifter från flera moment. Uppgift nr Ställ upp och dividera utan hjälp av miniräknare talet 48 med 2 Uppgift nr 2 Skriv talet 3 8 00 med hjälp av decimalkomma. Uppgift nr 3 Uppgift nr

Läs mer

Tränarguide del 1. Mattelek. www.mv-nordic.se

Tränarguide del 1. Mattelek. www.mv-nordic.se Tränarguide del 1 Mattelek www.mv-nordic.se 1 ATT TRÄNA MED MATTELEK Mattelek är ett adaptivt träningsprogram för att träna centrala matematiska färdigheter såsom antalsuppfattning, den inre mentala tallinjen

Läs mer

SKTFs undersökningsserie om värdigheten inom äldreomsorgen. Vågar man bli gammal?

SKTFs undersökningsserie om värdigheten inom äldreomsorgen. Vågar man bli gammal? SKTFs undersökningsserie om värdigheten inom äldreomsorgen Vågar man bli gammal? Maj 2008 2 Inledning Huvudinriktningen för regeringens äldrepolitiska satsningar är att äldre personer och deras närstående

Läs mer

4-6 Trianglar Namn:..

4-6 Trianglar Namn:.. 4-6 Trianglar Namn:.. Inledning Hittills har du arbetat med parallellogrammer. En sådan har fyra hörn och motstående sidor är parallella. Vad händer om vi har en geometrisk figur som bara har tre hörn?

Läs mer

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer Innehåll 1 Punktskattning och kondensintervall Innehåll 1 Punktskattning och kondensintervall Population Punktskattning och kondensintervall Vi har en population vars någon mätbar egenskap X vi är intresserade

Läs mer

Nationella prov i årskurs 3 våren 2013

Nationella prov i årskurs 3 våren 2013 Utbildningsstatistik 1 (8) Nationella prov i årskurs 3 våren 2013 Syftet med de nationella proven är i huvudsak att dels stödja en likvärdig och rättvis bedömning och betygsättning i de årskurser där betyg

Läs mer

Boken om Teknik. Boken om Teknik är en grundbok i Teknik för åk 4 6.

Boken om Teknik. Boken om Teknik är en grundbok i Teknik för åk 4 6. Boken om Teknik Boken om Teknik är en grundbok i Teknik för åk 4 6. PROVLEKTION: Teknikens arbetssätt att göra på riktigt Följande provlektion är ett utdrag ur Boken om Teknik. Uppslaget som är hämtat

Läs mer

Handledning för digitala verktyg Talsyntes och rättstavningsprogram. Vital, StavaRex och SpellRight

Handledning för digitala verktyg Talsyntes och rättstavningsprogram. Vital, StavaRex och SpellRight Handledning för digitala verktyg Talsyntes och rättstavningsprogram Vital, StavaRex och SpellRight Elevens namn:.. Skola: Datum:.. Varför behövs en handledning? Denna handledning är tänkt att användas

Läs mer

Systematiskt kvalitetsarbete

Systematiskt kvalitetsarbete Systematiskt kvalitetsarbete Rapport Läsår: 2015/2016 Organisationsenhet: STENSFSK/FSK Stensåkra Förskola Fokusområde: Samverkan Cecilia Stenemo, Barn- och utbildningsförvaltningen, Stensåkra förskola,

Läs mer

GRUNDERNA I SJÄLVLEDARSKAP

GRUNDERNA I SJÄLVLEDARSKAP Bli ditt bästa jag GRUNDERNA I SJÄLVLEDARSKAP ANDREAS ODHAGE Innehåll Bli ditt bästa jag 5 Reflektera mera 9 Varför ska jag reflektera? 10 Meditation gör dig fokuserad 14 Balans i livet 17 Vad gör du egentligen?

Läs mer

Föräldrabroschyr. Björkhagens skola - en skola med kunskap och hjärta. Vad ska barnen lära sig i skolan?

Föräldrabroschyr. Björkhagens skola - en skola med kunskap och hjärta. Vad ska barnen lära sig i skolan? Föräldrabroschyr Björkhagens skola - en skola med kunskap och hjärta. Vad ska barnen lära sig i skolan? Vad ska barnen lära sig i skolan? Tanken med den här broschyren är att ge Er föräldrar en bild av

Läs mer

Repetitivt arbete ska minska

Repetitivt arbete ska minska Repetitivt arbete ska minska Ett repetitivt arbete innebär att man upprepar en eller några få arbetsuppgifter med liknande arbetsrörelser om och om igen. Ofta med ett högt arbetstempo. Ett repetitivt arbete

Läs mer

Ha det kul med att förmedla och utveckla ett knepigt område!

Ha det kul med att förmedla och utveckla ett knepigt område! Kul med pizzabitar Första gången eleverna får materialet i handen bör dem få sin egen tid till att undersöka det på det viset blir dem bekanta med dess olika delar. Det kan också vara en god idé att låta

Läs mer

Begreppet delaktighet inom rättspsykiatrisk vård

Begreppet delaktighet inom rättspsykiatrisk vård Begreppet delaktighet inom rättspsykiatrisk vård Mikael Selvin ¹, Kjerstin Almqvist ², Lars Kjellin ¹, Agneta Schröder ¹ 1) University Health Care Research Center, Faculty of Medicine and Health, Örebro

Läs mer

Resultat från nationella prov i årskurs 3, vårterminen 2014

Resultat från nationella prov i årskurs 3, vårterminen 2014 Enheten för utbildningsstatistik 2014-10-21 1 (8) Resultat från nationella prov i årskurs 3, vårterminen 2014 Syftet med de nationella proven är i huvudsak att dels stödja en likvärdig och rättvis bedömning

Läs mer

Cellgifter/Cytostatika Myter & Sanningar:

Cellgifter/Cytostatika Myter & Sanningar: Cellgifter/Cytostatika Myter & Sanningar: Illamående och kräkningar efter cellgiftsbehandling Frågor-&-Svar Broschyr Skriven av en patient Personlig information Namn: Adress: Postnummer: Postadress: Telefon:

Läs mer

VÄRDERINGSÖVNINGAR. Vad är Svenskt?

VÄRDERINGSÖVNINGAR. Vad är Svenskt? VÄRDERINGSÖVNINGAR Vad är Svenskt? Typ av övning: Avstamp till diskussion. Övningen belyser hur svårt det är att säga vad som är svenskt och att normen vad som anses vara svenskt ändras med tiden och utifrån

Läs mer

Enkätresultat för elever i åk 9 i Borås Kristna Skola i Borås hösten 2012. Antal elever: 20 Antal svarande: 19 Svarsfrekvens: 95% Klasser: Klass 9

Enkätresultat för elever i åk 9 i Borås Kristna Skola i Borås hösten 2012. Antal elever: 20 Antal svarande: 19 Svarsfrekvens: 95% Klasser: Klass 9 Enkätresultat för elever i åk 9 i Borås Kristna Skola i Borås hösten 2012 Antal elever: 20 Antal svarande: 19 Svarsfrekvens: 95% Klasser: Klass 9 Skolenkäten Skolenkäten går ut en gång per termin till

Läs mer

Trygg på arbetsmarknaden?

Trygg på arbetsmarknaden? Trygg på arbetsmarknaden? En jämförelse av svenska och danska ungdomars syn på arbetsmarknaden och framtiden Stefan Persson September 2009 Rapport framtagen av: RHETIKFABRIKEN Stefan Persson Verksamhetsansvarig

Läs mer

Pesach Laksman är lärarutbildare i matematik och matematikdidaktik vid Malmö högskola.

Pesach Laksman är lärarutbildare i matematik och matematikdidaktik vid Malmö högskola. 111a Geometri med snöre Pesach Laksman är lärarutbildare i matematik och matematikdidaktik vid Malmö högskola. Areabegreppet När elever får frågan vad area betyder ges mestadels svar som antyder hur man

Läs mer

När jag har arbetat klart med det här området ska jag:

När jag har arbetat klart med det här området ska jag: Kraft och rörelse När jag har arbetat klart med det här området ska jag: kunna ge exempel på olika krafter och kunna använda mina kunskaper om dessa när jag förklarar olika fysikaliska fenomen, veta vad

Läs mer

Särskilt stöd i grundskolan

Särskilt stöd i grundskolan Enheten för utbildningsstatistik 15-1-8 1 (1) Särskilt stöd i grundskolan I den här promemorian beskrivs Skolverkets statistik om särskilt stöd i grundskolan läsåret 1/15. Sedan hösten 1 publicerar Skolverket

Läs mer

Invandrarföretagare om att starta, driva och expandera företagande i Sverige

Invandrarföretagare om att starta, driva och expandera företagande i Sverige Invandrarföretagare om att starta, driva och expandera företagande i Sverige 29 november 2001 Arne Modig T22502 Invandrarföretagare om att starta, driva och expandera företag i Sverige Svenskt Näringsliv

Läs mer

2005-01-31. Hävarmen. Peter Kock

2005-01-31. Hävarmen. Peter Kock 2005-01-31 Hävarmen Kurs: WT0010 Peter Kock Handledare: Jan Sandberg Sammanfattning Om man slår upp ordet hävarm i ett lexikon så kan man läsa att hävarm är avståndet mellan kraften och vridningspunkten.

Läs mer

Något om permutationer

Något om permutationer 105 Något om permutationer Lars Holst KTH, Stockholm 1. Inledning. I många matematiska resonemang måste man räkna antalet fall av olika slag. Den del av matematiken som systematiskt studerar dylikt brukar

Läs mer

912 Läsförståelse och matematik behöver man lära sig läsa matematik?

912 Läsförståelse och matematik behöver man lära sig läsa matematik? 912 Läsförståelse och matematik behöver man lära sig läsa matematik? Med utgångspunkt från min egen forskning kring läsförståelse av matematiska texter kommer jag att diskutera olika aspekter av läsning

Läs mer

Introduktion till Open 2012

Introduktion till Open 2012 Introduktion till Open 2012 av Lisbeth Rydén Funktionen med OPEN som jag ser den Alla har sin egen idé med att åka till OPEN. Någon framförallt för att lära sig något om de ämnen som ska avhandlas (kurs),

Läs mer

Volymer av n dimensionella klot

Volymer av n dimensionella klot 252 Volymer av n dimensionella klot Mikael Passare Stockholms universitet Ett klot med radien r är mängden av punkter vars avstånd till en given punkt (medelpunkten) är högst r. Låt oss skriva B 3 (r)

Läs mer

Sammanfatta era aktiviteter och effekten av dem i rutorna under punkt 1 på arbetsbladet.

Sammanfatta era aktiviteter och effekten av dem i rutorna under punkt 1 på arbetsbladet. Guide till arbetsblad för utvecklingsarbete Arbetsbladet är ett verktyg för dig och dina medarbetare/kollegor när ni analyserar resultatet från medarbetarundersökningen. Längst bak finns en bilaga med

Läs mer

Sektionen för Beteendemedicinsk smärtbehandling

Sektionen för Beteendemedicinsk smärtbehandling Sektionen för Beteendemedicinsk smärtbehandling Karolinska Universitetssjukhuset Solna Smärtcentrum Sektionen för Beteendemedicinsk smärtbehandling tar emot patienter med långvarig och svårbehandlad smärta

Läs mer

MR 5 FRÅN FÖRBUD TILL RÄTTIGHET WORKSHOP I KLASSRUMMET TEMA: MÄNSKLIGA RÄTTIGHETER (MR)

MR 5 FRÅN FÖRBUD TILL RÄTTIGHET WORKSHOP I KLASSRUMMET TEMA: MÄNSKLIGA RÄTTIGHETER (MR) SIDA 1/7 WORKSHOP I KLASSRUMMET TEMA: MÄNSKLIGA RÄTTIGHETER (MR) LÄRARMANUAL I det här dokumentet finns allt du behöver veta för att hålla workshopen. Här ser du också tydligt i vilka moment du använder

Läs mer

Skillnaden mellan betygsresultat på nationella prov och ämnesbetyg i årskurs 9, läsåret 2010/11

Skillnaden mellan betygsresultat på nationella prov och ämnesbetyg i årskurs 9, läsåret 2010/11 Utbildningsstatistik 2011-12-08 1 (20) Dnr Skillnaden mellan betygsresultat på nationella prov och ämnesbetyg i årskurs 9, läsåret 2010/11 Skolverket publicerar i SIRIS, Skolverkets internetbaserade resultat-

Läs mer

Laborativ matematik som bedömningsform. Per Berggren och Maria Lindroth 2016-01-28

Laborativ matematik som bedömningsform. Per Berggren och Maria Lindroth 2016-01-28 Laborativ matematik som bedömningsform Per Berggren och Maria Lindroth 2016-01-28 Kul matematik utan lärobok Vilka förmågor tränas Problemlösning (Förstå frågan i en textuppgift, Använda olika strategier

Läs mer

Disclosure. SOMP-I skapades av Kristina Persson. SOMP-I ägs av Barnens rörelsebyrå Kristina Persson & Kine Johansen är delägare i företaget

Disclosure. SOMP-I skapades av Kristina Persson. SOMP-I ägs av Barnens rörelsebyrå Kristina Persson & Kine Johansen är delägare i företaget Disclosure SOMP-I skapades av Kristina Persson SOMP-I ägs av Barnens rörelsebyrå Kristina Persson & Kine Johansen är delägare i företaget Fördelen med standardiserade metoder Mer information jämfört med

Läs mer

Sid. 87-99 i boken Rekrytering. Författare Annica Galfvensjö, Jure Förlag

Sid. 87-99 i boken Rekrytering. Författare Annica Galfvensjö, Jure Förlag Sid. 87-99 i boken Rekrytering Författare Annica Galfvensjö, Jure Förlag Nedan finner du en intervjuguide med förslag på frågor som du kan använda under intervjun. Det är många frågor så välj de du tycker

Läs mer

SOLCELLSBELYSNING. En praktisk guide. Råd & Tips SOLENERGI LADDA MED. Praktiska SÅ TAR DU BÄST HAND OM DIN SOLCELLSPRODUKT

SOLCELLSBELYSNING. En praktisk guide. Råd & Tips SOLENERGI LADDA MED. Praktiska SÅ TAR DU BÄST HAND OM DIN SOLCELLSPRODUKT SOLCELLSBELYSNING En praktisk guide LADDA MED SOLENERGI Praktiska Råd & Tips SÅ TAR DU BÄST HAND OM DIN SOLCELLSPRODUKT Kom igång med 3 solenergi fördelar med Solcell Mi l jö vä n l i g t Enkelt Praktiskt

Läs mer

Tankar om elevtankar. HÖJMA-projektet

Tankar om elevtankar. HÖJMA-projektet Tankar om elevtankar HÖJMA-projektet JAN UNENGE I förra numret av NÄMNAREN påbörjades en redogörelse från ett intressant forsknings- och utvecklingsarbete vid Lärarhögskolan i Jönköping. Den artikeln behandlade

Läs mer

Kapitel 6. f(x) = sin x. Figur 6.1: Funktionen sin x. 1 Oinas-Kukkonen m.fl. Kurs 6 kapitel 1

Kapitel 6. f(x) = sin x. Figur 6.1: Funktionen sin x. 1 Oinas-Kukkonen m.fl. Kurs 6 kapitel 1 Kapitel 6 Gränsvärde 6. Definition av gränsvärde När vi undersöker gränsvärdet av en funktion undersöker vi vad som händer med funktionsvärdet då variabeln, x, går mot ett visst värde. Frågeställningen

Läs mer

NATIONELLA MATEMATIKTÄVLING

NATIONELLA MATEMATIKTÄVLING NATIONELLA MATEMATIKTÄVLING PRATA OM SPELS EN KURS I SANNOLIKHET 1 INLEDNING Sannolikhetskursen består av sju olika steg där det sista steget utgörs av själva tävlingsmomentet. Det är upp till pedagogen

Läs mer

Syftet med en personlig handlingsplan

Syftet med en personlig handlingsplan Syftet med en personlig handlingsplan Gör idéerna konkreta Ger dig något att hålla dig till mellan mötena Skapar tillförlitlighet i utvecklingen Hjälper dig att fokusera på några områden Påminnelse om

Läs mer

Avsikt På ett lekfullt sätt färdighetsträna, utveckla elevers känsla för hur vårt talsystem är uppbyggt samt hitta mönster som uppkommer.

Avsikt På ett lekfullt sätt färdighetsträna, utveckla elevers känsla för hur vårt talsystem är uppbyggt samt hitta mönster som uppkommer. Strävorna 4A 100-rutan... förmåga att förstå, föra och använda logiska resonemang, dra slutsatser och generalisera samt muntligt och skriftligt förklara och argumentera för sitt tänkande.... grundläggande

Läs mer

Enkätresultat för elever i år 2 i Nösnäsgymnasiet 2 i Stenungsund våren 2014

Enkätresultat för elever i år 2 i Nösnäsgymnasiet 2 i Stenungsund våren 2014 Enkätresultat för elever i år 2 i Nösnäsgymnasiet 2 i Stenungsund våren 2014 Antal elever: 47 Antal svarande: 40 Svarsfrekvens: 85% Klasser: 12BAa, 12BAb, 12LL Skolenkäten Skolenkäten går ut en gång per

Läs mer

Vanliga frågor. LEGOeducation.com. Konceptet. Processen

Vanliga frågor. LEGOeducation.com. Konceptet. Processen LEGOeducation.com Vanliga frågor Konceptet Fråga: Hur ska jag förklara vad LEGO Education BuildToExpress är för mina chefer och för elevernas föräldrar? De tror att eleverna bara leker med LEGO! Svar:

Läs mer

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Stella Nova förskola

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Stella Nova förskola Sundbybergs stad Skolundersökning 2 Föräldrar förskola Stella Nova förskola Antal svar Stella Nova förskola: 2 ( %) Antal svar samtliga fristående förskolor: (5 %) 1 Innehåll Om undersökningen Förklaring

Läs mer

Riktlinjer - Rekryteringsprocesser inom Föreningen Ekonomerna skall vara genomtänkta och välplanerade i syfte att säkerhetsställa professionalism.

Riktlinjer - Rekryteringsprocesser inom Föreningen Ekonomerna skall vara genomtänkta och välplanerade i syfte att säkerhetsställa professionalism. REKRYTERINGSPOLICY Upprättad 2016-06-27 Bakgrund och Syfte Föreningen Ekonomernas verksamhet bygger på ideellt engagemang och innehar flertalet projekt där såväl projektledare som projektgrupp tillsätts

Läs mer

Utvärdering APL frågor till praktikant

Utvärdering APL frågor till praktikant Utvärdering APL frågor till praktikant Jag studerar på A. Vård och Omsorgsprogrammet för 0 0 ungdomar åk 1 B. Vård och Omsorgsprogrammet för 1 1,9 ungdomar åk 2 C. Vård och Omsorgsprogrammet för 8 15,4

Läs mer

Enkätresultat för elever i år 2 i Praktiska Skövde i Praktiska Sverige AB hösten 2014

Enkätresultat för elever i år 2 i Praktiska Skövde i Praktiska Sverige AB hösten 2014 Enkätresultat för elever i år 2 i Praktiska Skövde i Praktiska Sverige AB hösten 2014 Antal elever: 18 Antal svarande: 13 Svarsfrekvens: 72% Klasser: År 2 Skolenkäten Skolenkäten går ut en gång per termin

Läs mer

Enkätresultat för elever i år 2 i Mega Musik gymnasium hösten 2014. Antal elever: 47 Antal svarande: 46 Svarsfrekvens: 98% Klasser: MM13

Enkätresultat för elever i år 2 i Mega Musik gymnasium hösten 2014. Antal elever: 47 Antal svarande: 46 Svarsfrekvens: 98% Klasser: MM13 Enkätresultat för elever i år 2 i Mega Musik gymnasium hösten 2014 Antal elever: 47 Antal svarande: 46 Svarsfrekvens: 98% Klasser: MM13 Skolenkäten Skolenkäten går ut en gång per termin till de skolor

Läs mer

Manpower Work Life: 2014:1. Manpower Work Life. Rapport 2014. Mångfald på jobbet

Manpower Work Life: 2014:1. Manpower Work Life. Rapport 2014. Mångfald på jobbet Manpower Work Life: 2014:1 Manpower Work Life Rapport 2014 Mångfald på jobbet MÅNGFALD PÅ JOBBET Mångfald diskuteras ständigt i media, men hur ser det egentligen ut på Sveriges arbetsplatser? Hur ser svenska

Läs mer

Manual för Min sida 1/9. 2011-05-26 rev 2011-09-02

Manual för Min sida 1/9. 2011-05-26 rev 2011-09-02 1/9 2011-05-26 rev 2011-09-02 Manual för Min sida Introduktion... 2 Hur länge finns Min sida kvar?... 2 Vad kan jag publicera på Min sida?... 2 Inloggning... 2 Redigera personliga uppgifter... 3 Redigera

Läs mer

Kvinnor som driver företag pensionssparar mindre än män

Kvinnor som driver företag pensionssparar mindre än män Pressmeddelande 7 september 2016 Kvinnor som driver företag pensionssparar mindre än män Kvinnor som driver företag pensionssparar inte i lika hög utsträckning som män som driver företag, 56 respektive

Läs mer

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Datorövning 2 Statistik med Excel (Office 2007, svenska) Datorövning 2 Statistik med Excel (Office 2007, svenska) Denna datorövning fokuserar på att upptäcka samband mellan två variabler. Det görs genom att rita spridningsdiagram och beräkna korrelationskoefficienter

Läs mer

Intervjumall. Datum: Intervjuare: Kandidatens namn: Kandidatens uppgifter: www.roirekrytering.se info@roirekrytering.se Växel: 0770 110 177 1 (5)

Intervjumall. Datum: Intervjuare: Kandidatens namn: Kandidatens uppgifter: www.roirekrytering.se info@roirekrytering.se Växel: 0770 110 177 1 (5) Intervjumall Datum: Intervjuare: Kandidatens namn: Kandidatens uppgifter: www.roirekrytering.se info@roirekrytering.se Växel: 0770 110 177 1 (5) Intervju Att hålla i en anställningsintervju kan vara svårt.

Läs mer

Abstrakt. Resultat. Sammanfattning.

Abstrakt. Resultat. Sammanfattning. Abstrakt Bakgrund. Inom idrotten strävar många atleter att förbättra sin maximala förmåga i styrka i ett antal övningar med olika redskap. Min frågeställning har varit: Kan en pension på 66 år förbättra

Läs mer

85 % produkterna som annonseras. har köpt något de läst om i tidningen. ANNONSFAKTA & PRISLISTA 2016

85 % produkterna som annonseras. har köpt något de läst om i tidningen. ANNONSFAKTA & PRISLISTA 2016 ANNONSFAKTA & PRISLISTA 2016 Nordens största hälsomagasin och en av Sveriges 10 största tidningar alla kategorier. NU ÄNNU STÖRRE UPPLAGA: +50 000 EX! TOPPBETYG FÖR LIVE LIFE I SENASTE SKOP-UNDERSÖKNINGEN:

Läs mer

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Fristående förskolor totalt 2015. Antal svar samtliga fristående förskolor: 360 (57 %)

Sundbybergs stad Skolundersökning 2015 Föräldrar förskola Fristående förskolor totalt 2015. Antal svar samtliga fristående förskolor: 360 (57 %) Sundbybergs stad Skolundersökning Föräldrar förskola Antal svar samtliga fristående förskolor: ( %) Innehåll Om undersökningen Förklaring av diagram Resultat - Per fråga - NöjdKundIndex (NKI) Frågorna

Läs mer

FRÅN A TILL Ö LäraMera Ab / www.laramera.se och Allemansdata Ab / www.allemansdata.se FRÅN A TILL Ö

FRÅN A TILL Ö LäraMera Ab / www.laramera.se och Allemansdata Ab / www.allemansdata.se FRÅN A TILL Ö I programmet finns 11 olika aktiviteter för att träna varje bokstav och på att känna igen ord. För varje bokstav kan olika övningsblad skrivas ut: Inledningsvis väljer du vilken bokstav du vill öva på.

Läs mer

Programmera en NXT Robot

Programmera en NXT Robot KUNGLIGA TEKNISKA HÖGSKOLAN Programmera en NXT Robot Med hjälp utav NXC Peyman Torabi 2012-09-03 E-post: peymant@kth.se Introduktionskurs i datateknik (II1310) Sammanfattning Uppgiften var att analysera

Läs mer

Lathund till Annonsportalen

Lathund till Annonsportalen Lathund till Annonsportalen * För uppdrags-/arbetsgivare * www.gu.se/samverkan/annonsportalen/ Snabbvägar: 1. Klicka på För arbetsgivare 2. Sök efter arbetsgivarens namn i sökrutan. a. Om namnet finns

Läs mer

Det är bra om även distriktsstyrelsen gör en presentation av sig själva på samma sätt som de andra.

Det är bra om även distriktsstyrelsen gör en presentation av sig själva på samma sätt som de andra. Modul: Föreningspresentation Ett stort blädderblocksblad delas upp i fyra rutor. Deltagarna, som under detta pass är indelade föreningsvis, får i uppgift att rita följande saker i de fyra rutorna: Föreningsstyrelsen

Läs mer

Rapport Agilityverksamhetens framtid

Rapport Agilityverksamhetens framtid Rapport Agilityverksamhetens framtid Sammanfattning Enkäten om agilityverksamhetens framtid genomfördes mellan den 25 januari 2013 och 20 februari 2013 på initiativ av AG agilityns framtid. Populationen

Läs mer

Random Indexing för vektorbaserad semantisk analys

Random Indexing för vektorbaserad semantisk analys Random Indexing för vektorbaserad semantisk analys ScandSum 23 Vektorbaserad semantisk analys Ord (-betydelser) som vektorer i en mångdimensionell rymd y gitarr luta ScandSum 23 x tuba Vektorbaserad semantisk

Läs mer

Datorövning 3: Icke-parametriska test

Datorövning 3: Icke-parametriska test Datorövning 3: Icke-parametriska test Under denna datorövning ska ni lära er hur man använder Minitab för att utföra icke-parametriska test. De test ni går igenom under denna kurs är Wilcoxsons rangsummetest,

Läs mer

Aktiv väntan asylsökande i Sverige (SOU 2009:19)

Aktiv väntan asylsökande i Sverige (SOU 2009:19) Till: Justitiedepartementet 103 33 Stockholm REMISSYTTRANDE Aktiv väntan asylsökande i Sverige (SOU 2009:19) SABOs synpunkter Inledning SABO har i tidigare remissyttranden, senast över betänkandet Försörjningskrav

Läs mer

KOMMUNIKATIONSBAROMETERN för företag ATT JOBBA HEMIFRÅN. Rapport september 2003. 1

KOMMUNIKATIONSBAROMETERN för företag ATT JOBBA HEMIFRÅN. Rapport september 2003. 1 KOMMUNIKATIONSBAROMETERN för företag ATT JOBBA HEMIFRÅN Rapport september 2003. 1 Välkommen till Telias kommunikationsbarometer för företag Telias kommunikationsbarometer för företag är en återkommande

Läs mer

Kulturmöten. Det var vi som gjorde det.

Kulturmöten. Det var vi som gjorde det. Fröknegårdskolan Kristianstad Projektarbete inom ITiS Cederfjäll Tonny, Hedin Håkan, Sandgren Bo, Svensson Fredrik Kulturmöten Det var vi som gjorde det. Inledning Hösten 1999 började 54 nya årskurs 6-

Läs mer

FOLKUNIVERSITETET 1 (11) Bildmanér för Webb3. Vår referens: Fredrik Suter Version 1. Stockholm 2010.04.08

FOLKUNIVERSITETET 1 (11) Bildmanér för Webb3. Vår referens: Fredrik Suter Version 1. Stockholm 2010.04.08 FOLKUNIVERSITETET Bildmanér för Webb3 Vår referens: Fredrik Suter Version 1. Stockholm 2010.04.08 Ringvägen 100 SE-118 60 Stockholm Tel +46 (0)8 501 103 00 www.ottoboni.se 1 (11) I korthet Ett viktigt

Läs mer

L(9/G)MA10 Kombinatorik och geometri Gruppövning 1

L(9/G)MA10 Kombinatorik och geometri Gruppövning 1 L(9/G)MA10 Kombinatorik och geometri Gruppövning 1 Lisa och Pelle leker med svarta och vita byggklossar. Deras pedagogiska föräldrar vill att de lär sig matematik samtidigt som de håller på och leker.

Läs mer

Referensvärden samtliga undergrupper

Referensvärden samtliga undergrupper Brukarenkät Utförare IFO-FH 214 Referensvärden samtliga undergrupper 214 2 Samtliga undergrupper Lägsta värde Högsta värde HELHET, NKI 8-76 7 1 TILLGÄNGLIGHET 84-79 7 1 EFFEKTIVITET 87-8 28 1 INFORMATION

Läs mer

Sammanfattning på lättläst svenska

Sammanfattning på lättläst svenska Sammanfattning på lättläst svenska Utredningen skulle utreda och lämna förslag i vissa frågor som handlar om svenskt medborgarskap. Svenskt medborgarskap i dag Vissa personer blir svenska medborgare när

Läs mer

Energi & Miljötema Inrikting So - Kravmärkt

Energi & Miljötema Inrikting So - Kravmärkt Energi & Miljötema Inrikting So - Kravmärkt 21/5 2010 Sofie Roxå 9b Handledare Torgny Roxå Mentor Fredrik Alven 1 Innehållsförteckning Inledning s. 3 Bakgrund s. 3 Syfte s. 3 Hypotes s. 3 Metod s. 4 Resultat

Läs mer

Referensvärden samtliga resultatenheter

Referensvärden samtliga resultatenheter Brukarenkät Utförare IFO-FH 2 Referensvärden samtliga resultatenheter 2 3 Samtliga resultatenheter Lägsta värde Högsta värde HELHET, NKI - 78 55 94 TILLGÄNGLIGHET 61-78 59 92 EFFEKTIVITET 64-81 55 95 INFORMATION

Läs mer

Elektronen och laddning

Elektronen och laddning Detta är en något omarbetad version av Studiehandledningen som användes i tryckta kursen på SSVN. Sidhänvisningar hänför sig till Quanta A 2000, ISBN 91-27-60500-0 Där det har varit möjligt har motsvarande

Läs mer

Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) 2012-01-09 kl 08-13

Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) 2012-01-09 kl 08-13 LINKÖPINGS UNIVERSITET MAI Johan Thim Tentamen i matematisk statistik (9MA241/9MA341/LIMAB6, STN2) 212-1-9 kl 8-13 Hjälpmedel är: miniräknare med tömda minnen och formelbladet bifogat. Varje uppgift är

Läs mer

Guide för att hitta markavvattningssamfälligheter och täckdikningsplaner

Guide för att hitta markavvattningssamfälligheter och täckdikningsplaner 1(8) Guide för att hitta markavvattningssamfälligheter och täckdikningsplaner Framtagen av Magdalena Nyberg, Jordbruksverket, 2016 Markavvattningssamfälligheter Inför en Grepparådgivning är det bra om

Läs mer

Nämnarens adventskalendern 2007

Nämnarens adventskalendern 2007 Nämnarens adventskalendern 2007 1 När det närmar sig jul är det kallt. Då behöver de tre tomtenissarna både halsduk och mössa när de leker i snön. I korgen ligger en röd, en blå och en randig halsduk.

Läs mer

Träning i bevisföring

Träning i bevisföring KTHs Matematiska Cirkel Träning i bevisföring Andreas Enblom Institutionen för matematik, 2005 Finansierat av Marianne och Marcus Wallenbergs Stiftelse 1 Mängdlära Här kommer fyra tips på hur man visar

Läs mer

Virkade tofflor. Storlek 35 37 & 38 40. By: Pratamedrut. pratamedrut.se/blog/virkade tofflor 1

Virkade tofflor. Storlek 35 37 & 38 40. By: Pratamedrut. pratamedrut.se/blog/virkade tofflor 1 Virkade tofflor Storlek 35 37 & 38 40 By: Pratamedrut pratamedrut.se/blog/virkade tofflor 1 Innehåll Lite tips sid 3 Material sid 3 Maskor och förkortningar sid 3 Tillvägagångssätt Sulor sid 4 Skor, nedre

Läs mer