Korpusanalyser och Lab G09 Språkvetenskaplig databehandling
|
|
- Charlotta Vikström
- för 7 år sedan
- Visningar:
Transkript
1 Korpusanalyser och Lab 4 729G09 Språkvetenskaplig databehandling
2 Laborationens syfte Öva användningen av webbaserade korpusar och korpusverktyg frekvensberäkningar konkordanser kollokationsverktyg Ge insikter om hur korpusar kan användas för undersökningar av språkbruk och kulturella värderingar i språkbruket.
3 Kvantitativ analys vid korpusarbete Räkna och jämföra frekvenser absoluta frekvenser relativa frekvenser Hitta oväntade händelser samförekomstmått Rangordna, t.ex. efter frekvens eller samförekomstmått
4 Kvalitativa analyser Viktigt att veta vad vi räknar Ordtyper, Lemman, Ordklassetiketter, Se upp för flertydiga ord! man som pronomen vs. man som nomen Gruppera data i (relevanta) kategorier Tolka data (med omdöme och försiktighet) Förklaringarna finns inte i korpusen!
5 lemgram-sökning i Korp ger träffar även på mannen, män,...
6 Frekvensstatistik i Korp absolut frekvens relativ frekvens (antal / miljon)
7 Information om valda korpusar (inkl. antal tokens)
8 Relativ frekvens Relativ frekvens (eller proportion) för ett ord/fras i en korpus beräknas med f/n där f är den absoluta frekvensen för ordet, och N är det totala antalet ord i korpusen. För stora N är relativ frekvens en vanlig uppskattning av sannolikheten för ett visst ord.
9 Jämföra frekvenser Olikheter i frekvens kan visa på olikheter i språkbruk, t.ex. vad gäller genrer kön epok Därför är det viktigt att bestämma om skillnaden är slumpmässig eller signifikant. Ofta kan signifikans avgöras med ögat, men i svårare fall kan man använda signifikanstest.
10 Signifikanstest Signifikanstest är statistiska test som ger oss information om hur säker vi kan vara på en viss slutsats, I korpusanalyser t.ex. slutsatser av typen... observerade frekvenser talar emot hypotesen att två ord används lika mycket i olika genrer, eller vid olika tidpunkter observerade frekvenser talar emot hypotesen att ett ordpar t.ex. blå ögon eller nytt program utgör en kollokation
11 Ett exempel Vilka av de tre engelska orden diary, novel och story är vanligast? Är dessa ord lika vanliga idag som för femtio år sedan?
12 Plottade frekvenser från Google ngrams ( ) story novel diary
13 Relativa frekvenser 1950 vs 2000 (från Google books) diary novel story , , , , , , Hur avgöra om ökningen för orden är signifikant?
14 Signifikanstest t-test, antar underliggande normalfördelning χ 2 -test mutual information (MI) Alla test bygger på idén att ett beräknat värde jämförs med ett teoretiskt värde, som utgår från en antagen nollhypotes. Om avvikelsen är större än ett tröskelvärde kan vi dra slutsatsen att den alternativa hypotesen är korrekt med en viss sannolikhet.
15 χ 2 -test (Chi-squre) χ 2 -test O ij står för observerade värden E ij står för förväntade värden Förväntade värden kan beräknas utifrån ett antagande om att korpusarna är dragna från samma population χ 2 = Σ (O ij E ij ) 2 / E ij i,j
16 Chi-2 tillämpat på exemplet (en term) diary story O = 164, E = 154, (O-E) 2 = 10 2 = 100 χ 2 = 100/154 0,65 O = 1780, E = 1510, (O-E) 2 = = χ 2 = 72900/ Tröskelvärdet för χ 2 med ett 95%-igt signifikansområde och en frihetsgrad är 3,841 χ 2 = (O E) 2 / E
17 Att jämföra alternativa ordformer Exempel 1: ska ~ skall Observerade värden (O ij ) (Data från Språkbankens tidningskorpusar) ska skall N Press ,000 Press ,239,000 Totals ,230,000
18 Signifikans Om vi har många observationer och stora skillnader I relativ frekvens, (eller relativ kvot) kan vi vara säkra på att skillnaden är signifikant. I Press 65 är förhållandet mellan ska och skall ca 1:6. I Press 98 är förhållandet ca 2:1 Vi kan med säkerhet säga att användningen av ska och skall skiljer sig åt mellan korpusarna. En annan sak är att förklara den.
19 Att jämföra alternativa ordformer Exempel 2: rom ~ zigenare Hur kan vi besvara följande frågor med korpusar? När började tidningar använda ordet rom? När blev rom vanligare än zigenare?
20 Kollokationer När två eller flera ord tenderar att samförekomma oftare än vad man kan förvänta sig talar vi om en kollokation. Ett samförekomstmått ger ett mätvärde för samförekomst. Sådana mått utgår ofta från en fyrfältstabell och korpusstorleken N: ord2 annat ord ord1 a b annat ord c d a: antal förekomster av paret 'ord1 ord2' a+b: antal förekomster av ord1 a+c: antal förekomster av ord2
21 Kollokationer Om a är stort i jämförelse med en kombination av alla parametrar kan vi dra slutsatsen att vi har en kollokation. Förväntad förekomst vid oberoende: (a+b)*(a+c)/n 2 p(ord1)p(ord2) Enkelt mått: Dice = 2a/(2a+b+c) ord2 annat ord ord1 a b annat ord c d
22 Kollokationer Med t.ex. χ 2 kan vi undersöka om en kollokation är statistiskt signifikant, men man vill också ha mått som genererar kollokationer. Ett sådant mått är Pointwise Mutual Information (I). I(x,y) = log 2 [p(x,y) / p(x)p(y)] I blir stort om x och y samförekommer ofta I ligger nära 0 om X och Y samförekommer slumpartat p(x) uppskattas med relativa frekvensen för ordet x (a+b)/n p(y) uppskattas med relativa frekvensen för ordet y (a+c)/n p(x,y) uppskattas med relativa frekvensen för samförekomster av x och y: a/n
23 BYU search panel Mutual information används här som mått på relevans sorteringsordning för träffar
24 'blue N' jämfört med 'green N' i BYU Corpus of American English
25 Kollokationer I BYU-systemet kallas ordning efter samförekomstmått för relevans. Jämför t.ex (data från SUC, N = ca 1,000,000) blå ögon, 3 förekomster, p = 0, blå, 67 förekomster, p = 0, ögon, 130 förekomster p = 0, p(blå ögon) = om oberoende antas = 0, , dvs förväntad förekomst 0. I(blå,ögon) = log (0, / 0, ) = log (3000 / 8,7) log 345 8,3
26 Om skillnader mellan vad som sägs och vad som antyds (eller tas för givet) Sverige har fällts i Europadomstolen för mänskliga rättigheter för MR-kränkningar hela 47 gånger under perioden ECB vägrar inse att portugisiska statspapper är skräp. Illegala invandrare får billigare sjukvård än svenska pensionärer.
27 Om skillnader mellan vad som sägs och vad som antyds Jämför (från Hunston, sid 115). Several firms have closed their factories Factories have been closed Factories have closed A writer who consistently chooses the intransitive option in examples such as these presents economic events as if they were natural events, outside human control. A writer who consistently chooses the transitive, action option tends to stress the responsibility borne by people who take decisions to do things like close factories.
28 Upprepning kan antas förstärka våra uppfattningar Marknaden reagerade positivt på Europeiska centralbankens besked om räntesänkning.
29 Om ideologiska och kulturella drag (Hunston) Inom s.k. kritisk lingvistik studeras relationen mellan språk och ideologi: särskilt språkets roll för att forma och överföra antaganden om hur världen är och borde vara, samt språkets roll för att upprätthålla (eller utmana) befintliga maktrelationer. (Susan Hunston, Corpora in Applied Linguistics, p. 109) Två antaganden: Det finns föreställningar som finns kodade implicit, bakom faktiska påståenden. Det går att utmana givna föreställningar genom att peka ut att någonting skulle kunna representerats på något annat sätt, med en annan innebörd.
30 Ideologi i specialiserade korpusar partiprogram, tidningsledare, politiska tal, inlägg från lobbyorganisationer etc. nyckelord sätts -- medvetet eller omedvetet -- i sammanhang som ger dem en viss semantisk prosodi den siste brittiske Hongkongguvernören Pattens tal präglades av en positiv prosodi för ord som individ och individuell, liksom för orden economy-economic (positiva sammanhang och samförekommer med choice, freedom, fairness, cherfulness, growth, good health ) (många fler exempel i Hunstons artikel)
31 Semantisk prosodi Om ett ord har flera kollokationer där det andra ordet ofta tillhör en viss semantisk kategori talar man om semantisk prosodi. Exempel kan vara... negativa vs. positiva värderingar, framgång vs. motgång, styrka vs. svaghet, fest vs. vardag
32 Ideologi i allmänna korpusar Allmänna korpusar som studieobjekt Arkiv med kulturell och ideologisk information Stubbs kulturella nyckelord: The main concept is that words occur in characteristic collocations, which show the associations and connotations they have, and therefore the assumptions which they embody. Illegal immigrant Intellectual, blind, deaf rent beskrivande eller värderande?
33 Laboration 4 Uppgiften är att undersöka och jämföra användningen av ord som refererar till kön, dvs. ord som hon/han, kvinna/man, flicka/pojke, manlig/kvinnlig, etc. kvantifiera och beskriva sådana skillnader, och söka förklaringar Uppgiften omfattar både svenska och engelska Uppgift 1: frekvensanalys, Uppgift 2: kollokationer, Uppgift 3: ordningen I samordningar VG-uppgift: när framhävs könet (kvinnlig vd vs. manlig vd)?
34 Laboration 4: Verktyg För svenska Korp För engelska Mark Davies webbsystem (BYU) American corpus BNC (British National Corpus) Google Ngrams OBS! Alla dessa finns på webben!
35 Uppgift 1. Frekvenssökningar och genreskillnader Har orden han, hon, ungefär samma frekvens i (a) bloggtexter, (b) generellt? Om det finns skillnader, är de signifikanta? Finns det skillnader över tid? Hur används ordet hen?
36 Uppgift 2. Kollokationer Finns det egenskaper som i språket oftare kopplas till manligt än kvinnligt (och tvärtom)? Undersök både amerikansk och brittisk engelska Använd möjligheterna till kontextvillkor och relevansrankning i BYU
37 Tips för uppgift 2 Fokusera på adjektiv (som typiska ord för egenskaper). Försök gruppera resultaten i olika semantiska kategorier. T.ex. ålder utseende etnicitet (ursprung) positiva egenskaper negativa egenskaper Finns det några mönster? Gör en djupare undersökning av någon hypotes om mönster.
38 Uppgift 3. Ordningen i samordningar När vi refererar individer av båda könen använder vi samordningar som män och kvinnor, (men and women) flickor och pojkar, (girls and boys) pappa och mamma, (father and mother), Uppgiften är att undersöka sådana samordningar och se om det finns mönster när det gäller ordningen mellan det manliga och det kvinnliga ordet. Är ordningen slumpmässig eller väljs det ena regelmässigt före det andra? Uppför sig alla sådana samordningar likadant när det gäller vilket kön som kommer först? Om det finns skillnader, kan de förklaras?
39 Några tips för uppgift 3. I Korp använder man utökad sökning för att söka på ordsekvenser I BYU kan man söka på alla varianter på en gång genom att använda hakparenteser: [girl] and [boy] betyder att sökmotorn söker efter alla böjningsvarianter av girl och boy
40 VG-uppgift. När framhävs någon som kvinnlig eller manlig? Det här är en fri uppgift där vi vill att ni försöker fundera över uttryck som: kvinnlig VD/manlig VD kvinnlig hockeyspelare/manlig hockeyspelare manlig förskollärare/kvinnlig förskollärare tvåbarnsmamma/tvåbarnspappa kvinnlig författare/manlig författare Fundera över vad uttrycken står för. Vilket borde vara vanligast i samhället i stort? T.ex. finns det fler kvinnliga direktörer än manliga och speglas detta i vilket uttryck som är vanligast? Hur kan korpusverktygen användas för att pröva hypoteser?
41 Förbereda inför första tillfället Läs igenom labbinstruktionen och planera. Läs utdraget från Hunstons bok. Registrera er (en per par räcker) på BYU-sajten så snart som möjligt.
42 Redovisning Laborationen redovisas genom Separata redovisningar för varje uppgift En separat sammanfattning där ni diskuterar om de hypoteser som tas upp i Hunstons artikel ( corpus evidence for disadvantage ) kan förklara era data. Redovisa elektroniskt. Datasammanställningar kan lämnas i bilagor. Skicka till Lars!
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2018) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Korpuslingvistik och språkteknologi Textsegmentering
Läs merUppgift 1. Produktmomentkorrelationskoefficienten
Uppgift 1 Produktmomentkorrelationskoefficienten Både Vikt och Längd är variabler på kvotskalan och således kvantitativa variabler. Det innebär att vi inte har så stor nytta av korstabeller om vi vill
Läs merKorp. https://spraakbanken.gu.se/korplabb/ Övningar Språkbankens höstworkshop oktober 2016
Korp Övningar Språkbankens höstworkshop 2016 https://spraakbanken.gu.se/korplabb/ sb-korp@svenska.gu.se 17 oktober 2016 ÖVERSIKT Korp är Språkbankens korpusverktyg och en väsentlig del av vår korpusinfrastruktur.
Läs merKursintroduktion. Marco Kuhlmann Institutionen för datavetenskap. 729G49 Språk och datorer (2019)
729G49 Språk och datorer (2019) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Detta verk är licensierat under en Creative Commons Erkännande 4.0 Internationell Licens. Filosofi Psykologi
Läs mer729G09 Språkvetenskaplig databehandling
729G09 Språkvetenskaplig databehandling Kursintroduktion 2015-04-08 Lars Ahrenberg 1 Plan Kursens innehåll och organisation Text, språk och datorer Textformat och textrepresentationer Korpuslingvistik
Läs merF5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab
Repetition: Gnuer i (o)skyddade områden χ 2 -metoder, med koppling till binomialfördelning och genetik. Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 Endast 2 av de 13 observationerna
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs merKonventionaliserade fraser i en akademisk ordlista
Konventionaliserade fraser i en akademisk ordlista Forskning kring Academic Formulas List (AFL) Ellis, Simpson-Vlach & Maynard 2008 Simpson-Vlach & Ellis 2010 Julia Prentice, ISA, Julia.prentice@svenska.gu.se
Läs merSF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018
SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 14-15 PASSNING AV FÖRDELNING: χ 2 -METODER. Tatjana Pavlenko 14 maj 2018 PLAN FÖR DAGENS FÖRELÄSNING Icke-parametriska metoder. (Kap. 13.10) Det
Läs merJesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014
Föreläsning 7. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper@math.uu.se Tillämpad statistik för STS vt 2014 χ 2 -metoder Några varianter: Test av helt given fördelning [A & B, 8.2.1]
Läs merSF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 14 PASSNING AV FÖRDELNING: χ 2 -METODER. Tatjana Pavlenko 12 oktober 2015 PLAN FÖR DAGENS FÖRELÄSNING Icke-parametsriska metoder. (Kap. 13.10) Det grundläggande
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 8 Statistiska metoder 1 Dagens föreläsning o Chi-två-test Analys av enkla frekvenstabeller Analys av korstabeller (tvåvägs-tabeller) Problem med detta test o Fishers exakta test 2 Analys av
Läs merTvå innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
Läs merSF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski
SF1901: SANNOLIKHETSLÄRA OCH STATISTIK FÖRELÄSNING 13. MER OM χ 2 -TEST OCH LIKNANDE Jan Grandell & Timo Koski 25.02.2015 Jan Grandell & Timo Koski () Matematisk statistik 25.02.2015 1 / 33 INNEHÅLL χ
Läs merχ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:
Stat. teori gk, ht 006, JW F1 χ -TEST (NCT 16.1-16.) Ordlista till NCT Goodness-of-fit-test χ, chi-square Test av anpassning χ, chi-två Test av anpassning: sannolikheter specificerade i förväg Data: n
Läs merordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)
1 F1 ordinalskala F2 kvotskala F65A nominalskala F65B kvotskala F81 nominalskala (motivering krävs för full poäng) b) Variabler som används är F2 och F65b. Eftersom det är kvotskala på båda kan vi använda
Läs merTentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merFÖRELÄSNING 8:
FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data
Läs merCHANGE WITH THE BRAIN IN MIND. Frukostseminarium 11 oktober 2018
CHANGE WITH THE BRAIN IN MIND Frukostseminarium 11 oktober 2018 EGNA FÖRÄNDRINGAR ü Fundera på ett par förändringar du drivit eller varit del av ü De som gått bra och det som gått dåligt. Vi pratar om
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merOBS! Vi har nya rutiner.
KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-11-17 Tillåtna
Läs merSF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski
SF1901: SANNOLIKHETSLÄRA OCH STATISTIK FÖRELÄSNING 12. MER HYPOTESPRÖVNING. χ 2 -TEST Jan Grandell & Timo Koski 25.02.2016 Jan Grandell & Timo Koski Matematisk statistik 25.02.2016 1 / 46 INNEHÅLL Hypotesprövning
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala
Läs merF14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
Läs merSF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test
SF1915 Sannolikhetsteori och statistik 6 hp Föreläsning 12 χ 2 -test Jörgen Säve-Söderbergh Anpassningstest test av given fördelning n oberoende försök med r möjliga olika utfall Händelse A 1 A 2... A
Läs merFlickor, pojkar och samma MöjliGheter
Malin Gustavsson Flickor, pojkar och samma MöjliGheter hur du som förälder kan bidra till mer jämställda barn Alla barn har rätt att uppleva att de duger precis som de människor de är. Det ska inte göra
Läs merSpråk, datorer och textbehandling
Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) VG kräver > 80% rätt, G > 60% rätt Labbrapporter 2 sidor, fokusera på koncisa svar på uppgifterna. Labbsalar 9-1064 9-1070 Allmänna
Läs merOlika typer av variabler och skalor. 1. Nominalskala 2. Ordinalskala 3. Intervallskala 4. Kvotskala. Intervallskala. Nominalskala.
Olika typer av variabler och skalor Kvalitativ variabel -variabeln antar inte numeriska värden utan bara olika kategorier. vis olika bilmärken, eller man, kvinna. Kvantitativ variabel Antar numeriska värden
Läs merKorpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp
Korpuslingvistik (SV2119) Föreläsning 2: Språkbankens korpusar och sökverktyget Korp Richard Johansson richard.johansson@svenska.gu.se 20 september 2013 1. introduktion dagens föreläsning Språkbankens
Läs merHypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Läs merSpråk, datorer och textbehandling
Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044,7-0019 Labb 1: KORP vid
Läs merIdag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid
EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Slump och slumptal Analys Boxplot Konfidensintervall Experiment och test Kamratgranskning Kursmeddelanden Analys Om laborationer: alla labbar
Läs merFöreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
Läs merIntroduktion till statistik för statsvetare
"Det finns inget så praktiskt som en bra teori" November 2011 Bakgrund Introduktion till test Introduktion Formulera lämplig hypotes Bestäm en testvariabel Bestäm en beslutsregel Fatta ett beslut När det
Läs merFöreläsning 6. Korstabeller (Tvåvägstabeller) Kap Korstabeller
Föreläsning 6 Korstabeller (Tvåvägstabeller) Kap.6.7. En population och två kvalitativa variabler Korstabeller Det kan vara lämpligt att skapa en korstabell över ett datamaterial i följande två fall:.
Läs merOBS! Vi har nya rutiner.
KOD: Kurskod: PM1303 Kursnamn: Vetenskapsteori och grundläggande forskningsmetod Provmoment: Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-11-17 Tillåtna hjälpmedel: Miniräknare Tentan består av
Läs merStatistiska analyser C2 Inferensstatistik. Wieland Wermke
+ Statistiska analyser C2 Inferensstatistik Wieland Wermke + Signifikans och Normalfördelning + Problemet med generaliseringen: inferensstatistik n Om vi vill veta ngt. om en population, då kan vi ju fråga
Läs merIntroduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
Läs merBetrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.
Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten
Läs mer729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion. Marco Kuhlmann Institutionen för datavetenskap
729G09 Språkvetenskaplig databehandling (2017) Kursintroduktion Marco Kuhlmann Institutionen för datavetenskap Denna föreläsning Kursens innehåll och organisation Språk och datorer Korpuslingvistik och
Läs merDatorbaserade verktyg i humanistisk forskning
Datorbaserade verktyg i humanistisk forskning Introduktion till nätresurser Eva Pettersson Institutionen för lingvistik och filologi Uppsala universitet eva.pettersson@lingfil.uu.se Föreläsningsöversikt
Läs merVälkomna till DIT012 IPGO. Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1.
Välkomna till DIT012 IPGO 1 Tyvärr en bug i Google Docs: Sidnummer stämmer inte alltid. Alla anteckningar börjar på sidan 1. Lärare och Handledare Kursansvariga, examinatorer, föreläsare och handledare
Läs merF2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion
Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten
Läs merKorpussökning och korpusmått 1(44)
Korpussökning och korpusmått Beáta B. Megyesi Uppsala universitet Institutionen för lingvistik och filologi beata.megyesi@lingfil.uu.se Korpussökning och korpusmått 1(44) Förra gången Korpustyper Korpusdistributörer
Läs merChapter 1 : Who do you think you are?
Arbetslag: Gamma Klass: 9A Veckor: 34-39 År: 2019 Chapter 1 : Who do you think you are?. Syfte Förstå och tolka innehållet i talad engelska och i olika slags texter. Formulera sig och kommunicera i tal
Läs merSpråk, datorer och textbehandling
Fyra labbar, de två sista med inlämning och betygsättning (U, G, VG) Detaljer kring examinationen ges på kurssidan Datasalar för labb: 9-1064, 9-1070 Allmänna datasalar: 9-0044, 7-0019 Labb 1: KORP vid
Läs merhttp://marvel.com/games/play/31/create_your_own_superhero http://www.heromachine.com/
Name: Year 9 w. 4-7 The leading comic book publisher, Marvel Comics, is starting a new comic, which it hopes will become as popular as its classics Spiderman, Superman and The Incredible Hulk. Your job
Läs mer7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Läs merIdag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment
EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Kamratgranskning Analys Exempel: exekveringstid Hur analysera data? Hur vet man om man kan lita på skillnader och mönster som man observerar?
Läs merStatistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
Läs merHYPOTESPRÖVNING sysselsättning
0 självmord 20 40 60 HYPOTESPRÖVNING 4. Se spridningsdiagrammen nedan (A, B och C). Alla tre samband har samma korrelation och samma regressionslinje (r = 0,10, b = 0,15). Vi vill testa om sambandet mellan
Läs merKorpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga
Korpusanalys kvo ht 06 Ellen Breitholtz Institutionen för lingvistik Göteborgs uniersitet Vad är en korpus? Korpus = kropp (massa) Samling språkliga data Används traditionellt om alla verk av en viss typ,
Läs mersamhälle Susanna Öhman
Risker i ett heteronormativt samhälle Susanna Öhman 1 Bakgrund Riskhantering och riskforskning har baserats på ett antagande om att befolkningen är homogen Befolkningen har alltid varit heterogen när det
Läs merEnvägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper
Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper Tobias Abenius February 21, 2012 Envägs variansanalys (ANOVA) I envägs variansanalys utnyttjas att
Läs merVälkomna till DIT012 IPGO
Välkomna till DIT012 IPGO 1 Lärare och Handledare Kursansvariga, examinatorer, föreläsare och handledare Joachim von Hacht, hajo@chalmers.se, 772 1003 Handledare (se även kurssida) Alexander Sjösten, sjosten@chalmers.se
Läs merVetenskaplig metodik
Vetenskaplig metodik Vilka metoder används? Vi kan dela in metoder i flera grupper: Deduktiva metoder Metoder för hantering av experiment Metoder för publicering och liknande. Från föreläsning 3 Föreläsningen
Läs merAutomatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon
Automatisk identifiering av konstruktionskandidater för ett svenskt konstruktikon Markus Forsberg Språkbanken Göteborgs universitet 2013-03-19 Föredraget Föredraget är baserat på en artikel inskickad igår
Läs merKorpuslingvistik (SV2119) Föreläsning 4: Statistiska metoder
Korpuslingvistik (SV2119) Föreläsning 4: Statistiska metoder Richard Johansson richard.johansson@svenska.gu.se 18 oktober 2013 dagens föreläsning: att räkna ord metodologiska förmaningar lite statistik:
Läs merKvantitativ samhällsanalys med språkteknologiska metoder.
Kvantitativ samhällsanalys med språkteknologiska metoder Hillevi Hägglöf hillevi.hagglof@gmail.com Myndigheten för samhällsskydd och beredskap (MSB) Bakgrund Alla rapporter, utredningar, utvärderingar
Läs merIntroduktion till språkteknologi
Introduktion till språkteknologi OH-serie 9: informationshantering http://stp.lingfil.uu.se/~matsd/uv/uv08/ist/ Informationshantering Hjälpa en användare att söka efter dokument eller information i dokumentsamlingar.
Läs merTentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl
Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
Läs merF9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Läs merLaboration 3 Inferens fo r andelar och korstabeller
S0005M Statistik2 Lp 4 2016 Laboration 3 Inferens fo r andelar och korstabeller Laborationen behandlar Test av andelar med konfidensintervall och hypotestest Chi två test av oberoende mellan kvalitativa
Läs merSOPA62 - Kunskapsproduktion i socialt arbete
SOPA62 - Kunskapsproduktion i socialt arbete 2. Mer hypotesprövning och något om rapporten 1 Evidensbaserad behandling Behandling bygger på vetenskap och beprövad erfarenhet. "Beprövad erfarenhet" får
Läs merKurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 05 June 2017, 14:00-18:00. English Version
Kurskod: TAMS28 MATEMATISK STATISTIK Provkod: TEN1 5 June 217, 14:-18: Examiner: Zhenxia Liu (Tel: 7 89528). Please answer in ENGLISH if you can. a. You are allowed to use a calculator, the formula and
Läs mer1. Mänskliga rättigheter
Kritiken Kritiken 1. Mänskliga rättigheter Kritiken 1. Mänskliga rättigheter 2. Ekonomin 3. Migrationspolitiska effekter 4. Allt till alla 1. Mänskliga rättigheter När det gäller skyldigheten att erbjuda
Läs merOBS! Vi har nya rutiner.
KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-09-28 Tillåtna
Läs merDatorövning 1: Fördelningar
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMS012/MASB03: MATEMATISK STATISTIK, 9 HP, VT-17 Datorövning 1: Fördelningar I denna datorövning ska du utforska begreppen sannolikhet och
Läs merTaltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
Läs merHUR SKRIVER MAN EN LABORATIONSRAPPORT OCH VARFÖR?
HUR SKRIVER MAN EN LABORATIONSRAPPORT OCH VARFÖR? Du kommer med största sannolikhet att skriva rapporter senare i livet (träning!) Om man jobbar som forskare använder man sig av laborationsrapporter när
Läs merLösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 24 e mars 2016 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merInlämningsuppgift: Pronomenidentifierare
1 (7) Inlämningsuppgift: Pronomenidentifierare 2D1418 Språkteknologi landes@bredband.net johnne@kth.se 1 2 (7) 1 Uppgiften... 3 2 Algoritmen i korthet... 3 3 Representation av data... 3 4 Indikatorer...
Läs merTentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14
STOCKHOLMS UNIVERSITET MT4003 MATEMATISKA INSTITUTIONEN LÖSNINGAR Avd. Matematisk statistik 3 maj 013 Lösningar Tentamen i Tillämpad statistisk analys, GN, 7.5 hp 3 maj 013 kl. 9 14 Uppgift 1 a Eftersom
Läs merTentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.
KOD: Kurskod: PC1244 Kursnamn: Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Sandra Buratti Tentamensdatum: 2013-09-27 Tillåtna hjälpmedel: Miniräknare Tentamen består
Läs merEnglish. Things to remember
English Things to remember Essay Kolla instruktionerna noggrant! Gå tillbaka och läs igenom igen och kolla att allt är med. + Håll dig till ämnet! Vem riktar ni er till? Var ska den publiceras? Vad är
Läs merKontrollera att följande punkter är uppfyllda innan rapporten lämnas in: Första sidan är ett försättsblad (laddas ned från kurshemsidan)
Statistiska institutionen VT 2012 Inlämningsuppgift 1 Statistisk teori med tillämpningar Instruktioner Ett av problemen A, B eller C tilldelas gruppen vid första övningstillfället. Rapporten ska lämnas
Läs merAutomatisk extraktion av idiom ur text ANDREAS PETTERSSON
Automatisk extraktion av idiom ur text ANDREAS PETTERSSON Examensarbete Stockholm, Sverige 2012 Automatisk extraktion av idiom ur text ANDREAS PETTERSSON 2D1021, Examensarbete i datalogi om 30 högskolepoäng
Läs merÖVNINGSUPPGIFTER KAPITEL 10
ÖVNINGSUPPGIFTER KAPITEL 10 För vissa uppgifter behöver du en tabell över den standardiserade normalfördelningen. Se här. SAMPLING 1. Nedan ges beskrivningar av fyra sampel. Ange i respektive fall om detta
Läs merRektorernas roll i förskolans förändrade uppdrag
Rektorernas roll i förskolans förändrade uppdrag Naturvetenskap och teknik i förskolan Susanne Thulin & Ann Zetterqvist 2010 01-18 Innehåll Skolverkets förslag till förtydliganden i Lpfö när det gäller
Läs merKort presentation av Korp, Sveriges nationalkorpus
Kort presentation av Korp, Sveriges nationalkorpus Göteborgs universitet 19 januari 2017 vid Avdelningen för nordiska språk, L Orientale-universitetet i Neapel Fil.dr. i slaviska språk. Undervisat i slovenska,
Läs merDigitalisering i välfärdens tjänst
Digitalisering i välfärdens tjänst Katarina L Gidlund professor och digitaliseringsforskare FODI (Forum för digitalisering) ÖPPNINGAR Förändra för att digitalisera Digitalisera för att förändra Skolan
Läs merför att komma fram till resultat och slutsatser
för att komma fram till resultat och slutsatser Bearbetning & kvalitetssäkring 6:1 E. Bearbetning av materialet Analys och tolkning inleds med sortering och kodning av materialet 1) Kvalitativ hermeneutisk
Läs merMÅL ATT UPPNÅ (FRÅN SKOLVERKET)
ENGELSKA B MÅL ATT UPPNÅ (FRÅN SKOLVERKET) Du skall förstå vad som sägs i längre sekvenser av sammanhängande tydligt tal som förmedlas direkt eller via medier och där innehållet kan vara obekant för dig
Läs merGiltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.
KOD: Kurskod: PC1244 Kursnamn: Metod Provmoment: Metod Ansvarig lärare: Sandra Buratti Tentamensdatum: 2014-11-08 Tillåtna hjälpmedel: Miniräknare Tentan består av 13 frågor, totalt 40 poäng. Det krävs
Läs merχ 2 -test χ 2 -test med skattade parametrar små talens lag (Bortkiewicz) homogenitetstest oberoendetest
STATISTIK FÖR BIOTEKNIK FÖRELÄSNING 12. χ 2 -TEST OCH LIKNANDE Jan Grandell & Timo Koski 04.12.2017 Jan Grandell & Timo Koski Matematisk statistik 04.12.2017 1 / 40 INNEHÅLL χ 2 -test χ 2 -test med skattade
Läs merChecklista för systematiska litteraturstudier 3
Bilaga 1 Checklista för systematiska litteraturstudier 3 A. Syftet med studien? B. Litteraturval I vilka databaser har sökningen genomförts? Vilka sökord har använts? Har författaren gjort en heltäckande
Läs merSubjektiva sannolikheter. Helge Malmgren Filosofidagarna, Umeå 2007
Subjektiva sannolikheter Helge Malmgren Filosofidagarna, Umeå 2007 Relativa sannolikheter Sannolikhetsteorins axiom är sanna om andelar (proportioner), t.ex. andelar av en total yta Bayes sats vid hypotesprövning
Läs merUnit course plan English class 8C
Hanna Rüngen Wallner Unit course plan English class 8C Spring term 2018-01-11 w.2-8 forgery safe robbery burglar crime scene Mål och syfte med arbetsområdet Utveckla sin förmåga att: - kommunicera i tal
Läs merVÄGLEDNING för litteraturöversikt om
MALMÖ HÖGSKOLA Hälsa och samhälle Utbildningsområde omvårdnad VÄGLEDNING för litteraturöversikt om ett folkhälsoproblem KENT JOHNSSON INGELA SJÖBLOM LOTTIE FREDRIKSSON Litteraturöversikt Omvårdnad II OV311A
Läs merF19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Läs merLektion 3. Anteckningar
Lektion 3 Anteckningar Fraser: Tid Klockan Uttal (pronunciation) Långa och korta ljud + melodi Grammatik: Word order + Basics of the clause elements Vi lär oss klockan! Halv Kvart i, kvart över Tjugo i,
Läs mer34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD
6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller
Läs merFöreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler
Föreläsning 8 Kapitel 9 och 10 sid 230-284 Samband mellan kvalitativa och kvantitativa variabler 2 Agenda Samband mellan kvalitativa variabler Chitvåtest för analys av frekvenstabell och korstabell Samband
Läs merWORLD AIDS DAY. Hur kan man arbeta med World Aids Day i undervisningen?
WORLD AIDS DAY Hur kan man arbeta med World Aids Day i undervisningen? Den 1:a december är det World Aids Day. Hivfrågan i Sverige har fått ett uppsving bland annat genom Jonas Gardells uppmärksammade
Läs merStatistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018
Statistiska analysmetoder, en introduktion Fördjupad forskningsmetodik, allmän del Våren 2018 Vad är statistisk dataanalys? Analys och tolkning av kvantitativa data -> förutsätter numeriskt datamaterial
Läs merFormuleringar som kan förbise, kränka eller diskriminera
Formuleringar som kan förbise, kränka eller diskriminera Medborgare Riskerar att förbise personer utan formellt medborgarskap i Sverige. Invånare innefattar alla som bor i staden, regionen eller landet,
Läs merExempel på gymnasiearbete inom humanistiska programmet språk
Exempel på gymnasiearbete september 2012 Exempel på gymnasiearbete inom humanistiska programmet språk Ungdomsspråk i spanska bloggar Elevens idé Calle är genuint språkintresserad. Han har studerat spanska,
Läs mer