Föreläsning G60 Statistiska metoder

Relevanta dokument
Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Föreläsning G60 Statistiska metoder

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning G60 Statistiska metoder

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Föreläsning G60 Statistiska metoder

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Uppgift 1. Produktmomentkorrelationskoefficienten

Laboration 3 Inferens fo r andelar och korstabeller

Föreläsningsanteckningar till kapitel 9, del 2

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Stockholms Universitet Statistiska institutionen Termeh Shafie

Föreläsning 5. Kapitel 6, sid Inferens om en population

Statistik 1 för biologer, logopeder och psykologer

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

F19, (Multipel linjär regression forts) och F20, Chi-två test.

2. Test av hypotes rörande medianen i en population.

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Jämförelse av två populationer

Stockholms Universitet Statistiska institutionen Termeh Shafie

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Föreläsning G60 Statistiska metoder

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Föreläsning 7. NDAB01 Statistik; teori och tillämpning i biologi

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Laboration 4: Hypotesprövning och styrkefunktion

Statistik 1 för biologer, logopeder och psykologer

F22, Icke-parametriska metoder.

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

FACIT (korrekta svar i röd fetstil)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Exempel på tentamensuppgifter

TMS136. Föreläsning 13

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

OBS! Vi har nya rutiner.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 21 januari 2006, kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

ÄR OBSERVERAT SKILJT FRÅN FÖRVÄNTAT? (CHI2, χ 2 )

Kapitel 10 Hypotesprövning

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

Om statistisk hypotesprövning

Föreläsning 6. Korstabeller (Tvåvägstabeller) Kap Korstabeller

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

1. Test av anpassning.

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Hur man tolkar statistiska resultat

Avd. Matematisk statistik

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

OBS! Vi har nya rutiner.

Föreläsning G60 Statistiska metoder

SF1901: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 12 oktober 2015

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

a) Beräkna sannolikheten att en följd avkodas fel, det vill säga en ursprungliga 1:a tolkas som en 0:a eller omvänt, i fallet N = 3.

b) antalet timmar Lukas måste arbeta för att sannolikheten att han ska hinna med alla 112 datorerna ska bli minst (3 p)

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Föreläsning 5: Hypotesprövningar

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

Tentamen i Matematisk statistik Kurskod S0001M

Jag läser kursen på. Halvfart Helfart

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

TMS136. Föreläsning 11

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Avd. Matematisk statistik

SOPA62 - Kunskapsproduktion i socialt arbete

Föreläsning 12, FMSF45 Hypotesprövning

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Tentamen i Dataanalys och statistik för I den 28 okt 2015


Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

cx 5 om 2 x 8 f X (x) = 0 annars Uppgift 4

Datorlaboration 2 Konfidensintervall & hypotesprövning

Hypotestestning och repetition

Transkript:

Föreläsning 8 Statistiska metoder 1

Dagens föreläsning o Chi-två-test Analys av enkla frekvenstabeller Analys av korstabeller (tvåvägs-tabeller) Problem med detta test o Fishers exakta test 2

Analys av enkla frekvenstabeller Introduktion med hjälp av exempel I en undersökning med totalt 180 slumpmässigt utvalda personer så frågades vilken matbutik de utvalda handlar på i störst utsträckning. Svaren fick följande fördelning. Matbutik Antal svarande ICA 68 Coop 56 Willys 20 Hemköp 36 3

Analys av enkla frekvenstabeller Introduktion Med hjälp av ett chi-två-test kan frekvenstabeller analyseras djupare. T.ex. kan det undersökas om det finns ett mönster i hur undersökningsdeltagarna har svarat, eller om det kan anses vara slumpmässigt. Chi-två-test är en variant av hypotesprövning, med ett ytterligare steg. 1. Formulera hypoteser 2. Bestäm signifikansnivå 3. Beräkna förväntade frekvenser 4. Beräkna testvariabel 5. Undersök om nollhypotesen kan förkastas eller inte 4

Analys av enkla frekvenstabeller Formulera hypoteser Vid ett chi-två-test så uttryck hypoteserna i ord och inte med hjälp av beteckningar som vi har gjort tidigare. Hypoteserna kan uttryckas olika beroende på vad som undersöks, men grundtanken är att nollhypotesen (H 0 ) ska vara att det t.ex. inte finns ett mönster, att det är slumpmässigt eller liknande. Mothypotesen (H 1 ) säger att det finns ett mönster, att det inte är slumpmässigt etc. 5

Analys av enkla frekvenstabeller Beräkna förväntade frekvenser Efter att hypoteserna har formulerats beräknas de förväntade frekvenserna (E). Dessa förväntade frekvenser är antalet svarande på de olika alternativen, givet att H 0 är sann. Allmänt kan de förväntade frekvenserna uttryckas på följande sätt: E = 1 k n Där k är antalet svarsalternativ (kategorier) och n är antalet i undersökningen. 6

Analys av enkla frekvenstabeller Testvariabel När de förväntade frekvenserna har räknats fram kan testvariabeln beräknas. 2 χ obs = O E 2 E Denna testvariabel jämförs med ett kritiskt värde ur chi-tvåfördelningen (tabell 4). Det kritiska värdet har k 1 frihetsgrader, där k är antalet svarsalternativ (kategorier). H 0 förkastas när testvariabeln är större än det kritiska värdet. 7

Analys av enkla frekvenstabeller Exempel Vi återgår till undersökningen gällande matbutiker. Utred om det finns något mönster i vilken butik kunderna väljer, eller om man kan anse att de väljer butik slumpmässigt. Matbutik Antal svarande ICA 68 Coop 56 Willys 20 Hemköp 36 Totalt 180 8

Analys av korstabeller Introduktion I en korstabell så visas (oftast) två variabler samtidigt. Med hjälp av ett chi-två-test så kan man utreda om det finns något samband eller beroende mellan dessa två variabler. Antag att man i matbutiksundersökningen delade upp de svarande i åldersgrupper (yngre och äldre). Matbutik Åldersgrupp Yngre Äldre ICA 28 40 Coop 21 35 Willys 12 8 Hemköp 24 12 Totalt 85 95 9

Analys av korstabeller Formulera hypoteser Chi-två-test för en korstabell utförs på samma sätt som chi-två-test för en enkel frekvenstabell. Hypoteserna formuleras dock lite annorlunda. Grundtanken är att H 0 säger att det inte finns något samband eller beroende mellan de två variablerna. Mothypotesen H 1 säger då motsatsen, att det finns ett samband/beroende. Så hypoteserna kan exempelvis formuleras enligt: H 0 : Det finns inget samband mellan X och Y H 1 : Det finns ett samband mellan X och Y 10

Analys av korstabeller Förväntade frekvenser, testvariabel Även här beräknas förväntade frekvenser (E), vilket är antalet som bör vara i de olika cellerna givet att H 0 är sann. Dessa beräknas enligt: E = radsumma kolumnsumma totala antalet Dessa används för att beräkna testvariabeln: 2 χ obs = O E 2 Testvariabeln jämförs med kritiskt värde från chi-två-fördelningen. Detta kritiska värde har (r 1)(k 1) frihetsgrader, där r är antalet rader och k är antalet kolumner. H 0 förkastas om testvariabeln är större än det kritiska värdet. E 11

Analys av korstabeller Exempel Undersök om det finns ett beroende mellan matbutik och åldersgrupp med hjälp av ett chi-två-test. Matbutik Åldersgrupp Yngre Äldre ICA 28 40 Coop 21 35 Willys 12 8 Hemköp 24 12 Totalt 85 95 12

Chi-två-test Problem med detta test För att kunna genomföra ett chi-två-test ska dessa två förutsättningar vara uppfyllda: o Max 20 % av de förväntade frekvenserna får vara mindre än 5 o Ingen förväntad frekvens får vara mindre än 1 Om dessa förutsättningar inte uppfylls så ska man inte genomföra ett chi-två-test. För att komma runt detta problem kan man ibland använda sig av logisk sammanslagning. Det innebär att man, om möjligt, slår ihop två eller fler kategorier till en kategori. 13

Chi-två-test Logisk sammanslagning, exempel Vid en undersökning så fick de tillfrågade betygssätta en viss variabel på en skala 1-5. De tillfrågade delades upp på variabeln kön. 1 2 3 4 5 Kvinnor 1 7 30 6 7 Män 4 9 41 4 2 1-2 3 4-5 Kvinnor 8 30 13 Män 13 41 6 14

Fishers exakta test Om det inte är möjligt att använda sig av logisk sammanslagning kan man använda sig av Fishers exakta test. I kursboken finns exempel på hur beräkningar för detta test görs vid en korstabell med fyra celler (två rader, två kolumner). Det går även att tillämpa detta på större korstabeller, men det är väldigt tunga beräkningar och vi överlåter till datorerna att göra detta. 15

Tack för idag! Nästa tillfälle: Laboration 4, onsdag 13/3 10-12, PC1-2 16