Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Relevanta dokument
Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Datorövning 2 Statistik med Excel (Office 2007, svenska)

Sänkningen av parasitnivåerna i blodet

Föreläsning 6. Kapitel 7, sid Jämförelse av två populationer

Jämförelse av två populationer

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

Uppgift 1. Produktmomentkorrelationskoefficienten

F19, (Multipel linjär regression forts) och F20, Chi-två test.

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

Autokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012

Föreläsning G70 Statistik A

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Att välja statistisk metod

SF1901 Sannolikhetsteori och statistik I

OBS! Vi har nya rutiner.

FACIT (korrekta svar i röd fetstil)

Statistik 1 för biologer, logopeder och psykologer

Korrelation och autokorrelation

Statistiska undersökningar

Repetitionsföreläsning

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Laboration 3 Inferens fo r andelar och korstabeller

Medicinsk statistik II

Finansiell statistik

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Föreläsning G60 Statistiska metoder

Statistiska samband: regression och korrelation

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

SF1901: SANNOLIKHETSTEORI OCH HYPOTESPRÖVNING. STATISTIK. Tatjana Pavlenko. 13 maj 2015

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

F13. Förra gången (F12) Konfidensintervall och hypotesprövning Chi-tvåtest. Stratifierat urval

Höftledsdysplasi hos dansk-svensk gårdshund

732G01/732G40 Grundläggande statistik (7.5hp)

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

January 3, Statistiska metoder vid kvantitativa. undersökningar. Jan-Olof Johansson

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik för STS vt 2014

BIOSTATISTISK GRUNDKURS, MASB11 ÖVNING 7 ( ) OCH INFÖR ÖVNING 8 ( )

Stockholms Universitet Statistiska institutionen Termeh Shafie

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart:

Statistik 1 för biologer, logopeder och psykologer

b) Om vi antar att eleven är aktiv i en eller flera studentföreningar vad är sannolikheten att det är en kille? (5 p)

Föreläsningsanteckningar till kapitel 9, del 2

Föreläsning G60 Statistiska metoder

Lösningar till tentamen i Matematisk Statistik, 5p

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

En typisk medianmorot

Statistik 1 för biologer, logopeder och psykologer

Föreläsningsanteckningar. Grundläggande statistik 732G01/732G40


Föreläsning 12: Repetition

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

Matematisk statistik för D, I, Π och Fysiker

ÖVNINGSUPPGIFTER KAPITEL 3

Lösningsförslag till Matematisk statistik LKT325 Tentamen

OBS! Vi har nya rutiner.

1. Test av anpassning.

STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017

P(ξ > 1) = 1 P( 1) = 1 (P(ξ = 0)+P(ξ = 1)) = ξ = 2ξ 1 3ξ 2

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Lektionsanteckningar 2: Matematikrepetition, tabeller och diagram

Föreläsning 7: Punktskattningar

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Uppgift 1. P (A) och P (B) samt avgör om A och B är oberoende. (5 p)

Syfte: o statistiska test om parametrar för en fördelning o. förkasta eller acceptera hypotesen

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Stockholms Universitet Statistiska institutionen Termeh Shafie

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Föreläsning G60 Statistiska metoder

Uppgift 1. Deskripitiv statistik. Lön

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

TAMS65 - Föreläsning 6 Hypotesprövning

Tentamen i Tillämpad statistisk analys, GN, 7.5 hp. 23 maj 2013 kl. 9 14

Uppgift 1 (a) För två händelser, A och B, är följande sannolikheter kända

Temperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Transkript:

Föreläsning 8 Kapitel 9 och 10 sid 230-284 Samband mellan kvalitativa och kvantitativa variabler

2 Agenda Samband mellan kvalitativa variabler Chitvåtest för analys av frekvenstabell och korstabell Samband mellan kvantitativa variabler

Samband mellan kvalitativa variabler

4 Exempel En bilförsäljare har sålt bilar av ett visst märke som tillverkas i tre färger: röd, svart och silver. Försäljningen av bilar i respektive färg en viss månad presenteras i följande tabell. Färg Antal sålda bilar (f) Röd 13 Svart 21 Silver 17 Totalt 51 Finns det någon skillnad i popularitet mellan färgerna på 5% signifikansnivå?

5 Chitvåtest (χ # ) för analys av frekvenstabell Krav: det råder oberoende mellan grupperna i tabellen. Innebörden i detta är att samma element (person) endast får ingå i en grupp. max 20% av de förväntade frekvenserna är mindre än 5 alla förväntade frekvenser är större än 1. Steg 1: Välj signifikansnivå och formulera hypoteser H & : Det finns inga skillnader i frekvens mellan grupperna H : : Det finns skillnader i frekvens mellan grupperna

6 χ # -test för analys av frekvenstabell Steg 2: Testvariabeln V är antalet grupper D # χ ;<=; =? O A E # A AEF O A är de observerade frekvenserna E A är de förväntade frekvenserna (kraven gäller för dessa), och beräknas genom: E A = O A V E A

7 χ # -test för analys av frekvenstabell Steg 3: Beräkna kritiska området Ett χ # -test har alltid kritiskt område till höger av fördelningen # χ IJA; # = χ DKF;M Steg 4: Dra slutsats och tolka # Hamnar χ ;<=; i det kritiska området förkasta H &.

8 Exempel Man drar ett OSU om medlemmar ur en stor politiskt oberoende organisation, och frågar dels om kön, dels om politisk tillhörighet (vänster eller höger). Följande resultat erhålles. Vänster Höger Kvinna 98 141 Man 67 59 Går det att på 5 procents signifikansnivå påvisa några skillnader mellan kvinnor och män som är medlemmar i organisationen i fråga om politisk tillhörighet?

9 Exempel (forts.) 70% 60% 50% 40% 30% Kvinnor Män 20% 10% 0% Vänster Höger

10 χ # -test för analys av korstabell Krav: det råder oberoende mellan cellerna. Innebörden är att samma element (person) inte får förekomma i flera celler i tabellen max 20% av de förväntade frekvenserna är mindre än 5 alla förväntade frekvenser är större än 1 Steg 1: Hypoteser H & : Det finns inga skillnader i fördelning mellan grupperna (alternativt: Det finns inget samband mellan grupperna) H : : Det finns skillnader i fördelning mellan grupperna (alternativt: Det finns samband mellan grupperna)

11 χ # -test för analys av korstabell Steg 2: Testvariabeln Q # χ ;<=; =? O A E # A AEF W är antalet celler i korstabellen O A är de observerade frekvenserna E A är de förväntade frekvenserna (kraven gäller för dessa), och beräknas genom: E A E A = J:S;T; ITV;T; ;T;;T;

12 χ # -test för analys av korstabell Steg 3: Kritiskt område # χ IJA; # = χ JKF WKF ;M r och c är antalet rader respektive kolumner Steg 4: Dra slutsats och tolka # Hamnar χ YZ[Y i det kritiska området förkasta H &.

13 Sammanslagningar av variabler vid χ # -test Om inte kraven uppfylls måste ibland sammanslagningar av alternativ genomföras Dessa måste ske på logiskt vis, t.ex. måste ordningen bibehållas Vid nominalskala är det enklast att skapa ett nytt alternativ som kallas Övrigt

14 Exempel På ett företag angav chefer och övriga hur många dagar i veckan de motionerade Antal dagar Chefer Övriga 0 6 38 1 8 19 2 5 23 3 5 10 4 0 4 5 1 3 6 1 2 7 0 1

Samband mellan kvantitativa variabler

16 Exempel Ett företag har ett större antal säljare anställda. Vi har dragit ett OSU om 8 av dessa och för varje utvald person undersökt ålder och månadslön (i tusentals kronor). Föreligger det något samband mellan ålder och månadslön för säljare vid företaget? Säljare Månadslön Ålder 1 17 21 2 30 32 3 27 40 4 35 56 5 44 61 6 38 55 7 36 39 8 25 33

17 Exempel Månadslön (tkr) 50 45 40 35 30 25 20 15 10 5 0 0 10 20 30 40 50 60 70 Ålder

18 Att studera i ett spridningsdiagram Är sambandet linjärt? Undersök om punkterna faller längs en tänkt rät linje Lutar punktsvärmen? Lutar punkterna uppåt är det ett positivt samband, nedåt ett negativt samband

19 Att studera i ett spridningsdiagram Hur starkt är sambandet? Undersök hur tätt observationerna ligger längs den tänkta räta linjen. Om de är utspridda är sambandet svagt, om de ligger nära linjen är sambandet starkt Finns det några observationer som kraftigt avviker från de övriga? Dessa observationer kallas för uteliggare och kan (men inte behöver) bero på felmätning eller felinmatning

20 Korrelationskoefficienten Matematiskt mått för styrkan av ett linjärt samband mellan två variabler c AEF x A x y A y r = SS ]^ SS ]] SS^^ = c x A x # AEF c y A y # AEF Korrelationskoefficienten antar värden mellan 1 och +1. Ju närmare 1 desto starkare negativt linjärt samband Ju närmare +1 desto starkare positivt linjärt samband Om korrelationskoefficienten är nära 0 finns inget linjärt samband

21 Tolkning av korrelationskoefficienten Vi tolkar absolutvärdet av korrelationskoefficienten (betecknas r ): r Samband > 0.85 Mycket starkt 0.65 0.85 Starkt 0.35 0.65 Måttligt 0.20 0.35 Svagt < 0.20 Mycket svagt

Korrelation Kausalitet 22