Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Relevanta dokument
1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

(a) Lära sig beräkna sannolikheter för binomial- och normalfördelade variabler (b) Lära sig presentera binomial- och normalfördelningen gra skt

2. Lära sig beskriva en variabel numeriskt med "proc univariate" 4. Lära sig rita diagram med avseende på en annan variabel

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

2. Lära sig skatta en multipel linjär regressionsmodell samt plotta variablerna. 4. Lära sig skatta en linjär regressionsmodell med interaktionstermer

TENTAMEN I STATISTIKENS GRUNDER

OBS! Vi har nya rutiner.

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

Laboration 3 Inferens fo r andelar och korstabeller

Lösningar till SPSS-övning: Analytisk statistik

Uppgift 1. Produktmomentkorrelationskoefficienten

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Forsknings- och undersökningsmetodik Skrivtid: 4h

OBS! Vi har nya rutiner.

Föreläsning G60 Statistiska metoder

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER HYPOTESPRÖVNING. χ 2 -TEST. Jan Grandell & Timo Koski

4. Kunna orientera sig mellan de olika fönstren

ST-fredag i Biostatistik & Epidemiologi När ska jag använda vilket test?

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

SOPA62 - Kunskapsproduktion i socialt arbete

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

OBS! Vi har nya rutiner.

Richard Öhrvall, 1

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Statistik för teknologer, 5 poäng Skrivtid:

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Tentamen MVE301 Sannolikhet, statistik och risk

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

1. Lära sig beräkna kon densintervall och täckningsgrad 2. Lära sig rita en exponentialfördelning 3. Lära sig illustrera centrala gränsvärdessatsen

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 11 december, Ansvarig lärare: Bengt Jansson ( , mobil: )

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

χ 2, chi-två Test av anpassning: sannolikheter specificerade Data: n observationer klassificerade i K olika kategorier:

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

TENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )

TMS136: Dataanalys och statistik Tentamen

SF1915 Sannolikhetsteori och statistik 6 hp. χ 2 -test

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

TENTAMEN PC1307 PC1546. Statistik (5 hp) Onsdag den 20 oktober, Ansvarig lärare: Bengt Jansson ( , mobil: )

Tentamen MVE301 Sannolikhet, statistik och risk

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

SF1922/SF1923: SANNOLIKHETSTEORI OCH. PASSNING AV FÖRDELNING: χ 2 -METODER. STATISTIK. Tatjana Pavlenko. 14 maj 2018

Analytisk statistik. Tony Pansell, optiker Universitetslektor

F4 Beskrivning av ett datamaterial. Val av diagram, lägesmått och spridningsmått.

Analys av data från FIFA med hjälp av korrespondensanalys (Analysis of data from FIFA through correspondence analysis)

ÄR OBSERVERAT SKILJT FRÅN FÖRVÄNTAT? (CHI2, χ 2 )

Målet för D1 är att studenterna ska kunna följande: Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Jämförelse av två populationer

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

TENTAMEN PC1307 PC1546. Statistik (5 hp) Lördag den 24 april, Ansvarig lärare: Bengt Jansson ( , mobil: )

F9 SAMPLINGFÖRDELNINGAR (NCT

STATISTISK ANALYS AV KOMPLEXA DATA

SF1901: SANNOLIKHETSLÄRA OCH STATISTIK. MER OM χ 2 -TEST OCH LIKNANDE. Jan Grandell & Timo Koski

Uppgift 1. Deskripitiv statistik. Lön

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Metod och teori. Statistik för naturvetare Umeå universitet

Tentamen i matematisk statistik

, s a. , s b. personer från Alingsås och n b

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Följande resultat erhålls (enhet: 1000psi):

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

χ 2 -test χ 2 -test med skattade parametrar små talens lag (Bortkiewicz) homogenitetstest oberoendetest

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Föreläsning 6. Korstabeller (Tvåvägstabeller) Kap Korstabeller

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Psykologiska institutionen tillämpar anonymitet i samband med tentor i skrivsal, som går till så här:

Tentamen MVE300 Sannolikhet, statistik och risk

Del I. Uppgift 1 För händelserna A och B gäller att P (A) = 1/4, P (B A) = 1/3 och P (B A ) = 1/2. Beräkna P (A B). Svar:...

Omtentamen i Metod C-kurs

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Tentamen MVE300 Sannolikhet, statistik och risk

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars Ten 1, 9 hp

Använda några av de vanligaste PROC:arna. Sammanställa och presentera data i tabeller och grafiskt

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Transkript:

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs TE/RC Datorövning 6 Syfte: 1. Lära sig utföra godness of fit-test 2. Lära sig utföra test av homogenitet 3. Lära sig utföra prövning av hypoteser om oberoende Vi skall göra ett goodness of fit-test och utgår från exempel 18.1, sid 3, i kompendiet, Vi läser in datat på följande sätt: data work.ex181; input number count; datalines; 1 18 2 23 3 16 4 21 5 18 6 24 ; Vi skall göra ett test för att se om tärningen är symmetrisk. Om tärningen är symmetrisk och vi kastar den 120 gånger så förväntar vi oss att varje nummer skall komma upp 20 gånger. Hypoteserna blir: H 0 : tärningen är symmetrisk (lika fördelning mellan tärningens sidor) H A : tärningen är inte symmetrisk (ej lika fördelning) För att göra ett godness of fit-test skriver vi koden: proc freq data=work.ex181; weight count; tables number / testf=(20 20 20 20 20 20) chisq; Eftersom datat är inläst med en variabel (count) som innehåller frekvenser måste vi ange weight count. Efter tables anger vi den variabel som vi vill testa frekvenser för. testf står för testfrekvens man kan skriva testp, då får man istället ange testproportionen. Vi vill att SAS skall räkna ut chi-två värdet så vi skriver chisq 1). 1

Utskriften blir: The FREQ Procedure Test Cumulative Cumulative number Frequency Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 1 18 20 15.00 18 15.00 2 23 20 19.17 41 34.17 3 16 20 13.33 57 47.50 4 21 20 17.50 78 65.00 5 18 20 15.00 96 80.00 6 24 20 20.00 120 100.00 Chi-Square Test for Specified Frequencies ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square 2.5000 DF 5 1) Pr > ChiSq 0.7765 Sample Size = 120 Det observerade chi-två värdet blev 2.5, vi har 5 frihetsgrader (DF) och p-värdet är 0.7765. Bör vi förkasta H 0? Vi utgår från exempel 18.2 i kompendiet, sid 7, när vi skall utföra ett test av homogeniteten. Datat läses in på följande sätt: data work.ex182; input land$ intensitet$ antal; datalines; Sverige ofta 512 Sverige ibland 125 Sverige sällan 212 Italien ofta 395 Italien ibland 128 Italien sällan 404 England ofta 685 England ibland 130 England sällan 32 Usa ofta 743 Usa ibland 131 Usa sällan 71 Kina ofta 532 Kina ibland 184 Kina sällan 181 ; 2

Vi vill testa om fördelningen av intensiteten är densamma för länderna. Hypoteserna blir: H 0 : Fördelningen av intensiteten är densamma över länderna H A : Fördelningen av intensitet är ej densamma över länderna För att testa detta skriver vi koden (se korstab, dat.övn.2, sid2): proc freq data=work.ex182 order=data; weight antal; tables land*intensitet /chisq expected cellchi2 norow nocol; Vi skriver chisq för att få ut en tabell 1) som visar chi-två värdet, dvs. expected används när man vill få det förväntade värdet i varje cell dvs. att få ett chi-två värdet i varje cell.. Vi skriver cellchi2 för Vi skriver norow och nocol för när vi inte vill ha rad- och kolumnprocent. (I detta fall när vi vill testa skillnaden i intensitet mellan länderna skulle man kunna ta med radprocent dvs. utesluta norow ur koden. 3

Vi får en korstabell med olika värden i varje cell Table of land by intensitet land intensitet Frequency Expected Cell Chi-Square Percent ofta ibland sällan Total Sverige 512 125 212 849 545.15 132.72 171.13 2.0155 0.4492 9.7602 11.47 2.80 4.75 19.01 Italien 395 128 404 927 595.23 144.92 186.85 67.356 1.9744 252.35 8.85 2.87 9.05 20.76 England 685 130 32 847 543.86 132.41 170.73 36.626 0.0438 112.73 15.34 2.91 0.72 18.97 Usa 743 131 71 945 606.79 147.73 190.48 30.576 1.8944 74.946 16.64 2.93 1.59 21.16 Kina 532 184 181 897 575.97 140.23 180.81 3.3565 13.665 0.0002 11.91 4.12 4.05 20.09 Total 2867 698 900 4465 64.21 15.63 20.16 1 och dels en tabell med chi-två värden och p-värden Statistics for Table of land by intensitet Statistic DF Value Prob ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square 8 607.7415 <.0001 Likelihood Ratio Chi-Square 8 628.2416 <.0001 1) Mantel-Haenszel Chi-Square 1 93.3486 <.0001 Phi Coefficient 0.3689 Contingency Coefficient 0.3461 Cramer's V 0.2609 Sample Size = 4465 Vi är intresserade av den första raden i den sista delen av utskriften. Chi-två värdet 607.7415 och p- värdet mindre än 0.0001. 4

Vi utgår från exempel 18.3 i kompendiet när vi skall utföra prövning av hypoteser om oberoende. Datat kan läsas in på följande sätt: data work.ex183; input bostad$ civilstand$ antal; datalines; villa gift 25 villa ogift 5 villa skild 10 hyreslägenhet gift 15 hyreslägenhet ogift 25 hyreslägenhet skild 20 ; Vi vill testa om det råder oberoende mellan civilstånd och bostadstyp. H 0 : Oberoende mellan civilstånd och bostadstyp H A : Beroende mellan civilstånd och bostadstyp För att testa oberoendet skriver vi koden: proc freq data=work.ex183 order=data; weight antal; tables bostad*civilstand / chisq expected norow; I koden har vi angett (tagit bort) nocol för att få kolumnprocenten i utskriften. Utskriften blir: The FREQ Procedure Table of bostad by civilstand bostad civilstand Frequency Expected Percent Col Pct gift ogift skild Total ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ villa 25 5 10 40 16 12 12 25.00 5.00 10.00 40.00 62.50 16.67 33.33 ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ hyresläg 15 25 20 60 24 18 18 15.00 25.00 20.00 60.00 37.50 83.33 66.67 ƒƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆƒƒƒƒƒƒƒƒˆ Total 40 30 30 100 40.00 30.00 30.00 100.00 5

Statistics for Table of bostad by civilstand Statistic DF Value Prob ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Chi-Square 2 15.7986 0.0004 Likelihood Ratio Chi-Square 2 16.4528 0.0003 Mantel-Haenszel Chi-Square 1 7.2337 0.0072 Phi Coefficient 0.3975 Contingency Coefficient 0.3694 Cramer's V 0.3975 Sample Size = 100 Kolumnprocenten säger att 62.5% av de som gifta, 16.67% av de ogifta samt 33.33 av de skilda bor i villa. P-värdet är 0.0004 dvs litet. Det innebär att vi kan förkasta H 0 på alla signifikansnivåer som är större än α=0.0004. Det råder ett beroende mellan variablerna civilstånd och bostadstyp. Uppgifter 1. Utgå från övning 18.1 i kompendiet. Läs in datat och testa H 0 : Likafördelning mellan märken H A : Ej lika fördelning 2. Utgå från övning 18.8 i kompendiet. Läs in datat och testa H 0 : Fördelning av butik är samma för båda könen H A : Fördelningen av butik är ej samma för båda könen 3. Utgå från övning 18.10 i kompendiet. Läs in datat och testa H 0 : Oberoende mellan uppfattning om rökning och rökvana H A : Beroende mellan uppfattning om rökning och rökvana 4. Utgå från övning 18.2a i kompendiet. Läs in datat och testa H 0 : Proportionen är (9:3:3:1 H A : Proportionen är inte (9:3:3:1) 6

5. Läs in datat (hämtat frånupg.4, tenta 20091029) och testa H 0 : proportionen över inkomstklasser är (0.18 0.13 0.19 0.20 0.30) H A : Proportionen över inkomstklasser är inte (0.18 0.13 0.19 0.20 0.30) Uppgift 4. (20 poäng) I en viss kommun är man bekymrad över att de ekonomiska aktiviteterna i kommunen är svaga och invånarnas inkomster låga. Man vill därför ansluta sig till ett statligt åtgärdsprogram som syftar till att öka de ekonomiska aktiviteterna i kommunen och därigenom förhoppningsvis också öka kommuninvånarnas inkomster. Som stöd för sin ansökan att ansluta sig till åtgärdsprogrammet har man tagit ett slumpmässigt urval av 2000 personer över 18 år och undersökt deras inkomster. Erhållna antal personer i olika inkomstklasser och motsvarande procentuella andelar för landet som helhet visas i tabellen nedan. Ger dessa data stöd för påståendet att kommunens inkomstfördelning avviker från landets inkomstfördelning? Genomför ett lämpligt test med signifikansnivån 5 % och motivera ditt val av test. Inkomstklass Andel i landet Antal personer i urvalet Mer än 300 000 18 220 250 000-300 000 13 234 200 000-250 000 19 322 150 000-200 000 20 568 Mindre än 150 000 30 656 Totalt 100 2000 7

8