1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Relevanta dokument
Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Fråga nr a b c d 2 D

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Repetitionsföreläsning

import totalt, mkr index 85,23 100,00 107,36 103,76

Att välja statistisk metod

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Innehåll. Steg 4 Statistisk analys. Skillnader mellan grupper. Skillnader inom samma grupp över tid. Samband mellan variabler

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Icke parametriska metoder för variabler mätta på nominal- eller ordinalskala

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Repetitionsföreläsning

F22, Icke-parametriska metoder.

Statistik och epidemiologi T5

a) Facit till räkneseminarium 3

Föreläsning G60 Statistiska metoder

Parade och oparade test

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Medicinsk statistik II

Gamla tentor (forts) ( x. x ) ) 2 x1

Medicinsk statistik II

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

π = proportionen plustecken i populationen. Det numeriska värdet på π är okänt.

7.3.3 Nonparametric Mann-Whitney test

En kort instruktion för arbete i SPSS

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

En kort instruktion för arbete i R Commander

2. Test av hypotes rörande medianen i en population.

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Icke-parametriska/fördelningsfria test. Finansiell statistik, vt-05. Teckentest. Teckentest. Vi gör observationer för =1,, på variablerna.

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Statistik 1 för biologer, logopeder och psykologer

Statistik och epidemiologi T5

Föreläsning G60 Statistiska metoder

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 12 e januari Ten 1, 9 hp

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Tabell- och formelsamling. A4 Grundläggande Statistik A8 Statistik för ekonomer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Hur man tolkar statistiska resultat

Skrivning/skriftlig eksamen till statistikdelen av kursen i forskningsmetodik maj 2002

Föreläsning 12: Regression

January 3, Statistiska metoder vid kvantitativa. undersökningar. Jan-Olof Johansson

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Lösningsförslag till övningar

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Hypotestestning och repetition

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Föreläsning G60 Statistiska metoder

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Statistisk undersökningsmetodik (Pol. kand.)

Uppgift 1. Produktmomentkorrelationskoefficienten

Sänkningen av parasitnivåerna i blodet

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

Statistik 1 för biologer, logopeder och psykologer

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Avd. Matematisk statistik

Statistik Termin 10, Läkarprogrammet, HT16

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Mata in data i Excel och bearbeta i SPSS

Föreläsning 5 och 6.

Laboration 3 Inferens fo r andelar och korstabeller

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Stockholms Universitet Statistiska institutionen Termeh Shafie

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Föreläsning 9. NDAB02 Statistik; teori och tillämpning i biologi

Uppgift 3 Vid en simuleringsstudie drar man 1200 oberoende slumptal,x i. Varje X i är likformigt fördelat mellan 0 och 1. Dessa tal adderas.

Föreläsningsanteckningar till kapitel 9, del 2

8 Inferens om väntevärdet (och variansen) av en fördelning

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Är sjukvården jämställd och går det åt rätt håll?

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0002M MAM801 IEK309 Institutionen för matematik Datum Skrivtid

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Transkript:

1. a) F1(Sysselsättning) F2 (Ålder) F3 (Kön) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) nominalskala kvotskala nominalskala ordinalskala ordinalskala b) En möjlighet är att beräkna Spearmans korrelationskoefficient mellan variablerna F2 och F4. Om denna är signifikant och positiv är känslan av meningslöshet minst bland äldre, är den signifikant och negativ är känslan av meningslöshet minst bland yngre. Nollhypotes är att korrelationskoefficienten är lika med noll mothypotes att den avviker från noll. Ett annat alternativ är att gruppindela åldersvariabeln och göra en Kruska Wallis eller Wilcoxon rangsumma. Nollhypotesen i så fall att de olika åldersgrupperna har lika ofta upplever känsla av meningslöshet, mothypotesen att minst en skiljer sig åt. Man kan möjligen också tänka sig en korstabell om man gruppindelar bägge variablerna. Nollhypotes att variablerna är oberoende mothypotes att de är beroende. Men chi2 är det svagaste testet här och därför inte så lämpligt. Såväl Kruska Wallis, wilcoxons rangsumma som spearmans rangkorrelation beräknas utifrån rangtal, korstabellsanalysen baseras på frekvenser i olika grupper. I wilcoxon beräknas en z statistika utifrån ena gruppens rangsumma och båda gruppernas urvalstolekar c) Vi ska nu jämföra två variabler i hela gruppen, F4 (känsla av meningslöshet) och F5 (okontrollerade känlsoyttringar), Teckentest eller teckenrangtest eftersom det är ordinalskala. Nollhypotes att båda problemen är lika vanliga mothypotes att de skiljer sig åt. I teckentest räknas antalet som har högst värde på ena variabeln, i teckenrangtest rangordnas differenserna mellan de båda variablerna och sedan jämförs rangsumman för de negativa och positiva differenserna. Den lägsta rangsumman är teststatistika och den ska vara lägre än ett kritiskt värde.

2 Wilcoxons rangsummetest Om z är större än 1,96 eller mindre än -1,96 förkastas nollhypotesen Beräkna rangsumma arbetar studerar F4 rangtal F4 rangtal 2 3 3 6 4 8,5 5 10,5 1 1 6 12 3 6 5 10,5 2 3 3 6 4 8,5 2 3 Summa 33 Summa 45 Medel 4,7 Medel 9 (Om du utgår från andra gruppens rangsumma blir ) Eftersom z är mindre än det kritiska värdet förkastas nollhypotesen. Därmed kan vi dra slutsatsen att känslan av meningslöshet skiljer sig åt. Eftersom det genomsnittliga rangtalet är lägre bland de som arbetar upplever de känsla av meningslöshet oftare. De har svarat med lägre siffror. 3 median kvartilavstånd medel pearson measure of skewness 27800 5200 27 945 0,12

4 a) boxplot b) min -1,8 första kvartilen -0,4 andra kvartilen / medianen 0 tredje kvartilen 0,65 max 2,1 kvartilavstånd 1 variationsvidd 3,9 det finns inga extremvärden i det här fallet 5 a) När vi beräknar ett konfidensintervall är felmarginalen avståndet mellan punktestimatet och konfidensintervallets övre respektive undre gräns. Om vi har 95 procents konfidensgrad är sannolikheten 95 % att det sanna värdet ligger inom den statistiska felmarginalen. Dvs att avståndet mellan vårt punktestimat och det sanna värdet inte är större än felmarginalen. b) En hypergeometrisk fördelning uppstår om man tar ett urval ur en population och räknar antalet observationer som har en viss egenskap. c) Ett värde som ligger mer än ett och ett halvt kvartilavstånd över tredje kvartilen eller under första kvartilen. Ett värde som kraftigt avviker från de flesta värdena i fördelningen. d) Den största risk att ha fel som vi accepterar när vi drar slutsatser från en statistisk undersökning. 6 a) Ja sannolikheten för A ändras om B inträffar. Den betingade sannolikheten avviker från den obetingade. Samma gäller för sannolikheten för B b) Nej sannolikheten för A ändras inte om C inträffar. Den betingade sannolikheten är lika med den obetingade. Samma gäller för sannolikheten för C c) 0,09 d) 0,31 e) 0,7 7 a) År Inflationstakt KPI 2000 100,0 2001 3 % 103,0 2002 1 % 104,0 2003 2,5 % 106,6 2004 1,5 % 108,2 2005 2 % 110,4 b) lön 2005 omräknad i 2000 års penningvärde 24 276,5 löneökning i 2000 års penningvärde 24 276,5 23 600 = 676,5

8 Modell 1: Interceptet tolkas inte, dels inte signifikant dels finns inga företag som anställer nyfödda som VD. Antal år som VD är signifikant eftersom p-värdet, 0,003 är lägre än 0,05. Koefficienten tolkas som att lönen ökar med 31 tusen dollar om man varit VD ytterligare ett år givet oförändrade värden på övriga oberoende variabler. Ålder är inte signifikant eftersom p-värdet, 0,409 är större än 0,05. Därmed tolkas inte koefficienten. Räntabilitet totalt kapital är inte signifikant eftersom p-värdet, 0,280 är större än 0,05. Därmed tolkas inte koefficienten. Vinstmarginal är signifikant eftersom p-värdet, 0,001 är lägre än 0,05. Koefficienten tolkas som att lönen ökar med 51 tusen dollar om vinstmarginalen ökar med en procentenhet givet oförändrade värden på övriga oberoende variabler. Modell 2: Interceptet tolkas inte, dels inte signifikant dels finns inga företag som anställer nyfödda som VD. Ålder och ålder i kvadrat är signifikanta eftersom p-värdena, 0,018 och 0,022 är mindre än 0,05. Eftersom koeffienten före den icke kvadrerade variabeln är positiv och koefficienten före den kvadrerade variabeln är negativ tolkas den som att man får högre lön om man är äldre men att effekten minskar ju äldre man blir. Eventuellt påverkar åldern negativt för de allra äldsta VD arna. Antal år som VD är signifikant eftersom p-värdet, 0,001 är lägre än 0,05. Koefficienten tolkas som att lönen ökar med 38 tusen dollar om man varit VD ytterligare ett år givet oförändrade värden på övriga oberoende variabler. Vinstmarginal är signifikant eftersom p-värdet, 0,002 är lägre än 0,05. Koefficienten tolkas som att lönen ökar med 48 tusen dollar om vinstmarginalen ökar med en procentenhet givet oförändrade värden på övriga oberoende variabler. Räntabilitet totalt kapital är inte signifikant eftersom p-värdet, 0,312 är större än 0,05. Därmed tolkas inte koefficienten. b) Det nyckeltal som de flesta företag använder för att beräkna bonusen borde ju rimligen påverka lönen eftersom denna beräknas inklusive bonus. Därmed tyder denna analys på att vinstmarginalen används mer än räntabiliteten i företagens bonussystem.

c) Multikollinearitet innebär att några av de oberoende variablerna är korrelerade av varandra. Tittar vi på korrelationsmatrisen skulle det största problemet i så fall vara korrelationen mellan räntabilitet och vinstmarginal. Det är inte så förvånade eftersom bägge är beräknade från vinsten. Inte heller den korrelationen är jättehög så det är nog inte ett stort problem men kanske skulle vi fått ett lägre p-värde på räntabiliteten om vi tar bort vinstmarginalen. d) Förklaringsgraderna är något högre i modell 2. 0,07 istället för 0,06 respektive 0,06 istället för 0,05. Den kvadrerade modellen kan således förklara lite mer av variationen i VD löner. e) Svar det predikterade värdet är 1 850 000 dollar.