D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.



Relevanta dokument
D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL. Skrivning i ekonometri onsdagen den 1 juni 2011

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Regressions- och Tidsserieanalys - F4

Tentamen Tillämpad statistik A5 (15hp)

Tentamen Tillämpad statistik A5 (15hp)

Statistik för ekonomer, Statistik A1, Statistik A (Moment 2) : (7.5 hp) Personnr:..

Regressions- och Tidsserieanalys - F5

Valfri räknedosa, kursbok (Kutner m fl) utan anteckningar. Tentamen omfattar totalt 20p. Godkänt från 12p.

Föreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3

Regressions- och Tidsserieanalys - F3

10.1 Enkel linjär regression

Metod och teori. Statistik för naturvetare Umeå universitet

Exempel 1 på multipelregression

Skrivning i ekonometri lördagen den 25 augusti 2007

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

Föreläsning 3 Kap 3.4, 3.6, G71 Statistik B

Regressions- och Tidsserieanalys - F7

Flerfaktorförsök. Blockförsök, randomiserade block. Modell: yij i bj eij. Förutsättningar:

STOCKHOLMS UNIVERSITET VT 2007 Statistiska institutionen Johan Andersson

a) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Enkel linjär regression. Enkel linjär regression. Enkel linjär regression

Regressions- och Tidsserieanalys - F3

Skrivning i ekonometri torsdagen den 8 februari 2007

Föreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B

Statistik B Regressions- och tidsserieanalys Föreläsning 1

Räkneövning 3 Variansanalys

Tentamen i matematisk statistik

Tentamen i Matematisk statistik Kurskod S0001M

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Skrivning i ekonometri lördagen den 29 mars 2008

En scatterplot gjordes, och linjär regression utfördes därefter med följande hypoteser:

Tentamen i Matematisk statistik Kurskod S0001M

Regressions- och Tidsserieanalys - F3

Läs noggrant informationen nedan innan du börjar skriva tentamen

Tentamen i matematisk statistik

Skrivning i ekonometri lördagen den 15 januari 2005

Tentamen i Matematisk statistik Kurskod S0001M

a) Vad är sannolikheten att det tar mer än 6 sekunder för programmet att starta?

Tentamen i Matematisk statistik Kurskod S0001M

Exempel 1 på multipelregression

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

732G71 Statistik B. Föreläsning 3. Bertil Wegmann. November 4, IDA, Linköpings universitet

Person Antal månader som utrustningen ägts. Antal timmar utrustningen användes föregående vecka.

Regressions- och Tidsserieanalys - F1

TENTAMEN I MATEMATISK STATISTIK

F16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data

Regressions- och Tidsserieanalys - F1

732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet

TENTAMEN I REGRESSIONS- OCH TIDSSERIEANALYS,

Läs noggrant informationen nedan innan du börjar skriva tentamen

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Tentamen i Matematisk statistik Kurskod S0001M

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Tentamen i Matematisk statistik Kurskod S0001M

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

Tentamen Tillämpad statistik A5 (15hp)

Lö sningsfö rslag till tentamen i matematisk statistik Statistik öch kvalitetsteknik 7,5 hp

Tentamen Tillämpad statistik A5 (15hp)

Statistisk undersökningsmetodik (Pol. kand.)

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

7.5 Experiment with a single factor having more than two levels

tentaplugg.nu av studenter för studenter

Följande resultat erhålls (enhet: 1000psi):

Tentamen i Matematisk statistik Kurskod S0001M

Tentamen i Matematisk statistik Kurskod S0001M

Föreläsning 4. Kap 5,1-5,3

Läs noggrant informationen nedan innan du börjar skriva tentamen

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

1. En kontinuerlig slumpvariabel X har följande täthetsfunktion (för någon konstant k). f.ö.

Tentamen i Matematisk statistik Kurskod S0001M

Examinationsuppgifter del 2

OBS! Vi har nya rutiner.

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

732G71 Statistik B. Föreläsning 7. Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 29

TENTAMEN I STATISTIK B,

Grundläggande Statistik och Försöksplanering Provmoment: TEN1 & TEN2 Ladokkod: TT2311 Tentamen ges för: Bt2, En2, Bt4, En4.

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Medicinsk statistik II

Sänkningen av parasitnivåerna i blodet

Tentamen i Matematisk statistik Kurskod S0001M

Uppgift a b c d e f (vet ej) Poäng

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

732G71 Statistik B. Föreläsning 2. Bertil Wegmann. November 13, IDA, Linköpings universitet

Tentamen i Matematisk statistik Kurskod S0001M

a) Bestäm sannolikheten att en slumpmässigt vald komponent är defekt.

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Obligatorisk uppgift, del 1

Uppgift 1. Deskripitiv statistik. Lön

Föreläsning G60 Statistiska metoder

Transkript:

1 Att tänka på (obligatorisk läsning) A. Redovisa Dina lösningar i en form som gör det lätt att följa Din tankegång. (Rättaren förutsätter att det dunkelt skrivna är dunkelt tänkt.). Motivera alla väsentliga steg i lösningen. Ange alla antaganden Du gör och alla förutsättningar Du utnyttjar B. Vid konfidensintervall måste Du dessutom ange vad intervallet avser att täcka samt teckna intervallet i symbolform innan de numeriska uppgifterna sätts in. Verbal slutsats av det framräknade resultatet krävs för full poäng. C. Vid signifikansanalys måste Du utöver vad som sagts ovan ange H 0, H 1, signifikansnivå (alt. P-värde), testfunktion (inkl. ev. antal frihetsgrader), resultat och verbal slutsats. D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng. UPPGIFT 1 Ett stort företag har ett traineeprogram där 70 procent av traineerna är kvinnor. 90 procent av kvinnorna och 80 procent av männen är högskoleutbildade. a) Anta att en trainee väljs ut slumpmässigt. Hur stor är sannolikheten att denna är en kvinna som saknar högskoleutbildning? (3 p) b) För en viss specialutbildning vill man plocka ut en högskoleutbildad trainee. Hur stor är sannolikheten att man automatiskt får en högskoleutbildad trainee om man slumpmässigt väljer en ur högen? (3 p) c) Är kön och utbildningsbakgrund sinsemellan oberoende? (4 p) UPPGIFT 2 Jörgen och Ulla ska göra en tentamensskrivning. De bestämmer sig för att skrivningen ska omfatta 6 uppgifter och definierar ungefärligt tema för respektive uppgift. Sedan låter de slumpen avgöra vem som ska göra frågorna. Låt X vara antalet uppgifter som Jörgen ska skriva. a) Vilken fördelning har X? (2 p) b) Det visade sig att Jörgen fick skriva 2 av uppgifterna. Hur stor var sannolikheten att detta skulle inträffa? (3 p) c) Anta att de på samma sätt fördelar sammanlagt 300 arbetstimmar för en statistikkurs. Hur stor är då sannolikheten att Jörgen får göra högst 100 av timmarna? (5 p)

2 UPPGIFT 3 När ett stort hotell ska köpa in glödlampor finns det fyra tillgängliga märken. Inköpschefen begär in 100 lampor från varje tillverkare och testar dessa. Antal acceptabla respektive oacceptabla lampor från respektive leverantör redovisas i nedanstående tabell. Tyder resultatet på att det finns skillnader mellan de olika märkena? Tillverkare A B C D Acceptabla 88 92 95 89 Oacceptabla 12 8 5 11 Totalt 100 100 100 100 UPPGIFT 4 En dricka-automat är programmerad för att i genomsnitt fylla ett glas med 20 cl dricka. Standardavvikelsen är 1 cl. Mängden dricka per glas är ungefär normalfördelad. För att kontrollera att automaten uppfyller kravet på fyllandet tar man då och då stickprov om 25 glas och mäter den genomsnittliga mängden i dessa. Man vill definiera gränserna för vad som är acceptabelt genom att programmera systemet så att det ger signal för de 5% lägsta och de 5% högsta medelvärdena. a) Ange gränserna för vad som kan anses som acceptabla medelvärden. (5 p) b) Anta att medelvärdet ökar till 21 cl. Hur stor är sannolikheten att detta upptäcks när man tar ett stickprov för att kontrollera automaten. (5 p) UPPGIFT 5 I en studie har man försökt kartlägga sambandet mellan kön, ålder och systolisk blodtryck. I avsnittet nedan beskrivs vad det systoliska blodtrycket är för något. Blodtryck är det tryck som driver runt blodet i blodkärlen. Trycket mäts i mm kvicksilver (mmhg) med hjälp av en blodtrycksmanschett. Då blodet pumpas ut från hjärtat, uppstår en pulsvåg. Storleken på denna kan indirekt mätas med hjälp av manschetten. Trycket vid denna pulsvåg brukar kallas Systoliskt blodtryck ("övre trycket") och trycket, då pulsvågen gått över, brukar kallas Diastoliskt blodtryck ("undre trycket"). För att få kalla trycket för "högt blodtryck" krävs att blodtrycket överstiger 140/90 mmhg vid minst 3 tillfällen under 3 månader. Högt normalt blodtryck: 130-139/85-89 mmhg. Mild förhöjning av blodtrycket: 140-159/90-99 mmhg. Måttlig förhöjning av blodtrycket: 160-179/100-109 mmg. Svår förhöjning av blodtryckei: över 180/över 110 mmhg. Det högsta värdet gäller, t.ex. är 159/105 en måttlig förhöjning av blodtrycket. Dessa gränser används oberoende av individens ålder. Det insamlade materialet som baseras på 30 individer kan du se nedan:

3 Individ SBP Age Sex Individ SBP Age Sex 1 144 39 1 16 130 48 0 2 220 47 1 17 135 45 0 3 138 45 1 18 114 17 0 4 145 47 1 19 116 20 0 5 162 65 1 20 124 19 1 6 142 46 0 21 136 36 0 7 170 67 0 22 142 50 0 8 124 42 0 23 120 39 0 9 158 67 1 24 120 21 0 10 154 56 0 25 160 44 1 11 162 64 0 26 158 53 1 12 150 56 1 27 144 63 1 13 160 59 1 28 130 29 0 14 110 34 0 29 125 25 0 15 128 42 0 30 175 69 1 SBP är det systoliska blodtrycket angivet i mmhg Age är individens ålder angivet i år Sex är individens kön, där 0 är kvinna och 1 är man Följande information beräknas med hjälp av Minitab: Descriptive Statistics: SBP; Age; Sex Variable N N* Mean SE Mean StDev Minimum Q1 SBP 30 0 143,20 4,16 22,80 110,00 124,75 Age 30 0 45,13 2,79 15,29 17,00 35,50 Sex 30 0 0,4333 0,0920 0,5040 0,000000000 0,000000000 Variable Median Q3 Maximum SBP 142,00 158,50 220,00 Age 45,50 56,75 69,00 Sex 0,000000000 1,0000 1,0000 a) Ange för varje variabel typ och skalnivå! (2p) b) Ange vilka deskriptiva mått som är aktuella för respektive variabel! (3p) c) Vilka diagram är lämpliga för att beskriva dessa variabler? (2p) d) Beräkna lämpligt centralmått för variabeln SBP för män respektive kvinnor! (3p)

4 UPPGIFT 6 Uppgiften baseras på samma material som i föregående uppgift. Ett spridningsdiagram tas fram i syfte att visualisera ett eventuellt samband mellan variablerna. Scatterplot of SBP vs Age 220 200 Sex 0 1 180 SBP 160 140 120 100 10 20 30 40 Age 50 60 70 a) Verkar det finnas ett samband mellan variablerna om man studerar spridningsdiagrammet? (2p) För att studera sambandet mellan variablerna genomför man linjär regressionsanalys. Till att börja med så beräknar man korrelationskoefficienter mellan variablerna. Correlations: SBP; Age; Sex SBP Age 0,679 0,000 Age Sex 0,529 0,386 0,003 0,035 Cell Contents: Pearson correlation P-Value b) Vad säger dessa koefficienter? (2p) En enkel linjär regressionsmodell med ålder som förklarande variabel ger följande resultat:

5 Regression Analysis: SBP versus Age The regression equation is SBP = 97,5 + 1,01 Age Predictor Coef SE Coef T P Constant 97,536 9,842 9,91 0,000 Age 1,0118 0,2069 4,89 0,000 S = 17,0387 R-Sq = 46,1% R-Sq(adj) = 44,1% Analysis of Variance Source DF SS MS F P Regression 1 6943,9 6943,9 23,92 0,000 Residual Error 28 8128,9 290,3 Total 29 15072,8 Unusual Observations Obs Age SBP Fit SE Fit Residual St Resid 2 47,0 220,00 145,09 3,13 74,91 4,47R R denotes an observation with a large standardized residual. c) Vad säger den skattade modellen? Tolka koefficienterna! (3p)

6 För att se hur kön påverkar sambandet lägger man till denna variabel till modellen. Regression Analysis: SBP versus Age; Sex The regression equation is SBP = 99,5 + 0,831 Age + 14,2 Sex Predictor Coef SE Coef T P Constant 99,535 9,252 10,76 0,000 Age 0,8310 0,2098 3,96 0,000 Sex 14,215 6,367 2,23 0,034 S = 15,9422 R-Sq = 54,5% R-Sq(adj) = 51,1% Analysis of Variance Source DF SS MS F P Regression 2 8210,7 4105,3 16,15 0,000 Residual Error 27 6862,1 254,2 Total 29 15072,8 Source DF Seq SS Age 1 6943,9 Sex 1 1266,8 d) Hur påverkas modellen när man för in kön som en förklarande variabel? Tolka koefficienterna! Hur påverkar kön det systoliska blodtrycket? (3p)