Lösningsförslag till övningar

Storlek: px
Starta visningen från sidan:

Download "Lösningsförslag till övningar"

Transkript

1 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 014 1

2 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära... 6 Undersökningsdesign, konfidensintervall och bortfall Hypotesprövning Regression... 0 Icke parametriska metoder... 36

3 Deskriptiv statistik och index 1. Kontinuerliga: Ålder, Kroppslängd, Hastighet, Intelligenskvot Diskreta: Antal barn, Antal dörrar hos en bil (Ålder kan eventuellt betraktas som diskret eftersom man oftast inte uppger sin exakta ålder. Det är sällan någon säger att han är 5 år 5 månader 10 dagar sju timmar och åtta minuter gammal. Mätresultaten för ålder är därför ofta diskreta.). Kvantitativ: Ålder, kroppsvikt, Kvalitativ: Kön, Hemvist, Bilmärke, Lydig-olydig, Förnamn Spritmissbruk kan mätas på båda sätten. Kvantitativt kan man t ex ange förbrukningen av alkoholhaltiga drycker per år. Kvalitativt kan man dela in folk i tex absolutister, måttlighetsförbrukare och alkoholberoende. 3. På flera av variablerna kan mäta i flera skaltyper. Gruppstorlek mäts t ex i en ordinalskala om man delar in grupperna i smågrupper, mellanstora grupper och stora grupper. Mäter man däremot antal personer per grupp så blir det en kvotskala. Förslag på svar: Nominalskala: Hårfärg, Nationalitet, Stad - land, Straffad - icke straffad Ordinalskala: Gruppstorlek, Grad av demokratisk ledarstil, Kryddningen av en maträtt, Alkoholvanor Intervallskala: Temperatur Kvotskala: Kroppsvikt, C-vitaminhalt i apelsiner, Hastigheten hos en bil, Regnmängd, Arbetslöshet 4. Ålder, hur länge har du haft din nuvarande position och antal rum är kvotskala. Kön, vilken avdelning samt alla ja och nej frågor är nominalskala. Grad av relevans och grad av instämmande frågorna är ordinalskala. 3

4 5 A. 30,5 % av de 400 dvs 0, = 11 st är kvinnliga arbetare B. Av de 66,75 % manliga anställda är 0,5 % tjänstemän. 0,5 66,75 = 0,303 30,3 % av de manliga anställda är tjänstemän. 6. A. Ålder Kön < 35 år > 35 år totalt män 5 33,3 30 kvinnor 75 66,7 70 Totalt B. Ålder Kön < 35 år > 35 år totalt män 33,3 66,7 100 kvinnor 4,9 57,1 100 Totalt C. Ålder Kön < 35 år > 35 år totalt män kvinnor totalt

5 7 Medelvärde: 15,09 Median: 15 Varians: 8,9 Standardavvikelse:,88 Pearson measure of skewness: 0, a) Lådagram b) medianen är ca 4. Medelvärde kan inte utläsas ur lådagram, kvartilavstånden är ca 7 (45-38) c) det finns inga extremvärden, dessa skulle illustrerats med stjärnor. d) Högsta värde är ca 50 minsta ca Äldre bussar tenderar att ha högre årliga reparationskostnader 10. Om vi använder 1997 som basår: personbilar motorcyklar L År I t 1, t K 85, t a) = 104, b) = 103, a) Den nominella löneindexet anger den procentuella ökningen av nominella lönen. Den nominella lönen hade ökat med 3 procent. b) För att beräkna reallönen ska vi deflatera med KPI = 104,3 Reallöneindex var 104,3 vilket innebär att reallönen hade stigit med 4 %. 5

6 Sannolikhetslära 8! A) 8C !5! 3 1 8! B) 8C !3! 5!3! C) 5C 3 3 C 30 3!!1!! n (Begreppsförklaring: n C r skrivs även C r eller ( n n! ). Dessa uttryck är lika med r anger antal kombinationer av r element valda bland n element.). A) P(ruter) = 13/5 = ¼ B) P(röd kung) = /5 = 1/6 C) P(kung eller dam) = 8/5 = /13 D) P(ej kung eller dam): 1 - /13 = 11/13 alternativt 44/5 =11/13 3. A) Att få sexor i två kast efter varandra. 4. r!(n r)! och 0, rött 0,4 0,7 0, 0,056 0,4 rött 0,7 0,3 rött Ej rött 0,8 0, Ej rött 0,4 0,7 0,8 0,4 rött 0,4 0,3 0, 0,04 0,8 Ej rött 0,4 0,3 0,8 0,096 0, rött 0,6 0,7 0, 0,084 0,6 0, 7 Ej rött 0,3 rött Ej rött 0,8 0, Ej rött rött 0,6 0,7 0,8 0,336 0,6 0,3 0, 0,036 0,8 Ej rött 0,6 0,3 0,8 0,144 Låt A betyda att ljus A visar rött etc B) P(A och B och ~C) = P(A) P(B) P(~C) = = 0.4 C) P(A eller B eller C) = 1 - P(~A och ~B och ~C) = = 1 - P(~A) P(~B) P(~C) = = = D) Detta är samma sak som att exakt ett ljus visar rött. Det finns tre olika alternativ som uppfyller detta. Vi får då addera de tre sannolikheterna. P(sökt) = P(~A och ~B och C) + P(~A och B och ~C) + P(A och ~B och ~C) = = = = =

7 5 a) 0,1 rött 0,4 0,1 0,04 0,4 rött 0,9 grönt 0,4 0,9 0,36 0,6 grönt 0, rött 0,6 0, 0,1 0,8 grönt 0,6 0,8 0,48 b) Det finns tre sätt att få minst ett rött. Antingen rött-grönt, grönt-rött eller rött-rött. Det innebär att det bara är grönt-grönt som inte uppfyller detta. Vi kan använde komplementregeln: P(minst ett rött) = 1 P(grönt grönt) = 1 0,48 = 0,5 (Ett annat alternativ är att använda adderingsregeln och lägga ihop de tre utfallen som uppfyller händelsen.) 6 Ett bra första steg kan vara att skriva ner sannolikhetsfördelningen: Total dricks per dag: Antal dagar sannolikhet 0 x < ,40 (00/500) 0 x < ,0 (100/500) 50 x < ,15 (75/500) 100 x < ,15 (75/500) 00 eller mer 50 0,10 (50/500) totalt a) 0,10 b) Ja ett visst värde kan bara hamna i en av kategorierna c) Ja eftersom man inte kan få negativ dricks måsta alla värden hamna i någon av kategorierna d) 1 e) 0,4 + 0, = 0,6 f) 1 0,10 = 0,9 7

8 7 Män Kvinnor Totalt Högskoleutbildning 0,78*0,0 = 0,156 0,9*0,80 = 0,7 0,876 Ej 0,044 0,08 0,14 högskoleutbildning totalt 0,0 0,80 1 Män Kvinnor Totalt Högskoleutbildning 0,78 0,90 0,876 Ej 0, 0,10 0,14 högskoleutbildning totalt Män Kvinnor Totalt Högskoleutbildning 0,156/0,876=0,178 0,8 1 Ej 0,044/0,14=0,355 0,645 1 högskoleutbildning totalt 0, 0,8 1 b) 0,08 c) 0,14 d) 0,10 e) Nej eftersom sannolikheten att ha en högskoleutbildning är högre hos kvinnor än hos män är variablerna beroende. 8 a) Binomialfödelning, varje händelse har två utfall, vi räknar antalet ja och det är samma sannolikhet för ja varje gång. b) μ = 1 0,07 = 0,84 Bästa gissningen är att 1 låntagare kommer att misslyckas c) P(x = 0) = 1 C 0 0,07 0 0,93 1 = 1! 0! 1! 0,070 0,93 1 = 0,93 1 = 0,4186 d) P(x = 1) = 1 C 1 0,07 1 0,93 11 = 1! 1! 11! 0,071 0,93 11 = 1 0,07 0,93 11 = 0,3781 e) (x 1) = 1 P(x = 0) = 1 0,4186 = 0,5814 f) (x ) = 1 P(x = 0) P(x = 1) = 1 0,4186 0,378 = 0,033 9 a) 7 7 P 4 C ! 7 7 P 1! 4! P P 6 0,7 0,3 0, 646 8

9 b) P P P 10 7 C 3C C! 10 7! 7!! 3 4! 10! a) μ = 11,96+1,05 3!! 10 4! 4!6! = 4,01 b) σ = (1,05 11,96) 1 4 7! 3!!5!!1! 10! , 30 = 1,005 = (0,09) 1 = 0, c) P(x < 1) = 1 11,96 1,05 11,96 = 0,04 0,09 = 0,44 = 0, = 0,06 d) P(x > 11.98) = 1,05 11,98 1,05 11,96 = 0,07 0,09 = 0,78 e) Eftersom alla sockerpaket väger mer eller lika med 11,96 kommer alla paket väga mer än 11 P(x > 11,00) = 1 11 a. z = X μ σ z = = 0, P(X > 4000) = P(z > 0,4) = 0,5 P(0 < z < 0,4) = 0,5 0,1554 = 0,3446 b. z = = 1, P(X > 3000) = P(z > 1,6) = P(z < 1,6) = 0,5 + P(0 < z < 1,6) = 0,5 + 0,445 = 0,945 P(3000 < X < 4000) = P(X > 3000) P(X > 4000) = 0,945 0,3446 = 0,6006 c. z = = P(X > 35000) = P(z > 1) = P(z < 1) = 0,5 + P(0 < z < 1) = 0,5 + 0,3413 = 0,8413 P(3000 < X < 35000) = 0,945 0,8413 = 0,1039 d. 9

10 Vi söker den gräns där det är 0 procents sannolikhet att dra en anställd med högre lön. För att hitta den behöver vi hitta ett värde på z där sannolikheten att få ett större värde är 0 %. För det z-värdet gäller att: P(0 till z) = 0,3 Enligt tabellen är P(0<z<0,84) = 0,995 och P(0<z<0,85) = 0,303. Vi utgår ifrån z värdet 0,84 eftersom det ligger närmast 0,3 X ,84 = , = X X = , = procent av de anställda har en lön som överstiger så den som tjänar minst av de 0 procent som tjänar mest bör ha en lön på ca a. z = X μ σ z = = 1,1 P(X > 500) = P(z > 1,1) = 0,5 - P(0 < z < 1,1) = 0,5-0,3686 = 0, procent spenderar mer än 500 b. z = =,4 P(X > 3 000) = P(z >,4) = 0,5 - P(0< z <,4) = 0,5 0,4875 = 0,015 P( 500 < X < 3 000) = 0,1314 0,015 = 0, procent spenderar mellan 500 och c. z = =,1 P(X <1 000) = P(z < -,1) = P(z >,1) = 0,5 - P(0 < z <,1) = 0,5-0,4864 = 0,0136 1,3 procent spenderar mindre än dollar. 10

11 Undersökningsdesign, konfidensintervall och bortfall 1 Första steget är att beräkna medelvärde och standardavvikelse för urvalsmedelvärdena om en stor mängd urval om 9 observationer dras från denna fördelning: μ X = 60 och σ X = 1 9 a) z = S 1 / 9 P(X > 63) = P(z > 0,75) = 0,5 P(0 < z < 0,75) = 0,5000 0,734 = 0,66 b) z 1 1 / 9 P(X < 56) = P(z < 1) = P(z > 1) = 0,5 P(0 < z < 1) = 0,5000 0,3413 = 0,1587 c) Här kan man exempelvis använda sig av komplementregeln som säger att: P(56 < X < 63) = 1 P(X > 63) P(X < 56) = 1 0,66 0,1587 = 0,6147 a) z = X μ σ z = = 1 P(X < 500) = P(z < 1) = P(z > 1) = 0,5 P(0 < z < 1) = 0,5 0,3413 = 0,1587 Sannolikheten är ca 0,16 b) σ x = σ n = 5 = 0,8944 z = ,8944 =,36 P(X < 500) = P(z <,36) = P(z >,36) = 0,5 P(0 < z <,36) = 0,5 0,4874 = 0,016 Sannolikheten är ca 0,01 c) Det är väl ganska stor sannolikhet att de fem ostarna kommer från samma leverans och är då kanske tillverkade ungefär samtidigt. Därmed är det nog inte ett slumpmässigt urval av alla företags ostar. 11

12 3 X = 3,01 kg frihetsgrader: 35 konfidensnivå: 95% t =,030 X ± t s n 3,01 ±,03 0, < μ < 3,0 Med 95% sannolikhet täcker detta interval det sanna värdet. 4 Fördelningen av arbetslöshetstider är förmodligen en exponentialfördelning eftersom det är frågan om tidsperioder. Men när vi drar ett urval och beräknar urvalsmedelvärdet kommer fördelningen av alla möjliga utvalsmedelvärden att vara en normalfördelning eftersom vi har så många observationer. Därmed kan vi använda inferensformlerna. n = 50 X = 6 s = 6, frihetsgrader: 49 konfidensnivå: 95% t =,01 KI = 6 ±,01 6, 50 KI = 6 ± 1,76 Konfidensintervallet ligger mellan 4, och 7,8 Eftersom 8 ligger utanför konfidensintervallet är det inte så troligt att det sanna värdet är 8. Sannolikheten för det är mindre än 5 %. 1

13 5 n = 400 p = = 0,75 a) Vi använder andelen i urvalet som punktestimat, dvs 75% b) konfidensnivå 99% z =,576 KI = 0,75 ±,576 0,75 0,5 400 KI = 0,75 ±,576 0,0165 KI = 0,75 ± 0,0558 0,69 < π < 0,81 c) Hon har mycket goda chanser att bli vald. Med 99 procents sannolikhet kommer hon att få en andel mellan 69 och 81 procent och det räcker ju med 50 % för att bli vald. 6 E = z = 1,96 σ = 10 n = ( Zσ E ) n = ( 1,96 10 ) = 9,8 = 96,04 Avrunda uppåt till a) Maximal andel bilägare i A: P A (max) b) Minimal andel bilägare i A: P A (min) c) Maximal andel bilägare i B: P B (max) d) Minimal andel bilägare i B: 0.40 P B (min) e) Eftersom man gjort totalundersökning (fastän med bortfall) förekommer ingen samplingvariation. Differensen P B - P A har följaktligen Max.-värde: P B(max) - P A(min) = = Min.-värde: P B(min) - P A(max) = = Differensen P B - P A ligger således i intervallet

14 8. Antal svarande är 550. Bortfallet är = 4950 I svarsgruppen är 175 positiva till arbetet. Under de olika antagandena får vi nu: A) B) C) D) Om vi enbart räknat andelen på de som besvarade enkäten hade andelen blivit 300 / 1600 = ,1875 ± z 0,1875(1 0,1875) ,1875 ± 1,96 0, ,1875 ± 0,0191 Konfidensintervallet ligger mellan 0,168 och 0,07 Punktestimat av antalet i hela urvalet som jagat /100 = = 50 Vilket ger en andel på 50 / 000 = 6% 10 a) Validitet är den grad med vilken en mätning mäter det begrepp som man avser att mäta b) Reliabilitet, hur noga en mätning är. c) Operationalisering är den process där man gör ett begrepp mätbart så att man kan skapa en variabel. I en enkätundersökning innebär det att formulera en eller flera frågor samt att koda svaren till dessa. Om man konstruerar flera frågor är en del av operationaliseringen också att bestämma hur de olika frågorna ska vägas samman. 11 se diskussion kring liknande frågor i Bryman och Bell kapitel 10 14

15 Hypotesprövning 1 Hypoteser H 0 : μ = 90 H 1 : μ 90 (Det vi vill bevisa ska vi ha i mothypotesen eftersom vi försöker förkasta nollhypotesen.) Signifikansnivå 10 % Teststatistika: = X μ s n Frihetsgrader = 99 Kritiskt värde: 1,66 Beslutsregel: om värdet på teststatistikan är större än 1,66 eller mindre än -1,66 förkastas nollhypotesen. t = = 1,8 Eftersom 1,8 är större än 1,66 kan nollhypotesen förkastas. Därmed kan vi dra slutsatsen att försäljningstiden har ändrat och inte längre är lika med 90 dagar. Hypoteser: H 0 : μ 3,13 H 1 : μ < 3,13 Signifikansnivå 5 % Teststatistika: t = X μ s n Antal frihetsgrader : 4 Kritiskt värde: 1,711 Beslutsregel: om värdet på teststatistikan understiger det kritiska värdet -1,711 förkastas nollhypotesen. t =,86 3,13 = 1,15 1,0 5 Eftersom -1,15 är större än det kritiska värdet kan nollhypotesen inte förkastas. Därmed kan vi inte dra några slutssatser från denna undersökning. Donalds undersökningsmetod är det inget fel på men han kan inte dra den slutsats han gör. 15

16 3 Vi har två populationer, nedan använder jag m för kunder med mjukvaruproblem och h för kunder med hårdvaruproblem. n m = 35 n h = 45 X m = 18 X h = 15.5 s m = 4, s h = 3.9 Signifikansnivå 5 % H 0 : μ m μ h H 1 : μ m > μ h df = (4, 35 +3,9 45 ) ( 4, 35 ) 3,9 ( ) 45 1 Kritiskt värde:1,667 t = X m X h s m nm + s h n h t = 18 15,5 4, 35 +3,9 45 = 70 =,5 0,9176 =,7 Vi förkastar H 0 eftersom,7 är större än 1,667. Vi kan dra slutsatsen att det tar längre tid att hjälpa kunder med mjukvaruproblem. 4 a) H 0: Medellönen för centrar, forwards och guards är lika höga. H 1: Minst en av spelarkategorierna har en medellön som avviker från de andras. b) Eftersom p-värdet är större än vår signifikansnivå kan vi inte förkasta nollhypotesen. Därmed kan vi inte dra några slutsatser. c) Populationerna ska vara oberoende, normalfördelade och ha samma standardavvikelse. I det här fallet verkar centrarna ha en större standardavvikelse än de andra två populationerna. d) Centrarnas konfidensintervall ligger mellan 113 och 060 Forwards konfidensintervall ligger mellan 1310 och 1660 Guards konfidensintervall ligger mellan 113 och 1433 e) Eftersom det går att finna värden som ingår i alla tre konfidensintervallen kan vi inte heller från konfidensintervallen dra någon slutsats om att medelvärdena skulle skilja sig åt i de tre populationerna. 16

17 5 x m = 18,05 x k = 1,19 n m = 4 n k = 48 s m = 9,7 s k = 5,33 a) Hypoteser: H 0 : σ m = σ k H 1 : σ m σ k Teststatistika: F = s 1 s Frihetsgrader täljare: 41 Frihetsgrader nämnare:47 Kritiskt värde: ca.05 (använd tabellen för 1 % signifikansnivå, vid dubbelsidigt test används tabellen för halva signifikansnivån.) Beslutsregel: Nollhypotesen förkastas om teststatistikans värde överstiger,05 Beräkna teststatistikan, ta alltid den större variansen i täljaren. F = 9,7 5,33 = 85,93 8,41 = 3,0 Nollhypotesen förkastas då teststatistikans värde överstiger det kritiska värdet. Slutsats. Män och kvinnor har inte samma varians b) Hypoteser: H 0 : μ m = μ k H 1 : μ m μ k Teststatistika: t = X 1 X df = (85, ,41 48 ) ( 85,93 4 ) 41 + (8,41 48 ) 47 Kritiskt värde:,66 t = 18,05 1,19 85, ,41 48 s 1 n1 + s n = 63,5 = 5,86 1,6 = 3,608 Eftersom teststatistikans värde överstiger det kritiska värdet kan vi förkasta nollhypotesen. Vi kan därmed dra slutsatsen att medelvärdet för män avviker från medelvärdet för kvinnor i hela populationen. Män ägnar mer tid åt styrketräning än kvinnor. På nästa sida visas en SPSS utskrift på denna test. På raden equal variances not assumed ser vi att t värde och frihetsgrader överensstämmer med beräkningarna ovan. Levenes test är en lite mer komplicerad test av varianser från två populationer. Vi ser att den i det här fallet ger ett något högre värde på F än vad den enkla läroboksmetoden ger. Men slutsatsen blir densamma, varianserna avviker. 17

18 6 I urvalet är medelvärdena ganska lika för män och kvinnor men kvinnorna har en större varians. Levenes test är signifikant vilket innebär att vi kan avslå hypotesen att män och kvinnor har samma varians (p-värdet 0,008 är lägre än signifikansnivån). Det är större skillnader mellan olika män än mellan olika kvinnor i hur mycket tid man de lägger på konditionsträning. Eftersom varianserna skiljer sig åt bör vi tolka t-testet på nedre raden. T-testets p-värde är 0,35. Det är inte signifikant så vi kan inte förkasta nollhypotesen att män och kvinnor ägnar lika mycket tid åt konditionsträning. Därmed kan vi inte dra några slutsatser angående medelvärdena. 7 Vi använder t-test för beroende urval H 0 : μ d = 0 H 1 : μ d 0 Teststatistika: t = d 0 s d n Frihetsgrader: 89 Kritiskt värde:,63 t = 11,54 0 = 8,0 13,69 90 Då teststatistikans värde överstiger det kritiska värdet kan nollhypotesen förkastas. Vi kan därmed dra slutsatsen att personerna i populationen inte ägnar lika mycket tid åt styrketräning som åt konditionsträning. 18

19 8 a) Om man inte lyckas förkasta nollhypotesen kan man inte dra några slutsatser alls. Han kan därmed inte dra slutsatsen att kognitiv beteendeterapi är verkningslös. Det är möjligt att det finns en effekt även om han inte lyckats bevisa det. Den teststatistika han använder är för två oberoende urval. Om man ska använda den ska antalet frihetsgrader beräknas med följande formel: df = ( s 1 n1 + s n ) ( s 1 n1 ) s ( n1 1 + n ) n 1 = ( 10, ,1 10 ) ( 10, 10 ) ( 10,1 10 ) + Men han missar då att utnyttja det faktum att observationerna är relaterade till varandra. b) Här bör han istället använda t-test för beroende urval. c) Börja med att beräkna differensen för varje patient: Anders Eva Lotta Per Lars Ove Stina Anna Nils Klas medel std före ,6 10, efter ,6 10, ,77 Hypoteser: H 0 : μ d = 0 H 1 : μ d 0 Teststatistika: t = d 0 s d n Frihetsgrader: 9 Kritiskt värde:,6 t = 5 0 5,77 10 =,74 Då teststatistikans värde överstiger det kritiska värdet kan nollhypotesen förkastas. Vi kan därmed dra slutsatsen att blodtrycket inte är lika före och efter behandlingen. Vi kan således dra slutsatsen att kognitiv beteendeterapi har en effekt på blodtrycket. Här skulle man också kunna tänka sig att göra en enkelsidig test om man anser sig kunna utesluta att behandlingen ökar blodtrycket. I så fall är det kritiska värdet 1,83. 19

20 Regression 1 a) falsk b) sann c) falsk d) falsk e) sann f) falsk Detta är den justerade förklaringsgraden, eller den justerade determinationskoefficienten. Den anger den andel av variansen i Y som inte finns kvar i residualerna, dvs den andel av variansen som vår regressionsmodell har förklarat. 3 A. Koefficienten för x har värdet och anger att om utbildningstiden ökas med 1 år så minskar TV-tittandet i genomsnitt med timmar per dag förutsatt oförändrad ålder. B. Insättning av värdet 74 på x 1 och 11 på x ger y ˆ dvs i genomsnitt.1 timmar per dag. 4 A neg B pos C neg D pos (neg?) 5 A) Interceptet är 48, det ska inte tolkas eftersom det förmodligen inte finns några skolor som satsar noll dollar per student och där lärarna inte får lön. Koefficienten för expenditure är signifikant eftersom p värdet (0,000) är lägre än 5 %. Om vi antar att det inte finns något samband från skolresultat till resurstilldelning blir tolkningen att om vi satsar ytterligare en dollar per elev reduceras andelen som klarar provet med 0,006 procentenheter vid oförändrade värden på övriga oberoende variabler. Koefficienten för lärarlöner är signifikant eftersom p värdet (0,000) är lägre än 5 %. Om vi antar att det inte finns något samband från genomströmning till lärarlöner blir tolkningen att om man höjer lärarnas löner med 1000 dollar skulle genomströmningen öka med 0.69 procentenheter vid oförändrade värden på övriga oberoende variabler. Koefficienten för bidrag är signifikant eftersom p värdet (0,000) är lägre än 5 %. Om vi antar att det inte finns något samband från genomströmning till hur mycket bidrag skolorna får innebär det att om en skola får ytterligare 1 dollar i bidrag kar genomströmingen på matteprovet med 0,004 procentenheter vid oförändrade värden på övriga oberoende variabler. B) Om politikerna ger mer resurser till skolor med låga resultat, för att förbättra resultaten där, finns ett samband från provresultat till expenditure. Detta är nog troligare än att skolresultaten skulle försämras om skolorna får mer resurser. Det är också troligt att det finns ett samband mellan provresultat och hur mycket bidrag skolorna får från välgörenhetsorganisationer. Ofta får man stipendier utifrån hur goda resultat man har uppnått. Detta är därmed ett exempel på en dåligt utför regressionsanalys. 0

21 Förklaringarna till regressionskoefficienterna för exp och found är förmodligen att politiker tenderar att ge mer resurser till skolor med sämre resultat och att stipendier tenderar att delas ut till elever med goda resultat. Därmed kan vi inte göra de tolkningar vi gjorde i A- uppgiften. För lärarlönerna är det väl inte lika uppenbart att de skulle kunna påverkas av elevernas resultat. Det skulle i så fall vara om skolorna tillämpade någon slags lönesättningssystem där lärarna får extra betalt utifrån resultaten på proven. ( Angående lärarlönerna kan vi dock ha ett annat problem. Det skulle kunna vara så att prestigeskolor betala högre lärarlöner men också attraherar duktigare elever. Då skulle höga lärarlöner ge bättre resultat men inte för att de högavlönade lärarna är duktigare utan för att de lockar duktiga elever. Jag provade också att använda förbättringen av provresultaten mellan årskurs4 och årskurs 7 och då var lärarnas löner inte signifikant. Så de högavlönade lärarna lyckades inte förbättra sina redan högpresterande elevers resultat.) C) Förklaringsgraden R = SSR SST = = Den justerade förklaringsgraden R adj = 1 SSE n k 1 SST n 1 = = D) Den estimerade regressionsekvationen är: y = X X X 3 Sätt in värdena på de oberoende variablerna: y = = 56. Bästa gissningen för genomströmningen är drygt 56 % 6 a) Här har vi en bra modell som vi kan vara nöjda med. Residualerna verkar vara skapligt normal-fördelande med samma varians oavsett värde på x. De är jämnt utspridda men de flesta är nära noll. b) Här ökar variansen för höga värden på x. Detta problem kallas heteroskedasticitet. c) Här verkar det inte vara ett linjärt samband eftersom vi kan se ett mönster i residualerna. Låga och höga värden på x har negativa residualer, medan de är positiva för medelstora värden på x. Rekommendationen här skulle vara att lägga in x som förklarande variabel. 1

22 7 a) Modell 1 Här är antalet våldsbrott beroende variabel Interceptet tolkas ej eftersom det inte finns någon delstat som har värdet noll på alla oberoende variabler. Koefficienten för black är signifikant eftersom p värdet är mindre än 0,05 Tolkas som att om andelen svarta i befolkningen ökar med en enhet ökar antalet våldsbrott med 10 per invånare vid oförändrade värden på övriga oberoende variabler. ( Eftersom en andel alltid är ett tal mellan noll och ett är det kanske rimligare att säga att antalet våldsbrott ökar med 1 per invånare om andelen svarta ökar med 0,1 ) Koefficienten för metro är signifikant eftersom p värdet är mindre än 0,05 Tolkas som att om andelen i befolkningen som bor i storstäder ökar med en enhet ökar antalet våldsbrott med 4 per invånare vid oförändrade värden på övriga oberoende variabler. ( Eftersom en andel alltid är ett tal mellan noll och ett är det kanske rimligare att säga att antalet våldsbrott ökar med 0,4 per invånare om andelen som bor i storstäder ökar med 0,1 ) Koefficienten för unem är signifikant eftersom p värdet är mindre än 0,05 Tolkas som att om andelen arbetslösa i befolkningen ökar med en enhet ökar antalet våldsbrott med 53 per invånare vid oförändrade värden på övriga oberoende variabler.. ( Eftersom en andel alltid är ett tal mellan noll och ett är det kanske rimligare att säga att antalet våldsbrott ökar med 5,3 per invånare om andelen som är arbetslösa ökar med 0,1 ) Koefficienten för incpc är inte signifikant eftersom p värdet är större än 0,05. Och tolkas därför inte Koefficienten för polpc är signifikant eftersom p värdet är mindre än 0,05 Tolkas som att om antal poliser per invånare ökar med en polis ökar antalet våldsbrott med 0,04 per invånare vid oförändrade värden på övriga oberoende variabler. Modell Här är antalet stölder beroende variabel Interceptet tolkas ej eftersom det inte finns någon delstat som har värdet noll på alla oberoende variabler. Koefficienten för black är inte signifikant eftersom p värdet är större än 0,05. Och tolkas därför inte Koefficienten för metro är signifikant eftersom p värdet är mindre än 0,05

23 Tolkas som att om andelen i befolkningen som bor i storstäder ökar med en enhet ökar antalet stölder med per invånare vid oförändrade värden på övriga oberoende variabler.. ( Eftersom en andel alltid är ett tal mellan noll och ett är det kanske rimligare att säga att antalet stölder ökar med, per invånare om andelen som bor i storstäder ökar med 0,1 ) Koefficienten för unem är inte signifikant eftersom p värdet är större än 0,05. Och tolkas därför inte Koefficienten för incpc är signifikant eftersom p värdet är mindre än 0,05 Tolkas som att om befolkningens medelinkomst ökar med en dollar sjunker antalet stölder med 0,001 per invånare vid oförändrade värden på övriga oberoende variabler.. Koefficienten för polpc är signifikant eftersom p värdet är mindre än 0,05 Tolkas som att om antal poliser per invånare ökar med en polis ökar antalet stölder med 0,09 per invånare vid oförändrade värden på övriga oberoende variabler.. b) Här kan man exempelvis diskutera om våldsbrotten ökar kanske den vita befolkningen flyttar från delstaten, i så fall skulle sambandet gå från antalet våldsbrott till andel svarta Om våldsbrotten är höga kanske det är mindre attraktivt att starta företageande och anställa folk, då skulle andelen våldbrott påverka arbetslösheten Om våldbrotten ökar kanske man anställer fler poliser, då skulle antalet våldsbrott påverka antalet poliser. c) Förklaringsgraden R = 1 (y i y i) (y i y ) = 1 SSE SST = SSR SST = = 0,85 Den justerade förklaringsgraden R adj (y i y i) n k 1 = 1 (y i y ) n 1 = 1 SSE n k 1 SST n 1 = = 0,83 54 Förklaringsgraderna anger den andel av variationen i brottsstatistiken som förklaras av regressionsmodellen d) y = 4, ,5 0, + 3,9 0,3 + 5,8 0,06 + 0,04 50 = 7,5 e) y = 34,48 10,3 0, + 1,9 0,3 1,5 0,06 0, ,09 50 = 40, 3

24 8 Modell 1 Interceptet är 876; tolkas ej eftersom det antagligen inte finns några länder där genomsnittlig alkoholkonsumtion från vin är noll, vilket skulle innebära att ingen i hela landet dricker vin. Koefficienten för alkohol är -16,3, eftersom p-värdet överstiger 5 % är det dock inte signifikant och tolkas ej. Vi kan inte påvisa något samband mellan allmän dödlighet och vinkonsumtion. Modell Interceptet är 39; tolkas ej eftersom det antagligen inte finns några länder där genomsnittlig alkoholkonsumtion från vin är noll, vilket skulle innebära att ingen i hela landet dricker vin. Koefficienten för alkohol är -19,3, p-värdet är 0,001 så här är koefficienten signifikant. Tolkningen är att om alkoholkonsumtion från vin ökar med 1 liter per år så minskar antal döda i hjärtsjukdomar med 19 per invånare. Model 3 Interceptet är 10.8; tolkas ej eftersom det antagligen inte finns några länder där genomsnittlig alkoholkonsumtion från vin är noll, vilket skulle innebära att ingen i hela landet dricker vin. Koefficienten för alkohol är 3.6, p-värdet är 0,000 så här är koefficienten signifikant. Tolkningen är att om alkoholkonsumtion från vin ökar med 1 liter per år så ökar antalet döda i leversjukdomar med 3,6 dödsfall per invånare. En sammanfattande slutsats är således att vindrickande inte påverkar dödligheten generellt. Vin är bra för hjärtat men dåligt för levern så det minskar antalet döda i hjärtsjukdomar men ökar antalet döda i leversjukdomar. b) R = SSR SST = = R adj c) = 1 SSE n k 1 SST n 1 = = I modell 1 förklaras 1.8 procent av variansen i dödstal av modellen. I modell förklaras 40.1 procent av variansen i dödstal i hjärtsjukdomar av modellen. I modell 3 förklaras 51.9 procent av variansen i dödstal i leversjukdomar av modellen. d) = 18 e) = 00 4

25 9 a) I modell tar vi även hänsyn till prisskillnader mellan olika restaurangkedjor. b) Intercepten tolkas ej eftersom det inte finns områden där medianinkomsten är noll. I modell 1 är koefficienten för medianinkomst signifikant på 5% nivån eftersom p-värdet är mindre än 0,05. Det skulle tolkas som att när medianinkomsten stiger med en enhet sänker man priset på en huvudrätt med 5 miljondels enhet vid oförändrade värden på övriga oberoende variabler. (Någon slags omvänd prisdiskriminering) Vi får inte reda på enheterna här men om det är dollar innebär det att en höjning av medianinkomsten med 1000 dollar ger en prissänkning på 0,005 dollar. I modell är inkomst inte längre signifikant och vi tolkar då inte den koefficienten. Dummyvariablerna är däremot signifikanta och tolkningen av dem är att de anger prisskillnaden mellan den vanligaste huvudrätten i respektive restaurangkedja och den vanligaste huvudrätten på Wendys restauranger. Eftersom vi inte har med någon dummyvariabel för Wendys är de referenspunkten i regressionen. c) Det verkar som att restaurangkedjorna har lokaliserat sig till olika typer av områden. King Fried Chicken har den dyraste huvudrätten. Det skulle kunna vara så att de i huvudsak lokaliserat sig i områden med låga inkomster. Vi kan verifiera det genom att titta i korrelationsmatrisen. I kolumnen för income ser vi att korrelationen är negativ med KFC men positiv med de andra båda kedjorna. Vilket innebär att KFC finns i områden med låg inkomst och de andra i område med hög inkomst. (Tolkningen av regressionskoefficienterna gäller ju givet oförändrade värden på övriga variabler. I modell när vi har med dummyvariablerna blir tolkningen prisökningen på en restaurang av samma kedja när medianinkomsten stiger med en enhet. Och då har vi alltså ingen prisökning. I modell 1 där vi inte har med dummyvariablerna jämförs restauranger som tillhör olika kedjor) d) Normalfördelade residualer: Detta antagande stämmer dåligt i modell 1 men ganska bra i modell (I modell 1 ser det snarare ut som om residualerna kommer från olika normalfördelningar kanske beroende på restaurangkedja?) Heteroskedasticitet verkar inte vara något problem i någon av modellerna eftersom spridningen inte ökar eller minskar med ökad inkomst. Vi har inga bågmönster så antagandet av linjärt samband verkar funka i båda modellerna. I modell 1 har vi ett litet lustigt lutande mönster, eftersom det försvinner när vi har med restaurangdummies verkar det vara kopplat till det. e) Förklaringsgraden beräknas enligt: R = SSR = 18,74 = 0,87 SST 155,58 Detta är alltså den andel av variationen som förklaras av regressionen när vi mäter variationen som kvadratsummor. Om vi också tar hänsyn till frihetsgraderna får vi den justerade förklaringsgraden: R adj = 1 SSE n k 1 SST n k = 1 6, ,58 = 0,86 37 Detta är den andel av variansen som förklaras av regressionen. Förklaringsgraden ökar betydligt när vi tar med restaurangkedjedummies så skillnader mellan olika restaurangkedjor är en stor del i förklaringen av prisskillnaderna. Vilket är ganska naturligt eftersom de inte har exat samma maträtter. King Fried Chicken har kyckling och Burger King hamburgare. f) Modell 1 säger att det finns en omvänd prisdiskriminering modell två att det inte finns någon prisdiskriminering. Modell två har betydligt högre förklaringsgrad och av restaurangkedjedummies är signifikanta. (samtliga restaurangkedjedummies skulle varit signifikanta om vi använt 10 % signifikansnivå). Dessutom är antagandet om normalfördelade residualer bättre uppfyllt i modell. Det mesta talar därför för att 5

26 modell är att föredra. (Skulle vi enbart ha en modell för att förklara prisskillnader borde vi kanske ta bort variabeln inkomst men eftersom syftet var att studera just den variabeln behöver vi ha den med för att visa att den inte är signifikant) g) Vårt punktestimat för denna prisskillnad är regressionskoefficienten för BK dummien alltså -0,5 Eftersom frihetsgraderna är 368 får vi samma värde ur t fördelningen som ur z fördelningen, vid konfidensgraden 99 % blir t lika med,576 Standardavvikelsen är enligt regressionsresultatet 0,04 Vårt konfidensintervall blir därmed: β = b ± t s = 0,5 ±,576 0,04 = 0,5 ± 0,108 Prisskillnaden är med 99 procents säkerhet i intervallet mellan 0,333 och 0,117. (Sannolikheten att få ett sådant här värde på koefficienten om det sanna värdet inte finns i detta intervall är mindre än 1 %.) 10 a) Skillnaden består i att man i modell två också försöker undersöka påverkan från ingångslönen på nuvarande lön. b) Modell 1:Konstanten skulle i det här fallet ange lönen för en kvinna helt utan erfarenhet och utan examen från high scool. Om sådana inte finns med i urvalet är bör vi inte tolka interceptet. Koefficienten för male säger att män i genomsnitt har 7573 högre lön än kvinnor vid oförändrade värden på övriga oberoende variabler, denna är signifikant tom på 0,1 % nivån. Koefficienten för erfarenhet på samma arbete är inte signifikant, erfarenhet från tidigare arbete är signifikant på 5% nivå men negativ. I urvalet har tydligen de som har mycket arbetserfarenhet lägre lön. Tolkningen blir ju att ytterligare ett års erfarenhet sänker lönen med 103 vid oförändrade värden på övriga oberoende variabler. Utbildningsdummyvariablerna anger löneskillnaden för denna utbildningsnivå jämfört med en ingenjör som inte ens har high school givet oförändrade värden på övriga oberoende variabler. Av dessa är alla utom high scool signifikanta. Modell : Här är konstanten negativ och insignifikant, vilket kan tyckas märkligt. Ingångslön är positiv och signifikant. Den som har en hög startlön har hög lön även senare. Tolkningen är att om du får ytterligare en baht i ingångslön kommer din framtida lön att vara 1.5 baht högre. (kanske en effekt av procentuella löneökningar?) Koefficienten för male säger att män i genomsnitt har 411 högre lön än kvinnor vid oförändrade värden på övriga oberoende variabler, denna är signifikant tom på 0,1 % nivån. Koefficienten för erfarenhet på samma arbete är signifikant i den här modellen, tolkningen blir att ytterligare ett års arbete hos samma arbetsgivare ökar din lön med 566 baht vid oförändrade värden på övriga oberoende variabler. Erfarenhet från tidigare arbete är signifikant på 5% nivå men negativ, ytterligare ett års erfarenhet hos andra arbetsgivare sänker lönen med 36 baht givet oförändrade värden på övriga oberoende variabler. Utbildningsdummyvariablerna anger löneskillnaden för denna utbildningsnivå jämfört med en ingenjör som inte ens har high school givet oförändrade värden på övriga oberoende variabler. Av dessa är alla utom high scool och polytech signifikanta. 6

27 c) Alla faktorer som påverkar lönen bör även ha påverkat ingångslönen. Därmed fångar koefficienten för ingångslön en stor del av effekten från utbildning etc. d) Normalfördelningsantagandet fungerar halvbra i båda modellerna, residualerna är lite positivt snedfördelade. Heteroskedasticitet kanske i ingångslönen. Fördelningarna verkar smalare för låga ingångslöner. Inga tydliga tecken på icke linjäritet. e) Modell har en förklaringsgrad på drygt 80 procent vilket innebär att mer än 80 procent av variationen i lön kan förklaras av modell. Modell 1 förklarar dock bara 68% f) Vårt punktestimat för denna löneskillnad är regressionskoefficienten för male 7573,664 enligt modell 1. Eftersom frihetsgraderna är 395 får vi samma värde ur t fördelningen som ur z fördelningen. Vid konfidensgraden 95 % bir t lika med 1,96 Standardavvikelsen är enligt regressionsresultatet 111,458 enligt modell 1. Vårt konfidensintervall blir därmed: β = b ± t s = 7573,664 ± 1,96 111,458 = 7573,664 ± 374,458 löneskillnaden är med 95 procents säkerhet i intervallet mellan 5199 och (Sannolikheten att få ett sådant här värde på koefficienten om det sanna värdet inte finns i detta intervall är mindre än 5%.) g) Modell har högre förklaringsgrad och är därmed bättre på att förklara lönenivån. Dock döljs en stor del av effekterna från olika variabler i ingångslönen så de enskilda oberoende variablernas effekt utvärderas nog bäst från modell I områden med stor befolkning blir antalet brott liksom antal förvärvsarbetande mödrar högt jämfört med områden där befolkningen är liten. 1 Kausala riktningen - det är snarare så att ju längre en kvinna lever efter en operation desto fler barn kan hon föda. 13 A) I båda modellerna är regressionskoefficienten för female negativ och signifikant vilket tyder på att kvinnor diskrimineras. B) Koefficienten för non white är inte signifikant i någon av modellerna. Vi kan inte förkasta hypotesen att icke vita får lika hög lön som vita. C) Skillnaden ligger i att modell också innehåller kvadraten av antalet yrkesverksamma år. Det innebär att vi skattar ett icke linjärt samband mellan yrkeserfarenhet och lön. Om vi tror att effekten på lönen av ytterligare ett års yrkeserfarenhet minskar, ju fler år vi har arbetat är därför modell att föredra. (1 års yrkeserfarenhet borde väga tungt gentemot någon som inte har någon erfarenhet alls men få arbetsgivare borde fästa något större avseende vid om du har eller 3 års yrkeserfarenhet. Så det kan tyckas rimligt att värdet av ytterligare ett års erfarenhet minkar ju mer erfarenhet vi har.) D) I modell 1 är denna tolkning ganska enkel. Ytterligare ett års yrkeserfarenhet ger i genomsnitt 0,05 dollar mer per timme. I modell två blir det knepigare. Första årets 7

28 yrkeserfarenhet ger 0, dollar mer per timme. (När exper=1 blir även exper = 1 och vi kan summera koefficienterna för exper och expersq) När yrkeserfarenheten ökar minskar effekten av ytterligare ett års yrkeserfarenhet eftersom regressionskoefficienten för expersq är negativ. (För att få den marginella effekten av ytterligare ett års erfarenhet vid olika värden av erfarenhet kan man derivera regressionsekvationen med avseende på erfarenhet.) E) Enligt histogrammen är residualerna något snedfördelade för båda modellerna men verkar ändå skapligt normalfördelade. I båda modellerna verkar vi ha heteroskedasticitet för variabeln utbildning. Om vi kan urskilja ett bananmönster i residualerna för experience i modell 1 skulle det ge stöd för modell. Det är dock svårt att urskilja något sådant. F) Det faktum att den kvadrerade yrkeserfarenheten är signifikant talar för modell. Även logiska skäl gör det. Det kan verka rimligt att det finns en avtagande avkastning av yrkeserfarenhet. Mot modell två talar att residualplotten i modell 1 ser ganska bra ut, vi ser inget tydligt bananmönster. Mot modell talar också att den är lite svårare att förklara för icke statistiker. Det är enklare att tolka en linjär modell. Eftersom studiens fokus är diskriminering är vi i första hand intresserade av regressionskoefficienterna för female och non white, då dessa är snarlika i båda modellerna spelar modellvalet ingen större roll. Kanske den enklare modell 1 är att föredra? G) Eftersom frihetsgraderna är mer än 300 får vi samma värde ur t fördelningen som ur z fördelningen. Vid konfidensgraden 95 % blir t lika med 1,96 b ± t s Från modell 1: 1,81 ± 1,96 0,65 1,81 ± 0,519 Löneskillnaden ligger med 95 % sannolikhet mellan 1,3 och,3 dollar per timme. Från modell : 1,79 ± 1,96 0,58 1,79 ± 0,506 Löneskillnaden ligger med 95 % sannolikhet mellan 1,3 och,3 dollar per timme. H) Förklaringsgraden är relativt låg. Vilket tyder på att betydligt fler variabler påverkar lönenivån. Exempel på intressanta variabler att lägga till kan vara typ av befattning (chef, tjänsteman, arbetare) olika yrkeskategorier etc. Om antalet manliga chefer är större än antalet kvinnliga chefer, vilket nog var ganska sannolikt på 70-talet i USA, kan man ana att koefficienten för female inte skulle vara lika negativ i en modell som innehöll den typen av variabler. 8

29 I) Från modell 1 y = 1,54 1,81 + 0, , , = 4,6 Från modell y =,078 1,79 + 0, , , , = 5,5 J) Från modell1 y = 1,54 + 0, , ,141 3 = 3,518 Från modell y =, , , , , = 3, a) Regressionskoefficienten för logaritmerat pris på ekologiska äpplen i regressionerna med logaritmerat pris på ekologiska äpplen som beroende variabel dvs modell 1,3 och 4 ger oss egenpriselasticiteten på ekologiska äpplen. I alla tre modeller är denna koefficient signifikant vilket innebär att vi kan dra slutsatsen att elasticiteten inte är noll. Den ligger i alla tre modellerna mellan -0,4 och -0,5 så där någonstans har vi bästa gissningen för egenpriselasticiteten. b) Regressionskoefficienten för logaritmerat pris på konventionella äpplen i regressionerna med logaritmerat pris på ekologiska äpplen som beroende variabel dvs modell 1,3 och 4 ger oss korspriselasticiteten på ekologiska äpplen. I alla tre modeller är denna koefficient ej signifikant vilket innebär att korspriselasticiteten skulle kunna vara lika med noll. Den ligger i alla tre modellerna mellan 0,3 och 0,4 så där någonstans har vi bästa gissningen för korspriselasticiteten. c) Regressionskoefficienten för logaritmerat pris på konventionella äpplen i regressionerna med logaritmerat pris på konventionella äpplen som beroende variabel dvs modell och 5 ger oss egenpriselasticiteten på konventionella äpplen. I båda modellerna är denna koefficient ej signifikant vilket innebär att egenpriselasticiteten skulle kunna vara lika med noll. I modell är den -0,35 och i modell 5-0,96 så där någonstans har vi bästa gissningen för egenpriselasticiteten. d) Regressionskoefficienten för logaritmerat pris på ekologiska äpplen i regressionerna med logaritmerat pris på konventionella äpplen som beroende variabel dvs modell och 5 ger oss korspriselasticiteten på konventionella äpplen. I båda modellerna är denna koefficient ej signifikant vilket innebär att korspriselasticiteten skulle kunna vara lika med noll. I modell är den 0,54 och i modell 5 0,1 så där någonstans har vi bästa gissningen för korspriselasticiteten. e) Att enbart lägga till familjestorlek gjorde ingen större skillnad för att förklara äppelinköpen. Först när vi tar med antalet familjemedlemmar i olika åldersgrupper får vi någon vidare ökning av förklaringsgraden. Men den är fortfarande låg. För ekologiska äpplen är det bara antalet personer över 64 år som har en signifikant påverkan på familjens äppelinköp. I modellen för konventionella äpplen har även barn mellan 5 och 17 år en signifikant påverkan. f) De justerade förklaringsgraderna anger den andel av variansen i äppelinköp som förklaras av modellen. Förklaringsgraderna är väldigt låga i alla modellerna. I modell 5 som har den största förklaringsgraden är den ändå bara 4 % av variansen som förklaras av modellen. Hur mycket äpplen olika hushåll köper beror säkert på en mängd andra faktorer. Speciellt om man tycker om äpplen eller inte. 9

30 15 16 a) a = 15.1, har ingen rimlig tolkning eftersom priserna aldrig är noll och tolkas därför inte. b 1 = -4.15, förväntad förändring av försäljningen i miljoner kr vid en ökning av priset på den egna produkten med 1 kr/l då genomsnittspriset på konkurrerande produkter ej ändras b =.4, förväntad förändring av försäljningen i miljoner kr vid en ökning av konkurrenternas genomsnittspris med 1 kr/l då det egna priset är oförändrat b) Modell 1; b = -3.55, mäter effekten av egna priset på försäljningen men innehåller inverkan från alla variabler som ej ingår i modellen bl a konkurrenternas genomsnittspris. Att denna är lägre än i modell 3 kan bero på att konkurrenterna tenderar att sänka priset samtidigt som vi gör det, vilket innebär att effekten av vår prisförändring blir mindre. Modell 3; b = -4.15, mäter effekten av egna priset på försäljningen då inverkan från konkurrenternas genomsnittspris eliminerats genom att denna variabel nu ingår i modellen c) t-kvot = 6.64 innebär att regressionskoefficienten för variabeln konkurrerande produkters genomsnittspris avviker så mycket från värdet noll att denna skillnad ej kan anses bero enbart på slumpen dvs den variabel som koefficienten står ihop med har med stor sannolikhet betydelse för den beroende variabelns utveckling. Egentligen behöver vi känna antalet frihetsgrader för att kunna tolka t-värdet men här är det så pass stort att koefficienten är signifikant oavsett antalet frihetsgrader. a) Dessa båda variabler uttrycktes i dollar i övning 5 medan de här uttrycks i tusen dollar. I övning 5 kom vi fram till att om vi satsar ytterligare en dollar per elev reduceras andelen som klarar provet med 0,006 procentenheter vid oförändrade värden på övriga oberoende variabler. Här skulle vi tolka det som att om vi satsar ytterligare tusen dollar reduceras andelen som klarar matteprovet med 6 procentenheter. Och innebörden av det är ju precis samma. För att göra om variabeln mätt i dollar till en variabel mätt i tusen dollar divideras alla värden med Monsekvensen av det blir att regressionskoefficienten blir gånger så stor. (Detta illustrerar att det är viktigt att kontrollera enheterna nr man tolkar regressionskoefficienter) b) De log linjära modellerna har genomgående högre justerad förklaringsgrad än motsvarande linjär modell därmed kan vi säga att de loglinjära modellerna förklarar variationen i matematikresultat bättre. c) Modell 4 Interceptet är 76,8, tolkas ej eftersom inte alla oberoende variabler kan vara noll. Kostnad per elev är signifikant eftersom p värdet (0,000) är mindre än 5 %. Koefficientens värde -6,4 tolkas som att om vi ökar kostnaderna per elev med dollar så sjunker andelen som klara matteprovet med 6,4 procentenheter vid oförändrade värden på övriga oberoende variabler. Genomsnittlig lärarlön är signifikant eftersom p värdet (0,00) är mindre än 5 %. 30

31 Koefficientens värde 0,5 tolkas som att om vi ökar den genomsnittliga lärarlönen med dollar så ökar andelen som klara matteprovet med 0,5 procentenheter vid oförändrade värden på övriga oberoende variabler. Elever per lärare är signifikant eftersom p värdet (0,043) är mindre än 5 %. Koefficientens värde -0,8 tolkas som att om varje lärare får ytterligare en elev att undervisa så sjunker andelen som klara matteprovet med 0,8 procentenheter vid oförändrade värden på övriga oberoende variabler. Procent av elever med rätt till fri lunch är signifikant eftersom p värdet (0,000) är mindre än 5 %. Koefficientens värde -0,3 tolkas som att om andelen elever med rätt till fri lunch ökar med en procentenhet så sjunker andelen som klara matteprovet med 0.3 procentenheter vid oförändrade värden på övriga oberoende variabler. Bidrag från välgörenhetsorganisationer är signifikant eftersom p värdet (0,00) är mindre än 5 %. Koefficientens värde 5, tolkas som att om ett skoldistrikt får ytterligare dollar i bidrag från välgörenhetsorganisationer ökar andelen elever som klarar matteprovet med 5, procentenheter vid oförändrade värden på övriga oberoende variabler. Vinst per elev är signifikant eftersom p värdet (0,010) är mindre än 5 %. Koefficientens värde -4,0 tolkas som att om vi ökar vinst per elev med dollar så sjunker andelen som klara matteprovet med 4 procentenheter vid oförändrade värden på övriga oberoende variabler. Modell 9 Interceptet är,6, tolkas ej eftersom inte alla oberoende variabler kan vara noll. Kostnad per elev är signifikant eftersom p värdet (0,000) är mindre än 5 %. Koefficientens värde -1, tolkas som att om vi ökar kostnaderna per elev med en procent så sjunker andelen som klara matteprovet med 1, procent vid oförändrade värden på övriga oberoende variabler. Genomsnittlig lärarlön är signifikant eftersom p värdet (0,000) är mindre än 5 %. Koefficientens värde 0,5 tolkas som att om vi ökar den genomsnittliga lärarlönen med en procent så ökar andelen som klara matteprovet med 0,5 procent vid oförändrade värden på övriga oberoende variabler. Elever per lärare är signifikant eftersom p värdet (0,000) är mindre än 5 %. Koefficientens värde -0,7 tolkas som att om antalet elever per lärare ökar med en procent så sjunker andelen som klara matteprovet med 0,7 procent vid oförändrade värden på övriga oberoende variabler. Procent av elever med rätt till fri lunch är signifikant eftersom p värdet (0,000) är mindre än 5 %. 31

32 Koefficientens värde -0,15 tolkas som att om andelen elever med rätt till fri lunch ökar med en procent så sjunker andelen som klara matteprovet med 0.15 procent vid oförändrade värden på övriga oberoende variabler. Bidrag från välgörenhetsorganisationer är signifikant eftersom p värdet (0,005) är mindre än 5 %. Koefficientens värde 0,6 tolkas som att om bidrag från välgörenhetsorganisationer ökar med en procent så ökar andelen elever som klarar matteprovet med 0,6 procent vid oförändrade värden på övriga oberoende variabler. Vinst per elev är signifikant eftersom p värdet (0,0131) är mindre än 5 %. Koefficientens värde -0,05 tolkas som att om vinst per elev ökar med en procent så sjunker andelen som klara matteprovet med 0,05 procent vid oförändrade värden på övriga oberoende variabler. Den genomgående skillnaden mellan den linjära modellen och den log linjära är att jag skriver procentenhet när jag tolkar den linjära modellen och procent när jag tolkar den log linjära. Vad är innebörden av det? För en skola där 63 % klarar matteprovet skulle en ökning med en procentenhet innebära att 64 % klarar matteprovet. Men om andelen ökar med en procent blir den 1,01 63 = 63,63 %. När procenttalen är så här stora blir det inte så stor skillnad. Men om exempelvis räntan är % skulle en ökning med 1 procentenhet ge en ränta på 3 % medan en ökning med 1 procent ger en ränta på,0 procent så då är skillnaden stor. Det är viktigt att utrycka sig korrekt om procent och procentenheter även om många slarvar med det. Om vi jämför koefficienten för procent av eleverna med fri lunch så verkar den vara dubbelt så stor i den linjära modellen. Men om vi utgår ifrån ett skoldistrikt som ligger som medelvärdet för såväl matematikresultat om fri lunch så säger den linjära modellen att en ökning av andelen med fri lunch från 8,8 till 9,8 ger en sänkning av matteresultatet från 6,7 till 6,4 procent. Den loglinjära modellen säger att en ökning av andelen som har fri lunch från 8,8 till 9,1 (1,01 8,8) ger en sänkning av matteresultatet från 6,7 till 6,6 (0,9985 6,7 ). Eftersom andelen med fri lunch bara ökar med en tredjedels procentenhet i det här fallet är nog minskningen med en tiondels procentenhet ganska jämförbar med minskningen med tre tiondels procentenheter i förra fallet. Men om vi istället hade valt ett skoldistrikt som ligger långt från medelvärdena för dessa båda variabler kan modellernas tolkning skilja sig mera åt. Antag en skola där hälften av eleverna har fri lunch och enbart en fjärdedel av eleverna klarar matteprovet. Den linjära modellen säger att om andelen med fri lunch ökar från 50 % till 51 % så minskar andelen som klarar matteprovet från 5 % till 4,7 %. Den loglinjära modellen skulle säga att om andelen som har fri lunch ökar från 50 % till 50,5 % så minskar andelen som klarar matteprovet från 5 % till 4,96 (0, ). Eller vi kan uttrycka det som att den loglinjära modellen säger att om andelen med fri lunch ökar med procent dvs från 50 % till 51 % så minskar andelen som klarar matteprovet med 0,3 procent dvs från 5 % till 4,9 % (0,997 5 ). Så den log linjära modellen ger en minskning med 0,1 procentenhet medan den linjära ger en minskning med 0,3 procentenheter. 3

Lösningsförslag till övningar

Lösningsförslag till övningar MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2015 1 Innehåll Deskriptiv statistik

Läs mer

Lösningsförslag till övningar

Lösningsförslag till övningar MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 1 Innehåll Deskriptiv statistik och

Läs mer

Lösningsförslag till övningar

Lösningsförslag till övningar MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2016 1 Innehåll Deskriptiv statistik

Läs mer

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14

Läs mer

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 5 Tillåtna hjälpmedel: Miniräknare (Formelsamling

Läs mer

import totalt, mkr index 85,23 100,00 107,36 103,76

import totalt, mkr index 85,23 100,00 107,36 103,76 1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen

Läs mer

Fråga nr a b c d 2 D

Fråga nr a b c d 2 D Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841

Läs mer

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 23 e mars 2017 Ten 1, 9 hp Tillåtna hjälpmedel:

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 2 Tillåtna hjälpmedel: Miniräknare (Formelsamling

Läs mer

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng) 1 F1 ordinalskala F2 kvotskala F65A nominalskala F65B kvotskala F81 nominalskala (motivering krävs för full poäng) b) Variabler som används är F2 och F65b. Eftersom det är kvotskala på båda kan vi använda

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 2 Tillåtna hjälpmedel: Miniräknare (Formelsamling

Läs mer

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c) 1a) F1 och F3 nominalskala, enbart olika saker F kvotskala, Riktiga siffror, 0 betyder att man inte finns och avståndet mellan två värden är exakt definierat F4 och F5 ordinalskala, vi kan ordna svaren

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1 MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 1 Tillåtna hjälpmedel: Miniräknare (Formelsamling

Läs mer

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Fredagen den 9 e juni 2017 Ten 1, 9 hp Tillåtna hjälpmedel:

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning

Läs mer

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) 1. a) F1(Sysselsättning) F2 (Ålder) F3 (Kön) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) nominalskala kvotskala nominalskala ordinalskala ordinalskala b) En möjlighet är att beräkna

Läs mer

Laboration 2. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att utföra multipel regressionsanalys MÄLARDALENS HÖGSKOLA

Laboration 2. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att utföra multipel regressionsanalys MÄLARDALENS HÖGSKOLA MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 p Höstterminen 2016 Laboration 2 Övningsuppgifter Baserade på dataseten: Discrim_lab.xlsx

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 10 e januari 2017 Ten 1, 9 hp Tillåtna hjälpmedel:

Läs mer

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information

Läs mer

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Mälardalens Högskola. Formelsamling. Statistik, grundkurs Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 16 e januari 2015 Tillåtna hjälpmedel: Miniräknare

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 4 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 4 e mars Ten 1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Fredagen den 4 e mars 2016 Ten 1, 9 hp Tillåtna hjälpmedel:

Läs mer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT Stat. teori gk, ht 006, JW F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT 1.1, 13.1-13.6, 13.8-13.9) Modell för multipel linjär regression Modellantaganden: 1) x-värdena är fixa. ) Varje y i (i = 1,, n) är

Läs mer

EXAMINATION KVANTITATIV METOD vt-11 (110204)

EXAMINATION KVANTITATIV METOD vt-11 (110204) ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema

Läs mer

Att välja statistisk metod

Att välja statistisk metod Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...

Läs mer

, s a. , s b. personer från Alingsås och n b

, s a. , s b. personer från Alingsås och n b Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:

Läs mer

Repetitionsföreläsning

Repetitionsföreläsning Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 24 e mars 2016 Ten 1, 9 hp Tillåtna hjälpmedel:

Läs mer

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för

Läs mer

Sänkningen av parasitnivåerna i blodet

Sänkningen av parasitnivåerna i blodet 4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 12 e januari Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 12 e januari Ten 1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 12 e januari 2016 Ten 1, 9 hp Tillåtna hjälpmedel:

Läs mer

MÄLARDALENS HÖGSKOLA. Akademin för hållbar samhälls- och teknikutveckling. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP

MÄLARDALENS HÖGSKOLA. Akademin för hållbar samhälls- och teknikutveckling. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2014 1 Innehåll Deskriptiv statistik och index...

Läs mer

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då

Läs mer

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2015 1 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära...

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 HP Ten1 9 HP 19 e augusti 2015 Tillåtna hjälpmedel: Miniräknare

Läs mer

Multipel Regressionsmodellen

Multipel Regressionsmodellen Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b

Läs mer

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa. Betrakta kopparutbytet från malm från en viss gruva. Anta att budgeten för utbytet är beräknad på att kopparhalten ligger på 70 %. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten

Läs mer

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13 Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare

Läs mer

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Biostatistik kursmål Dra slutsatser utifrån basala statistiska begrepp och analyser och själva kunna använda sådana metoder.

Läs mer

F3 Introduktion Stickprov

F3 Introduktion Stickprov Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 9

ÖVNINGSUPPGIFTER KAPITEL 9 ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar

Läs mer

Medicinsk statistik II

Medicinsk statistik II Medicinsk statistik II Läkarprogrammet T5 HT 2014 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus Hypotesprövning Man sätter upp en nollhypotes (H0) och en mothypotes (H1) H0: Ingen effekt H1:

Läs mer

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 p Höstterminen 2016 Laboration 3 Övningsuppgifter Baserade på datasetet energibolag.rdata

Läs mer

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Deskriptiv statistik Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Deskriptiv statistik Tabeller Figurer Sammanfattande mått Vilken

Läs mer

Föreläsning 5. Kapitel 6, sid Inferens om en population

Föreläsning 5. Kapitel 6, sid Inferens om en population Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population 2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning

Läs mer

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen

Läs mer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Analytisk statistik. Mattias Nilsson Benfatto, PhD. Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik

Läs mer

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 2 Statistik; teori och tillämpning i biologi 1 Normalfördelning Samplingfördelningar och CGS Fördelning för en stickprovsstatistika (t.ex. medelvärde) kallas samplingfördelning. I teorin är

Läs mer

EXAMINATION KVANTITATIV METOD vt-11 (110319)

EXAMINATION KVANTITATIV METOD vt-11 (110319) ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 22 mars 2018 TEN1, 9 hp Tillåtna hjälpmedel: Miniräknare

Läs mer

FACIT (korrekta svar i röd fetstil)

FACIT (korrekta svar i röd fetstil) v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta

Läs mer

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att

Läs mer

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller: Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal

Läs mer

F19, (Multipel linjär regression forts) och F20, Chi-två test.

F19, (Multipel linjär regression forts) och F20, Chi-två test. Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med

Läs mer

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad

Läs mer

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts.

Spridningsdiagram (scatterplot) Fler exempel. Korrelation (forts.) Korrelation. Enkel linjär regression. Enkel linjär regression (forts. Spridningsdiagram (scatterplot) En scatterplot som visar par av observationer: reklamkostnader på -aeln and försäljning på -aeln ScatterplotofAdvertising Ependitures ()andsales () 4 Fler eempel Notera:

Läs mer

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två

Läs mer

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING

Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population

Läs mer

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek

Läs mer

Lektionsanteckningar 11-12: Normalfördelningen

Lektionsanteckningar 11-12: Normalfördelningen Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet

Läs mer

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER

Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER Kapitel 15: INTERAKTIONER, STANDARDISERADE SKALOR OCH ICKE-LINJÄRA EFFEKTER När vi mäter en effekt i data så vill vi ofta se om denna skiljer sig mellan olika delgrupper. Vi kanske testar effekten av ett

Läs mer

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer

Läs mer

Metod och teori. Statistik för naturvetare Umeå universitet

Metod och teori. Statistik för naturvetare Umeå universitet Statistik för naturvetare -6-8 Metod och teori Uppgift Uppgiften är att undersöka hur hjärtfrekvensen hos en person påverkas av dennes kroppstemperatur. Detta görs genom enkel linjär regression. Låt signifikansnivån

Läs mer

Statistik och epidemiologi T5

Statistik och epidemiologi T5 Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer

Läs mer

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 16 januari 2004, kl Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A0 och STA A3 (9 poäng) 6 januari 004, kl. 4.00-9.00 Tillåtna hjälpmedel: Bifogade formel-

Läs mer

Obligatorisk uppgift, del 1

Obligatorisk uppgift, del 1 Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten

Läs mer

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK 2007-08-29 UMEÅ UNIVERSITET Institutionen för matematik och matematisk statistik Statistik för Teknologer, 5 poäng (TNK, ET, BTG) Peter Anton, Per Arnqvist Anton Grafström TENTAMEN 7-8-9 LÖSNINGSFÖRSLAG TILL TENTAMEN

Läs mer

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Analytisk statistik. Tony Pansell, optiker Universitetslektor Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp

Läs mer

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet 1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.

Läs mer

ÖVNINGSUPPGIFTER KAPITEL 9

ÖVNINGSUPPGIFTER KAPITEL 9 ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar

Läs mer

Hur skriver man statistikavsnittet i en ansökan?

Hur skriver man statistikavsnittet i en ansökan? Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det

Läs mer

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Vårterminen 2019 1 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära...

Läs mer

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2016 1 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära...

Läs mer

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars Ten 1, 9 hp MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 2015 Ten 1, 9 hp Tillåtna hjälpmedel:

Läs mer

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP

MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 1 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära...

Läs mer

Hypotestestning och repetition

Hypotestestning och repetition Hypotestestning och repetition Statistisk inferens Vid inferens använder man urvalet för att uttala sig om populationen Centralmått Medelvärde: x= Σx i / n Median Typvärde Spridningsmått Används för att

Läs mer

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi Föreläsning 5 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Andelar (kap 24) o Binomialfördelning (kap 24.1) o Test och konfidensintervall för en andel (kap 24.5, 24.6, 24.8) o Test

Läs mer

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20

732G71 Statistik B. Föreläsning 1, kap Bertil Wegmann. IDA, Linköpings universitet. Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 732G71 Statistik B Föreläsning 1, kap. 3.1-3.7 Bertil Wegmann IDA, Linköpings universitet Bertil Wegmann (IDA, LiU) 732G71, Statistik B 1 / 20 Exempel, enkel linjär regressionsanalys Ett företag vill veta

Läs mer

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 22 december, 2016 Examinatorer: Kerstin Wiklander och Erik Broman.

Läs mer

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1

Standardfel (Standard error, SE) SD eller SE. Intervallskattning MSG Staffan Nilsson, Chalmers 1 Standardfel (Standard error, SE) Anta vi har ett stickprov X 1,,X n där varje X i has medel = µ och std.dev = σ. Då är Det sista kalls standardfel (eng:standard error of mean (SEM) eller (SE) och skattas

Läs mer

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet

Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) Statistiska institutionen, Uppsala universitet Preliminära lösningar för Tentamen Tillämpad statistik A5 (15hp) 2016-01-13 Statistiska institutionen, Uppsala universitet Uppgift 1 (20 poäng) A) (4p) Om kommunens befolkning i den lokala arbetsmarknaden

Läs mer

Föreläsning G60 Statistiska metoder

Föreläsning G60 Statistiska metoder Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel

Läs mer

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E Innehåll I. Grundläggande begrepp II. Deskriptiv statistik (sid 53 i E) III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser 1 II. Beskrivande statistik,

Läs mer

OBS! Vi har nya rutiner.

OBS! Vi har nya rutiner. KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare

Läs mer

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi Föreläsning 9 Statistik; teori och tillämpning i biologi 1 (kap. 20) Introduktion I föregående föreläsning diskuterades enkel linjär regression, där en oberoende variabel X förklarar variationen hos en

Läs mer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende

Läs mer

Uppgift 1. Produktmomentkorrelationskoefficienten

Uppgift 1. Produktmomentkorrelationskoefficienten Uppgift 1 Produktmomentkorrelationskoefficienten Både Vikt och Längd är variabler på kvotskalan och således kvantitativa variabler. Det innebär att vi inte har så stor nytta av korstabeller om vi vill

Läs mer

7.5 Experiment with a single factor having more than two levels

7.5 Experiment with a single factor having more than two levels 7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan

Läs mer

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

LTH: Fastighetsekonomi 23-24 sep 2008. Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING LTH: Fastighetsekonomi 23-24 sep 2008 Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING Hypotesprövning (statistisk inferensteori) Statistisk hypotesprövning innebär att man med hjälp av slumpmässiga

Läs mer

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större

Läs mer

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD 6.4 Att dra slutsatser på basis av statistisk analys en kort inledning - Man har ett stickprov, men man vill med hjälp av det få veta något om hela populationen => för att kunna dra slutsatser som gäller

Läs mer

Tentamen för kursen. Linjära statistiska modeller. 22 augusti

Tentamen för kursen. Linjära statistiska modeller. 22 augusti STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus

Läs mer

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2

Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Tillämpad statistik (A5), HT15 Föreläsning 11: Multipel linjär regression 2 Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-23 Faktum är att vi i praktiken nästan alltid har en blandning

Läs mer