MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP
|
|
- Ida Emilia Sandberg
- för 6 år sedan
- Visningar:
Transkript
1 MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Vårterminen
2 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära... 7 Undersökningsdesign, konfidensintervall och bortfall Hypotesprövning Regression Icke parametriska metoder
3 Deskriptiv statistik och index 1 Vilka av följande variabler kan betraktas som kontinuerliga och vilka kan betraktas som diskreta? Ålder Antal dörrar hos en bil Hastighet Antal barn Kroppslängd Intelligenskvot 2 När kan man här nedan tala om kvantitativ och när om kvalitativ variation: Kön Hemvist Kroppsvikt Lydig - olydig Ålder Bilmärke Spritmissbruk Förnamn 3 Diskutera skaltyp vid mätning av var och en av de variabler som omnämns nedan: Hårfärg Kroppsvikt C-vitaminhalt i apelsiner Gruppstorlek Grad av demokratisk ledarstil Alkoholvanor Temperatur Nationalitet Stad - land Hastigheten hos en bil Straffad - icke straffad Kryddningen av en maträtt Regnmängd arbetslöshet 4 Som bilaga till detta övningskompendium visas en enkät som använts i en studie av kompetensutveckling inom hotellbranschen. Diskutera skaltyp för de olika frågorna i enkäten. 3
4 5 Tabell 1 nedan visar procentuella fördelningen efter kön och tjänsteförhållanden för 400 anställda i företaget ASONAB. Tabell 1 Män Kvinnor Män + Kvinnor Arbetare 46,50 30,25 76,75 Tjänstemän 20,25 3,00 23,25 66,75 33,25 100,00 A B Beräkna antalet kvinnliga arbetare i företaget ASONAB. Ange hur stor andel av de manliga anställda som är tjänstemän i företaget ASONAB. 6 Denna fyrfältstabell anger de 500 anställda vid ett företag fördelade efter kön och ålder. Ålder <35 år >35år Män Kvinnor Gör om de absoluta frekvenserna i denna tabell till relativa så att a) varje kolumnsumma är 100% b) varje radsumma är 100% c) totalen 500 är 100% 7 En fårbonde skickade 100 lamm till slakt. Ur dessa drogs ett slumpmässigt urval om 11 lamm. Slaktvikterna i urvalet var: 10, 12, 13, 14, 14, 15, 16, 17, 17, 18, 20 Beräkna medelvärde, median, varians, standardavvikelse, Pearsson measure of skewness, första, andra och tredje kvartilen, kvartilsavståndet, variationsvidden, min och max. 4
5 årliliga reparationskostnader 8 Följande diagram illustrerar vikten (i kg) för ett urval bestående av 26 stycken 10-åriga flickor med en viss sjukdom. a) Vad kallas diagramtypen? b) Ange median, medelvärde, kvartilavstånd c) Finns det några extremvärden? d) Ange högsta och minsta värde vikt i kg Ett bussföretag samlar in följande information om sina 14 bussar Buss nr Ålder månader Årliga reparationskostnader Buss nr Ålder månader Årliga reparationskostnader Baserat på den informationen skapas följande plot Bussens ålder i månader Vilka slutsatser kan du dra från diagrammet? 5
6 10 I nedanstående tabell anges antalet personbilar i trafik respektive antal motorcyklar i trafik i Sverige i december månad åren Fordonsslag bestånd Personbilar i trafik Motorcyklar i trafik Beräkna två jämförbara serier av indextal som beskriver utvecklingen av de båda fordonsslagen under åren Beträffande prisutvecklingen för en varugrupp under åren föreligger följande uppgifter, avseende den procentuella prisstegringen från närmast föregående år: År Procentuell prisstegring från närmast föregående år , , , , ,9 Procenttalen har erhållits genom att man för varje år har beräknat Laspeyres' index med närmast föregående år som basår och från indextalet subtraherat 100. A. Ange de nämnda indextalen. ( L I1995, 96, L I, , etc). B. Beräkna ett kedjeindex för vart och ett av de sex åren med 1995 som basår. 12 Tabellen nedan anger pris och kvantitet för tre olika produkter vid två olika år. År 1 År 2 Pris Kvantitet Pris Kvantitet tvål schampo Tandkräm a) Beräkna Laspeyres pris index b) Beräkna Paasches pris index 13 Antag att löneindex för en viss typ av arbetskraft år 2000 var 123, och att basåret i den indexserien var Även KPI hade 1990 som basår och indexvärdet för KPI år 2000 var 118 i det här landet. a) Beräkna den procentuella ökningen av den nominella lönen mellan 1990 och 2000 b) Beräkna den procentuella ökningen av reallönen mellan 1990 och
7 Sannolikhetslära 1 En styrelse bestående av 8 personer, varav 5 män och 3 kvinnor, skall inom sig utse ett utskott. På hur många sätt kan detta ske, om utskottet skall bestå av: a) 3 personer b) 5 personer c) 3 män och 2 kvinnor? 2 Hur stor är sannolikheten att man vid slumpmässig dragning av ett kort ur en vanlig kortlek (52 kort) får a) en ruter b) en röd kung c) en kung eller en dam d) varken dam eller kung 3 Vilka av följande par av händelser är oberoende? a) Att få sexor i två successiva kast med en tärning. b) Att köra bil berusad och bli inblandad i en trafikolycka. c) Att ha körkort och äga bil. d) Två stycken varandra uteslutande händelser. e) Två successiva bestämningar av järnhalten i malm levererad från en och samma gruva. 4 En kvinna passerar tre trafikljus (A, B och C) på sin väg hem från arbetet. Ljusen är vid denna tid på dygnet inställda så att sannolikheten för rött ljus är 0,4 vid A, 0,7 vid B och 0,2 vid C. Rött ljus vid A, B respektive C är oberoende händelser. a) illustrera i ett träddiagram Beräkna sannolikheten: b) att både A och B visar rött ljus men inte C c) att åtminstone ett av de tre ljusen visar rött d) att exakt två ljus inte visar rött. 7
8 5 Maria kör bil längs huvudleden genom en mindre stad. Det finns två trafikljus på huvudleden, vilka är ihopkopplade i en så kallad grön våg för att underlätta trafikrytmen. Vid första trafikljuset är sannolikheten 0,6 för grönt ljus och 0,4 för rött ljus. Om Maria får rött ljus vid första trafikljuset är det ganska stor sannolikhet att hon får grönt vid nästa eftersom hon då kommer in i den gröna vågen. Den betingade sannolikheten för grönt ljus vid det andra trafikljuset givet att hon får rött vid första är 0,9. Men om Maria får grönt ljus vid första är sannolikheten lite lägre för grönt vid nästa. (Om hon kommer precis innan det slår om kanske hon inte hinner fram innan nästa ljus slår om till rött). Den betingade sannolikheten för grönt ljus vid det andra trafikljuset, givet att hon får grönt ljus vid första är därför bara 0,8. a. Illustrera ovanstående med ett sannolikhetsträd där alla sannolikheter anges, dvs de obetingade sannolikheterna för grönt respektive rött vid första trafikljuset, de betingade sannolikheterna för grönt respektive rött vid andra trafikljuset och de gemensamma sannolikheterna för utfallen vid båda trafikljusen. b. Hur stor är sannolikheten att Maria får rött vid minst ett av trafikljusen? 6 En restaurang som söker personal vill kunna informera de sökande om hur mycket dricks de kan förväntas tjäna på jobbet. Därför tar man fram statistik på hur mycket dricks servitörerna har fått per person och dag. Man väljer ut 500 dagar slumpmässigt och tar fram följande tabell. Total dricks per dag: Antal dagar 0 x < x < x < x < eller mer 50 a) Vad är sannolikheten att en servitör under en dag får 200 eller mer I dricks. b) Är de fem olika grupperna (0 x < 20, 20 x < 50 etc) ömsesidigt uteslutande? c) Är de fem olika grupperna (0 x < 20, 20 x < 50 etc) kollektivt uttömmande? d) Om vi summerar sannolikheterna för de 5 olika utfallen, vad blir summan då? e) Vad är sannolikheten att en servitör får mindre än 50 i dricks under en dag? f) Vad är sannolikheten att en servitör får mindre än 200 i dricks under en dag? 8
9 7 Av de anställda på ett stort företag är 80 procent kvinnor och 20 procent män. Av kvinnorna har 90 procent högskoleutbildning men enbart 78 procent av männen har högskoleutbildning. a) Illustrera personalsammansättningen i korstabeller med relativa frekvenser. En tabell där alla celler summerar till 1, en tabell där kolumnsummorna är 1 och en tabell där radsummorna är 1. b) Om man väljer ut en anställd slumpmässigt, vad är sannolikheten att det är en kvinna utan högskoleutbildning? c) Om man väljer ut en anställd slumpmässigt, vad är sannolikheten att det är en anställd utan högskoleutbildning? d) Om man väljer ut en kvinna slumpmässigt vad är sannolikheten att hon inte har högskoleutbildning? e) Är kön och utbildningsnivå oberoende variabler i populationen de anställda på detta företag? 8 Av alla låntagare i en bank har tidigare 7 % inte kunnat betala igen lånet i tid. I förra veckan betalade banken ut nya lån till 12 låntagare. a) Antalet personer som misslyckas med återbetalningen är en slumpvariabel, vad kallar vi dess fördelning? b) Hur många av de nya låntagarna tror du kommer att misslyckas med återbetalningen? Dvs vad är väntevärdet (medelvärdet) för denna sannolikhetsfördelning. c) Vad är sannolikheten att alla låntagare klarar av att betala tillbaka sitt lån. d) Vad är sannolikheten att exakt 1 kommer att misslyckas med återbetalningen? e) Vad är sannolikheten att minst en kommer att misslyckas med återbetalningen? f) Vad är sannolikheten att minst 2 kommer att misslyckas med återbetalningen? 9 En urna innehåller 10 kulor. Av dessa är 7 vita och 3 svarta. Du drar slumpmässigt 4 kulor ur urnan. a) Vad är sannolikheten att exakt 2 av kulorna är vita om du lägger tillbaka kulorna mellan varje dragning? b) Vad är sannolikheten att exakt två kulor är vita om du inte lägger tillbaka dem mellan varje dragning? 9
10 10 Antag att innehållet i en 12 kg förpackning med socker är en slumpvariabel som är uniformt fördelad mellan 11,96 och 12,05 kg. a) Vad är medelvärdet för förpackningarnas vikt? b) Vad är standardavvikelsen för vikten? c) Vad är sannolikheten att ett slumpvist valt sockerpaket väger mindre än 12 kilo? d) Vad är sannolikheten att ett slumpvis valt sockerpaket väger mer än 11,98 kg? e) Vad är sannolikheten att ett slumpvis valt sockerpaket väger mer än 11 kg? 11 Årslönen hos de anställda på ett amerikanskt storföretag är normalfördelad med medelvärdet och standardavvikelsen dollar. a) Hur stor andel av de anställda tjänar mer än dollar? b) Hur stor andel tjänar mellan och per år? c) Hur stor andel tjänar mellan och per år? d) Antag att man väljer ut de 20 procent av de anställda som har högst lön. Hur mycket tjänar den som har lägst lön i den gruppen? 12 Enligt en undersökning är den summa pengar som amerikanska 30 åringar spenderar på restaurangbesök per år normalfördelad med medelvärdet dollar och standardavvikelsen 450 a) Hur stor andel av 30 åringarna spenderar mer än per år på restaurangbesök? b) Hur stor andel spenderar mellan och dollar per år på restaurangbesök? c) Hur stor andel spenderar mindre än dollar per år på restaurangbesök? 10
11 Undersökningsdesign, konfidensintervall och bortfall 1 En normalfördelning har medelvärde 60 och standardavvikelse 12. Du drar ett slumpmässigt urval av 9 observationer. Beräkna sannolikheten att urvalsmedelvärdet är: a) Större än 63 b) Mindre än 56 c) Mellan 56 och 63 2 Ett företag tillverkar brieostar som ska väga 500 gram. I tillverkningsprocessen uppkommer dock en viss variation i vikten per ost. Ostarnas vikt är normalfördelad med medelvärdet 502 gram och standardavvikelsen 2 gram. a) Beräkna sannolikheten att en slumpmässigt vald ost väger mindre än 500 gram. b) Pelle ska köpa 5 ostar till sin fest. Beräkna sannolikheten att medelvärdet av de 5 ostarnas vikt är lägre än 500 gram. Betrakta Pelles ostinköp som ett slumpmässigt urval ur populationen alla ostar som är tillverkade av detta företag. 3 En livsmedelsinspektör kontrollerar förpackningar som ska innehålla 3 kilo äpplen. Han kontrollväger ett slumpmässigt urval om 36 förpackningar och finner att urvalet har medelvärde 3,01 och standardavvikelsen 0,03. Beräkna och tolka ett 95 procents konfidensintervall för populationsmedelvärdet. 4 En undersökning av 50 slumpvis utvalda personer som blev uppsagda från jobbet i senaste lågkonjunkturen visar att det tog dem i genomsnitt 26 veckor att finna ett nytt jobb. Urvalets standardavvikelse var 6,2 veckor. Konstruera ett 95 procents konfidensintervall för medelvärdet av arbetslöshetstiden för hela populationen, dvs alla som blev uppsagda i senaste lågkonjunkturen. Är det troligt att medelvärdet för hela populationen är 28 veckor eller mer? 11
12 5 En politiker funderar på att ställa upp i landets presidentval. För att undersöka sina chanser att bli vald gör hon en urvalsundersökning. I ett slumpmässigt urval om 400 väljare säger 300 att de kommer att rösta på henne. a) Beräkna ett punktestimat för andelen i hela befolkningen som kommer att rösta på henne. b) Beräkna ett 99 procents konfidensintervall för andelen i hela befolkningen som kommer att rösta på henne. c) Tolka dina resultat 6 En population antas ha standardavvikelsen 10. Vi vill skapa ett 95 procentigt konfidensintervall för medelvärde där felmarginalen (halva konfidensintervallets längd) inte är större än 2. Hur stort urval behöver vi dra? 7 Genom totalundersökning av två populationer avsåg man att fastställa skillnaden i proportionen bilägare. Tyvärr lyckades man ej erhålla uppgifter från samtliga personer utan det förekom ett visst bortfall. Undersökningens resultat framgår av följande tabell: Population Antal Bilägare Icke-bilägare Bortfall Summa A B a) Vilken är den högsta tänkbara andelen bilägare i A? b) Vilken är den lägsta tänkbara andelen bilägare i A? c) Vilken är den högsta tänkbara andelen bilägare i B? d) Vilken är den lägsta tänkbara andelen bilägare i B? e) Vilket är det högsta respektive lägsta tänkbara värdet på skillnaden mellan A och B beträffande andelen bilägare? 12
13 8 Rubriken baseras alltså på de som svarat av tillfrågade. Beräkna proportionen»positiva till arbetet«bland samtliga tillfrågade under antagande att A alla B ingen C 30% D 70% i bortfallsgruppen är positiva till arbetet. 9 a) Man vill ta reda på hur stor andel av landsbygdsbefolkningen som deltar i älgjakten och gör ett slumpmässigt urval om 2000 personer. I detta urval var bortfallet 20 %. Av de 1600 som svarade, hade 300 under undersökningsperioden deltagit i älgjakt. Beräkna ett 95 % konfidensintervall där du behandlar de svarande som ett slumpmässigt urval. b) Bland de 400 i bortfallet uttog man slumpmässigt 100. Efter åtskilligt besvär lyckades man få svar från alla 100, av vilka 55 stycken hade deltagit i älgjakt under undersökningsperioden. Beräkna ett punktestimat för andelen som deltagit i Älgjakten där du även tar hänsyn till bortfallsanalysen. 10 Förklara följande begrepp: a) Validitet b) Reliabilitet c) Operationalisering 13
14 Hypotesprövning 1 En mäklarfirma hade tidigare en genomsnittlig försäljningstid på sina objekt på 90 dagar. Man misstänker att försäljningstiden har ändrats och gör en undersökning av 100 slumpvis utvalda fastigheter. I det urvalet var den genomsnittliga tiden för en försäljning 94 dagar med en standardavvikelse på 22 dagar. Gör en hypotestest för att undersöka om det har blivit en signifikant förändring av försäljningstiden. Använd 10 procents signifikansnivå. 2 Enligt officiell statistik är medelantalet personer i ett hushåll i USA lika med 3,13. Donald gör en urvalsundersökning för att se om det också gäller i hans stad. Han drar ett slumpmässigt urval om 25 hushåll och i det urvalet visar det sig att medelvärdet är 2.86 medlemmar per hushåll. I urvalet var standardavvikelsen 1,20. Donald gör en hypotestest för att se om antalet medlemmar per hushåll är lika med 3.13 i Donalds stad. Han använder 5 % signifikansnivå. Utifrån den undersökningen drar han slutsatsen att hushållen är lika stora i hans stad som i hela USA. Finns det skäl att kritisera Donalds undersökning och slutsats? 3 Ett dataföretags supportavdelning vill undersöka om det tar längre tid att hjälpa kunder med mjukvaruproblem än kunder med hårdvaruproblem. Man tar ett slumpmässigt urval om 35 kunder med mjukvaruproblem och ett annat slumpmässigt urval om 45 kunder med hårdvaruproblem. I urvalet för mjukvaruproblem var medelvärdet för samtalstiden 18 minuter med en standardavvikelse på 4,2 minuter. För kunderna med hårdvaruproblem var medelvärdet för samtalstiden 15,5 minuter med en standardavvikelse på 3,9 minuter. Gör en hypotestest för att undersöka om vi kan hävda att det tar längre tid att lösa ett mjukvaruproblem än ett hårdvaruproblem. Kan vi dra slutsatsen att medelvärdet för samtalstiden i hela populationen kunder med mjukvaruproblem är längre än medelvärdet för hela populationen kunder med hårdvaruproblem? Använd 5 % signifikansnivå. 4 I baseball kan man dela i spelarna i guards, forwards och center. För att se om dessa tre typer av spelare har ungefär lika hög lön gjordes en ANOVA test på ett urval av 269 baseballspelare. Resultatet visas nedan. a) Ange viken noll och alternativhypotes som används i detta ANOVA-test. b) Vilka slutsatser kan dras från detta test om vi vill ha en signifikansnivå på 5%? c) Vilka antaganden ska vara uppfyllda för att ANOVA testen ska vara tillförlitligt. Anser du att de är det i det här fallet? d) Konstruera tre 95 % konfidensintervall för populationsmedelvärdena, ett för varje spelarkategori e) Jämför resultatet i ANOVA-testet med dina konfidensintervall 14
15 5 I undersökningen om gymvanor i Bryman och Bell var det 42 män och 48 kvinnor i urvalet. På variabeln stryketräningstid föregående träningspass hade männen ett medelvärde på 18,05 minuter med en standardavvikelse på 9,27 minuter. Kvinnorna hade ett medelvärde på 12,19 minuter med en standardavvikelse på 5,33 minuter. a) Gör en lämplig test för att se om variansen är lika för män och kvinnor i hela populationen. Använd 2 % signifikansnivå. b) Gör en lämplig test för att se om medelvärdet är samma för män och kvinnor i hela populationen. Använd 1 % signifikansnivå. 6 R utskrifterna nedan kommer från gymundersökningen i Bryman och Bell. Det är en test på hur lång tid män och kvinnor ägnar åt konditionsträning. Tolka resultaten och förklara vilka slutsatser som vi kan dra om vi använder en signifikansnivå på 5%. Vilken av de båda testen för medelvärdet skulle du rekommendera i det här fallet? 15
16 7 Vi fortsätter med Gymundersökningen men nu skiljer vi inte mellan män och kvinnor utan betraktar det som ett urval ur en population. I hela urvalet på 90 personer är medelvärdet för konditionsträning 26,47 minuter med standardavvikelsen 26,47 minuter och för styrketräning 14,92 minuter med standardavvikelsen 7,95 minuter. Om vi skapar en variabel för skillnaden mellan den tid en person ägnar åt konditionsträning och den tid han eller hon ägnar åt styrketräning blir medelvärdet för den variabeln 11,54 med standardavvikelsen 13,69. Ägnar personerna i hela populationen lika mycket tid åt konditionsträning som åt styrketräning? Gör en hypotestest där du använder 1 % signifikansnivå. 8 En läkare vill undersöka om kognitiv beteendeterapi kan användas för att sänka blodtrycket hos patienter med för högt blodtryck. Han baserar sin studie på 10 slumpvis utvalda patienter. Tabellen nedan visar deras blodtryck före och efter behandlingen. Anders Eva Lotta Per Lars Ove Stina Anna Nils Klas medel std före ,6 10,2 efter ,6 10,1 Läkaren beräknar följande teststatistika. t = 137,6 132,6 10, ,1 10 = 5 4,53 = 1,1 Eftersom han har ett urval av 10 patienter anser han att denna tesstatiska bör vara t-fördelad med 9 frihetsgrader. Det kritiska värdet givet en signifikansnivå på 5 % blir då 2,26 Eftersom hans teststatistika är lägre än det kritiska värdet drar läkaren slutsatsen att kognitiv beteendeterapi inte har någon effekt på blodtrycket. a) Finns det några skäl att ifrågasätta läkarens analys? b) Föreslå en bättre metod att analysera detta. c) Utför den test du föreslagit i b-frågan. 16
17 Regression Uppgifter markerade med * är lite mer överkurs. 1 Bilderna nedan visar plottar över observationerna och regressionslinjen från tre olika regressioner som alla har en enda förklarande variabel. Ange om följande uttalanden är sanna eller falska. a) Regressionskoefficienten b är positiv i alla tre regressionerna. b) Korrelationskoefficienten r är positiv i A och C men negativ i B. c) Korrelationskoefficienten r är större i C än i A. d) Regressionskoefficienten b är större i C än i A. e) Korrelationskoefficienten r är positiv i A och negativ i B men har ungefär lika stort absolut värde i både A och B. f) Regressionskoefficienten b är positiv i A och negativ i B men har ungefär lika stort absolut värde i både A och B. 17
18 2 Vad kallas det mått som erhålls om man dividerar residualvariansen med variansen av en 2 se förklarade variabeln och sedan beräknar 1 den kvoten, dvs1 2 s y 3 I en amerikansk undersökning studerades den tid pensionärer dagligen ägnade åt TVtittande. En multipel regressionsmodell anpassades. Som oberoende variabler användes x 1 = ålder och x 2 = utbildningstid i år. Den anpassade regressionsekvationen blev: y = x x 2 A. Gör en tolkning av koefficienten för x 2 i termer av de ingående variablerna. B. Skatta den tid en 74-åring med 11 års utbildning dagligen tittar på TV. 4 För vart och ett av följande variabelpar, tala om, om Du förväntar Dig att regressionskoefficienten skall bli positiv eller negativ. A. X: Familjeinkomst Y: Procent av inkomsten som är matkostnader B. X: Trafiktäthet på en bro vid olika tidpunkter Y: Genomsnittlig tidsåtgång för en bil att passera bron C. X: Familjestorlek Y: Utgifter för nya kläder per person i familjen D. X: Försäljning av en viss vara i ett varuhus Y: Innestående lager av varan. 18
19 5 Ska vi ge mer resurser till skolorna eller höja lärarnas löner? För att analysera vilka faktorer som är viktiga för att få goda resultat i skolorna samlades data in från ett urval av 550 amerikanska skolor. Vi har information om andel som klarade godkänt resultat på provet i matte i årskurs 7, ekonomiska resurser per elev, lärarlön samt hur stora bidrag skolan har fått från välgörenhetsorganisationer. math7 Procent som klarade matteprovet i årskurs 7, 1998 avgsalth Genomsnittlig lärarlön (tusen dollar) 1998 expp Ekonomiska resurser per elev (dollar) 1998 found Bidrag från välgörenhetsorganisationer och fonder (dollar): Besvara följande frågar med hjälp av regressionsresultatet nedan. a) Tolka regressionskoefficienterna och deras p-värde under antagandet att det inte finns några kausala samband från den beroende till de oberoende variablerna. Använd 5 % signifikansnivå. b) Finns det anledning att tro att det finns några kausala samband från den beroende variabeln till någon eller några av de oberoende variablerna? Om det är fallet hur påverkar det tolkningen av regressionskoefficienterna? c) Beräkna och tolka förklaringsgraderna. d) Beräkna det predikterade värdet för genomströmningen (andel godkända) på matteprovet i sjunde årskursen i en skola som har genomsnittliga lärarlöner på dollar, spenderar dollar per elev och får dollar i bidrag från välgörenhetsorganisationer. ANOVA Model df Sum of Squares Mean Square Regression , ,000 Residual , Total ,000 Källa till datamaterialet: Michigan Department of Education web site, 19
20 6 Bilderna nedan visar plottar över residualerna mot en av de förklarande variablerna från tre olika regressionsmodeller. Vilken modell skulle du vara mest nöjd med? Vilka problem kan du ana i de andra två? Regression A: Regression B: Regression C: 20
21 7 Brottslighet För att analysera vilka faktorer som påverkar brottsligheten gjordes en undersökning i USA 1993 där man försökte förklara skillnader i våldsbrott och stölder. Följande variabler samlades in från USA, 51 delstater criv crip blackpro metropro unempro incpc polpc antal våldsbrott per invånare antal stölder per invånare procentuell andel svarta i befolkningen procentuell andel av befolkningen som bor i storstäder procentuell andel arbetslösa befolkningens medelinkomst i dollar antal poliser per invånare Källa till datamaterialet: S.D. Levitt (1996), The Effect of Prison Population Size on Crime Rates: Evidence from Prison Overcrowding Legislation, Quarterly Journal of Economics 111, På detta datamaterial har jag gjort två olika regressionsmodeller I SPSS. Modell 1 ANOVA Model df Sum of Squares Mean Square Regression 5 827,33 165,47 Residual ,31 3,23 Total ,64 21
22 Modell 2 Besvara följande frågor utifrån regressionsresultaten. a) Tolka regressionskoefficienterna och deras p-värden, under antagandet att det inte finns någon påverkan från den beroende variabeln till de oberoende variablerna, använd 5 % signifikansnivå. b) Diskutera om det kan tänkas finnas något orsakssamband från den beroende variabeln till någon av de oberoende variablerna. c) Beräkna och tolka förklaringsgraderna i modell 1 såväl R2 som R2adj. d) Beräkna det predikterade värdet på antal våldsbrott per invånare i en delstat där andelen svarta är lika med 0,2, andelen storstadsbor är lika med 0,3 andelen arbetslösa är lika med 0,06, befolkningens medelinkomst är dollar och antal poliser på invånare är 250. e) Beräkna det predikterade värdet på antal stölder per invånare för samma delstat som i d uppgiften. 22
23 8 Hälsoeffekter av vinkonsumtion För att analysera hur hälsan påverkas av vindrickande samlades följande data in från ett urval av 21 länder. alcohol heart liver deaths liter alkohol från vin, per person. antal dödsfall hjärtsjukdomar per 100,000 invånare antal dödsfall leversjukdomar per 100,000 invånare antal dödsfall per 100,000 invånare Source: These data were reported in a New York Times article, December 28, På denna data estimerades tre olika regressionsmodeller. Resultaten redovisas nedan: Resultat från regressionerna Modell 1 Modell 2 Modell 3 Beroende variabel: deaths heart liver Förklarande variabler: Intercept alcohol 876,2* (30,5) -16,3 (8,2) 239,1* (19,0) -19,7* (5,1) 10,9* (2,8) 3,6* (0,8) R 2 0,17 0,44 0,54 R 2 adj 0,13 0,41 0,52 Regressionskoefficienternas standardavvikelser anges inom parentes *variabler signifikanta på 5 % nivån markerade med stjärna a) Rapportera och tolka regressionskoefficienterna från alla tre modellerna. Använd en signifikansnivå på 5 % b) Tolka förklaringsgraden i alla tre modellerna. c) Vad är det predikterade värdet för antalet döda i leversjukdomar i ett land där befolkningen dricker 2 liter alkohol från vin per person? d) Vad är det predikterade värdet för antalet döda i hjärtsjukdomar i ett land där befolkningen dricker 2 liter alkohol från vin per person? e) Vad är det predikterade värdet för antalet döda i leversjukdomar i ett land där befolkningen dricker 10 liter alkohol från vin per person? f) Vad är det predikterade värdet för antalet döda i hjärtsjukdomar i ett land där befolkningen dricker 10 liter alkohol från vin per person? 23
24 9 Vad styr snabbmatsrestaurangernas prissättning? Ibland försöker företag prisdiskriminera mellan olika kunder, dvs ta ut högre priser från kunder med högre betalningsförmåga. För att undersöka om detta är fallet bland snabbmatsrestauranger insamlas följande data från 373 restauranger tillhörande kedjorna Wendys, Burger King, King Fried Chicken och Roy Rogers. Variabelförteckning: pentree: Priset på den vanligaste huvudrätten (hamburgare eller kyckling) income: Medianhushållets inkomst i det postnummer område där restaurangen ligger, dollar WE: Dummyvariabel som tar värdet 1 om Wendys KFC: Dummyvariabel som tar värdet 1 om King Fried Chicken RR: Dummyvariabel som tar värdet 1 om Roy Rogers (Restaurangerna som tillhör Burger King har alltså noll på alla tre dummyvariablerna) Källa till datamaterialet: K. Graddy (1997), "Do Fast-Food Chains Price Discriminate on the Race and Income Characteristics of an Area?" Journal of Business and Economic Statistics 15, På dessa variabler har jag gjort en korrelationsmatris och två regressionsmodeller. Besvara frågorna nedan med hjälp av resultaten på de följande sidorna. a) Förklara skillnaden mellan de båda modellerna. b) Tolka regressionskoefficienterna och deras p-värden och förklara vilka slutsatser vi kan dra från koefficienterna. Använd 5 % signifikansnivå. c) Hur kommer det sig att koefficienten för inkomst blir så olika i de båda modellerna? d) Gör en residualanalys e) Beräkna förklaringsgraden i modell två, såväl R 2 som R 2 adjusted. Tolka förklaringsgraderna till båda modellerna. f) Förekommer det prisdiskriminering mellan rika och fattiga områden enligt de båda modellerna, vilken modell tror du mest på motivera. g) Beräkna ett 99 % konfidensintervall för prisskillnaden mellan Burger King och Wendys. Tolka innebörden av intervallet 24
25 Nedan visas en korrelationsmatris över dessa variabler. 25
26 Regressionsmodel 1 ANOVA Model df Sum of Squares Mean Square Regression 1 1,637 0,611 Residual ,95 2,410 Total ,58 Residualanalys model 1 26
27 Regressionsmodell 2 ANOVA Model df Sum of Squares Mean Square Regression 4 128,74 32,19 Residual ,84 0,07 Total ,58 Residualanalys model 2 27
28 10 Ingenjörslöner i Thailand Man vill undersöka vilka faktorer som påverkar lönenivåerna för thailändska Ingenjörer och analyser därför ett urval av 403 stycken ingenjörer. Följande variabler samlas in: Deskriptiv statistik Variabel Medelvärde Standardavvikelse Månadslön thai baht Ingångslön thai baht (den lön man hade när man började jobba på nuvarande jobb) År på nuvarande jobb 13,53 1,75 Tidigare erfarenhet år 11,3 10,5 Andel: Man (dummyvariabel) 0,53 Ingen High school examen 0,08 High school examen 0,41 College examen 0,12 Universitetsutbildning 0,12 Polytech utbildning 0,27 Källa: Thada Chaisawangwong, a graduate student at MSU, obtained these data for a term project in applied econometrics. They come from the Material Requirement Planning Survey carried out in Thailand during Besvara följande frågor utifrån regressionsresultaten på nästa sida a) Förklara skillnaden mellan de fyra modellerna. b) Tolka regressionskoefficienterna från modell 1 och 2. Använd 5 procents signifikansnivå. c) Varför är värdet på många av regressionskoefficienterna lägre i modell 2? d) Tolka regressionskoefficienterna för variablerna År på nuvarande jobb samt År på nuvarande jobb i kvadrat enligt modell 3. 28
29 Resultat från regressionerna Modell 1 Modell 2 Modell 3 Modell 4 Beroende variabel: Månadslön thai baht Månadslön thai baht Månadslön thai baht Ingångslön thai baht Förklarande variabler: Intercept * (4 225) (3 335) * (22 151) (9 116) År på nuvarande jobb 253 (278) 566* (206) * (3 273) 27 (1 347) År på nuvarande jobb i kvadrat 255* (121) -8 (50) Tidigare erfarenhet år -104* (47) -236* (36) -107* (47) 80* (19) Ingångslön thai baht 1,65* (0,09) Man (dummyvariabel) 7 574* (1 211) 2 411* (938) 7 413* (1 209) 3 131* (497) Dummyvariabler för högsta examen: High school examen (1 892) 121 (1 399) (1 884) 891 (775) College examen * (2 281) 7 421* (1 877) * (2 271) 9 161* (935) Universitetsutbildning * (2 392) 7 302* (2 382) * (2 381) * (980) Polytech utbildning 4 883* (2 060) (1 532) 4 852* (2 051) 2 086* (844) R 2 adj 0,6745 0,8228 0,6774 0,7273 Regressionskoefficienternas standardavvikelser anges inom parentes *variabler signifikanta på 5 % nivån markerade med stjärna 29
30 11 Korrelationskoefficienten mäter styrkan i det linjära sambandet mellan två variabler. Då undersökningsenheterna är geografiska områden av varierande befolkningsstorlek, får man ofta ett högt värde på korrelationskoefficienten. Exempelvis kan relateras en undersökning av ungdomsbrottslighet där man bl a för ett antal områden beräknade korrelationen mellan antal ungdomsbrott begångna under året och antal förvärvsarbetande mödrar bosatta i området. Korrelationen blev mycket hög. Ge en förklaring varför man i en sådan här situation får en hög korrelation. 12 * Man tror att det efter en viss operation (avlägsnande av bröstvävnad på grund av bröstcancer) är farligt för en kvinna att bli med barn (graviditeten ökar risken för återfall i cancer). En intresserad läkare undersökte en grupp kvinnor som hade genomgått denna operation. För varje kvinna noterades såväl antalet födda barn som överlevelsetiden efter operationen. Läkaren upptäckte att ju fler barn kvinnan fick desto längre (i genomsnitt) levde hon. Hans slutsats blev då att föreställningen om graviditetens farlighet var överdriven. Kommentera! 30
31 13 Lönediskriminering 1976 samlade Henry Farber från MIT in data over löner, utbildning och arbetserfarenhet i ett OSU om 526 individer för att studera lönediskriminering. Baserat på den datan har jag gjort 4 olika regressionsmodeller i R Commander. Utskrifter från dessa finns inklistrade efter sammanställningen av regressionsresultaten nedan. Efter datautskrifterna följer ett antal frågor att besvara. Variabelförteckning: Wage genomsnittlig timlön Educ utbildning antal års skolgång Educsq utbildning antal års skolgång upphöjt till 2. Exper arbetslivserfarenhet, år Expersq arbetslivserfarenhet, år upphöjt till 2. Female dummyvariabel med värdet 1 om individen är kvinna, noll annars Nonwhite dummyvariabel som tar värdet 1 om individen inte är vit, noll annars Tenure antal år hos senaste arbetsgivaren Tenuresq antal år hos senaste arbetsgivaren upphöjt till 2. A) Tolka regressionskoefficienterna för utbildning och arbetslivserfarenhet i modell 1 och modell 4.Exper B) Förekommer det diskriminering av kvinnor enligt de här regressionsmodellerna? C) Förekommer det diskriminering av icke vita enligt de här regressionsmodellerna? D) Förklara verbalt skillnaden mellan de 4 olika regressionsmodellerna och diskutera vilken modell som är att föredra. E) Gör en analys av residualerna för att se om vi har några statistiska problem i de här två modellerna. F) Beräkna ett konfidensintervall med 95 % konfidensgrad för skillnaden mellan män och kvinnors löner när vi har tagit hänsyn till skillnader i utbildning och erfarenhet. G) Diskutera vilka slutsatser vi kan dra från förklaringsgraderna i de fyra modellerna. Finns det skäl att försöka samla in data över fler variabler? H) Beräkna det predikterade värdet för en vit kvinna med 10 års utbildning och 20 års arbetslivserfarenhet, varav de sista 10 åren har varit hos samma arbetsgivare från respektive regressionsmodell. I) Beräkna det predikterade värdet för en icke vit kvinna med 10 års utbildning och 20 års arbetslivserfarenhet, varav de sista 10 åren har varit hos samma arbetsgivare från respektive regressionsmodell. J) Beräkna det predikterade värdet för en vit man med 8 års utbildning och 3 års yrkeserfarenhet från en och samma arbetsgivare från respektive regressionsmodell. 31
32 Resultat från regressionerna Modell 1 Modell 2 Modell 3 Modell 4 Beroende variabel: Wage Wage Wage Wage Förklarande variabler: Intercept -1,54* (0,732) -2,08* (0,719) 2,87* (1,333) 2,93* (1,33) Educ 0,57* (0,050) 0,53* (0,049) -0,38 (0,212) -0,39 (0,212) Educsq 0,038* (0,009) 0,039* (0,009) Exper 0,025* (0,012) 0,21* (0,034) 0,20* (0,035) 0,21* (0,034) Expersq -0,0041* (0,001) -0,0041* (0,001) -0,0044* (0,001) Female -1,81* (0,265) -1,79* (0,258) -1,65* (0,255) -1,66* (0,255) Nonwhite -0,12 (0,427) -0,18 (0,416) -0,32 (0,409) -0,29 (0,409) Tenure 0,14* (0,021) 0,13* (0,021) 0,20* (0,048) 0,13* (0,020) Tenuresq -0,0027 (0,002) R 2 adj 0,36 0,39 0,41 0,41 Regressionskoefficienternas standardavvikelser anges inom parentes *variabler signifikanta på 5 % nivån markerade med stjärna 32
33 Regressionsresultat modell 1. 33
34 Regressionsresultat modell 2. 34
35 Regressionsresultat modell 3. 35
36 Regressionsresultat modell 4. 36
37 14 Skattning av priselasticiteter på ekologiska respektive konventionellt odlade äpplen. Jeffrey Blend gjorde ett experiment för att skapa data över inköp av äpplen vid olika priser på konventionellt odlade respektive ekologisk odlade äpplen. 660 personer fick en enkät där de fick svara om de skulle köpa ekologiska äpplen eller konventionellt odlade äpplen samt hur stor mängd i ponds, givet vissa hypotetiska priser på dessa båda produkter. Eftersom priserna är påhittade påverkas de inte av efterfrågan och därmed blir det möjligt att skatta priselasticiteter. Genom att priser finns för såväl konventionella som ekologiska äpplen kan vi även skatta korspriselasticiteten. Besvara frågorna på nästa sida med hjälp av regressionsresultaten i tabellen nedan. (I de tidigare uppgifterna har ni fåt resultatet direkt från SPSS för att träna på att tolka datautskrifter, i den här uppgiften redovisar jag istället resultaten så som man brukar redovisa dem när man skriver uppsatser.) Resultat från regressionerna Beroende variabel: Förklarande variabler: Intercept Logaritmerat pris ekologiska äpplen Logaritmerat pris konventionella äpplen Antal familjemedlemmar Antal barn under 5 år Antal barn 5 17 år Antal vuxna år Antal vuxna över 64 år Modell 1 Modell 2 Modell 3 Modell 4 Modell 5 Logaritmen av kvantitet ekologiska äpplen 0,273* (0,022) -0,447* (0,207) 0,344 (0,215) Logaritmen av kvantitet konv. äpplen 0,252* (0,030) 0,254 (0,255) -0,359 (0,242) Logaritmen av kvantitet ekologiska äpplen 0,236* (0,037) -0,454* (0,207) 0,352 (0,215) 0,012 (0,010) Logaritmen av kvantitet ekologiska äpplen 0,190* (0,044) -0,475* (0,206) 0,356 (0,214) -0,001 (0,023) 0,019 (0,015) 0,027 (0,018) 0,102* (0,033) Logaritmen av kvantitet konv. äpplen 0,114* (0,050) 0,221 (0,252) -0,296 (0,239) -0,025 (0,025) 0,058* (0,018) 0,039 (0,020) 0,089* (0,036) R 2 0,012 0,007 0,015 0,036 0,062 R 2 adj 0,007 0,001 0,008 0,022 0,041 Regressionskoefficienternas standardavvikelser anges inom parentes *variabler signifikanta på 5 % nivån markerade med stjärna Data Source: These data were used in the doctoral dissertation of Jeffrey Blend, Department of Agricultural Economics, Michigan State University, The data were obtained from a telephone survey conducted by the Institute for Public Policy and Social Research at MSU. 37
38 a) Vad är egenpriselasticiteten för ekologiska äpplen enligt dessa regressioner b) Vad är korspriselasticiteten för ekologiska äpplen med avseende på priset på konventionella äpplen enligt dessa regressioner c) Vad är egenpriselasticiteten för konventionella äpplen enligt dessa regressioner d) Vad är korspriselasticiteten för konventionella äpplen med avseende på priset på ekologiska äpplen enligt dessa regressioner e) Vilka slutsatser kan dras från variablerna om hushållsstorlek och antal familjemedlemmar i olika åldrar. f) Tolka och kommentera förklaringsgraderna i de fyra modellerna 15 Ett företag som säljer diskmedel, genomför en marknadsundersökning för att se i vilken mån den egna försäljningen beror endast på priset på den egna produkten eller om det kan vara så att även konkurrerande varors priser är av betydelse. Följande variabler utnyttjas: y = värdet av den egna försäljningen i miljoner kr x 1 = priset på den egna produkten i kr per liter x 2 = genomsnittspriset på konkurrerande produkter i kr per liter Följande modeller prövades: 1. y = + 1x y = + 2x y = + 1x 1 + 2x 2 + De skattade regressionsekvationerna blev 1. yˆ x1 R 2 = yˆ x2 R 2 = yˆ x x2 R 2 = 0.70 a) Tolka koefficienterna i den multipla modellen i termer av de ingående variablerna. b) Kommentera förändringen av regressionskoefficienten för egna priset vid en jämförelse mellan modellerna 1 och 3. c) Vid anpassning av modell 3 visar det sig att regressionskoefficienten för konkurrerande varors pris får en t-kvot = Hur tolkar Du detta värde? 38
39 16 Effekten av rökning under graviditeten på barnets hälsa Apgar är en skala som används vid förlossning. När barnet har fötts och är 1 minut gammalt, kontrollerar en barnmorska hur många poäng barnet har fått från apgarskalan nedan. Testet togs fram 1953 av Virginia Apgar. Även om barnen kan få låga poäng direkt efter utdrivningsskedet, så har de flesta runt 9 eller 10 poäng när de testas igen efter 5 minuter. Källa wikipedia För att utvärdera effekterna av mödravård före förlossningen på barnets hälsa vid födsloögonblicket samlades data in från födslar: Följande variabler samlades in: omaps Apgar värde 1 minut efter födseln (se fråga 8 för en förklaring av apgar) cigs Antal cigaretter per dag under graviditeten monpre antal månader som modern haft kontakt med barnmorska före förlossningen npvis antal besök hos barnmorska före förlossningen npvissq antal besök hos barnmorska upphöjt i två På ovanstående data kördes två olika regressionsmodeller vilka redovisas på nästa sida. Baserat på de resultaten ska du svara på följande frågor. a) På vilken skaltyp mäts Apgar skalan? b) Rapportera och tolka regressionskoefficienterna och deras p-värde från båda modellerna, använd 10 % signifikansnivå. c) Diskutera om det kan finnas skäl att ifrågasätta metodvalet, är något av den linjära regressionsmodellens antaganden inte uppfyllda i det här fallet. (Delfråga a är ger en ledtråd. d) Beräkna och tolka ett konfidensintervall med 95 procents konfidensgrad för regressionskoefficienten för antalet besök hos barnmorska i modell 2. 39
40 Regressionsmodell 1 Regressionsmodell 2 40
41 Icke parametriska metoder 1 Detta är en fortsättning från sista frågan i regressionsavsnittet. Använd 10 % signifikansnivå för att besvara frågorna nedan. a) Baserat på samma data beräknades två typer av korrelationskoefficienter mellan apgar värdet och antalet besök hos barnmorska. Tolka och kommentera 41
42 b) Man ville också undersöka om det fanns samband mellan moderns ålder och apgarvärdet. två typer av korrelationskoefficienter beräknades. Tolka och kommentera. 42
43 c) Man provade också att dela in mödrarna in i tre åldergrupper. Grupp 1 bestod av de som var 22 eller yngre, grupp 2 av 23 till 32 och grupp tre av de som var 33 eller äldre. Därefter gjordes dels en ANOVA test dels en Kruska Wallis test. Resultaten redovisas nedan. Tolka och kommentera. 43
44 d) För att undersöka alkoholens och rökningens betydelse för apgarvärdet gjordes följande korrelationer 44
45 2 Enligt en nyhetsartikel i USA får endast en tredjedel av de som slutar college jobb direkt efter avslutande studier. Ett specifikt college vill undersöka om det också gäller på deras skola. I ett slumpmässigt urval om 200 studenter från detta college hade 80 stycken fått jobb direkt efter att de slutade. Skiljer sig andelen som får jobb från genomsnittsvärdet för alla collegestudenter i USA? Gör ett hypotestest med 1 procents signifikansnivå. 3 Ett läkemedelsföretag har utvecklat en ny medicin och vill undersöka om den är bättre än deras tidigare produkt. För att göra detta dras två slumpmässiga urval av patienter. Den första gruppen som består av 200 patienter får den nya medicinen. Den andra gruppen som består av 300 patienter får den gamla medicinen. För att undvika placeboeffekter ges dock båda grupperna informationen att de använder den nya medicinen. I gruppen som får den nya medicinen anser 180 patienter att den ger bättre effekt än den gamla medicinen. I gruppen som fortfarande använder den gamla medicinen men tror att de har bytt till den nya anser 261 att den nya medicinen ger bättre effekt. Läkemedelsbolaget hävdar att man har bevisat att den nya medicinen är effektivare än den gamla eftersom andelen som anser så är större i den grupp som använder den nya medicinen. Finns det skäl att kritisera läkemedelsbolagets slutsats? Gör en hypotestest med en signifikansnivå på 5 %. Beräkna också p-värdet. 4 För närvarande köper 20 procent av konsumenterna tvål av ett visst märke. För att utöka sin marknadsandel gör företaget en reklamkampanj. Efter kampanjen tar man ett slumpmässigt urval av 400 potentiella kunder för att undersöka om kampanjen var lyckosam. Av de 400 i urvalet sa 90 att de köper tvål av detta märke. Gör ett hypotestest för att undersöka om kampanjen har ökat företagets marknadsandel. Använd 5 % signifikansnivå. Sätt upp adekvata hypoteser, formulera en teststatistika och dess kritiska värde. Beräkna teststatistikan och förklara vilka eventuella slutsatser som kan dras från testet. 5 Kalle tror att en större andel av tjejerna än av killarna använder facebook. För att undersöka detta gör han en urvalsundersökning. Han gör ett slumpmässigt urval av 60 tjejer och av dem är det 52 stycken som använder facebook. Han gör ett annat slumpmässigt urval av 60 stycken pojkar. Av dem är det 49 stycken som använder facebook. Använd 5 procents signifikansnivå för att göra en hypotestest utifrån dessa urval. Kan du bevisa att Kalle har rätt? a) Sätt upp lämplig nollhypotes och mothypotes. b) Ange formeln för din teststatistika och en beslutregel c) Beräkna värdet på din teststatistika d) Kan vi dra någon slutsats från undersökningen? I så fall vilken? 6 En sexsidig tärning kastas 30 gånger. Följande utfall observeras: Utfall Frekvens Utfall Frekvens Kan vi dra slutsatsen att tärningen är felkonstruerad, dvs att sannolikheten inte är lika för alla utfallen? Gör en hypotestest med 10 procents signifikansnivå. 45
46 7 Nedan finns en R Commander utskrift där man gjort en korstabell över variablerna kön och skäl för träning ur Gymundersökningen från Bryman och Bell. a) Tolka siffrorna i rutan för förbättra styrka och kvinna i samtliga korstabeller. b) Vilken slutsats kan du dra från chi square analysen? Antag att man drar en slumpvis respondent ur urvalet. Hur stor är sannolikheten att det är en: c) Kvinna. d) Kvinna som har förbättra kondition som skäl för sin träning. 46
47 Så här skulle motsvarande resultat presenterats av SPSS e) Gör en hypotestest där nollhypotesen är att andelen kvinnor som har bantning som motiv för sin träning är lika stor som andelen män som har bantning som motiv för sin träning. Använd 5 % signifikansnivå och förklara vilka slutsatser som kan dras från detta test. f) Gör en hypotestest där nollhypotesen är att andelen kvinnor som har konditionsträning som motiv för sin träning är lika stor som andelen män som har konditionsträning som motiv för sin träning. Använd 5 % signifikansnivå och förklara vilka slutsatser som kan dras från detta test. 47
48 8 På en större arbetsplats tillfrågas de anställda om vilken typ av avtalspension de skulle vilja ha. Resultatet redovisas i korstabellen nedan. Finns det något samband mellan variablerna yrkeskategori och val av avtalspension? Gör en lämplig hypotestest, använd 1% signifikansnivå pensionstyp Yrkeskategori A B C Supervisor Clerical Labor Ett urval av 70 personer med magproblem deltog i ett test av en ny medicin. Efter en veckas behandling hävdade 32 personer att deras magproblem minskat, 25 upplevde ingen skillnad och 13 ansåg att problemen förvärrats. a) Gör en hypotestest för att se om du kan bevisa att medicinen minskar upplevda magproblem. Använd 5 % signifikansnivå b) Kan du se några problem med den valda undersökningsdesignen? Föreslå en bättre design. 10 Ett mjukvaruföretag har dels en telefonsupport avdelning dels en chatsupportavdelning. Man vill undersöka vilken typ av support som kunderna är mest nöjda med. Ett slumpvis urval om 11 kunder uppmanas betygsätta respektive avdelning på en skala mellan 1 och 7. Resultatet visas nedan. respondentnummer Betyg av telefonsupport Betyg av chatsupport Föreslå två olika testmetoder för att undersöka om någon av supportavdelningarna är mer omtyckt än den andra bland företagets kunder. Utför de båda testerna. Använd 5 % signifikansnivå. Förklara varför resultaten avviker om de gör det och ge några argument för och emot de olika metoderna. Kan du föreslå någon förbättring av undersökningens design? 48
49 11 Nedan visas ett utdrag ur en enkätundersökning som besvarades av 223 personer. För var och en av frågorna A till H skapas en variabel med betäckningen F_5? Där frågetecknet är bokstaven för respektive fråga. a) Vilken skala är dessa variabler mätta på? b) Vilka slutsatsen kan du dra från nedanstående resultat från RCommander: 49
50 Tabellen nedan visar motsvarande resultat från SPSS 50
51 c) Varför använder man inte Pearsons korrelationskoefficient i det här fallet? d) Vilka slutsatser kan du dra från RCommander utskriften nedan? e) Varför använde man inte t-test för beroende urval i d-uppgiften? f) I enkäten fanns även en variabel för kön, vilken skala är variabeln kön mätt på? g) Vilka slutsatser kan du dra från resultaten från R Commander utskriften nedan? 51
52 52
53 53
54 Nedan visas motsvarande resultat från SPSS h) Varför används inte t-test på medelvärden från oberoende urval i det här fallet? 54
55 12 I en enkät undersökning om livsmedelskedjornas kunders lojalitet ställdes bl a följande frågor. 1 För mig är det viktigt att handla från en viss livsmedelskedja. 2. Hur många av dina fem senaste matinköp har varit från samma livsmedelskedja? Instämmer inte alls Instämmer helt Kön 1 Man 2 Kvinna 4. Ålder Utifrån svaren skapas fyra variabler F1, F2, F3 och F4 a) Ange skaltyp för respektive variabel. b) Antag att du vill besvara följande fråga, Anser kvinnor och män att det är lika viktigt att handla från en viss livsmedelskedja. Vilket statistiskt test rekomederar du och vilka variabler skulle du använda. Beskriv kort hur testen går till. c) Antag att man vill se om de som anser det är viktigt att handla från en viss livsmedelskedja också är mer lojala i sitt faktiska beteende. Vilket statistiskt test rekomederar du och vilka variabler skulle du använda. Beskriv kort hur testen går till. d) Antag att man vill se om äldre personer är mer lojala än yngre personer i sitt faktiska beteende. Vilket statistiskt test rekomederar du och vilka variabler skulle du använda. Beskriv kort hur testen går till. e) Antag att man vill undersöka om det finns ett samband mellan ålder och huruvida man anser det viktigt att handla från en viss livsmedelskedja. Vilken test rekommenderar du och vilka variabler skulle du använda. Beskriv kort hur testen går till. f) Pelle vill undersöka om kunderna säger sig vara mer lojala än vad deras faktiska beteende uppvisar. Han gör därför en t-test på medelvärdet av differensen mellan variabelvärdet på F1 och F2. (t-test på beroenden urval). Pelle visar att de svarande i genomsnitt har anger högre siffror på fråga 1 än fråga 2. Differensen är positiv och signifikant. Han drar utifrån det slutsatsen att deras faktiska beteende uppvisar en lägre lojalitet än vad de säger sig ha. Finns det skäl att kritisera Pelles val av metod och den slutsats han drar? 55
MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2016 1 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära...
Läs merMÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Vårterminen 2019 1 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära...
Läs merMÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2015 1 Innehåll Deskriptiv statistik och index... 3 Sannolikhetslära...
Läs merTentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 5 Tillåtna hjälpmedel: Miniräknare (Formelsamling
Läs merMÄLARDALENS HÖGSKOLA. Akademin för hållbar samhälls- och teknikutveckling. Statistik. Övningar. Statistik och kvantitativa undersökningar 15 HP
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2014 1 Innehåll Deskriptiv statistik och index...
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 24 e mars 2016 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merTentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 2 Tillåtna hjälpmedel: Miniräknare (Formelsamling
Läs merTentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas
Läs merTentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 2 Tillåtna hjälpmedel: Miniräknare (Formelsamling
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 4 e mars Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Fredagen den 4 e mars 2016 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merTentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 2015 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 10 e januari 2017 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merTentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 HP Ten1 9 HP 19 e augusti 2015 Tillåtna hjälpmedel: Miniräknare
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Fredagen den 9 e juni 2017 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merLösningsförslag till övningar
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2016 1 Innehåll Deskriptiv statistik
Läs merLösningsförslag till övningar
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 1 Innehåll Deskriptiv statistik och
Läs merTentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 1 Tillåtna hjälpmedel: Miniräknare (Formelsamling
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 23 e mars 2017 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merLösningsförslag till övningar
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 2015 1 Innehåll Deskriptiv statistik
Läs merRepetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Läs merLösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Lösningsförslag till tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 13 e mars 015 1 a 13 och 14
Läs merTentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA100, 15 hp Fredagen den 16 e januari 2015 Tillåtna hjälpmedel: Miniräknare
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 12 e januari Ten 1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Tisdagen den 12 e januari 2016 Ten 1, 9 hp Tillåtna hjälpmedel:
Läs merLösningsförslag till övningar
MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Lösningsförslag till övningar Statistik och kvantitativa undersökningar 15 HP Höstterminen 014 1 Innehåll Deskriptiv statistik
Läs merSTA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017 Räknestuga 2 Förberedelser: Lyssna på föreläsningarna F4, F5 och
Läs merSTA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik STA101, Statistik och kvantitativa undersökningar, A 15 p Vårterminen 2017 Räknestuga 2 Förberedelser: Lyssna på föreläsningarna F4, F5 och
Läs mer1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)
1. a) F1(Sysselsättning) F2 (Ålder) F3 (Kön) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar) nominalskala kvotskala nominalskala ordinalskala ordinalskala b) En möjlighet är att beräkna
Läs merLaboration 2. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att utföra multipel regressionsanalys MÄLARDALENS HÖGSKOLA
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 p Höstterminen 2016 Laboration 2 Övningsuppgifter Baserade på dataseten: Discrim_lab.xlsx
Läs merLaboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 Hp Vårterminen 2017 Laboration 2 Omprovsuppgift Regressionsanalys, baserat på Sveriges kommuner
Läs merBild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II
Bild 1 Medicinsk statistik II Läkarprogrammet T5 HT 2014 Anna Jöud Arbets- och miljömedicin, Lunds universitet ERC Syd, Skånes Universitetssjukhus anna.joud@med.lu.se Bild 2 Sammanfattning Statistik I
Läs merEXAMINATION KVANTITATIV METOD vt-11 (110204)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110204) Examinationen består av 11 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Läs merAtt välja statistisk metod
Att välja statistisk metod en översikt anpassad till kursen: Statistik och kvantitativa undersökningar 15 HP Vårterminen 2018 Lars Bohlin Innehåll Val av statistisk metod.... 2 1. Undersökning av en variabel...
Läs merordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)
1 F1 ordinalskala F2 kvotskala F65A nominalskala F65B kvotskala F81 nominalskala (motivering krävs för full poäng) b) Variabler som används är F2 och F65b. Eftersom det är kvotskala på båda kan vi använda
Läs merRepetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Läs merProvmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Läs merRättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen 6.5 hp AT1MS1 DTEIN16h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 1 juni 2017 Tid: 14-18 Hjälpmedel: Miniräknare Totalt antal
Läs merMälardalens Högskola. Formelsamling. Statistik, grundkurs
Mälardalens Högskola Formelsamling Statistik, grundkurs Höstterminen 2015 Deskriptiv statistik Populationens medelvärde (population mean): μ = X N Urvalets medelvärde (sample mean): X = X n Där N är storleken
Läs merTentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik Tentamen på Statistik och kvantitativa undersökningar STA101, 15 hp Torsdagen den 22 mars 2018 TEN1, 9 hp Tillåtna hjälpmedel: Miniräknare
Läs merKapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Läs merEXAMINATION KVANTITATIV METOD vt-11 (110319)
ÖREBRO UNIVERSITET Hälsoakademin Idrott B Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-11 (110319) Examinationen består av 10 frågor, flera med tillhörande följdfrågor. Besvara alla frågor i direkt
Läs merLaboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA
MÄLARDALENS HÖGSKOLA Akademin för ekonomi, samhälle och teknik Statistik och kvantitativa undersökningar, A 15 p Höstterminen 2016 Laboration 3 Övningsuppgifter Baserade på datasetet energibolag.rdata
Läs merMedicinsk statistik II
Medicinsk statistik II Läkarprogrammet termin 5 VT 2013 Susanna Lövdahl, Msc, doktorand Klinisk koagulationsforskning, Lunds universitet E-post: susanna.lovdahl@med.lu.se Dagens föreläsning Fördjupning
Läs merMultipel Regressionsmodellen
Multipel Regressionsmodellen Koefficienterna i multipel regression skattas från ett stickprov enligt: Multipel Regressionsmodell med k förklarande variabler: Skattad (predicerad) Värde på y y ˆ = b + b
Läs merAnalytisk statistik. Mattias Nilsson Benfatto, PhD.
Analytisk statistik Mattias Nilsson Benfatto, PhD Mattias.nilsson@ki.se Beskrivande statistik kort repetition Centralmått Spridningsmått Normalfördelning Konfidensintervall Korrelation Analytisk statistik
Läs merFråga nr a b c d 2 D
Fråga nr a b c d 1 B 2 D 3 C 4 B 5 B 6 A 7 a) Första kvartilen: 33 b) Medelvärde: 39,29 c) Standardavvikelse: 7,80 d) Pearson measure of skewness 1,07 Beräkningar: L q1 = (7 + 1) 1 4 = 2 29-10 105,8841
Läs merSkolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Läs merAnalytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens
Analytisk statistik Tony Pansell, Leg optiker Docent, Universitetslektor Analytisk statistik Att dra slutsatser från den insamlade datan. Två metoder:. att generalisera från en mindre grupp mot en större
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson
1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och
Läs merSTOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh
1 STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh Skriftlig tentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik
Läs merimport totalt, mkr index 85,23 100,00 107,36 103,76
1. a) F1 Kvotskala (riktiga siffror. Skillnaden mellan 3 och 5 månader är lika som skillnaden mellan 5 och 7 månader. 0 betyder att man inte haft kontakt med innovations Stockholm.) F2 Nominalskala (ingen
Läs merKapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Läs merOBS! Vi har nya rutiner.
KOD: Kurskod: PC1203 och PC1244 Kursnamn: Kognitiv psykologi och metod och Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Linda Hassing Tentamensdatum: 2012-11-17 Tillåtna
Läs mer1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)
1a) F1 och F3 nominalskala, enbart olika saker F kvotskala, Riktiga siffror, 0 betyder att man inte finns och avståndet mellan två värden är exakt definierat F4 och F5 ordinalskala, vi kan ordna svaren
Läs merAnalytisk statistik. Tony Pansell, optiker Universitetslektor
Analytisk statistik Tony Pansell, optiker Universitetslektor Analytisk statistik Att dra slutsatser från det insamlade materialet. Två metoder: 1. att generalisera från en mindre grupp mot en större grupp
Läs merTentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl
Karlstads universitet Avdelningen för nationalekonomi och statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema
Läs merF19, (Multipel linjär regression forts) och F20, Chi-två test.
Partiella t-test F19, (Multipel linjär regression forts) och F20, Chi-två test. Christian Tallberg Statistiska institutionen Stockholms universitet Då man testar om en enskild variabel X i skall vara med
Läs merFöreläsning G60 Statistiska metoder
Föreläsning 9 Statistiska metoder 1 Dagens föreläsning o Regression Regressionsmodell Signifikant lutning? Prognoser Konfidensintervall Prediktionsintervall Tolka Minitab-utskrifter o Sammanfattning Exempel
Läs merOBS! Vi har nya rutiner.
KOD: Kurskod: PM2315 Kursnamn: Psykologprogrammet, kurs 15, Metoder för psykologisk forskning (15 hp) Ansvarig lärare: Jan Johansson Hanse Tentamensdatum: 14 januari 2012 Tillåtna hjälpmedel: miniräknare
Läs merStatistik och epidemiologi T5
Statistik och epidemiologi T5 Anna Axmon Biostatistiker Yrkes- och miljömedicin Dagens föreläsning Fördjupning av hypotesprövning Repetition av p-värde och konfidensintervall Tester för ytterligare situationer
Läs merMedicinsk statistik II
Medicinsk statistik II Läkarprogrammet T5 HT 2014 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus Hypotesprövning Man sätter upp en nollhypotes (H0) och en mothypotes (H1) H0: Ingen effekt H1:
Läs merRättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:
Statistik 2 Provmoment: Ladokkod: Tentamen ges för: TentamensKod: Tentamen SST021 ACEKO16h, ACIVE16h 7,5 högskolepoäng Tentamensdatum: 2018-05-31 Tid: 14.00-19.00 Hjälpmedel: Valfri miniräknare Linjal
Läs merLaboration 3 Inferens fo r andelar och korstabeller
S0005M Statistik2 Lp 4 2016 Laboration 3 Inferens fo r andelar och korstabeller Laborationen behandlar Test av andelar med konfidensintervall och hypotestest Chi två test av oberoende mellan kvalitativa
Läs merResidualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen
Residualanalys För modellen Johan Koskinen, Statistiska institutionen, Stockholms universitet Finansiell statistik, vt-5 F7 regressionsanalys antog vi att ε, ε,..., ε är oberoende likafördelade N(,σ Då
Läs merTENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp
UMEÅ UNIVERSITET Tentamen 2016-08-24 Sid 1 TENTAMEN I MATEMATISK STATISTIK Statistik för lärare 7,5 hp Skrivtid: 16-22 Tillåtna hjälpmedel: Miniräknare. Formelblad och tabeller bifogas till tentamen. Studenterna
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs mer7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Läs merTentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.
KOD: Kurskod: PC1244 Kursnamn: Kognitiv psykologi och utvecklingspsykologi Provmoment: Metod Ansvarig lärare: Sandra Buratti Tentamensdatum: 2013-09-27 Tillåtna hjälpmedel: Miniräknare Tentamen består
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merFÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik
Grundläggande statistik Påbyggnadskurs T1 Odontologisk profylaktik FÖRELÄSNINGSMATERIAL : KORRELATION OCH HYPOTESTESTNING t diff SE x 1 diff SE x x 1 x. Analytisk statistik Regression & Korrelation Oberoende
Läs merÖVNINGSUPPGIFTER KAPITEL 2
ÖVNINGSUPPGIFTER KAPITEL 2 DATAMATRISEN 1. Datamatrisen nedan visar ett utdrag av ett datamaterial för USA:s 50 stater. Stat Befolkningsmängd Inkomst Marijuana Procent män (miljoner) per person lagligt?
Läs merATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER
ATT KONTROLLERA FÖR BAKOMLIGGANDE FAKTORER 1. Regressionen nedan visar hur kvinnors arbetsmarknadsdeltagande varierar beroende på om de har småbarn eller inte. Datamaterialet gäller 753 amerikanska kvinnor
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson
1 STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson Skriftlig omtentamen på momentet Statistisk dataanalys III (SDA III), 3 högskolepoäng ingående i kursen Undersökningsmetodik och
Läs merEXAMINATION KVANTITATIV METOD
ÖREBRO UNIVERSITET Hälsoakademin Idrott B, Vetenskaplig metod EXAMINATION KVANTITATIV METOD vt-09 (090209) Examinationen består av 8 frågor, några med tillhörande följdfrågor. Frågorna 4-7 är knutna till
Läs merTentamentsskrivning: Matematisk Statistik med Metoder MVE490 1
Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1 Tentamentsskrivning i Matematisk Statistik med Metoder MVE490 Tid: den 16 augusti, 2017 Examinatorer: Kerstin Wiklander och Erik Broman. Jour:
Läs merRättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:
Matematisk Statistik Provmoment: Ladokkod: Tentamen ges för: Tentamen TT091A TGMAS15h 7,5 högskolepoäng TentamensKod: Tentamensdatum: 30 Maj Tid: 9-13 Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig
Läs merSänkningen av parasitnivåerna i blodet
4.1 Oberoende (x-axeln) Kön Kön Längd Ålder Dos Dos C max Parasitnivå i blodet Beroende (y-axeln) Längd Vikt Vikt Vikt C max Sänkningen av parasitnivåerna i blodet Sänkningen av parasitnivåerna i blodet
Läs merÖvningshäfte till kursen Regressionsanalys och tidsserieanalys
Övningshäfte till kursen Regressionsanalys och tidsserieanalys Linda Wänström October 31, 2010 1 Enkel linjär regressionsanalys (baserad på uppgift 2.3 i Andersson, Jorner, Ågren (2009)) Antag att följande
Läs merObligatorisk uppgift, del 1
Obligatorisk uppgift, del 1 Uppgiften består av tre sannolikhetsproblem, som skall lösas med hjälp av miniräknare och tabellsamling. 1. Vid tillverkning av en produkt är felfrekvensen 0,02, dvs sannolikheten
Läs merHur skriver man statistikavsnittet i en ansökan?
Hur skriver man statistikavsnittet i en ansökan? Val av metod och stickprovsdimensionering Registercentrum Norr http://www.registercentrumnorr.vll.se/ statistik.rcnorr@vll.se 11 Oktober, 2018 1 / 52 Det
Läs merFACIT (korrekta svar i röd fetstil)
v. 2013-01-14 Statistik, 3hp PROTOKOLL FACIT (korrekta svar i röd fetstil) Datorlaboration 2 Konfidensintervall & hypotesprövning Syftet med denna laboration är att ni med hjälp av MS Excel ska fortsätta
Läs merTENTAMEN. HiG sal 51:525A B eller annan ort. Lärare: Tommy Waller ( tel: eller )
TENTMEN Kurs: Plats: Dataanalys och statistik 2 distans 7,5 hp HiG sal 5:525 B eller annan ort Datum: 2 6 9 Tid: 9: 4: Lärare: Tommy Waller ( tel: 26-64 89 65 eller 74 3 86 3 ) Hjälpmedel: Miniräknare
Läs merAnalys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
Läs merIdag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment
EDAA35, föreläsning 4 KVANTITATIV ANALYS Idag Kvantitativ analys Kamratgranskning Analys Exempel: exekveringstid Hur analysera data? Hur vet man om man kan lita på skillnader och mönster som man observerar?
Läs merHypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University
Hypotesprövning Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Hypotesprövning Liksom konfidensintervall ett hjälpmedel för att
Läs merLinjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Läs merMSG830 Statistisk analys och experimentplanering
MSG830 Statistisk analys och experimentplanering Tentamen 16 April 2015, 8:30-12:30 Examinator: Staan Nilsson, telefon 073 5599 736, kommer till tentamenslokalen 9:30 och 11:30 Tillåtna hjälpmedel: Valfri
Läs merTentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
Läs merÖVNINGSUPPGIFTER KAPITEL 9
ÖVNINGSUPPGIFTER KAPITEL 9 STOKASTISKA VARIABLER 1. Ange om följande stokastiska variabler är diskreta eller kontinuerliga: a. X = En slumpmässigt utvald person ur populationen är arbetslös, där x antar
Läs merUppgift a b c d e Vet inte Poäng 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
TENTAMEN: Dataanalys och statistik för I, TMS136 Onsdagen den 5 oktober kl. 8.30-13.30 på M. Jour: Jenny Andersson, ankn 5317 Hjälpmedel: Utdelad formelsamling med tabeller, BETA, på kursen använd ordlista
Läs merHur man tolkar statistiska resultat
Hur man tolkar statistiska resultat Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Varför använder vi oss av statistiska tester?
Läs merTentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan 08.15-13.15
Karlstads universitet Institutionen för informationsteknologi Avdelningen för Statistik Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 6 april 004, klockan 08.15-13.15 Tillåtna hjälpmedel: Bifogad
Läs merInnehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik (sid 53 i E) III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser 1 II. Beskrivande statistik,
Läs merTentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl 08.15-13.15 Tillåtna hjälpmedel: Bifogad formelsamling, approximationsschema och tabellsamling (dessa skall returneras). Egen
Läs merStockholms Universitet Statistiska institutionen Termeh Shafie
Stockholms Universitet Statistiska institutionen Termeh Shafie TENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER 2011-10-28 Skrivtid: 9.00-14.00 Hjälpmedel: Miniräknare utan lagrade formler eller text, bifogade
Läs merFöreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs merGiltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.
KOD: Kurskod: PC1244 Kursnamn: Metod Provmoment: Metod Ansvarig lärare: Sandra Buratti Tentamensdatum: 2014-11-08 Tillåtna hjälpmedel: Miniräknare Tentan består av 13 frågor, totalt 40 poäng. Det krävs
Läs merTentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl 14.00-19.00
Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 004, kl 14.00-19.00 Tillåtna hjälpmedel: Bifogad formelsamling, approimationsschema och tabellsamling (dessa skall returneras). Egen miniräknare.
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merTT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng
Matematisk statistik Provmoment: Ladokkod: Tentamen ges för: TT091A, TVJ22A, NVJA02 Pu, Ti 7,5 högskolepoäng Namn: (Ifylles av student) Personnummer: (Ifylles av student) Tentamensdatum: 2012-05-29 Tid:
Läs mer