Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 1

Relevanta dokument
Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 22 mars TEN1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 16 e januari 2015

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 10 e januari Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 HP. Ten1 9 HP. 19 e augusti 2015

Tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 12 e januari Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 4 e mars Ten 1, 9 hp

1b) Om denna överstiger det kritiska värdet förkastas nollhypotesen. 1c)

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

import totalt, mkr index 85,23 100,00 107,36 103,76

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Måndag 14 maj 2007, Kl

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

Fråga nr a b c d 2 D

Repetitionsföreläsning

Att välja statistisk metod

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Tentamen Tillämpad statistik A5 (15hp)

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) Fredag 8 december 2006, Kl

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Johan Andersson

Läs noggrant informationen nedan innan du börjar skriva tentamen

OBS! Vi har nya rutiner.

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Miniräknare. Betygsgränser: Maximal poäng är 24. För betyget godkänd krävs 12 poäng och för betyget väl godkänd krävs 18 poäng.

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 april 2004, klockan

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

OBS! Vi har nya rutiner.

Statistisk försöksplanering

OBS! Vi har nya rutiner.

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Rättningstiden är i normalfall 15 arbetsdagar, till detta tillkommer upp till 5 arbetsdagar för administration, annars är det detta datum som gäller:

Föreläsning G60 Statistiska metoder

Stockholms Universitet Statistiska institutionen Termeh Shafie

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

Tentamen i matematisk statistik

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

OBS! Vi har nya rutiner.

732G01/732G40 Grundläggande statistik (7.5hp)

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

OMTENTAMEN I GRUNDLÄGGANDE STATISTIK FÖR EKONOMER

Examinationsuppgift 2014

Statistisk försöksplanering

Laboration 2. Omprovsuppgift MÄLARDALENS HÖGSKOLA. Akademin för ekonomi, samhälle och teknik

OBS! Vi har nya rutiner.

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Tisdagen den 5 e juni TEN1, 9 hp

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

MSG830 Statistisk analys och experimentplanering

Statistik för teknologer, 5 poäng Skrivtid:

Rättningstiden är i normalfall 15 arbetsdagar, annars är det detta datum som gäller:

Tentamen Tillämpad statistik A5 (15hp)

Sänkningen av parasitnivåerna i blodet

Föreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

7,5 högskolepoäng. Statistisk försöksplanering och kvalitetsstyrning. TentamensKod: Tentamensdatum: 28 oktober 2016 Tid: 9.

TENTAMEN I MATEMATISK STATISTIK

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 4 juni 2004, kl

Tentamen i Statistik, STG A01 och STG A06 (13,5 hp) Torsdag 5 juni 2008, Kl

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

, s a. , s b. personer från Alingsås och n b

Hjälpmedel: Miniräknare (nollställd) samt allmänspråklig (ej fackspråklig) ordbok utan kommentarer. Formelsamling lånas i tentamenslokalen.

Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Tentamentsskrivning: Matematisk Statistik med Metoder MVE490 1

TT091A, TVJ22A, NVJA02 Pu, Ti. 50 poäng

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Repetitionsföreläsning

Tentamen i Vetenskaplig grundkurs (MC001G/MC014G/MC1016), STATISTIK

Multipel Regressionsmodellen

Tentamen i Matematisk statistik Kurskod S0001M

Hypotestestning och repetition

Deskriptiv statistik. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

Tentamen Metod C vid Uppsala universitet, , kl

Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle

Uppgift a b c d e Vet inte Poäng

LULEÅ TEKNISKA UNIVERSITET Ämneskod S0006M Institutionen för matematik Datum Skrivtid

Tentamen Tillämpad statistik A5 (15hp)

8 Inferens om väntevärdet (och variansen) av en fördelning

Matematisk statistik LKT325 Tentamen med lösningar

Ett A4-blad med egna handskrivna anteckningar (båda sidor) samt räknedosa.

TENTAMEN I STATISTIK B,

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Transkript:

MÄLARDALENS HÖGSKOLA Akademin för hållbar samhälls- och teknikutveckling Statistik Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp Exempeltenta 1 Tillåtna hjälpmedel: Miniräknare (Formelsamling bifogas tentamen) Ansvarig lärare. Lars Bohlin 0730-452937 Poäng Totalt 40 Betygsgränser: G 20 VG 30 Generella uppmaningar: Redovisa dina lösningar i en form som gör det enkelt att följa din tankegång. Motivera alla väsentliga steg i beräkningar, ange alla antaganden du gör och förutsättningar du utnyttjar.

Nedan visas ett utdrag ur en enkätundersökning om livmedelskedjornas kunders lojalitet som du ska använda när du besvarar frågorna 1 3. 1 För mig är det viktigt att handla från en viss livsmedelskedja. Instämmer inte alls Instämmer helt 1 2 3 4 5 2. Hur många av dina fem senaste matinköp har varit från samma livsmedelskedja? 1 2 3 4 5 3. Kön 1 Man 2 Kvinna 4. Ålder Utifrån svaren skapas fyra variabler F1(påstådd lojalitet) F2 (uppvisad lojalitet) F3 (kön) och F4 (ålder) 1. (1 poäng) Vilket av följande påståenden är sant om variabeln F1 (påstådd lojalitet) a) Variabeln F1 (påstådd lojalitet) mäts på kvotskala b) Variabeln F1 (påstådd lojalitet) mäts på intervallskala c) Variabeln F1 (påstådd lojalitet) mäts på ordinal skala d) Variabeln F1 (påstådd lojalitet) mäts på nominal skala 2. (1 poäng) Vilket av följande påståenden är sant om variabeln F2 (uppvisad lojalitet) a) Variabeln F2 (uppvisad lojalitet) mäts på kvotskala b) Variabeln F2 (uppvisad lojalitet) mäts på intervallskala c) Variabeln F2 (uppvisad lojalitet) mäts på ordinal skala d) Variabeln F2 (uppvisad lojalitet) mäts på nominal skala 3. (1 poäng) Antag att du med hjälp av svaren till enkätfrågorna ska besvara följande fråga: Anser kvinnor och män att det är lika viktigt att handla från en viss livsmedelskedja? Du ska använda dig av variablerna F1(påstådd lojalitet) och F3 (kön). Vilken av följande metoder är lämpligast? a) Beräkna Pearsons korrelationskoefficient b) t-test på medelvärden från 2 oberoende urval c) Wilcoxons teckenrangtest d) Wilcoxons rangsummetest

4. (1 poäng) Figuren nedan visar plottar med en regressionslinje från tre olika regressionsanalyser vilka alla har enbart en oberoende variabel. Vilket av följande påståenden är falskt? a) Korrelationskoefficienten r är positive i A och C men negativ i B. b) Korrelationskoefficienten r är mindre i C än i A. c) Regressionskoefficienten b är större i C än i A. d) Regressionskoefficienten b är negativ i B och positiv i C. 5. (1 poäng) Vilken av följande fördelningar är en uniform fördelning a) b) c) d) 6. (1 poäng) Vilket påstående är sant om följande fördelning a) Fördelningen är diskret och medianen är större än medelvärdet b) Fördelningen är kontinuerlig och medianen är större än medelvärdet c) Fördelningen är diskret och medianen är mindre än medelvärdet d) Fördelningen är kontinuerlig och medianen är mindre än medelvärdet

7. (1 poäng) Vilket av följande diagram skulle du rekommendera för att beskriva en kvalitativ variabel mätt på nominalskala? a) Histogram b) Cirkeldiagram c) Lådagram (box plot ) d) Frekvenspolygon 8. (6 poäng) I en undersökning dras ett slumpmässigt urval av 850 universitetslärare varav 300 är kvinnor. Hälften av de kvinnliga lärarna i urvalet har doktorsexamen. Av samtliga lärare i urvalet har 40 % doktorsexamen. a) Illustrera urvalet med en korstabell. b) Hur stor andel av de manliga lärarna i urvalet har doktorsexamen? c) Antag att man från urvalet slumpmässigt drar en lärare. Det visar sig att denna lärare ine har doktorsexamen. Hur stor är sannolikheten att det är en man? d) Kan kön och doktorsgrad anses vara oberoende variabler i hela populationen universitetslärare? Utför en lämplig statistisk test där du använder 5% signifikansnivå. 9. (3 poäng) Maria kör bil längs huvudleden genom en mindre stad. Det finns två trafikljus på huvudleden, vilka är ihopkopplade i en så kallad grön våg för att underlätta trafikrytmen. Vid första trafikljuset är sannolikheten 0,6 för grönt ljus och 0,4 för rött ljus. Om Maria får rött ljus vid första trafikljuset är det ganska stor sannolikhet att hon får grönt vid nästa eftersom hon då kommer in i den gröna vågen. Den betingade sannolikheten för grönt ljus vid det andra trafikljuset givet att hon får rött vid första är 0,9. Men om Maria får grönt ljus vid första är sannolikheten lite lägre för grönt vid nästa. (Om hon kommer precis innan det slår om kanske hon inte hinner fram innan nästa ljus slår om till rött). Den betingade sannolikheten för grönt ljus vid det andra trafikljuset, givet att hon får grönt ljus vid första är därför bara 0,8. a. Illustrera ovanstående med ett sannolikhetsträd där alla sannolikheter anges, dvs de obetingade sannolikheterna för grönt respektive rött vid första trafikljuset, de betingade sannolikheterna för grönt respektive rött vid andra trafikljuset och de gemensamma sannolikheterna för utfallen vid båda trafikljusen. b. Hur stor är sannolikheten att Maria får rött vid minst ett av trafikljusen?

10. (5 poäng) Svenska kvinnor ägnar i genomsitt 4 timmar per dag åt hemarbete. Pelle tror att kvinnor på landsbygden ägnar mer än 4 timmar per dag åt hemarbete. Han gör därför en urvalsundersökning där han frågar 25 slumpvis utvalda kvinnor boende på landsbygden om hur många timmar per dag de ägnar åt hemarbete. Medelvärdet i hans urval blev 4,25 timmar med standardavvikelsen 1 timme. Använd 5 procents signifikansnivå för att göra en hypotestest utifrån detta urval. Kan du bevisa att Pelle har rätt? a) Sätt upp lämplig nollhypotes och mothypotes. b) Ange formeln för din teststatistika och en beslutregel c) Beräkna värdet på din teststatistika d) Kan vi dra någon slutsats från undersökningen? I så fall vilken? 11. (3 poäng) Tomater av en viss sort väger i genomsnitt 50 gram med en standardavvikelse på 3 gram. a) Beräkna sannolikheten att en slumpvis vald tomat väger mer än 52 gram b) Beräkna sannoliketen att medelvärdet i ett slumpmässigt urval av 9 tomater är större än 52 gram. 12 (3 poäng) Prisökningarna på konsumtionsvaror i ett litet land var enligt följande tabell. 2001 2 % 2002 1 % 2003 1,5 % 2004 2 % 2005 3 % a) Beräkna ett kedjeindex med 2000 som basår b) Metallarbetarna i det här landet tjänade år 2000 i genomsnitt 20 000 per månad. År 2005 tjänade de i genomsnitt 24 000 per månad, hur stor var reallöneökningen i 2000 år penningvärde? 13 (3 poäng) Beskriv följande tre typer av urval samt redogör för hur urvalstypen påverkar undersökningen. a) Bekvämlighetsurval b) Oberoende slumpmässigt urval c) Stratifierat slumpmässigt urval

14. (10 poäng) En amerikansk collegestudent ville veta vilka faktorer som påverkade skolbetygen och gjorde en undersökning bland sina studiekamrater på college. Med hjälp av regressionsanalys försökte han förklara hur medelbetyget på college påverkades av olika faktorer. Variabellista: colgpa Medelbetyg på college hsgpa Medelbetyg från High scool skipped Genomsnittligt antal lektioner missade per vecka alcohol Genomsnittligt antal dagar per vecka som studenten dricker alkohol bgfriend Dummyvariabel som tar värdet 1 om studenten har en pojk eller flickvän och 0 om studenten är singel. Följande resultat erhålls från R Commander ANOVA tabellen konverterad till lärobokens format var: Source DF SS MS Regression 4 4,891 1,223 Residual Error 136 14,515 0,107 Total 140 19,406 a) Tolka regressionskoefficienterna och deras p-värden, under antagandet att det inte finns någon påverkan från den beroende variabeln till de oberoende variablerna, använd 5 % signifikansnivå. 5 p b) Diskutera om det kan tänkas finnas något orsakssamband från den beroende variabeln till någon av de oberoende variablerna. 1 p c) Beräkna och tolka ett 95 procentigt konfidensintervall för effekten på medelbetyget om en student i genomsnitt missar 1 lektion per vecka. 2 p d) Beräkna och tolka förklaringsgraderna, såväl R 2 som R 2 adj. 2 p

Svarsblanket för multiple choice frågor (Riv av denna sida och lämna in tillsammans med dina lösningar) Fråga nr a b c d 1 2 3 4 5 6 7

Lösningsförslag Fråga nr a b c d 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 a) doktorsexamen Ej doktorsexamen Män 190 360 550 Kvinnor 150 150 300 340 510 850 b) 190 / 550 = 0,35 ca 35 % av de manliga lärarna har doktorsexamen. c) 360 / 510 = 0,71 sannolikheten att en slumpvis vald lärare som inte har doktorsexamen är man är 0,71. d) För att testa om variablerna är oberoende i hela populationen görs lämpligen en chi2 test. Vi sätter upp följande hypoteser H 0 : Variablerna kön och utbildningsnivå är oberoende H 1 : Variablerna kön och utbildningsnivå är beroend av varandra De förväntade frekvenserna under H 0 är: doktorsexamen Ej doktorsexamen Män 220 (550*340/850) 330 (550*510/850) 550 Kvinnor 120 (300*340/850) 180 (300*510/850) 300 340 510 850 Vår chi2 tesstatistika beräknas till 19,32

f 0 f e f 0 f e (f 0 f e ) 2 Man doktor 190 220-30 4,09 Man ej doktor 360 330 30 2,73 Kvinna doktor 150 120 30 7,5 Kvinna ej doktor 150 180-30 5 Summa 850 850 0 19,32 f e Antal frihetsgrader är (2 1) (2 1) = 1 Kritiskt värde: 3,841 Eftersom värdet på vår teststatistika överstiger det kritiska värdet kan vi avslå nollhypotesen. Vi kan därmed dra slutsatsen att utbildningsnivå och kön är beroende variabler i hela populationen universitetslärare. En större andel av de kvinnliga än av de manliga lärarna har doktorsexamen. 9 a) 0,1 rött 0,4 0,1 0,04 0,4 rött 0,9 grönt 0,4 0,9 0,36 0,6 grönt 0,2 rött 0,6 0,2 0,12 0,8 grönt 0,6 0,8 0,48 b) Det finns tre sätt att få minst ett rött. Antingen rött grönt, grönt rött eller rött-rött. Det innebär att det bara är grönt grönt som inte uppfyller detta. Vi kan använde komplementregeln: P(minst ett rött) = 1 P(grönt grönt) = 1 0,48 = 0,52 (Ett annat alternativ är att använda adderingsregeln och lägga ihop de tre utfallen som uppfyller händelsen.)

10 a) H 0 : μ 4 H 1 : μ > 4 b) t = X μ Beslutsregel: förkasta H 0 om teststatistikan är större än det kritiska värdet s n 1,711 c) t = 4,25 4 1 25 = 0,25 0,2 = 1,25 d) Eftersom 1,125 är mindre än 1,711 kan vi inte förkasta H 0 och kan därför inte dra några slutsatser. 11 a) z = 52 50 3 = 0,67 P(X > 52) = P(z > 0,67) = 0,5 P(0 < z < 0,67) = 0,5 0,2486 = 0,2514 Sannolikheten att en tomat väger mer än 52 gram är 0,25 b) Ett urvalsmedelvärde har standardavvikelsen: σ x = σ n = 3 9 = 1 z = 52 50 1 = 2 P(X > 52) = P(z > 2) = 0,5 P(0 < z < 2) = 0,5 0,4772 = 0,0228 Sannolikheten att medelvärdet i ett slumpmässigt urval om 9 tomater är större än 52 gram är lika med 0,023. 12 a) index 2000 100,0 2001 2 % 102,0 2002 1 % 103,0 2003 1,5 % 104,6 2004 2 % 106,7 2005 3 % 109,9 b) lön 2005 i 2000 års penningvärde: 24000 100 = 21 847 109,9 reallöneökning 21 847 20 000 = 1 847

13 Bekvämlighetsurval är den enklaste typen av urval. Man använder de individer man har tillgång till, exempelvis delar ut enkäter till de som råkar gå förbi på gatan. I ett obundet slumpmässigt urval måste alla i populationen ha samma sannolikhet att hamna i urvalet. Skapas oftast genom någon form av lottning eller slumptalsgenerering. I ett stratifierat slumpmässigt urval delas populationen upp i grupper och man tar ett slumpmässigt urval ur varje grupp. Inferens kan användas på obundet slumpmässigt urval och även på stratifierat urval. Fördelen med stratifierat urval är att man klan jämföra de olika grupperna och att man inte riskerar att viktiga undergrupper i populationen missas av urvalet. Teoretiskt sett kan man inte använda inferens på ett bekvämlighetsurval. Men om man kan argumentera för att det är relativt slumpmässigt vilka individer som man råkar ha tillgång till kan man hävda att alla i populationen har samma sannolikhet att komma med i bekvämlighetsurvalet. Huruvida det är realistiskt eller ej beror ofta på hur man definierar populationen. Om man delar ut enkäter på en gata i Västerås och kastar bort dem som inte besvarats av personer boende i Västerås kan man möjligen betrakta det som ett slumpmässigt urval av västeråsare men knappas som ett slumpmässigt urval av hela jordens befolkning. De personer som undviker att ta emot papper som delas ut på stan kommer dock att ha lägre sannolikhet att ingå i urvalet. 14 a) Interceptet (constant) tolkas ej eftersom det förmodligen inte finns någon som har medelbetyget 0 från high school och blivit antagen till college. Alcohol och bgfriend är inte signifikanta eftersom p-värdena är högre än 5 procent och tolkas därför inte. hsgpa är signifikant eftersom p-värdet är lägre än 5 procent, tolkningen är att för varje enhet högre betyg från high school ökar betyget på college med 0,467 enheter vid oförändrade värden på övriga oberoende variabler. (Eller egentligen kanske man ska säga att duktiga elever får höga betyg både på college och high school) Skipped är signifikant eftersom p-värdet är lägre än 5 procent, tolkningen är att om man missar ytterligare en lektion per vecka sjunker medelbetyget med 0,093 enheter vid oförändrade värden på övriga oberoende variabler.

b) exempel på saker man kan diskutera: Collegebetyget kan inte påverka highscool betyget eftersom man får highscoolbetyget först. ( Men egentligen påverkas nog både collegebetyget och highscoolbetyget av en tredje variabel som vi kan kalla goda anlag för studier ) Om det är så at den som får höga betyg därmed tycker att skolan känns roligare kanske han eller hon får högre närvaro? I så fall finns ett samband från betyg till skipped. Om man firar att man fått höga betyg med att dricka alkohol, eller tröstar sig efter att ha fått dåliga skulle man kunna tänka sig ett samband från betyg till alkohol men det är väl ganska tveksamt. Om elever med höga betyg skulle vara mer attraktiva på kärleksmarknaden skulle det finnas ett samband från betyg till att ha pojk eller flickvän men det är väl också ganska tveksamt. Om det finns den här typen av omvänd kausalitet kan vi inte lita på de tolkningar av regressionskoefficienterna som vi gjorde i a-uppgiften. c) Antal frihetsgrader: 136 t = 1,98 0,093 ± 1,98 0,027 0,093 ± 0,053 Med 95 % säkerhet försämras medelbetyget mellan 0,04 och 0,15 enheter om man missar ytterligare en lektion per vecka. d) R 2 = SSR SST = 4,89 19,41 = 0,25 2 R adj = 1 SSE n k 1 SST n 1 = 1 14,5 136 19,4 = 0,23 140 Ca en fjärdedel av variationen av medelbetygen på college kan förklaras av den här modellen. Eftersom förklaringsgraderna är ganska låga finns det troligen också andra variabler som har påverkan på medelbetyget.