Uppgift 1. Produktmomentkorrelationskoefficienten



Relevanta dokument
Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Lösningar till SPSS-övning: Analytisk statistik

Tentamen består av 9 frågor, totalt 34 poäng. Det krävs minst 17 poäng för att få godkänt och minst 26 poäng för att få väl godkänt.

Tentan består av 10 frågor, totalt 30 poäng. Det krävs 20 poäng för att få godkänt på tentan, varav 50 % inom respektive moment.

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

OBS! Vi har nya rutiner.

Tentan består av 15 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 33 poäng för att få välgodkänt.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

OBS! Vi har nya rutiner.

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Forsknings- och undersökningsmetodik Skrivtid: 4h

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Datorövning 5. Statistisk teori med tillämpningar. Lära sig beräkna konfidensintervall och utföra hypotestest för:

SOPA62 - Kunskapsproduktion i socialt arbete

Sociologi GR (A) Sociologisk Metod Examination #2 Peter Axelsson. N Minimum Maximum Mean Std. Deviation

SOPA62 - Kunskapsproduktion i socialt arbete

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

Uppgift 1. Deskripitiv statistik. Lön

Samhällsvetenskaplig metod, 7,5 hp

Medicinsk statistik II

Föreläsning G60 Statistiska metoder

1. Lära sig utföra hypotestest för populationsproportionen. 2. Lära sig utföra test för populationsmedelvärdet

OBS! Vi har nya rutiner.

HÖGSKOLAN I BORÅS. FORSKNINGSMETODER I OFFENTLIG FÖRVALTNING 15 Högskolepoäng

En rät linje ett enkelt samband. En rät linje + slumpbrus. Observationspar (X i,y i ) MSG Staffan Nilsson, Chalmers 1.

Statistiska analyser C2 Bivariat analys. Wieland Wermke

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Matematikcentrum 1(5) Matematisk Statistik Lunds Universitet MASB11 HT Laboration P3-P4. Statistiska test

OBS! Vi har nya rutiner.

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

DATORÖVNING 3: MER OM STATISTISK INFERENS.

Hypotestestning och repetition

Datorövning Power curve 0,0305 0, Kvantiler, kritiska regioner

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Lösningar med kommentarer till övningsuppgifterna i min bok Grundläggande statistiska metoder för analys av kvantitativa data

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Population. Observationsenhet. Stickprov. Variabel Ålder Kön. Blodtryck 120/80. Värden. 37 år. Kvinna

Medicinsk statistik II

OBS! Vi har nya rutiner.

Matematikcentrum 1(6) Matematisk Statistik Lunds Universitet MASB11 HT11. Laboration. Statistiska test /16

ANOVA Mellangruppsdesign

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Maximalt antal poäng för hela skrivningen är 22 poäng. För Godkänt krävs minst 13 poäng. För Väl Godkänt krävs minst 18 poäng.

Idag. EDAA35, föreläsning 4. Analys. Exempel: exekveringstid. Vanliga steg i analysfasen av ett experiment

Statistik 1 för biologer, logopeder och psykologer

FÖRELÄSNINGSMATERIAL. diff SE. SE x x. Grundläggande statistik 2: KORRELATION OCH HYPOTESTESTNING. Påbyggnadskurs T1. Odontologisk profylaktik

Idag. EDAA35, föreläsning 4. Analys. Kursmeddelanden. Vanliga steg i analysfasen av ett experiment. Exempel: exekveringstid

Mata in data i Excel och bearbeta i SPSS

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

För Godkänt krävs minst 70% av maxpoängen i kvalitativ metodik och minst 70% av maxpoängen i kvantitativ metodik.

7.5 Experiment with a single factor having more than two levels

7.1 Hypotesprövning. Nollhypotes: H 0 : µ = 3.9, Alternativ hypotes: H 1 : µ < 3.9.

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Föreläsning 8. Kapitel 9 och 10 sid Samband mellan kvalitativa och kvantitativa variabler

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

ordinalskala kvotskala F65A nominalskala F65B kvotskala nominalskala (motivering krävs för full poäng)

F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva

kodnr: 2) OO (5p) Klassindelningar

F13. Förra gången (F12) Konfidensintervall och hypotesprövning Chi-tvåtest. Stratifierat urval

Kroppstemperaturen hos människa anses i regel vara 37,0 C/ 98,6 F. För att beräkna och rita grafer har programmet Minitab använts.

2.1 Minitab-introduktion

1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell

Metod och teori. Statistik för naturvetare Umeå universitet

Laboration 2. i 5B1512, Grundkurs i matematisk statistik för ekonomer

1. a) F4 (känsla av meningslöshet) F5 (okontrollerade känlsoyttringar)

F5 Introduktion Anpassning Korstabeller Homogenitet Oberoende Sammanfattning Minitab

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval

Laboration 3 Inferens fo r andelar och korstabeller

EXAMINATION KVANTITATIV METOD vt-11 (110204)

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

D. Samtliga beräknade mått skall följas av en verbal slutsats för full poäng.

Statistik 1 för biologer, logopeder och psykologer

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 24 e mars Ten 1, 9 hp

Föreläsning 5. NDAB02 Statistik; teori och tillämpning i biologi

I vår laboration kom vi fram till att kroppstemperaturen påverkar hjärtfrekvensen enligt

Följande resultat erhålls (enhet: 1000psi):

Sambandsmått. Centralmått. Det mest frekventa värdet. Det mittersta värdet i en rangordnad fördelning. Aritmetiska medelvärdet.

Inferensstatistik. Hypostesprövning - Signifikanstest

FACIT (korrekta svar i röd fetstil)

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

Mälardalens Högskola. Formelsamling. Statistik, grundkurs

Gamla tentor (forts) ( x. x ) ) 2 x1

Innehåll. Frekvenstabell. II. Beskrivande statistik, sid 53 i E

F3 Introduktion Stickprov

Föreläsning 6. NDAB01 Statistik; teori och tillämpning i biologi

Hypotesprövning. Andrew Hooker. Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University

Temperatur (grader Celcius) 4 tim. och 32 min tim. och 12 min tim. och 52 min tim. och 1 min tim. och 4 min.

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Statistikens grunder 1 och 2, GN, 15 hp, deltid, kvällskurs

, s a. , s b. personer från Alingsås och n b

Statistik för teknologer, 5 poäng Skrivtid:

Provmoment: Forskningsmetod, Salstentamen nr 1 Ladokkod:

Introduktion till SPSS

Transkript:

Uppgift 1 Produktmomentkorrelationskoefficienten Både Vikt och Längd är variabler på kvotskalan och således kvantitativa variabler. Det innebär att vi inte har så stor nytta av korstabeller om vi vill leta efter samband, allra helst eftersom värdena i de båda variablerna är kontinuerliga och med stor spridning, (Djurfeldt, 2003:161). Det gör att vi får använda andra sätt för att hitta eventuella korrelationer, och ett är att räkna ut produktmomentkorrelationskoefficienten r. I SPSS är det viktigt att veta att det vi är ute efter är Pearsons r eftersom det går att använda flera andra varianter. Pearsons r (Djurfeldt, 2003:161ff) beskriver hur mycket varje observations x- och y-variabler (Vikt och Längd i denna uppgift) varierar runt sina respektive medelvärden. Avsaknad av samband ger r=0 medan ett fullständigt samband ger r som närmar sig -1 eller +1. Correlations längd i cm vikt i kg längd i cm Pearson Correlation 1,702 ** Sig. (2-tailed),000 N 200 198 vikt i kg Pearson Correlation,702 ** 1 Sig. (2-tailed),000 N 198 198 **. Correlation is significant at the 0.01 level (2-tailed). Efter körning i SPSS visar det sig att korrelationenkorrelationskoefficienten r mellan längd och vikt är 0,702 vilket är ganska starkt, vilket vi kan förstå med det sunda förnuftet. Det innebär att spridningen för varje barns vikt och längd jämfört med dess respektive medelvärde följer varandra med r-värdet 0,702. Att det inte finns en fullständig koppling mellan längden och vikten, vilket skulle ha visats med ett r-värde på upp mot 1,0 förstår vi också med sunda förnuftet eftersom vi människor är väldigt olika byggda. I materialet från SPSS kan vi också se att vi har en signifikans på 1% nivån vilket ger en stor sannolikhet att vi har ett sambanden enligt det beräknade värdet på r. 2008-01-11 RevA www.petera.se Sid 1 (9)

Hur spridningen rent grafiskt ser ut går att se med ett spridningsdiagram. Här kan vi med blotta ögat se att det finns en tydlig koppling, men att det finns ganska stora variationer mellan de olika värdena för längd respektive vikt. 2008-01-11 RevA www.petera.se Sid 2 (9)

Uppgift 2 Flickor och pojkar vikt och längd I den här uppgiften skall vi undersöka ifall flickor och pojkar är lika långa och skiljer i vikt i årskurs 3. Utifrån det underlag vi har kan vi testa medelvärdet för pojkar respektive flickor och se om vi kan dra någon slutsats om skillnader i vikt och längd samt bedöma om den skillnaden är statistiskt försvarbar. Det handlar om en bivariat analys med en kvalitativ x- variabel (Kön) och en kvantitativ y-variabel (Vikt respektive Längd) med hypotesprövning (Djurfeldt, 2003:241ff). Vi vill göra det med 95 % sannolikhet. Vikt Vi använder SPSS för att ta fram underlag för att testa våra värden. Vi börjar med vikt. Group Statistics kön N Mean Std. Deviation Std. Error Mean vikt i kg Pojke 95 37,42 5,856,601 Flicka 103 34,41 4,622,455 En medelvärdeskörning på variabeln vikt för flickor och pojkar ser vi att pojkar har m p =37,4 kg och för flickor m f =34,4. Det ser ut som en tydlig skillnad, men det är inte uppenbart att alla skillnader är statistiskt signifikanta och det är alltså det vi ska testa. Vi sätter våra hypoteser: H 0: m p = m f dvs. m p m f = 0, ingen skillnad - flickor och pojkar väger lika mycket H 1: m p m f dvs. m p m f 0, det finns en skillnad flickor och pojkar väger olika Levene's Test for Independent Samples Test Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Sig. (2- Mean Std. Error F Sig. t df tailed) Difference Difference Lower Upper vikt i kg Equal variances assumed Equal variances not assumed 10,967,001 4,035 196,000 3,013,747 1,540 4,486 3,997 178,690,000 3,013,754 1,526 4,501 Med hjälp av SPSS får vi först en bedömning av variansskillnaden. SPSS använder Levenes test (Djurfeldt, 2003:244f) för att bedöma skillnaden i s 2. Vi kan läsa av det uträknade F- 2008-01-11 RevA www.petera.se Sid 3 (9)

värdet nedan, men enklast är att se Sig. som ger oss p-värdet direkt. Eftersom vi är ute efter en sannolikhet på 95% krävs det att p-värdet är högre än eller lika med 5%, dvs. p 0,05. Det är det inte i det här fallet. Med Sig.=0,001 vet vi att skillnaden mellan flickornas och pojkarnas varianser är för stor, och vi måste avläsa den undre raden i SPSS-materialet. Ur den undre raden läser vi av att t=3,997 med en hög nivå på frihetsgraden, df=178,69, vilken är lite lägre än den frihetsgrad vi haft med lika varianser, och utan att veta antar jag frankt att det har att göra med att vi har en stor differens mellan de båda urvalen och att vi har ett högre beviskrav för vårt framräknade t-värde än om varianserna varit lika. Med ett lägre df blir det kritiska t-värde som vi måste nå upp till för att kunna förkasta vår nollhypotes H 0 högre. I vårt exempel kan vi direkt läsa av p-värdet i kolumn Sig. (2-tailed) där det blir uppenbart att vår nollhypotes inte håller. Med ett p-värde på 0,000 är det väldigt liten chans att vår H 0 är rätt utan vi har en signifikant skillnad mellan vikt på pojkar och flickor. Slutsatsen är att flickor och pojkar skiljer i vikt. Längd Group Statistics kön N Mean Std. Deviation Std. Error Mean längd i cm pojke 95 141,12 6,628,680 flicka 105 138,63 5,848,571 När vi studerar längd så ser vi liknande skillnader i medelvärdet som i fallet med vikt. Med blotta ögat upplevs dock skillnaden som mindre än för vikten. För längd är m p =141,1cm och m f =138,6 vilket innebär en skillnad på endast 2,5 cm. Vi vill nu testa om vår hypotes är korrekt och om skillnaden mellan pojkar och flickor är signifikant. H 0: m p = m f dvs. m p m f = 0, ingen skillnad - flickor och pojkar är lika långa H 1: m p m f dvs. m p m f 0, det finns en skillnad flickor och pojkar är olika långa 2008-01-11 RevA www.petera.se Sid 4 (9)

Levene's Test for Independent Samples Test Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Sig. (2- Mean Std. Error F Sig. t df tailed) Difference Difference Lower Upper längd i cm Equal variances assumed Equal variances not assumed 3,312,070 2,819 198,005 2,487,882,747 4,227 2,802 188,514,006 2,487,888,736 4,238 På samma sätt som för vikten gör vi först en bedömning av variansskillnaden. Levenes test ger F-värdet nedan, men vi kikar direkt på Sig. för att få p-värdet. Eftersom vi är ute efter en signifikans på 95% nivån krävs det att p-värdet är högre än eller lika med 5 %, dvs. p 0,05. Det är det också. Vi har fått ett p=0,07 och då vet vi att skillnaden mellan flickornas och pojkarnas varianser håller för en uträkning av t-värdet genom att anta att s 2 för pojkar respektive flickor är lika, så då kan vi läsa den övre raden i SPSS-materialet. På den övre raden läser vi att t=2,819 med frihetsgraden df=198 (n f + n p 2). I exemplet kan vi direkt läsa av p-värdet i kolumn Sig. (2-tailed) där det visar sig att vår nollhypotes inte heller i fallet med längd håller. För att H 0 ska hålla krävs ett p-värde på minst 5% eller 0,05. Vårt beräknade p-värde på 0,005 visar således att vi har en signifikant grund för att förkasta nollhypotesen och att vi har en till 95 % sannolikt signifikant skillnad mellan pojkar och flickors längder. Slutsatsen är att flickor och pojkar inte är lika långa. 2008-01-11 RevA www.petera.se Sid 5 (9)

Uppgift 3 Genomförd. Inget att redovisa. Uppgift 4 Korrelation mellan kön och position I den här uppgiften skall vi, med en ny datafil, undersöka ifall det finns någon skillnad mellan de olika könen och deras respektive position på arbetsmarknaden. Vi ska också bedöma om den skillnaden är statistiskt försvarbar. På samma sätt ska vi undersöka skillnader mellan olika utbildningskategorier (hög/låg utbildning) och position på arbetsmarknaden Vi vill göra det med 95 % sannolikhet. Kön och Position på arbetsmarknaden När vi har två kvalitativa variabler som vi vill undersöka kan vi använda korstabulering (Djurfeldt, 2003:148ff) och sambandsmått, som till exempel Chi2 (Djurfeldt, 2003:225ff). Som i exemplen ovan är det nollhypotes och mothypotes vi ställer upp först: H 0: Oberoende råder mellan variablerna, dvs. kön påverkar inte position på arbetsmarknaden. H 1: Beroende råder mellan variablerna, dvs. kön påverkar position på arbetsmarknaden. Count kön * position på arbetsmarknaden Crosstabulation position på arbetsmarknaden Arbetslös Har arbete Total kön Kvinna 40 145 185 Man 28 187 215 Total 68 332 400 Chi 2 -test arbetar med korstabeller (Djurfeldt, 2003:225f) som vi kört fram via SPSS enligt tabellen ovan. Det är förhållandet mellan två kvalitativa variabler som vi vill analysera. Vi jämför de observerade frekvenserna (O), som listas i tabellen ovan, med den förväntade fördelning (E) som vi skulle ha fått vid ett slumpmässigt utfall. Det går till genom att vi räknar ut en förväntad frekvens för alla fyra frekvenser och räknar chi 2 med formeln: χ 2 = (O i - E i ) 2 E i 2008-01-11 RevA www.petera.se Sid 6 (9)

Och utifrån värdena ovan får vi den egna beräkningen som följer: O i E i (O i -E i ) (O i -E i ) 2 (O i -E i ) 2 /E i 40 31,450 8,550 73,103 2,324 145 153,550-8,550 73,103 0,476 28 36,550-8,550 73,102 2,000 187 178,450 8,550 73,103 0,410 = 5,210 Detta är Pearsons Chi 2 som är den vanligaste (Djurfeldt, 2003:225). Vi behöver nu testa detta Chi 2 -värde 5,210 mot det kritiska värdet för våra sannolikhetskrav med hänsyn till antalet frihetsgrader. Frihetsgraderna är (kolumner-1)*(rader-1) och blir i vårt fall 1. Om vi vill testa vår hypotes med en 95% sannolikhet läser vi av det kritiska Chi 2 -värdet i tabellen (Djurfeldt, 2003:494) kolumn P%=5 för Frihetsgrader=1. Där får vi 3,841 som kritiskt värde. Vi ligger långt över detta värde och kan alltså förkasta vår nollhypotes och att ett beroende råder mellan variablerna, dvs. kön påverkar position på arbetsmarknaden. Chi-Square Tests Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1- Value df Pearson Chi-Square 5,210 a 1,022 Continuity Correction b 4,619 1,032 Likelihood Ratio 5,204 1,023 Fisher's Exact Test,024,016 Linear-by-Linear Association 5,197 1,023 N of Valid Cases 400 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 31,45. b. Computed only for a 2x2 table Med SPSS kan vi göra samma körning och få ett Chi 2 -test genomfört på ett snabbare sätt. I tabellen ovan får vi olika beräkningar för Chi 2 redovisade. Vi kan jämföra med beräkningen ovan och ser att vi har fått samma värde för Pearsons Chi 2, nämligen 5,210. Där får vi också ett värde för sannolikheten på samma rad (Asymp. Sig. (2-) som anges till 0,022, dvs. risken för att vi felaktigt skulle förkasta nollhypotesen är 2,2%. Vi ville ha en sannolikhet på minst 95 % för att det finns en skillnad mellan kön och position på arbetsmarknaden och det nådde vi. 2008-01-11 RevA www.petera.se Sid 7 (9)

Slutsatsen är att det föreligger en signifikant skillnad mellan könen och positionen på arbetsmarknaden. Utbildningskategori och Position på arbetsmarknaden Vår analys av skillnader mellan utbildningskategori och position på arbetsmarknaden följer samma mönster som i ovanstående redovisning. Det är genom en korstabell och med en Chi 2 - analys vi gör beräkningarna. Som i exemplen ovan är det nollhypotes och mothypotes vi ställer upp först: H 0: Oberoende råder mellan variablerna, dvs. utbildningskategori påverkar inte position på arbetsmarknaden. H 1: Beroende råder mellan variablerna, dvs. utbildningskategori påverkar position på arbetsmarknaden. Count utbildningskategori * position på arbetsmarknaden Crosstabulation position på arbetsmarknaden Arbetslös Har arbete Total utbildningskategori Låg 66 257 323 Hög 2 75 77 Total 68 332 400 Efter en körning av Crosstabs i SPSS får vi dels en tabell med våra värden. Från denna kan vi själva få en känsla för fördelningen mellan utbildningskategori och position på arbetsmarknaden. Det känns med sunda förnuftet att det är en klar påverkan där endast 2 personer av 77 som har högre utbildning är arbetslösa, medan 66 personer av 323 lågutbildade saknar arbete. I den här uppgiften använder jag bara SPSS beräkningar. 2008-01-11 RevA www.petera.se Sid 8 (9)

Chi-Square Tests Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1- Value df Pearson Chi-Square 14,019 a 1,000 Continuity Correction b 12,783 1,000 Likelihood Ratio 19,055 1,000 Fisher's Exact Test,000,000 Linear-by-Linear Association 13,983 1,000 N of Valid Cases 400 a. 0 cells (,0%) have expected count less than 5. The minimum expected count is 13,09. b. Computed only for a 2x2 table Med SPSS analys av Chi 2 ser vi (fortfarande på Pearsons värden) att vårt Chi 2 är så högt som 14,019 och med samma antal frihetsgrader (1 st) som i förra exemplet passerar vi gränsvärdet med stor marginal. Att det utfall som vi observerar skulle vara slumpmässigt anges till 0,000 som är bättre än 0,1 % nivån%! Det kan vara lätt att lockas till en övertro på styrkan av analysen med ett utfall på 100 % sannolikhet för att det föreligger ett beroende. Vi skulle dock behöva arbeta mer med materialet för att studera just styrkan, vilket Chi 2 -testet inte ger något underlag till. Slutsatsen är dock att det föreligger en signifikant skillnad vad gäller utbildningskategori (hög/låg utbildning) och position på arbetsmarknaden. Djurfeldt Göran, Larsson Rolf, Stjärnhagen Ola (2003). Statistisk verktygslåda. Studentlitteratur 2008-01-11 RevA www.petera.se Sid 9 (9)