Kvantitativa (analys) metoder



Relevanta dokument
Kvantitativa (analys) metoder. Roland Sjöström

I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska

34% 34% 13.5% 68% 13.5% 2.35% 95% 2.35% 0.15% 99.7% 0.15% -3 SD -2 SD -1 SD M +1 SD +2 SD +3 SD

Tentamen på Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 4

Att välja statistisk metod

Statistikens grunder. Mattias Nilsson Benfatto, Ph.D

Analytisk statistik. Mattias Nilsson Benfatto, PhD.

Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018

Bild 1. Bild 2 Sammanfattning Statistik I. Bild 3 Hypotesprövning. Medicinsk statistik II

Statistiska analysmetoder, en introduktion. Fördjupad forskningsmetodik, allmän del Våren 2018

KVANTITATIV FORSKNING

Uppgift 1. Deskripitiv statistik. Lön

Statistik 1 för biologer, logopeder och psykologer

Statistik 1 för biologer, logopeder och psykologer

Repetitionsföreläsning

ANOVA Mellangruppsdesign

kodnr: 2) OO (5p) Klassindelningar

Regressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet

OBS! Vi har nya rutiner.

, s a. , s b. personer från Alingsås och n b

Agenda. Statistik Termin 11, Läkarprogrammet, VT14. Forskningsprocessen. Agenda (forts.) Data - skalnivåer. Den heliga treenigheten

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Föreläsning G70 Statistik A

Lösningar till SPSS-övning: Analytisk statistik

Lösningsförslag till tentamen på. Statistik och kvantitativa undersökningar STA100, 15 hp. Fredagen den 13 e mars 2015

Föreläsning 4. Kapitel 5, sid Stickprovsteori

Tentamen vetenskaplig teori och metod, Namn/Kod Vetenskaplig teori och metod Provmoment: Tentamen 1

Uppgift 1. Produktmomentkorrelationskoefficienten

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Torsdagen den 23 e mars Ten 1, 9 hp

EXAMINATION KVANTITATIV METOD vt-11 (110204)

F19, (Multipel linjär regression forts) och F20, Chi-två test.

Manual för granskning av artiklar som bedömer en mätmetods egenskaper

för att komma fram till resultat och slutsatser

Hypotestestning och repetition

Föreläsning 9. NDAB01 Statistik; teori och tillämpning i biologi

Envägs variansanalys (ANOVA) för test av olika väntevärde i flera grupper

Statistiska analyser C2 Bivariat analys. Wieland Wermke

Föreläsning 1: Introduktion. Vad är statistik?

Kursens upplägg. Roller. Läs studiehandledningen!! Examinatorn - extern granskare (se särskilt dokument)

EXAMINATION KVANTITATIV METOD vt-11 (110319)

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Kvantitativ strategi viktiga begrepp II. Wieland Wermke

Föreläsning G60 Statistiska metoder

Kvantitativ forskning C2. Viktiga begrepp och univariat analys

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Metod1. Intervjuer och observationer. Ex post facto, laboratorie -, fältexperiment samt fältstudier. forskningsetik

T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen

F3 Introduktion Stickprov

LÖSNINGSFÖRSLAG TILL TENTAMEN I MATEMATISK STATISTIK

Statistik. Det finns tre sorters lögner: lögn, förbannad lögn och statistik

Lektionsanteckningar 11-12: Normalfördelningen

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 2

Analytisk statistik. Tony Pansell, optiker Universitetslektor

Statistiska analyser C2 Inferensstatistik. Wieland Wermke

Beskrivande statistik Kapitel 19. (totalt 12 sidor)

1) FRÅGOR OM RESPONDENTENS SOCIAL-DEMOGRAFISKA DATA: - Hur gammal är du?... år (= öppen fråga)

Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13

Laboration 3: Urval och skattningar

Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA

Betrakta kopparutbytet från malm från en viss gruva. För att kontrollera detta tar man ut n =16 prover och mäter kopparhalten i dessa.

Mall och manual för granskning av interventionsstudier

Kvantitativ metod. Föreläsning Kristin Wiksell

Analytisk statistik. 1. Estimering. Statistisk interferens. Statistisk interferens

Laboration 3. Övningsuppgifter. Syfte: Syftet med den här laborationen är att träna på att analysera enkätundersökningar. MÄLARDALENS HÖGSKOLA

Giltig legitimation/pass är obligatoriskt att ha med sig. Tentamensvakt kontrollerar detta. Tentamensresultaten anslås med hjälp av kodnummer.

Typvärde. Mest frekventa värdet Används framförallt vid nominalskala Ex: typvärdet. Kemi 250. Ekon 570. Psyk 120. Mate 195.

Kvantitativ strategi viktiga begrepp 3. Wieland Wermke

Residualanalys. Finansiell statistik, vt-05. Normalfördelade? Normalfördelade? För modellen

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Agenda. Statistik Termin 10, Läkarprogrammet, VT15. Agenda (forts.) Forskningsprocessen. Data - skalnivåer. Den heliga treenigheten

STOCKHOLMS UNIVERSITET VT 2009 Statistiska institutionen Jörgen Säve-Söderbergh

import totalt, mkr index 85,23 100,00 107,36 103,76

Fråga nr a b c d 2 D

Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.

Statistik Termin 10, Läkarprogrammet, HT16

1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet

Anvisningar till rapporter i psykologi på B-nivå

EXAMINATION KVANTITATIV METOD

Statistik 1 för biologer, logopeder och psykologer

OBS! Vi har nya rutiner.

Statistik och epidemiologi T5

Tentamen består av 12 frågor, totalt 40 poäng. Det krävs minst 24 poäng för att få godkänt och minst 32 poäng för att få väl godkänt.

Föreläsning 2 Deskription (forts). Index Deskription: diagram som stapeldiagram, histogram mm (tex spridningsdiagram, Mera om mätnivåer

F18 MULTIPEL LINJÄR REGRESSION, FORTS. (NCT

Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken

Del A: Schema för ifyllande av svar nns på sista sidan

Hur skriver man statistikavsnittet i en ansökan?

Tentamen på. Statistik och kvantitativa undersökningar STA101, 15 hp. Fredagen den 9 e juni Ten 1, 9 hp

Medicinsk statistik II

Allmänna anvisningar: - Nästkommande tentamenstillfälle: Tidigast två veckor efter det att resultatet från denna tenta blivit inregistrerat.

Tentamen på. Statistik och kvantitativa undersökningar STA001, 15 hp. Exempeltenta 5. Poäng. Totalt 40. Betygsgränser: G 20 VG 30

EXJOBBSINTRODUKTION 1/22/16

OBS! Vi har nya rutiner.

STOCKHOLMS UNIVERSITET HT 2007 Statistiska institutionen Johan Andersson

LTH: Fastighetsekonomi sep Enkel och multipel linjär regressionsanalys HYPOTESPRÖVNING

Provmoment: Tentamen 2 Ladokkod: 61ST01 Tentamen ges för: SSK06 VHB. TentamensKod: Tentamensdatum: Tid:

Föreläsning G60 Statistiska metoder

FACIT (korrekta svar i röd fetstil)

Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab

Kvantitativ strategi Univariat analys 2. Wieland Wermke

Transkript:

Kvantitativa (analys) metoder Roland Sjöström Statistik, SPSS, analysmetoder Vad är standardavvikelse och varians Vad händer om ni får dubbelt så många svar? Medelfel? Vad innebär 95% sannolikhet Varför är det riskfyllt/olämpligt att leta resultat i redan insamlade data? Hur många kombinationsmöjligheter finns i en enkät Korstabeller, medelvärdesskillnader etc (ni är duktiga på matte) Hur många av dessa kombinationer ska trilla ut som signifikanta trots att de inte är det? Vilken roll får slumpen spela? 2008-02-14 Roland Sjöström 2 Mål med fö & labbar Ge övergripande kunskaper för att kunna lägga upp en kvantitativ analys Betoning på multivariat analys Förstå och kunna tolka utskrifter från SPSS Förbättra magkänslan Kunna tillämpa några kvantitativa analysmetoder på egna insamlade data Känna till grunderna i multivariat analys Korstabeller Medelvärdesanalyser, ANOVA, t-test, (F-test) sanalys/korrelation Labmtrl http://www.iei.liu.se/indmark/teim07-industriell-marknadsanalys 2008-02-14 Roland Sjöström 3 Inlämningsuppgift i kvantitativa (statistiska) analysmetoder Mål med uppgiften: att ni ska diskutera och reflektera över hur multivariata analysmetoder kan användas i kvantitativa undersökningar. I grupper om ca fyra personer ska ni: Konstruera en kvantitativ kursvärdering med minst 10 och max 15 frågor samt förklara hur svaren ska analyseras. Ett bivillkor är att förslag till analys endast ska innehålla multivariata analysmetoder såsom korstabeller, skillnader i medelvärden mellan olika grupper, regressionsanalyser etc. Minst en av frågorna ska kunna fungera som beroende variabel i en multipel regressionsanalys. Betygsnivåer: G, VG För G krävs en någorlunda ingående användning av minst två analysmetoder eller en mer översiktlig användning av tre analysmetoder. Avgörande för G är hur väl ni har motiverat val av frågor och förslag till analys. För VG krävs att såväl korstabeller som skillnader i medelvärden mellan olika grupper och regressionsanalys finns med i analysförslaget använda på ett begåvat sätt och med tydlig beskrivning av hur analysen ska utföras och tolka. 2008-02-14 Roland Sjöström 4 Mål med en undersökning Metod Ge bra rekommendationer Dra bra slutsatser Göra bra analyser & tolkningar Samla rätt data med hög kvalitet Vilken roll får slumpen spela? Ska man kunna lita på slutsatserna? Stor/liten Ju större betydelse (risk) undersökningen har desto mindre roll får/bör slumpen spela Metod är ett systematiskt sätt att undersöka verkligheten på. en guide som talar om hur man ska göra eller har gjort Det innebär inte att alla metoder klarar en kritisk granskning lika bra. Hur? Varför? Vanligt fel hur och varför blev det just dessa frågor i enkäten? 2008-02-14 Roland Sjöström 5 2008-02-14 Roland Sjöström 6 1

Tolkning av data Mål i förarbetet Ha rätt perspektiv Förstå sitt undersökningsområde Praktiskt och teoretiskt Fördjupa sig inom rätt frågeområden Inte för få Bra balans Ställa rätt frågor Självklart? Kvalitativ intervju ett intervjutillfälle? (Ställa frågor rätt) 2008-02-14 Roland Sjöström 7 2008-02-14 Roland Sjöström 8 Kvalitativa data All statistik handlar om. Data som inte på en meningsfullt sätt går att översätta i sifferform Skilja mellan orka/tycka och precision i analysen 2008-02-14 Roland Sjöström 9 2008-02-14 Roland Sjöström 10 Målpopulation Representativitet De företag/organisationer/individer som ska beskrivas och analyseras. Ramfel nettopopulation 100-200 per målpopulation bruttopopulation analysgrupp Undersöka björnar undertäckning övertäckning 2008-02-14 Roland Sjöström 11 2008-02-14 Roland Sjöström 12 2

Inferensproblem Inferensproblem, forts Inferens är att dra slutsatser om en målpopulation på grundval av resultaten från de enheter i målpopulationen som faktiskt har undersökts - gäller alla undersökningar där inte samtliga enheter har undersökts - representativa (bedömning görs på förhand) Urvalets storlek - Två grupper ska undersökas, 5.000 ftg resp 500 ftg, vi har resurser att genomföra 100 intervjuer - Hur ska vi fördela dem? inomformulärsbortfall => svars % varierar mellan frågor (mindre än ca 70% bearbetningsbara svar => skepsis) minska bortfall - bra formulär, säkra deltagande (t.ex. ringa), belöning?, påminnelse analys av bortfall 2008-02-14 Roland Sjöström 13 2008-02-14 Roland Sjöström 14 Analys strategi (operativ) syfte Mätteknik Hur ska insamlade data analyseras? Intervjuer Enkätdata Vad ställer detta för krav på dataunderlaget? Vem ska t.ex. avgöra vilka faktorer som är viktiga? Respondenten? Vad händer om man frågar respondenten om vilka faktorer som är viktigast t.ex. påverkar attityden till något? Vad betyder begreppet viktigt? Betyder viktigt samma för samtliga respondenter? Om inte vad mäts då? Hur hantera skillnader mellan olika respondenter? Jmfr lön Undersökaren? Hur gör man då? Inleds med en reflektion över hur data ska analyseras Handlar om konsten att inte förstöra en del av informationsinnehållet i ett svar genom att mäta på fel sätt operationalisering av begrepp användning av variabler (kan bara anta ett värde) mätskalor konstruktion av enskilda frågor konstruktion av hela formulär 2008-02-14 Roland Sjöström 15 2008-02-14 Roland Sjöström 16 Variabel Skalor Flervalsfrågor Viktigaste konkurrenterna - utgår från preciserade uppgiften (de konkreta undersökningsfrågorna), ansats, metod för datainsamling - Nominalskala bör vara uttömmande och uteslutande 0 man 0 kvinna - Ordinalskala (rangordningar - hur göra) 0 inst helt 0 inst delvis 0 varken eller... 2008-02-14 Roland Sjöström 17 2008-02-14 Roland Sjöström 18 3

Skalor, forts Konstruktion av enskilda frågor - Intervallskala inst. inte alls 0 0 0 0 0 inst. helt - Kvotskala, intervallskala med absolut nollpunkt (omsättning? tid?) Mäta Intention eller faktisk handling Ekomat Många kan tänka sig 3% av inköp Slentrian, bråttom Miljöbil? Större inköp, viktigare - öppna frågor - "ingen åsikt/uppfattning" - möjlighet att lägga till 2008-02-14 Roland Sjöström 19 2008-02-14 Roland Sjöström 20 Konstruktion av enskilda frågor, forts Laddade ord & ledande frågor Hur ska en fråga formuleras? Påstående? Ändpunkter i skala? Väntevärde? (Idol) Frågor avgr i tid och rum i övrigt neutrala Inte tillåta förbjuda 2008-02-14 Roland Sjöström 21 2008-02-14 Roland Sjöström 22 Ingen uppfattning Respondentens tre nivåer 30-50% ej svar Leveranstid, pris Strategier Helhetsbedömningar Helhetsbedömning Senaste projektet hur mkt bidrog olika gruppmedlemmar till slutresultatet? Varför bidrog de med just så mkt? Svårbedömt Hur mkt bidrog du själv? Vad var det som gjorde att du bidrog med just så mkt? 2008-02-14 Roland Sjöström 23 2008-02-14 Roland Sjöström 24 4

Konstruktion av formulär - Instruktioner (vid enkät) - Ordningsföljd logisk för respondenten - Ej inleda med känsliga frågor för respondenten - Tidsordning - Fakta & kännedom, allmän åsikt, specifik åsik, skäl för åsik, intensitet i åsikt - Filterfrågor - Kontrollfrågor - Provintervjuer Bakgrundsfrågor Program/arbetsplats Närmaste chef Etc Kontrollvariabler Kön Ålder Anställningstid Etc Frågor i block Enkätstruktur Blocken motsvarar ofta preciserade frågor Inleds oftast med ett antal detaljfrågor (påståenden) Blocket avslutas med en helhetsfråga Avslutningsblock med en eller flera helhetsfrågor som motsvarar syftet 2008-02-14 Roland Sjöström 25 2008-02-14 Roland Sjöström 26 Frågors ordningsföljd Laddade ord & ledande frågor Komplexitet Början och slut av uppräkning melodifestivalen 5-6 alternativ Överspillningseffekten Frågor avgr i tid och rum i övrigt neutrala Inte tillåta - förbjuda 2008-02-14 Roland Sjöström 27 2008-02-14 Roland Sjöström 28 Prövning av formulär Validitet och reliabilitet - intressant för respondenten - begripligt språk för respondenten - fri från ledande inslag - ej väcka försvarsinstinkter - fri från oavsiktliga emotionelt, socialt, politiskt etc laddade ord - tidsåtgång Respondenten som "expert" (öppningsfråga) Tänk psykiatri och tester Det instrument (frågeformulär) som ni tar fram och den datainsamling som ni ska göra ska passa syftet. Validitet och reliabilitet är inte entydiga begrepp Författare lägger delvis olika innebörd och tyngdpunkt beroende på tillämpningsområde. 2008-02-14 Roland Sjöström 29 2008-02-14 Roland Sjöström 30 5

Validitet (giltighet) Om mätmetoden verkligen mäter den egenskap (det uppdrag/syfte) man avser att mäta (mäter det som är relevant) Test Om de slutsatser som genererats från undersökningen överensstämmer med verkligheten och därmed om rekommendationer är värda något. att använda rätt sak (teori/modell) vid rätt tillfälle jämför t.ex. med busskort. De är giltiga i vissa situationer men inte i andra. Man kan använda busskortet på en buss men inte i en taxi. (Rätt modeller t.ex. egen analysmodell) Be någon insatt person verifiera resultaten Olika typer av validitet Begreppsvaliditet (teoretisk validitet) fungerade modellerna (analysmodellen bra) innehållsvaliditet (content validity) Heltäckande? Ofta stort antal tänkbara frågor- i testet plats för ett fåtal. Med innehållsvaliditet avses hur bra urvalet av frågor är. Det är oftast inte möjligt att få ett kvantitativt mått på innehållsvaliditet, den bedöms i stället av experter på ett mer eller mindre subjektivt sätt. Empirisk validitet (samtidig och prediktiv validitet) Vid samtidig validitet görs en mätning vid t.ex. intervjutillfället. Vid prediktiv validitet görs mätningen långt senare. Ett exempel på prediktiv validitet är hur väl högskoleprovet förutsäger senare framgång vid högskolestudier. 2008-02-14 Roland Sjöström 31 2008-02-14 Roland Sjöström 32 Reliabilitet (tillförlitlighet mäta på ett tillförlitligt sätt) Relationen validitet och reliabilitet Får vi samma resultat om undersökningen genomförs på nytt, eller har den påverkats av slumpmässiga eller tillfälliga faktorer Kan jag lita på hantverkaren som bygger om mitt dusch? Vad kan hända om hantverkaren inte är pålitlig? Vilka slutsatser kan dras om de baseras på mätningar som man inte kan lita på? parallella tester, split-half, test-retest (upprepade mätningar på samma personer!?) Antag att vi vill mäta företags lönsamhet. mäta lönsamheten (pris minus rörliga kostnader) per produkt är inte tillräckligt. Det hjälper inte att hävda att mätningarna var mycket noggranna. Hög reliabilitet är alltså ingen garanti för att få hög validitet. Mäta företagens totala intäkter samt produktions- och fasta kostnader. Då mäter vi något som är mer relevant. Antag vidare att vi gör vår mätning genom att be någon i organisationen som inte arbetar med ekonomisk redovisning att uppskatta företagets intäkter och kostnader. Vår mätning görs då med låg tillförlitlighet (låg reliabilitet). Även om vi mätte rätt sak så blev mätningen så dålig att vi inte fick ett bra mått. Låg reliabilitet medför alltså alltid låg validitet. Följande två regler är bra att komma ihåg: Hög reliabilitet garanterar inte hög validitet. Hög validitet förutsätter hög reliabilitet (däremot kan begreppsvaliditeten vara bra, men det räcker inte) 2008-02-14 Roland Sjöström 33 2008-02-14 Roland Sjöström 34 Statistik, SPSS, analysmetoder Val av analysmetoder nominal skalnivå ordinal en (beroende variabel) intervall kvot Skalnivå nominal prediktor (x) Chi-två Cont. coeff ordinal stopp nominal intervall Diskriminant analys Skalnivå prediktor (x) stopp stopp Spearman s Rank korr. intervall Skalnivå nominal prediktor (x) med dummy var. (0/1) ordinal stopp intervall s analys 2008-02-14 Roland Sjöström 35 2008-02-14 Roland Sjöström 36 6

ingen (beroende variabel) Val av analysmetoder Analys av skillnader nominal Faktoranalys med dummy var. Klusteranalys skalnivå ordinal överkurs intervall kvot Faktoranalys Klusteranalys Chi-två test Män/kvinnor resturang 1/2 Utan väntevärde är tabellen svårtolkad 2 = (O-E)2 E = (O)2 - N E Ur tabell testvärde (95% nivån) ca 4 för fyrfältare ca 9 för niofältare nästan 16 för 16 fältare (eg. 15) 2008-02-14 Roland Sjöström 37 2008-02-14 Roland Sjöström 38 Chi-två för fyrfältare Korstabell Mindre tillförlitligt Korrigeras med Yates kontinuitets korrektion Ingen av cellerna får ha lägre förväntat värde än 5 Om så är fallet använder SPSS Fisher s exakta test för 2x2 tabeller Hur tolkas en korstabell? Vanlig miss Fisher s exakta sannolikhetstest P=(a+b)!(c+d)!(a+c)!(b+d)!/N!a!b!c!d! a b c d 2008-02-14 Roland Sjöström 39 2008-02-14 Roland Sjöström 40 Frihetsgrad?? 2008-02-14 Roland Sjöström 41 2008-02-14 Roland Sjöström 42 7

Medelfel och konf intervall Medelfel och konf intervall, forts. Exemplet testförsäljning Avsikten med denna test kan vara flera men här koncentrerar vi oss på volymen. Anta att det krävs en viss minsta volym för att produkten ska anses bli lönsam och för att företaget därför ska gå vidare till en fullskaleförsäljning. Testförsäljningar är dessutom ofta kostsamma och företagen försöker begränsa dem till ett fåtal marknader. Antag att företag X bedriver testförsäljning på tre marknader. Kravet för att produkten ska gå vidare till fullskaleförsäljning är att den i genomsnitt säljs i minst 100 exemplar per marknad. Marknad 1 Marknad 2 Marknad 3 Antal sålda produkter 130 120 86 Medelvärdet i denna testförsäljning är klart över 100, närmare bestämt 112. Målet borde vara uppfyllt och det borde bara vara att gå vidare. Men, på grund av den stora spridningen visar det sig att testförsäljningen inte har uppfyllt målet med 95 procents sannolikhet. 2008-02-14 Roland Sjöström 43 2008-02-14 Roland Sjöström 44 Standardavvikelse T-test Standardavvikelsen: Σ(X-x) i 2 s= ------------- (n-1) är ca 23 (19 om vi räknar med n istället för n-1 eftersom det är så få fall). Det medför att medelfelet s/ n är 8 (6) För att testa signifikansnivån görs en t-test. t=(x-µ)/medelfelet=(112-100)/6=2 Det kritiska värdet för denna test erhålls ur en tabell för t- fördelning där antalet frihetsgrader är n-1, dvs 2 och alfa=0,05. Det kritiska värdet är 4,3 och eftersom det beräknade värdet inte överstiger det kritiska värdet måste hypotesen att målet var uppfyllt förkastas. (Det kritiska värdet är ca 4 för få frihetsgrader och ca 2 för +100 frihetsgrader.) Först vid 80 procent (istället för 95) är testförsäljningen "signifikant", dvs man kan med 80 procents säkerhet påstå att försäljningen kommer att uppgå till minst 100 enheter i snitt per marknad. 2008-02-14 Roland Sjöström 45 2008-02-14 Roland Sjöström 46 Analys av enskilda medelvärden trubbigt instrument Jämföra två medelvärden Människor är olika trygga eller otrygga positiva eller skeptiska benägenhet att uttrycka vad de egentligen anser etc en del instämmer i det mesta medan andra tar avstånd en tredje grupp svara alltid någonstans mitt emellan Medelvärden tenderar alltså att bli ett mycket trubbigt instrument annat än för återkommande undersökningar där avsikten är att mäta avvikelser från tidigare undersökningar Tre olika grundläggande förutsättningar Känd varians i mätningarna (sample); ovanligt i m.u. Varians okänd men antas vara lika Varians okänd men antas vara olika För att testa skillnader mellan två medelvärden använder man sig vanligtvis av en t-test. Den andra och tredje situationen innebär att man måste räkna ut medelvärde och medelfel för de två grupperna. Detta görs på motsvarande sätt som för ett medelvärde. Skillnaden i t-testet är att man jämför skillnader i medelvärde och dividerar med det totala medelfelet. 2008-02-14 Roland Sjöström 47 2008-02-14 Roland Sjöström 48 8

Jämföra två medelvärden, forts Variansanalys (Anova) Σ (X 1 -x 1 ) 2 + Σ (X 2 -x 2 ) 2 s 12 = ------------------------------- (n 1 +n 2-2) Medelfel olika beroende på om samma varians eller ej (Om variansen är lika i de båda grupperna blir medelfelet lika med s/ n 1 +n 2. Är variansen olika blir medelfelet lika med (s 12 /n 1 )+(s 22 /n 2 ), dvs roten ur summan. ) t-värdet räknas ut på motsvarande sätt: t=(x 1 -x 2 ) /s 12 Det kritiska värdet är, som tidigare nämnts, ca 2 för stora sampel (+100 observationer/frihetsgrader). Om t-värdet överstiger det kritiska värdet är medelvärdena olika. 2008-02-14 Roland Sjöström 49 I sin enklaste variant ett F-test som är en direkt vidareutveckling av t-testet Två centrala begrepp Mellangruppsvarians (skillnader mellan grupperna) a variansen för alla som ingår i undersökningen i relation till det totala genomsnittet Inomgruppsvarians (skillnader inom grupperna) a variansen inom de olika grupperna i relation till deras respektive genomsnitt mellangruppsvarians F-test=---------------- inomgruppsvarians 2008-02-14 Roland Sjöström 50 Variansanalys, forts Om t.ex. kvinnor och män verkligen har samma åsikt så är inomgruppsvariansen densamma. Ju mer mellangruppsvariansen överstiger inomgruppsvariansen desto större är chansen att de har olika uppfattning => att nollhypotesen kan förkastas Tre grupper, t.ex. olika utbildningsprogram ger samma tolkning En grupp kan medföra att nollhypotesen förkastas => viktigt att gå vidare i analysen (t.ex. Bonferroni-test) OBS: Variansen lika 2008-02-14 Roland Sjöström 51 2008-02-14 Roland Sjöström 52 Analys av likheter Korrelations- och enkel regressionsanalys Används ofta som substitut Stora likheter En avgörande skillnad Korrelation - gemensam varians - prediktering av värde bästa skattning utan regression?? linjära samband sanalys Anses ha använts första gången av Francis Galton (1822-1911) samband mellan föräldrars och barns längd tendens mot mitten kallades regression inom geovetenskap regression då strandlinjen förskjuts utåt; drar sig tillbaka inom biologi och beteendevetenskap betyder regression tillbakagång till mera primitiva funktions- eller utvecklingsnivåer hos en individ eller ett organ. I statistiska sammanhang betyder regression att en storhet beror av en eller flera storheter. Kopplingen till "tillbakagång" är att alla värden relateras till medelvärdet, dvs man mäter avvikelser från det förväntade värdet som är medelvärdet. 2008-02-14 Roland Sjöström 53 2008-02-14 Roland Sjöström 54 9

Linjär regression Multipel regression Flera variabler R 2 Multikollinearitet Någon eller några variabler är överflödiga Y ^ Y e Y=¾+ßX x 1 =a+b 2 x 2 +b 3 x 3 analysera R 2 Lösning Ta bort beroende variabler Ta bort de beroende komponenterna i variablerna - regression på faktorer X Stegvis regression Stabilitetstest Ta bort första variabeln, gör om analys, övriga in i samma ordning 2008-02-14 Roland Sjöström 55 2008-02-14 Roland Sjöström 56 2008-02-14 Roland Sjöström 57 2008-02-14 Roland Sjöström 58 Variabel saknas Missing values 2008-02-14 Roland Sjöström 59 2008-02-14 Roland Sjöström 60 10

ANOVA g Model 1 2 3 4 5 6 Sum of Squares df Mean Square F Sig. 112,255 1 112,255 65,017,000 a 257,255 149 1,727 178,980 2 89,490 69,514,000 b 190,530 148 1,287 207,521 3 69,174 62,773,000 c 161,989 147 1,102 216,227 4 54,057 51,489,000 d 153,283 146 1,050 225,139 5 45,028 45,224,000 e 144,371 145,996 229,417 6 38,236 39,302,000 f 140,093 144,973 a. Predictors: (Constant), Rimliga priser b. Predictors: (Constant), Rimliga priser, Tillräckligt varierat utbud c. Predictors: (Constant), Rimliga priser, Tillräckligt varierat utbud, Trevlig inredning d. Predictors: (Constant), Rimliga priser, Tillräckligt varierat utbud, Trevlig inredning, Diskinlämningen fungerar bra e. Predictors: (Constant), Rimliga priser, Tillräckligt varierat utbud, Trevlig inredning, Diskinlämningen fungerar bra, Bra öppettider f. Predictors: (Constant), Rimliga priser, Tillräckligt varierat utbud, Trevlig inredning, Diskinlämningen fungerar bra, Bra öppettider, Trevlig personal g. Dependent Variable: Som helhet nöjd 2008-02-14 Roland Sjöström 61 2008-02-14 Roland Sjöström 62 Slut 2008-02-14 Roland Sjöström 63 11