Faktoranalys - Som en god cigarr
|
|
- Kurt Axelsson
- för 6 år sedan
- Visningar:
Transkript
1 Innehåll Faktoranalys - Som en god cigarr Faktoranalys. Användningsområde. Krav/rekommen. 3. Olika typer av FA 4. Faktorladdningar 5. Eigenvalue 6. Rotation 7. Laddningar & Korr. 8. Jämförelse av metoder 9. Välja antalet faktorer. Faktorpoäng. Namngivning. Konfirmatorisk FA Övrigt 3. Homogenitet 4. Risk Ratio 5. Odds Ratio. Primär användning: Gruppera ett antal item till ett mindre antal faktorer Grupperingen sker utifrån korrelationer. Item som anses mäta samma sak bör korrelera högre med varandra än med item som mäter andra saker. Fysisk storlek Liberalism Sensation Seeking Längd Skonummer Vikt Inställning till homosexualitet Inställning till invandring Inställning till yttrandefrihet Vilja att hoppa fallskärm Vilja att sitta hemma Vilja att hoppa bungyjump. Krav/Rekommendationer Minst intervalldata (eller åtminstone nästan). Samband bör vara linjära. Inga singulariteter. Data från fler personer än vad man har item. N > 5 x antal item; ; 3 KMO (medel) >,6; KMO (item) >,6 (,5) Outliers är inte bra (kanske speciellt multivariata sådana) och bör kanske strykas (Mahalanobis distans). Fundera redan från början vad du vill mäta och konstruera frågor utifrån detta. Annars blir det lätt pannkaka av det hela (GIGO-principen).. Krav/Rekommendationer Testar om populationens korrelationsmatris kan antas vara en identitetsmatris (med endast nollor utanför diagonalen). Partialkorrelationer (när man kontrollerar för alla andra item) * - Σr Σr Σpr r = korrelation pr = partiell korrelation Bör vara >,6 3. Olika typer av FA Principal Components Analysis (PCA): - Skapar okorrelerade komponenter. - Försöker förklara så mycket av den totala variansen som möjligt (både unik och gemensam). - Första komponenten förklarar mest varians. - Används för datareduktion. - Egentligen inte faktoranalys. Principal Axis Factoring: - Försöker hitta latenta variabler som förklarar den gemensamma variansen för ett antal item (ignorerar unik varians).
2 3. Olika typer av FA Unweighted Least-Squares Method: - Försöker minimera skillnaden mellan observerade och återskapade korrelationer. Weighted Least-Squares Method: - Samma a som ovan, men ger mindre vikt åt item som korrelerar lågt med andra item. Alpha: - Maximerar faktorernas homogenitet (alpha) Maximum-Likelihood Method: Image Factoring: 4. Faktorladdningar Analysen beräknar korrelationer mellan observerade item och latenta faktorer (komponenter). Hur höga laddningar bör man minst ha? Tja,,4 är en tumregel (,3;,35). Laddningar kan vara positiva och negativa. Om man summerar de kvadrerade faktorladdningarna för ett visst item över alla faktorer så får man ett värde på hur pass mycket av variansen i detta item som kan förklaras med hjälp av faktorerna. Detta kallas för communality och kan ses som ett tecken på items reliabilitet. En kommunalitet > är ett tecken på vajsing. 4. Faktorladdningar Summan av kvadrerade faktorladdningar = Kommunalitet =, Eigenvalue Eigenvalue = Hur stor andel av den totala standardiserade variansen som en faktor kan förklara (procenttalet får man fram genom att dividera eigenvalue med antalet item) = summan av de kvadrerade d faktorladdningarna över alla item. En faktor med eigenvalue < förklarar alltså mindre av den totala variansen än vad enskilda item gör. 5. Eigenvalue 6. Rotation, För att underlättar tolkningen av faktorer brukar laddningsmatrisen utsättas för rotation. Summan av kvadrerade laddningar = Eigenvalue = 3,5
3 6. Rotation Faktor Faktor Fråga 3 -,664 -,44 Fråga 6 -,636,55 Fråga 7,674,555 Fråga 8 -,56,68 Fråga,559,69 Fråga,63 -,553 cos Ψ sin Ψ -sin Ψ cos Ψ = Rotations vinkeln är alltså 4,8 grader. F8 F F3 F F7 -,664*, ,44*, F -.8 Faktor Faktor Fråga 3 -,786,8 Fråga 6 -,94,835 Fråga 7,87 -,5 Fråga 8,55,85 Fråga,84,68 Fråga,74 -,8 6. Rotation Oroterad Faktor Faktor h Fråga 3 -,664 -, Fråga 6 -,636,55.77 Fråga 7,674, Fråga 8 -,56,68.65 Fråga,559, Fråga,63 -, Eigenv Roterad Faktor Faktor h Fråga 3 -,786,8.634 Fråga 6 -,94, Fråga 7,87 -,5.76 Fråga 8,55,85.65 Fråga,84, Fråga,74 -,8.68 Eigenv Rotation, underlättar tolkningen av faktorer F F4 Faktor F F6 Faktor F5 F8 F7 F3 Ortogonal rotation Faktorerna är okorrelerade med varandra (axlarna behåller ett förhållande på 9 ) F F4 Faktor F F6 Faktor F5 F8 F7 F3 Oblik rotation Faktorerna tillåts korrelera med varandra + närmare anpassning - mer svårtolkade faktorer 6. Rotation, olika metoder Varimax: Maximerar variansen för laddningar inom faktorerna över alla item, vilket underlättar tolkningen av faktorerna. Rotationen är ortogonal, vilket ger okorrelerade faktorer. Direkt oblimin: Faktorerna tillåts korrelera med varandra (oblik rotation). Tenderar att ge faktorer med högre egenvärden men som är svårare att tolka. Quartimax: Maximerar variansen för laddningar inom item över alla faktorer. Equamax: Kombination av Varimax och Quartimax. Promax: En snabb oblik rotations-algoritm. 6. Rotation: Varimax & Quartimax 6. Rotation: Oblimin Motsvarar standardiserade regressionskoeffic ienter. Anger sambandet mellan en faktor och ett item kontrollerat för de andra faktorerna. Motsvarar enkla korrelationer mellan item och faktorer. 3
4 7. Faktorladdningar & Korrelationer 7. Faktorladdningar & Korrelationer Faktor Faktor Faktor 3 Faktor 4 Faktor 5 Faktor 6 Fråga 3 -,664 -,44,56,56 -,3, Fråga 6 -,636,55,4 -,5,48 -, Fråga 7,674,555, -,87 -,,467 Fråga 8 -,56,68 -,35,483 -,3,8 Fråga,559,69,49,6 -,57 -,33 Fråga,63 -,553,53,46,36,45 Faktor -,664 -,636,674 -,56,559,63,559,674 + Faktor -,44,55,555,68,69 -,553,69,555 + Faktor 3,56,4, -,35,49,53,49, + Faktor 4,56 -,5 -,87,483,6,46,6 -,87 + Faktor 5 -,3,48 -, -,3 -,57,36 -,57 -, + Faktor 6, -,,467,8 -,33,45 -,33,467 = Fråga 3,,9 -,553,5 -,437 -,3 Fråga 6,9, -,3,54 -, -,554 Fråga 7 -,553 -,3, -,3,6,89 Fråga 8,5,54 -,3,,48 -,488 Fråga -,437 -,,6,48,,38 Fråga -,3 -,554,89 -,488,38, Faktor Faktor Fråga 3 -,664 -,44 Fråga 6 -,636,55 Fråga 7,674,555 Fråga 8 -,56,68 Fråga,559,69 Fråga,63 -, Faktorladdningar & Korrelationer Faktor -,664 -,636,674 -,56,559,63 Faktor -,44,55,555,68,69 -,553 = Fråga 3,634,8 -,69,6 -,639 -,64 Fråga 6,8,77 -,4,667 -, -,694 Fråga 7 -,69 -,4,76,7,75,6 Fråga 8,6,667,7,65, -,658 Fråga -,639 -,,75,,684,6 Fråga -,64 -,694,6 -,658,6,68 Fråga 3,,9 -,553,5 -,437 -,3 Fråga 6,9, -,3,54 -, -,554 Fråga 7 -,553 -,3, -,3,6,89 Fråga 8,5,54 -,3,,48 -,488 Fråga -,437 -,,6,48,,38 Fråga -,3 -,554,89 -,488,38, 7. Faktor-laddningar & Korrelationer Observerad Reproducerad Residualer Stora residualer (>.) indikerar att man kanske borde öka antalet faktorer Fråga 3,,9 -,553,5 -,437 -,3 Fråga 6,9, -,3,54 -, -,554 Fråga 7 -,553 -,3, -,3,6,89 Fråga 8,5,54 -,3,,48 -,488 Fråga -,437 -,,6,48,,38 Fråga -,3 -,554,89 -,488,38, Minus Fråga 3,634,8 -,69,6 -,639 -,64 Fråga 6,8,77 -,4,667 -, -,694 Fråga 7 -,69 -,4,76,7,75,6 Fråga 8,6,667,7,65, -,658 Fråga -,639 -,,75,,684,6 Fråga -,64 -,694,6 -,658,6,68 = Fråga 3,9,38 -,35,,4 Fråga 6,9, -,63,9,4 Fråga 7,38, -,37 -,4 -,7 Fråga 8 -,35 -,63 -,37 -,5,7 Fråga,,9 -,4 -,5,3 Fråga,4,4 -,7,7,3 7. Faktor-laddningar & Korrelationer 8. Jämförelse av metoder Målet med faktoranalysen är att få fram en faktorstruktur (hur item laddar på faktorer) som ger en reproducerad korrelationsmatris som är så lik den observerade korrelationsmatrisen som möjligt, alltså att minimera residualer. Dock tar man även hänsyn till antalet faktorer. En modell med få faktorer är att föredra framför en modell med flera faktorer även om den förra skulle leda till något större residualer. 4
5 9. Välja antal faktorer Antalet faktorer med Eigenvalue > (börja här, Kaiser criterion). Om en faktor har mindre än två (tre) högladdare : Minska antalet faktorer. Är någon faktor svårbegriplig: Minska antalet faktorer. Scree-plot: Antalet faktorer ovanför knät. Faktor tenderar att lägga beslag på många item och ibland kan det vara vettigt att bryta upp den i mindre faktorer (utifrån formuleringen av item och en selekterad faktoranalys). 9. Välja antal faktorer Scree-plot. Faktorpoäng Programmet kan räkna fram poäng för varje person på varje faktor utifrån faktorpoäng. Detta ger faktorer som är okorrelerade med varandra. Det vanligaste är dock att man för varje person räknar fram medelvärdet (eller summan) för de item som ingår i en faktor. Innan detta görs måste man eventuellt spegelvända vissa item. Har item olika skalor så bör de standardiseras först.. Faktorpoäng Regressionsmetoden: På faktor (komponent) skulle varje person få ett värde =,4 x personens standardiserade värde på fråga +,34 x standardiserat värde på fråga +,3 x standardiserat värde på fråga 3 Enkel metod: På faktor (komponent) skulle varje person få ett värde = medelvärdet för personens svar på frågorna, 6 (reversed), 8 (reversed), och. Faktorpoäng Jämförelse av regressions- och enkel metod. Namngivning Utifrån de item som ingår i en faktor ger man den ett namn som reflekterar vad den mäter (= vad ett högt värde på faktorn står för). Risk för subjektivitet. Ett item som laddar högt på en faktor men som innehållsmässigt inte passar ihop med övriga item bör strykas (åtminstone tycker Kimmo det). 5
6 . Namngivning Fråga : Lena betedde sig omoraliskt när hon attackerade Johan. Fråga 6: Det var förståeligt att Lena attackerade Johan. Fråga 8: Lenas beteende mot Johan var acceptabelt. Fråga : Det var fruktansvärt av Lena att attackera Johan.. Namngivning Fråga : Om Johan dog eller blev allvarligt skadad så skulle det vara en katastrof för samhället. Fråga 5: Personer som Johan är väldigt nyttiga för samhället. Fråga 9: Johans betydelse för samhället var, på det stora hela, nog rätt så obetydlig. Fråga : Johan var en värdefull medlem av samhället.. Konfirmatorisk FA Man testar hur pass väl data stämmer överens med en förutbestämd faktormodell. Den faktiska kovariansmatrisen (mellan ingående item) jämförs med den ur modellen härledda kovariansmatrisen. Ju bättre överensstämmelse desto bättre modell. 3. Homogenitet = Hur pass väl ett antal item hänger ihop (bygger på korrelationer). Ett statistiskt test av om ett antal item kan antas mäta samma sak. 3. Homogenitet Cronbach s alpha N i ( ) N X N antal item i varians på item i varians på den totala testpoängen Anger hur mycket av variansen i en skala/index som kan attribueras till en gemensam källa. Alpha kan variera mellan - och,. Gränsen för en godtagbar homogenitet sätts ibland till,6 (,65;,7). Item som behöver spegelvändas spegelvänds innan alpha beräknas. X 4. Risk & Odds Risk = Antal med utfall dividerat med totalt antal (kan variera mellan och ) Odds = Antal med utfall dividerat med antal utan utfall (kan variera mellan och ) ) Kvinnor Män Risk(kvinna) Odds(kvinna) /(+8)=, /8=,5 5/(5+5)=,5 5/5= 8/(8+)=,8 8/=4 6
7 4. Risk Ratio Ej starr Risk för demens om man har starr jämfört med inte starr: RR = ( / 73) / (43 / ) =,75 /,558 =,63 6% riskökning för demens om man har starr jämfört med om man inte har starr. Risk för starr om man har demens jämfört med inte demens: RR = ( / 65) / (5 / ) =,739 /,6 =,3 3% riskökning för starr om man har demens jämfört med om man inte har demens. 4. Risk Ratio Ej starr 34 Estimering av populationens RR för demens om man har starr jämfört med om man inte har starr. SEln( RR ) 95% CI RR p N p e p N p ln( RR).96SEln( RR ) e Formeln ger medelfel för ln(rr); p = andel med utfall (demens) i exponerad grupp (starr); N = antal exponerade p = andel med utfall (demens) i icke-exponerad grupp (ej starr); N = antal icke-exponerade Med 95% säkerhet ligger populationens RR någonstans mellan. och Risk Ratio Ej starr 34 Estimering av populationens RR för starr om man har demens jämfört med om man inte har demens. SEln( RR ) 95% CI RR p N p e p N p ln( RR).96SEln( RR ) e Formeln ger medelfel för ln(rr); p = andel med utfall (starr) i exponerad grupp (demens); N = antal exponerade p = andel med utfall (starr) i icke-exponerad grupp (ej demens); N = antal icke-exponerade Med 95% säkerhet ligger populationens RR någonstans mellan.3 och Odds Ratio Ej starr 34 OR p ( p) q /( q) p = risk för utfall i grupp q = risk för utfall i grupp 43 5 Odds för demens om man har starr jämfört med inte starr: OR = ( / 5) / (43 / 34) =,39 /,65 =,89 Oddsen att ha demens är,9 gånger så hög om man har starr jämfört med om man inte har starr. Odds för starr om man har demens jämfört med ej demens: OR = ( / 43) / (5 / 34) =,837 /,5 =,89 Oddsen att ha starr är,9 gånger så hög om man har demens jämfört med om man inte har demens Odds Ratio Ej starr 34 (n) Estimering av populationens OR för starr om man har demens jämfört med om man inte har demens = OR för demens om man har starr jämfört med om man inte har starr. 43 (n) 5 (n) (n) Odds Ratio SEln( OR ) n n n n Formeln ger medelfel för ln(or) OR skiljer sig signifikant från. 95% CI e ln( OR).96SEln( OR ) e Med 95% säkerhet ligger populationens OR någonstans mellan.84 och
8 Innehåll Faktoranalys. Användningsområde. Krav/rekommen. 3. Olika typer av FA 4. Faktorladdningar 5. Eigenvalue 6. Rotation 7. Laddningar & Korr. 8. Jämförelse av metoder 9. Välja antalet faktorer.faktorpoäng.namngivning. Konfirmatorisk FA Övrigt 3. Homogenitet 4. Risk Ratio 5. Odds Ratio 8
Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio
Faktoranalys, Cronbach s Alpha, Risk Ratio, & Odds Ratio med SPSS Kimmo Sorjonen 1. Faktoranalys Innan man utför en faktoranalys kan det vara bra att testa om det finns några outliers i data. Detta kan
Läs merInnehåll: 3.4 Parametriskt eller ej 3.5 Life Table 3.6 Kaplan Meier 4. Cox Regression 4.1 Hazard Function 4.2 Estimering (PL)
Innehåll: 1. Risk & Odds 1.1 Risk Ratio 1.2 Odds Ratio 2. Logistisk Regression 2.1 Ln Odds 2.2 SPSS Output 2.3 Estimering (ML) 2.4 Multipel 3. Survival Analys 3.1 vs. Logistisk 3.2 Censurerade data 3.3
Läs merDifferentiell psykologi
Differentiell psykologi Tisdag 20 september 2011 Integrering och frågestund Moment II: Personlighet och intelligens Petter Gustavsson 20 september 20112 Upplägg: Momentansvarig: Petter Första veckan: Intelligens
Läs merMultivariata metoder
Multivariata metoder F3 Linda Wänström Linköpings universitet 17 september Wänström (Linköpings universitet) Multivariata metoder 17 september 1 / 21 Principalkomponentanalys Syfte med principalkomponentanalys
Läs merDifferentiell psykologi
Differentiell psykologi Tisdag 24 september 2013 Confirmatory Factor Analysis CFA Dagens agenda Repetition: Sensitivitet och specificitet Övningsuppgift från idag Confirmatory Factor Analysis Utveckling
Läs merSTATISTISK ANALYS AV KOMPLEXA DATA
STATISTISK ANALYS AV KOMPLEXA DATA LONGITUDINELLA DATA Linda Wänström Linköpings universitet 12 December Linda Wänström (Linköpings universitet) LONGITUDINELLA DATA 12 December 1 / 12 Explorativ Faktoranalys
Läs merDifferentiell psykologi
Differentiell psykologi Tisdag 25 september 2012 Frågestund Repetition Agenda Skillnader i definitioner mellan underlagen Statistik Instuderings- och tentamensfrågor Regressionsdiagnostik Fråga om Reliabilitet
Läs merGranskning av en medarbetarenkät. - En explorativ och konfirmativ faktoranalys
Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:19 Granskning av en medarbetarenkät - En explorativ och konfirmativ faktoranalys Evaluating an employee survey
Läs merRegressionsanalys. - en fråga om balans. Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet
Regressionsanalys - en fråga om balans Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll: 1. Enkel reg.analys 1.1. Data 1.2. Reg.linjen 1.3. Beta (β) 1.4. Signifikansprövning 1.5. Reg.
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; () Mixed effect models; (3)
Läs merInnehåll. Data. Skillnad SEM & Regression. Exogena & Endogena variabler. Latenta & Manifesta variabler
Innehåll Structural Equation Modeling (SEM) Ingenting är omöjligt Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Data Latenta och manifesta variabler Typ av modell (path, CFA, SEM) Specificera
Läs merNy indikator för svensk arbetsmarknad. - En faktoranalys som sammanfattar 14 variablers variation. A new indicator for the Swedish labour market
Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:15 Ny indikator för svensk arbetsmarknad - En faktoranalys som sammanfattar 14 variablers variation A new indicator
Läs merInstuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8
1 Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8 Dessa instuderingsfrågor är främst tänkta att stämma överens med innehållet i föreläsningarna,
Läs merStructural Equation Modeling (SEM) Ingenting är omöjligt
Structural Equation Modeling (SEM) Ingenting är omöjligt Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Innehåll Data Latenta och manifesta variabler Typ av modell (path, CFA, SEM) Specificera
Läs merNy indikator för svensk arbetsmarknad. - En faktoranalys som sammanfattar 14 variablers variation. A new indicator for the Swedish labour market
Kandidatuppsats Statistiska institutionen Bachelor thesis, Department of Statistics Nr 2014:15 Ny indikator för svensk arbetsmarknad - En faktoranalys som sammanfattar 14 variablers variation A new indicator
Läs merVad är faktoranalys? Faktoranalys. Vad är dimensioner? Vad är dimensioner?
Vad är faktoranalys? Faktoranalys Thomas Ågren Faktoranalys är ett samlingsnamn för dimensionsreducerande statistiska metoder syftande till att åskådliggöra underliggande strukturer i data Vad är dimensioner?
Läs merDifferentiell psykologi
Differentiell psykologi Torsdag 8 september 2011 Reliabilitet Dagens agenda MDI skattningsövning resultat av kriterietolkning Värt att veta om normalfördelningen Frågesport Kort info om kursboken : Personality
Läs merInförandet av nätjournal
Införandet av nätjournal En analys av vårdförbundets medlemmars inställning Sara Nilsson Hörnell och Jonas Ström Statistiska Institutionen Kandidatuppsats Handledare: Inger Persson Höstterminen 2014 Sammanfattning
Läs merAnvändning. Fixed & Random. Centrering. Multilevel Modeling (MLM) Var sak på sin nivå
Användning Multilevel Modeling (MLM) Var sak på sin nivå Kimmo Sorjonen Sektionen för Psykologi Karolinska Institutet Kärt barn har många namn: (1) Random coefficient models; (2) Mixed effect models; (3)
Läs merRegressionsanalys med SPSS Kimmo Sorjonen (2010)
1 Regressionsanalys med SPSS Kimmo Sorjonen (2010) 1. Multipel regression 1.1. Variabler I det aktuella exemplet ingår följande variabler: (1) life.sat, anger i vilket utsträckning man är nöjd med livet;
Läs merOrdlista Enkätmetodik
Ordlista Enkätmetodik A Alfaförändring. Förändringar av medelvärdet över tid som kan tillskrivas en känd händelse. Ankare. Ytterlighetsalternativen i en svarsskala, exempelvis i en Likertskala. Autokorrelation.
Läs merMultivariat databehandling och dataanalys
U.U.D.M. Project Report 2016:20 Multivariat databehandling och dataanalys en faktoranalys av slutbetyg i åk 9 inom Lgr11 på kommunnivå Robin Samuelsson Examensarbete i matematik, 15 hp Handledare: Jesper
Läs merResultat. Principalkomponentanalys för alla icke-kategoriska variabler
Introduktion Den första delen av laborationen baserar sig på mätdata som skapades i samband med en medicinsk studie där en ny metod för att mäta ögontryck utvärderas. Den nya metoden som testas, Applanation
Läs merMultivariata metoder
Multivariata metoder F5 Linda Wänström Linköpings universitet 1 oktober Wänström (Linköpings universitet) Multivariata metoder 1 oktober 1 / 18 Kanonisk korrelationsanalys Syfte: Undersöka om en grupp
Läs merTvå kulturer på Internet Resultat av faktor- och klusteranalys
Resultat av faktor- och klusteranalys Håkan Selg Department of Information Technology Technical report 2009-015 Swedish IT-User Centre May 2009 Uppsala University ISSN 1404-3203 Box 337, SE-751 05 Uppsala,
Läs merSammanfattning av dugga 2
Sammanfattning av dugga 2 Vad som påverkar svarsfrekvens på en enkät Respondentens dagsform och intresse Dock brukar den överlag följa klockformad kurva - över 20 svar brukar approximativt antas vara normalfördelade
Läs merF16 MULTIPEL LINJÄR REGRESSION (NCT , 13.9) Anpassning av linjär funktion till givna data
Stat. teori gk, ht 006, JW F16 MULTIPEL LINJÄR REGRESSION (NCT 13.1-13.3, 13.9) Anpassning av linjär funktion till givna data Data med en beroende variabel (y) och K stycken (potentiellt) förklarande variabler
Läs merDifferentiell psykologi
Differentiell psykologi Torsdag 13 september 2012 Reliabilitet Dagens agenda Värt att veta om normalfördelningen Frågesport Kort intro till kvalitetsparametrarna: reliabilitet och validitet Reliabilitet
Läs merTill ampad statistik (A5) Förläsning 13: Logistisk regression
Till ampad statistik (A5) Förläsning 13: Logistisk regression Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2016-03-08 Exempel 1: NTU2015 Exempel 2: En jobbannons Exempel 3 1 1 Klofstad, C.
Läs merGrundläggande matematisk statistik
Grundläggande matematisk statistik Linjär Regression Uwe Menzel, 2018 uwe.menzel@slu.se; uwe.menzel@matstat.de www.matstat.de Linjär Regression y i y 5 y 3 mätvärden x i, y i y 1 x 1 x 2 x 3 x 4 x 6 x
Läs merUtvärdering av SOM-institutets personlighetsinstrument
Utvärdering av SOM-institutets personlighetsinstrument Mattias Gunnarsson [ SOM-rapport nr 2014:30] Utvärdering av SOM-institutets personlighetsinstrument SOM-institutet har från starten haft fokus på
Läs merRegressions- och Tidsserieanalys - F4
Regressions- och Tidsserieanalys - F4 Modellbygge och residualanalys. Kap 5.1-5.4 (t.o.m. halva s 257), ej C-statistic s 23. Linda Wänström Linköpings universitet Wänström (Linköpings universitet) F4 1
Läs merAutokorrelation och Durbin-Watson testet. Patrik Zetterberg. 17 december 2012
Föreläsning 6 Autokorrelation och Durbin-Watson testet Patrik Zetterberg 17 december 2012 1 / 14 Korrelation och autokorrelation På tidigare föreläsningar har vi analyserat korrelationer för stickprov
Läs merKorrelation kausalitet. ˆ Y =bx +a KAPITEL 6: LINEAR REGRESSION: PREDICTION
KAPITEL 6: LINEAR REGRESSION: PREDICTION Prediktion att estimera "poäng" på en variabel (Y), kriteriet, på basis av kunskap om "poäng" på en annan variabel (X), prediktorn. Prediktion heter med ett annat
Läs mer7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Läs mer1/31 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/31 REGRESSIONSANALYS F1 Linda Wänström Statistiska institutionen, Stockholms universitet 2/31 Kap 4: Introduktion till regressionsanalys. Introduktion Regressionsanalys är en statistisk teknik för att
Läs mer1/23 REGRESSIONSANALYS. Statistiska institutionen, Stockholms universitet
1/23 REGRESSIONSANALYS F4 Linda Wänström Statistiska institutionen, Stockholms universitet 2/23 Multipel regressionsanalys Multipel regressionsanalys kan ses som en utvidgning av enkel linjär regressionsanalys.
Läs merT-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen
T-test, Korrelation och Konfidensintervall med SPSS Kimmo Sorjonen 1. One-Sample T-Test 1.1 När? Denna analys kan utföras om man vill ta reda på om en populations medelvärde på en viss variabel kan antas
Läs merFöreläsning 8. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 8 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Enkel linjär regression (kap 17.1 17.5) o Skatta regressionslinje (kap 17.2) o Signifikant lutning? (kap 17.3, 17.5a) o Förklaringsgrad
Läs mer1. Lära sig plotta en beroende variabel mot en oberoende variabel. 2. Lära sig skatta en enkel linjär regressionsmodell
Datorövning 1 Regressions- och tidsserieanalys Syfte 1. Lära sig plotta en beroende variabel mot en oberoende variabel 2. Lära sig skatta en enkel linjär regressionsmodell 3. Lära sig beräkna en skattning
Läs merchi 2 : A B A: B: p-värde: A B K M K M phi A B Ja 25 50 75 Ja 50 100 150 Nej 75 50 125 Nej 150 100 250 100 100 200 200 200 400 (2 tentor av 8)
Parametiskt vs. icke-parametriskt 1. Icke-parametriska analysmetoder kallas med ett annat ord för fördelningsfria analyser. Hur förklarar du relevansen hos detta begrepp? Och vad står parametrisk och dess
Läs merStructural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24)
1 Structural Equation Modeling med Amos Kimmo Sorjonen (2012-01-24) 1. Variabler och tänkt modell Data simulerar de som använts i följande studie (se Appendix A): Hull, J. G., & Mendolia, M. (1991). Modeling
Läs merBildmosaik. Bilddatabaser, TNM025. Anna Flisberg Linne a Mellblom. linme882. Linko pings Universitet
Bildmosaik Bilddatabaser, TNM025 Linko pings Universitet Anna Flisberg Linne a Mellblom annfl042 linme882 28 maj 2015 Innehåll 1 Introduktion 2 2 Metod 2 2.1 Features..............................................
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E, HT-15 Punktskattningar Anna Lindgren 25 november 2015 Anna Lindgren anna@maths.lth.se FMSF20 F8: Statistikteori 1/17 Matematisk statistik slumpens matematik
Läs merSensory processing sensitivity
Sensory processing sensitivity En valideringsstudie Isabelle Ferré Hernandez Psykologiska Institutionen Examensarbete 30 hp Psykologi Mastersprogram inom Personal, Arbete och Organisation (120 hp) Vårterminen
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merLogistisk regression och Indexteori. Patrik Zetterberg. 7 januari 2013
Föreläsning 9 Logistisk regression och Indexteori Patrik Zetterberg 7 januari 2013 1 / 33 Logistisk regression I logistisk regression har vi en binär (kategorisk) responsvariabel Y i som vanligen kodas
Läs merDifferentiell psykologi: Moment I: Lärandemål, instuderingsuppgift och instuderingsfrågor
Differentiell psykologi: Moment I: Lärandemål, instuderingsuppgift och instuderingsfrågor Inledning Välkommen till kursen i differentiell psykologi och det första momentet om psykometri och statistik.
Läs merLinjär regressionsanalys. Wieland Wermke
+ Linjär regressionsanalys Wieland Wermke + Regressionsanalys n Analys av samband mellan variabler (x,y) n Ökad kunskap om x (oberoende variabel) leder till ökad kunskap om y (beroende variabel) n Utifrån
Läs merKapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA
Kapitel 12: TEST GÄLLANDE EN GRUPP KOEFFICIENTER - ANOVA 12.1 ANOVA I EN MULTIPEL REGRESSION Exempel: Tjänar man mer som egenföretagare? Nedan visas ett utdrag ur ett dataset som innehåller information
Läs merFöreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet November 4, 2013 Wänström (Linköpings universitet) F1 November 4, 2013 1 / 25 Statistik B, 8 hp
Läs merMatematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18 Matematisk
Läs merRegressions- och Tidsserieanalys - F1
Regressions- och Tidsserieanalys - F1 Kap 3: Enkel linjär regression Linda Wänström Linköpings universitet May 4, 2015 Wänström (Linköpings universitet) F1 May 4, 2015 1 / 25 Regressions- och tidsserieanalys,
Läs merKorrelation och autokorrelation
Korrelation och autokorrelation Låt oss begrunda uttrycket r = i=1 (x i x) (y i y) n i=1 (x i x) 2 n. i=1 (y i y) 2 De kvadratsummor kring de aritmetiska medelvärdena som står i nämnaren är alltid positiva.
Läs merFör logitmodellen ges G (=F) av den logistiska funktionen: (= exp(z)/(1+ exp(z))
Logitmodellen För logitmodellen ges G (=F) av den logistiska funktionen: F(z) = e z /(1 + e z ) (= exp(z)/(1+ exp(z)) Funktionen motsvarar den kumulativa fördelningsfunktionen för en standardiserad logistiskt
Läs merSkrivning i ekonometri torsdagen den 8 februari 2007
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA2:3 Skrivning i ekonometri torsdagen den 8 februari 27. Vi vill undersöka hur variationen i lön för 2 belgiska löntagare = WAGE (timlön i euro)
Läs mera) Bedöm om villkoren för enkel linjär regression tycks vara uppfyllda! b) Pröva om regressionkoefficienten kan anses vara 1!
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STA1:3 Skrivning i ekonometri tisdagen den 1 juni 4 1. Vi vill undersöka hur variationen i brottsligheten i USA:s delstater år 196 = R (i antal
Läs merKriterier och riktlinjer för evidensbaserad bedömning av mätinstrument
Kriterier och riktlinjer för evidensbaserad bedömning av mätinstrument Evidens för instrument kan mätas med liknande kriterier som vid mätning av evidens för interventioner 1. Nedan finns en sammanfattning
Läs merI. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Parametriska Icke-parametriska
Innehåll I. Grundläggande begrepp II. Deskriptiv statistik III. Statistisk inferens Hypotesprövnig Statistiska analyser Parametriska analyser Icke-parametriska analyser Univariata analyser Univariata analyser
Läs merSTOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström. Omtentamen i Regressionsanalys
STOCKHOLMS UNIVERSITET HT 2008 Statistiska institutionen Linda Wänström Omtentamen i Regressionsanalys 2009-01-08 Skrivtid: 9.00-14.00 Godkända hjälpmedel: Miniräknare utan lagrade formler. Tentamen består
Läs merEn jämförelse mellan några multivariata data-analysmetoder
En jämförelse mellan några multivariata data-analysmetoder av Johan Westerbergh Matematisk-statistiska institutionen Umeå universitet Handledare Peter Anton Ett tack till min handledare Peter Anton för
Läs merFinansiering. Föreläsning 6 Risk och avkastning BMA: Kap. 7. Jonas Råsbrant
Finansiering Föreläsning 6 Risk och avkastning BMA: Kap. 7 Jonas Råsbrant jonas.rasbrant@fek.uu.se Föreläsningens innehåll Historisk avkastning för finansiella tillgångar Beräkning av avkastning och risk
Läs merStatistiska samband: regression och korrelation
Statistiska samband: regression och korrelation Vi ska nu gå igenom något som kallas regressionsanalys och som innebär att man identifierar sambandet mellan en beroende variabel (x) och en oberoende variabel
Läs merRegressionsanalys Enkel regressionsanalys Regressionslinjen
--9 Regreionanaly - en fråga om balan Kimmo Sorjonen Sektionen för Pykologi Karolinka Intitutet. Enkel reg.analy.. Data.. Reg.linjen.. Beta (β).. Signifikan.. Reg. om Var..6. Korr. & Förklarad var..7.
Läs merRegressionsanalys Enkel regressionsanalys Regressionslinjen
-9-6 Regreionanaly - om en mak åt en hungrande Kimmo Sorjonen Sektionen för Pykologi Karolinka Intitutet. Enkel reg.analy.. Data.. Reg.linjen.. Beta (β).. Signifikan.. Reg. om Var..6. Korr. & Förklarad
Läs merRegression med Genetiska Algoritmer
Regression med Genetiska Algoritmer Projektarbete, Artificiell intelligens, 729G43 Jimmy Eriksson, jimer336 770529-5991 2014 Inledning Hur många kramar finns det i världen givet? Att kunna estimera givet
Läs merSkolprestationer på kommunnivå med hänsyn tagen till socioekonomi
1(6) PCA/MIH Johan Löfgren 2016-11-10 Skolprestationer på kommunnivå med hänsyn tagen till socioekonomi 1 Inledning Sveriges kommuner och landsting (SKL) presenterar varje år statistik över elevprestationer
Läs merSkrivning i ekonometri lördagen den 29 mars 2008
LUNDS UNIVERSITET STATISTISKA INSTITUTIONEN MATS HAGNELL STAB, Ekonometri Skrivning i ekonometri lördagen den 9 mars 8.Vi vill undersöka hur variationen i antal arbetande timmar för gifta kvinnor i Michigan
Läs merDekomponering av löneskillnader
Lönebildningsrapporten 2013 133 FÖRDJUPNING Dekomponering av löneskillnader Den här fördjupningen ger en detaljerad beskrivning av dekomponeringen av skillnader i genomsnittlig lön. Först beskrivs metoden
Läs mer732G71 Statistik B. Föreläsning 4. Bertil Wegmann. November 11, IDA, Linköpings universitet
732G71 Statistik B Föreläsning 4 Bertil Wegmann IDA, Linköpings universitet November 11, 2016 Bertil Wegmann (IDA, LiU) 732G71, Statistik B November 11, 2016 1 / 34 Kap. 5.1, korrelationsmatris En korrelationsmatris
Läs merPrognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson
Prognosmodell för medlemstal i Svenska kyrkan. Av Thomas Holgersson Det framtida medlemsantalet i svenska kyrkan tycks vara intressant för många, då det regelbundet diskuteras i olika sammanhang. Att kyrkans
Läs merInstruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet
1 Instruktioner till Examinationen Kursen Introduktion till Multivariat Dataanalys Karolinska Institutet Uppdaterad: 120412 För att bli godkänd skall man utföra alla sex uppgifter som beskrivs nedan. OBS:
Läs merVilka grupper av faktorer predicerar bäst elevers skolkande?
Vilka grupper av faktorer predicerar bäst elevers skolkande? En kvantitativ studie baserad på PISA-enkäten 2015 Statistiska institutionen Vårterminen 2017 Examensarbete statistik 15 högskolepoäng Författare:
Läs merTentamen Tillämpad statistik A5 (15hp)
Uppsala universitet Statistiska institutionen A5 2014-08-26 Tentamen Tillämpad statistik A5 (15hp) 2014-08-26 UPPLYSNINGAR A. Tillåtna hjälpmedel: Miniräknare Formelsamlingar: A4/A8 Tabell- och formelsamling
Läs merFöreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse
Läs merStatistik B Regressions- och tidsserieanalys Föreläsning 1
Statistik B Regressions- och tidsserieanalys Föreläsning Kurskod: 732G7, 8 hp Lärare och examinator: Ann-Charlotte (Lotta) Hallberg Lärare och lektionsledare: Isak Hietala Labassistenter Kap 3,-3,6. Läs
Läs merFöreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
Läs merVid formulering av den linjära regressionsmodellen utgår man ifrån att; Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar
ICKE-LINJÄRA MODELLER Vid formulering av den linjära regressionsmodellen utgår man ifrån att; Y i = 1 + 2 X 2i + u i Sambandet mellan Y-variabel och X-variabel är linjärt m a p parametrar cov(x i,u i )
Läs mer5B Portföljteori och riskvärdering
B7 - Portföljteori och riskvärdering Laboration Farid Bonawiede - 89-09 Alexandre Messo - 89-77 - Beräkning av den effektiva fronten för en portfölj Uppgiften går ut på att beräkna de portföljer som ger
Läs merFöreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Läs merKapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN
Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN Spridningsdiagrammen nedan representerar samma korrelationskoefficient, r = 0,8. 80 80 60 60 40 40 20 20 0 0 20 40 0 0 20 40 Det finns dock två
Läs merFöreläsning 4 Kap 3.5, 3.8 Material om index. 732G71 Statistik B
Föreläsning 4 Kap 3.5, 3.8 Material om index 732G71 Statistik B Skötsel (y) Transformationer Ett av kraven för regressionsmodellens giltighet är att residualernas varians är konstant. Vad gör vi om så
Läs merTENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS
STOCKHOLMS UNIVERSITET Statistiska institutionen Marcus Berg VT2014 TENTAMEN I REGRESSIONSANALYS OCH TIDSSERIEANALYS Fredag 23 maj 2014 kl. 12-17 Skrivtid: 5 timmar Godkända hjälpmedel: Kalkylator utan
Läs merFöreläsning 4. Kap 5,1-5,3
Föreläsning 4 Kap 5,1-5,3 Multikolinjäritetsproblem De förklarande variablerna kan vara oberoende (korrelerade) av varann men det är inte så vanligt. Ofta är de korrelerade, och det är helt ok men beroendet
Läs merHar invandrare som arbetar inom äldreomsorgen en besvärligare arbetssituation än sina svensk födda kollegor?
Anders Giertz & Håkan Jönson Har invandrare som arbetar inom äldreomsorgen en besvärligare arbetssituation än sina svensk födda kollegor? Do immigrants working in formal eldercare have a more precarious
Läs merFöreläsning 2. Kap 3,7-3,8 4,1-4,6 5,2 5,3
Föreläsning Kap 3,7-3,8 4,1-4,6 5, 5,3 1 Kap 3,7 och 3,8 Hur bra är modellen som vi har anpassat? Vi bedömer modellen med hjälp av ett antal kriterier: visuell bedömning, om möjligt F-test, signifikanstest
Läs merRunning head: ATT MÄTA SPECIESISM OCH RÄTTFÄRDIGANDE AV EXPLOATERING AV DJUR 1. Att mäta speciesism och rättfärdigande av exploatering av djur
Running head: ATT MÄTA SPECIESISM OCH RÄTTFÄRDIGANDE AV EXPLOATERING AV DJUR 1 Att mäta speciesism och rättfärdigande av exploatering av djur Tomasic, Henrik & Wing, Joel Örebro Universitet Sammanfattning
Läs merUpprepade mätningar och tidsberoende analyser. Stefan Franzén Statistiker Registercentrum Västra Götaland
Upprepade mätningar och tidsberoende analyser Stefan Franzén Statistiker Registercentrum Västra Götaland Innehåll Stort område Simpsons paradox En mätning per individ Flera mätningar per individ Flera
Läs merLektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Läs merSF1901: Medelfel, felfortplantning
SF1901: Medelfel, felfortplantning Jan Grandell & Timo Koski 15.09.2011 Jan Grandell & Timo Koski () Matematisk statistik 15.09.2011 1 / 14 Felfortplantning Felfortplantning kallas propagation of error
Läs merUtvärdering av ett screeningformulär med syfte att kartlägga problemområden hos barn och ungdomar med neuropsykiatriska funktionsnedsättningar
GÖTEBORGS UNIVERSITET PSYKOLOGISKA INSTITUTIONEN Utvärdering av ett screeningformulär med syfte att kartlägga problemområden hos barn och ungdomar med neuropsykiatriska funktionsnedsättningar En pilotstudie
Läs merKapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING
Kapitel 17: HETEROSKEDASTICITET, ROBUSTA STANDARDFEL OCH VIKTNING När vi gör en regressionsanalys så bygger denna på vissa antaganden: Vi antar att vi dragit ett slumpmässigt sampel från en population
Läs mer10.1 Enkel linjär regression
Exempel: Hur mycket dragkraft behövs för att en halvledare skall lossna från sin sockel vid olika längder på halvledarens ben. De halvledare vi betraktar är av samma storlek (bortsett benlängden). 70 Scatterplot
Läs merRepetitionsföreläsning
Population / Urval / Inferens Repetitionsföreläsning Ett företag som tillverkar byxor gör ett experiment för att kontrollera kvalitén. Man väljer slumpmässigt ut 100 par som man utsätter för hård nötning
Läs merKapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT
Kapitel 18: LINJÄRA SANNOLIKHETSMODELLER, LOGIT OCH PROBIT Regressionsanalys handlar om att estimera hur medelvärdet för en variabel (y) varierar med en eller flera oberoende variabler (x). Exempel: Hur
Läs merTentamensgenomgång och återlämning: Måndagen 24/2 kl16.00 i B497. Därefter kan skrivningarna hämtas på studentexpeditionen, plan 7 i B-huset.
Statistiska institutionen Nicklas Pettersson Skriftlig tentamen i Finansiell Statistik Grundnivå 7.5hp, HT2013 2014-02-07 Skrivtid: 13.00-18.00 Hjälpmedel: Godkänd miniräknare utan lagrade formler eller
Läs merKvantitativ strategi Univariat analys 2. Wieland Wermke
+ Kvantitativ strategi Univariat analys 2 Wieland Wermke + Sammanfattande mått: centralmått n Beroende på skalnivån finns det olika mått, som betecknar variablernas fördelning n Typvärde eller modalvärde
Läs merLärmål Sannolikhet, statistik och risk 2015
Lärmål Sannolikhet, statistik och risk 2015 Johan Jonasson Februari 2016 Följande begrepp och metoder ska behärskas väl, kunna förklaras och tillämpas. Direkta bevis av satser från kursen kommer inte på
Läs merSTOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB DATORLABORATION 3: MULTIPEL REGRESSION.
MATEMATISKA INSTITUTIONEN Tillämpad statistisk analys, GN STOCKHOLMS UNIVERSITET VT 2011 Avd. Matematisk statistik GB 2011-04-13 DATORLABORATION 3: MULTIPEL REGRESSION. Under Instruktioner och data på
Läs mer