22--5 F Deskripio Saisikes gruder 2 dagid HT 22 A beskriva, illusrera och sammafaa e uppsäig observaioer Me förs ågo kor om Daabildig (Nyquis kap 9) Daabildig Kap 9 Mäig Daa: Mäigar, observaioer ex. 22 M 45 62 84 Meadaa: Iformaio om daa, förklarar vad rade ova sår för, vad värdea beyder, ufallsrum mm. Paradaa (SCB och adra): uppgifer om daaisamlige: Ex. 4 T 62 Meaparadaa : beräar vad paradaa sår för Validie: Mäprocesses förmåga a represeera de suderade egeskape. Predikiv validie = förmåga a förusäga observaioer Reliabilie: Mäprocesses förmåga a ge ugefär samma resula vid upprepade mäigar. Tillförlilighe, slumpfel.
22--5 Mäig 2 Empiriska sudier Bias: E sysemaisk fel som iroduceras av mäprocesse. Slumpfel: E sokasisk fel som iroduceras av mäprocesse. Observera värde Y = μ + b + ε Sa värde Bias Slumpfel Syfe: a på ågo sä avgöra om e modell är e rimlig beskrivig av de verklighe vi suderar. Experimeella sudier: Objek usäs för olika behadligar för sudera effeker (respos) Radomiserad (slumpmässig) allokerig av objek ill olika behadligar Korollgrupper (placebo) Ofa för a sudera orsakssambad (kausaliie) Eik? Empiriska sudier 2 Empiriska sudier 3 Observaiossudier: Objek väljs u ur e populaio och suderas (mäs) Dessa får represeera hela populaioe Sudera egeskaper i populaioe och/eller jämförelser mella olika grupper iom populaioe Usäs ie för e behadlig, passiv observerade Svår (omöjlig?) a dra absolua slusaser om kausalie Eik? Urvalsudersökigar: Kosadsskäl billigare udersöka e fåal jmfr med alla Tidsskäl går forare (kosad och akualie) Mer pegar över mäprocesse ka förfias, bäre resula jmfr med oaludersökig Prakisk omöjlig.ex. oädliga populaioer Försörade mäigar 2
22--5 Empiriska sudier 4 Deskripio Kap -2 Slumpmässiga urval: Represeaiva urval vad meas med de? Akiv välja urvalsobjek som ma aser vara represeaiva medför problem (kap 9 sid 2) varför? Vad ma aser behöver ie vara hela saige ie es delvis Slumpmässiga urval garaerar (om de görs rä) vad ma kallar väevärdesrikiga skaigar med bra precisio. A preseera och sammafaa empiriska observaioer (empirisk fördelig). Exploraiv aalys! A jämföra med e eoreisk modell (saolikhesfördelig). Tabeller Grafisk framsällig Me äve Sammafaade må medelvärde, media, adelar, sadardavvikelse i e uppsäig empiriska observaioer, daa Variabler Kvaiaiva variabler Aar umeriska värde Kvaliaiva variabler Aar icke-umeriska värde Koiuerliga variabler Ka aa samliga värde iom e iervall Ka vara ädlig eller oädlig Diskrea variabler Ka aa edas vissa värde Skalor Värdea som e variabel ka aa ages på olika skalyper: Nomialskala icke-umerisk, lai ome = am Ex. bilmärke, yrke m.m. Ordialskala Icke-umerisk me ka ordas Ex. bra, bäre, bäs Iervallskala Numeriska värde där avsåde är väldefiierade me ie kvoer Ex. Celsiusskala Kvoskala 2 är vå ggr sörre ä 3
Ordial Diskre Nomial 22--5 Sammafaig Frekvesabeller Variabelyp Skalyp Diskre Koiuerlig Nomial X - Ordial X - Iervall X X Kvo X X Kvaliaiv Kvaiaiv Kvaliaiva omial och ordial Kvaiaiva diskre och klassidelad koiuerlig Räka aale som faller iom varje defiierad kaegori Olika variabelyper och skalor kräver olika abellyper och diagramyper! Glassmak Frekves Rel. frekv. Choklad 7 35, % Vailj 5 25, % Sörs förs! Jordgubb 45 22,5% Hallo 3 5, % Lakris 5 2,5 % Mis sis! Summa 2 % Frekvesabeller 2 Klassidelig Beyg Frekves Rel. frekv. Säms 3 5, % Dålig 55 22,5 % OK 8 4,% God 2, % Bäs 5 7,5 % Summa 2 % Aal fel Frekves Rel. frekv. 5 2,5 % 2 3 5, % 3 7 35,% 4 45 22,5 % 5 5 25, % Summa 2 % Orda efer ragordige på skala! Orda efer sorleksordig! När e variabel är koiuerlig eller äsa koiuerlig (hur måga decimalers oggrahe?) Gruppera ärliggade ill samma klass. Klassbredd måse defiieras Ex. -4,99; 5,-9,99;,-4,99 Samma klassbredd eller olika? Ex. åldersgrupper ka variera iblad Frekvesera ka sammasällas klassvis i e abell. 4
22--5 Grafisk framsällig Hisogram Frekveser (absolua el. relaiva) Sapeldiagram Kvaliaiva, omial och ordial Orda på mosvarade sä som med frekvesabeller Uppdelade saplar Cirkeldiagram Kvaliaiva, omial Solpdiagram Kvaiaiva, diskre Hisogram Kvaiaiva, klassidelad koiuerlig Hisogram aväds är ma har koiuerlig variabel. Samma som med abeller, klassbreddera måse defiieras. Frekvese i e klass ska avspeglas i sapels area, ie dess höjd! Om lika klassbredd kommer höjde bli proporioell mo frekvese. Öppa klasser (ex. >65) markeras med sreckade lijer Efersom vi ie ve var de sluar ka vi ie vea vad area är! Lägesmå Lägesmå 2 Empiriska lägesmå Arimeisk medelvärde x x i i Käslig för exrema värde Ex. 2, 3, 4, 5 x 3,5 Ex. 2, 3, 4, 25 x 8,5 Sickprovsmedelvärde mosvaras av de eoreiska och absraka väevärde Mediae delar e daa maerial i mie, dvs. 5 % av observaioera ligger på vara sida om mediae Ragorda observaioera udda media = miersa jäm media = medelvärde av de vå ärmas mie Ex. 2, 3, 4, 5 media = 3,5 Ex. 2, 3, 4, 25 media = 3,5 5
22--5 Spridigsmå Tchebysheffs olikhe Sickprovsvariase (Näsa) samma defiiio som de eoreiska fördeliges varias Geomsilig kvadrera avsåd ill medelvärde s 2 - i ( x i x) Obs! - isf Medför bäre egeskaper 2 k är e al s.a. k För alla empiriska fördeligar gäller a adele observaioer som ligger i iervalle Ex. ( x ks, x ks) är mis /k 2 k = adele > / 2 = k = 2 adele > /2 2 =,75 k = 3 adele > /3 2 =,8889 k = 4 adele > /4 2 =,9735 Spridigsmå 2 Boxploar Kvariler och kvarilavsåd q = :a kvarile 25 % edaför, 75 % ovaför q 3 = 3:e kvarile 75 % edaför, 25 % ovaför Beräkas elig samma möser som mediae (se kap sid 7) IRQ = Kvarilavsåd = q 3 q (eg. ierquarile rage) Behöver misa och sörsa värde media, försa och redje kvariler defiiera ev. exremvärde Ouliers: elig e defiiio (Tukey) värde som ligger mer ä,5 ggr IRQ ill väser om q eller ill höger om q 3. Exrema ouliers: om avsåde är sörre 3 ggr IRQ 6
22--5 Boxploar 2 Flera variabler Exempel Varför ia på flera samidig? Mi Media q q 3 2 3 4 5 6 7 8,5 ggr IRQ IRQ Sörsa värde som ej är exrem,5 ggr IRQ Exremvärde Max Sambadsaalys Fis de söd eller ie i daa för e sambad (beroede) mella olika variabler? Sudera korsabeller och olika grafer/diagram Frekvesabeller Beskrivade må Korsabeller, ma korsar vå eller fler variabler. Absolua eller relaiva frekveser Me u ka vi välja: - simulaa relaiva frekv. - beigade relaiva frekv. Vi suderade beigade fördeligar och dessas väevärde och variaser. De ka vi givevis göra med empiriska daa. Jämföra vå eller flera grupper map läge och spridig. Med de seare är de ofare läare a uppäcka sambad. Se ex. kap 2 sid 5. 7
22--5 Kvoabeller Kvoabeller 2 Besläka begrepp (SCB): magiudabeller Isf medelvärde praar ma ofa (på SCB) om oaler Dvs. de uppsummerade eller aggregerade värde för e variabel y beiga på värde på e aa x Ma ka försås korsa flera förklarigsvariabler och aggregera e resposvariabel Se.ex. abell 2.6 sid För e redovisigsgrupp g: Kvo: medelvärde Toal: Adel: specialfall av medelvärde. p där Ag g x i x g g xig x g i x xig g x i g xig, omi haregeskapa, aars x i F2 Deskripio fors Saplade yor Grafisk framsällig flera variabler Varia av sapeldiagram Saplade saplar (kaegoriska daa) Absolua frekveser per grupp (simula fördelig) 8 6 4 2 2 3 4 Serie3 Serie2 Serie Absolua frekveser per grupp (simula fördelig) 8 6 4 2 2 3 4 Serie3 Serie2 Serie Relaiva frekveser per grupp (beigad fördelig) % 8% 6% 4% 2% % 2 3 4 Serie3 Serie2 Serie Relaiva % frekveser 8% per grupp 6% 4% (beigad för- 2% delig) % 2 3 4 Serie3 Serie2 Serie 8
22--5 Sapeldiagram Boxploar ige Grupperade saplar Jämföra grupper 7 6 5 * * * * 4 3 2 Serie Serie2 Serie3 * * 2 3 4 2 3 4 5 6 7 8 Pukploar Pukploar 2 Varje alpar represeeras av e puk: 6 5 4 3 2 2 22 24 26 28 3 32 34 Oerhör vikig isrume är ma suderar sambad mella (koiuerliga) variabler! Vad lear ma efer? Sarka eller svaga sambad Posiiva eller egaiva sambad Lijära eller icke-lijära sambad Avvikade och exrema värde huvudsaklige vå yper me mer om de på äsa kurs! 9
22--5 Pukploar 3 Kovarias och korrelaio Ex. Ascomb s daa se Sickprovsmosvarigheera ill kovarias och korrelaio i e simula bivaria fördelig s xy - - i ( x x)( y i i i y) xiyi xy r xy sxy s s x y A jämföra med pukploara! Jämföra empiri och modell Jämföra e empirisk fördelig med e eoreisk fördelig Forsa läsig Avsi 2.5 Samspelseffek Avsi 2.6 Sadardpopulaiosmeode Läs själva me särskil 2.5 fis aledig a åerkomma ill är i läser Regressiosaalys De empiriska visas i e hisogram, de eoreiska som e graf
22--5 Tidsserier Tidsserier När vi suderar e variabel över id Beeckas ofa X Sor X för a är sokasisk Idex för id Vad umärker idsserieaalys jmfr med värsisdaa? Upprepade mäigar över id Beroede observaioer Två sä beskrivs i Nyquis Dekompoerig, uppdelig i kompoeer Sokasisk process Frågesälligara kua ill series uvecklig över id,.e.x förädrigar, reder och säsogsmässiga variaioer mm. (Se Kap 3 sid 4) Grafisk framsällig Kompoeer Kurvdiagram, ide på x-axel och observaioera mo y-axel. Pukera förbids med lijer. 4 3,5 3 2,5 2,5,5 975 976 977 978 979 98 98 982 Mjölk Sockerdricka År Mjölk Sockerdricka 975,34,2 976,43,33 977,63,38 978,92,46 979 2,7,5 98 2,4,66 98 2,87,84 982 3,38 2, Ma äker sig a varje observaio besår av fyra delar Tred Kojukur Säsog Slump X Tr K S ε Hur sor del var och bidrar med varierar Dels kompoeeras uvecklig över och sorlek
22--5 Dekompoerig Sokasiska processer Eklase variae: :a ordiges auoregressiv process, eller AR() X μ ρ( X μ) ε Ofa me ie allid fimpar ma lägesparameer geom a isälle ia på Y = X μ Muliplikaiv modell: X = Tr C S ε Y ρy ε Sokasiska processer 2 Ekla idex 6 5 4 3 2 - -2-3 -4-5 ρ =,9 Mjukare, små förädrigara, slumpfele midre Välj e basidpuk ( = ) Jämför samliga observaioer mo dea idpuk Idex X X 3 2 - -2-3 ρ =,4 Taggigare, hoppar mer, slumpfele slår igeom mer Visar edas förädrig, ie ivåer Edas jämföra mo basåre År X Idex 975,6, 976,72 6,7 977,96 2,6 978 2,3 43,3 979 2,48 54,5 98 2,89 79,9 98 3,44 24,2 982 4,6 252,2 2
22--5 Ekla idex 2 Sammasaa idex I grafisk form: Origial Idex 4,5 4, 3,5 3, 2,5 2,,5,,5, 975 976 977 978 979 98 98 982 3, 25, 2, 5,, Mjölk Sockerdricka Mjölk Sockerdricka När ma vill mäa.ex. de allmäa prisivå och dess förädrigar (iflaio). Ska edas mäa prisivås förädrigar och ie påverkas av förädrigar i kosumees levadsivå. E prisidex ska mäa prisivås förädrigar vid oförädrad levadsivå. 5,, 975 976 977 978 979 98 98 982 Sammasaa idex 2 Sammasaa idex 3 Ex. priser på ågra varor: 98 982 Kosym 845 932 Skjora 2 7 Herrsockor 7 9 Förädrig? Summera prisera och jämför summora? Jämför varje vara för sig och a arimeisk medelvärde av förädrigara? Väg varje vara mo kvaieera, dvs. aale sålda av var och e Idex PQ Vilka kvaieer ska ma välja? År = eller år? P Q 3
22--5 Sammasaa idex 4 Sammasaa idex 5 Laspeyres idex: Kvaieer vid basåre = Idex L PQ Paasche idex: Kvaieer ievarade år Idex P P Q PQ P Q Edgeworh idex: Sie av kvaieer vid basåre = och PQ, E Idex P Q, Fishers idealidex: Geomerisk medelvärde av Laspeyres och Paasches Idex Idex Idex L P 4