F1 Deskription. Statistikens grunder 2 dagtid. Databildning Kap 9. Mätning 1. Att beskriva, illustrera och sammanfatta en uppsättning observationer

Relevanta dokument
Ekvationen (ekv1) kan bl. annat beskriva värmeledningen i en tunn stav där u( x, betecknar temperaturen i punkten x vid tiden t.

Prognoser

Föreläsning G04: Surveymetodik

Kvinnors arbetsmiljö. Rapport 2012:11. Tillsynsaktivitet 2012 inom regeringsuppdraget om kvinnors arbetsmiljö. Delrapport

Programmering Emme-makro rvinst_ic.mac version 2

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

KURV- OCH YTAPPROXIMATION MED POLYNOM

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 1)

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Borel-Cantellis sats och stora talens lag

Korrelatio n : Korrelation Korrelation är samma sak som faltning med. Signal- och Bildbehandling FÖRELÄSNING 12

Modellering och prediktion av tidsserier gällande sjukförmåner inom socialförsäkringen

1. Test av anpassning.

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

F3 Lite till om tidsserier. Statistikens grunder 2 dagtid. Sammansatta index 4. Deflatering HT Laspeyres index: Paasche index: Index.

Datorövning 2 Fördelningar inom säkerhetsanalys

2. Konfidensintervall för skillnaden mellan två proportioner.

Autokorrelationens inverkan på signifikansnivån för Jarque-Beras normalitetstest för regressionsresidualer en Monte Carlo-studie

Antalet sätt att välja ut r objekt bland n stycken med hänsyn till ordning är np r = n(n 1) (n r + 1).

F10 ESTIMATION (NCT )

helst. poäng. (betyg Fx). Vem som Komplettering sker c:a Uppgift Uppgift Uppgift veta hur vänd! Var god

bättre säljprognoser med hjälp av matematiska prognosmodeller!

Formler, grundläggande statistik

101. och sista termen 1

Följande begrepp används ofta vid beskrivning av ett statistiskt material:

Höftledsdysplasi hos dansk-svensk gårdshund - Exempel på tavlan

F19 HYPOTESPRÖVNING (NCT ) Hypotesprövning för en differens mellan två medelvärden

Formelsamling. Enkel linjär regressionsananalys: Modell: y i = β 0 + β 1 x i + ε i. Anpassad regressionslinje: ŷ = b 0 + b 1 x. (x i x) (y i ȳ) ( x)2

Grundläggande matematisk statistik

Laboration D158. Sekvenskretsar. Namn: Datum: Kurs:

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 4 (del 2)

Föreläsning 8. Kap 7,1 7,2

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

Begreppet rörelsemängd (eng. momentum)

Stokastiska variabler

KOM IHÅG ATT NOTERA DITT TENTAMENSNUMMER NEDAN OCH TA MED DIG TALONGEN INNAN DU LÄMNAR IN TENTAN!!

Skattning / Inferens. Sannolikhet och statistik. Skattning / Inferens. Vad är det som skattas?

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Stat. teori gk, ht 2006, JW F13 HYPOTESPRÖVNING (NCT ) Ordlista till NCT

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Jag läser kursen på. Halvfart Helfart

2 Laboration 2. Positionsmätning

NEWTON-RAPHSONS METOD (en metod för numerisk lösning av ekvationer)

Tentamen i Elektronik, ESS010, del 2 den 14 dec 2009 klockan 14:00 19:00.

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Digital signalbehandling Fönsterfunktioner

Föreläsning 2: Punktskattningar

a) Beräkna E (W ). (2 p)

Finansiell Statistik (GN, 7,5 hp,, HT 2008) Föreläsning 9. Analys av Tidsserier (LLL kap 18) Tidsserie data

1 av 10. (sys1) ELEMENTERA OPERATIONER Vi får göra följande elementära operationer med ekvationer utan att ändra systemets lösningsmängd:

Högskoleutbildad 0,90*0,70=0,63 0,80*0,30=0,24 0,87 Ej högskoleutbildad 0,07 0,06 0,13 0,70 0,30 1,00

Tjänsteprisindex för detektiv- och bevakningstjänster; säkerhetstjänster

Datorövning 2 Fördelningar inom säkerhetsanalys

Trigonometriska polynom

FÖRDJUPNINGS-PM. Nr Räntekostnaders bidrag till KPI-inflationen. Av Marcus Widén

( ) ( θ( n) 1. Ett kausalt tidskontinuerligt filter F har tillståndsekvationen

NEWTON-RAPHSONS METOD (en metod för numerisk lösning av ekvationer)

Introduktion till statistik för statsvetare

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

Lösningar och kommentarer till uppgifter i 1.1

Andra ordningens lineära differensekvationer

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in.

θx θ 1 om 0 x 1 f(x) = 0 annars

Bilaga 6.1 Låt oss studera ett generellt andra ordningens tidsdiskreta system

4.2.3 Normalfördelningen

DIGITALTEKNIK. Laboration D171. Grindar och vippor

Uppgifter 3: Talföljder och induktionsbevis

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Tentamen i Statistik, STA A10 och STA A13 (9 poäng) 26 mars 2004, klockan

FOURIERSERIER. Definition 1. (Trigonometrisk serie) Ett utryck av följande form. är en trigonometrisk serie.

Normalfördelningens betydelse. Sannolikhet och statistik. Täthetsfunktion, väntevärde och varians för N (µ, σ)

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

Statistik för ingenjörer 1MS008

Från kap. 25: Man får alltid ett spänningsfall i strömmens riktning i ett motstånd.

Diskussion om rörelse på banan (ändras hastigheten, behövs någon kraft för att upprätthålla hastigheten, spelar massan på skytteln någon roll?

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

Interpolation. Interpolation. Teknisk-vetenskapliga beräkningar 1. Några tillämpningar. Interpolation. Basfunktioner. Definitioner. Kvadratiskt system

BASiQ. BASiQ. Tryckoberoende elektronisk flödesregulator

SAMMANFATTNING TAMS79 Matematisk statistik, grundkurs

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

Statistik. Språkligt och historiskt betyder statistik ungefär sifferkunskap om staten

Betalningsbalansen. Andra kvartalet 2012

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

Lösningar till Matematisk analys IV,

Glada barnröster kan bli för höga

REGULJÄRA SPRÅK (8p + 6p) 1. DFA och reguljära uttryck (6 p) Problem. För följande NFA över alfabetet {0,1}:

b 1 och har för olika värden på den reella konstanten a.

Jag läser kursen på. Halvfart Helfart

KTH/ICT IX1501:F7 IX1305:F2 Göran Andersson Statistik: Skattningar

Smärtlindring vid medicinsk abort

Föreläsning G70 Statistik A

Webprogrammering och databaser. Begrepps-modellering. Exempel: universitetsstudier Kravspec. ER-modellen. Exempel: kravspec forts:

TMS136: Dataanalys och statistik Tentamen med lösningar

H1009, Introduktionskurs i matematik Armin Halilovic POLYNOM, POLYNOMDIVISION, ALGEBRAISKA EKVATIONER, PARTIALBRÅKSUPPDELNING. vara ett polynom där a

Transkript:

22--5 F Deskripio Saisikes gruder 2 dagid HT 22 A beskriva, illusrera och sammafaa e uppsäig observaioer Me förs ågo kor om Daabildig (Nyquis kap 9) Daabildig Kap 9 Mäig Daa: Mäigar, observaioer ex. 22 M 45 62 84 Meadaa: Iformaio om daa, förklarar vad rade ova sår för, vad värdea beyder, ufallsrum mm. Paradaa (SCB och adra): uppgifer om daaisamlige: Ex. 4 T 62 Meaparadaa : beräar vad paradaa sår för Validie: Mäprocesses förmåga a represeera de suderade egeskape. Predikiv validie = förmåga a förusäga observaioer Reliabilie: Mäprocesses förmåga a ge ugefär samma resula vid upprepade mäigar. Tillförlilighe, slumpfel.

22--5 Mäig 2 Empiriska sudier Bias: E sysemaisk fel som iroduceras av mäprocesse. Slumpfel: E sokasisk fel som iroduceras av mäprocesse. Observera värde Y = μ + b + ε Sa värde Bias Slumpfel Syfe: a på ågo sä avgöra om e modell är e rimlig beskrivig av de verklighe vi suderar. Experimeella sudier: Objek usäs för olika behadligar för sudera effeker (respos) Radomiserad (slumpmässig) allokerig av objek ill olika behadligar Korollgrupper (placebo) Ofa för a sudera orsakssambad (kausaliie) Eik? Empiriska sudier 2 Empiriska sudier 3 Observaiossudier: Objek väljs u ur e populaio och suderas (mäs) Dessa får represeera hela populaioe Sudera egeskaper i populaioe och/eller jämförelser mella olika grupper iom populaioe Usäs ie för e behadlig, passiv observerade Svår (omöjlig?) a dra absolua slusaser om kausalie Eik? Urvalsudersökigar: Kosadsskäl billigare udersöka e fåal jmfr med alla Tidsskäl går forare (kosad och akualie) Mer pegar över mäprocesse ka förfias, bäre resula jmfr med oaludersökig Prakisk omöjlig.ex. oädliga populaioer Försörade mäigar 2

22--5 Empiriska sudier 4 Deskripio Kap -2 Slumpmässiga urval: Represeaiva urval vad meas med de? Akiv välja urvalsobjek som ma aser vara represeaiva medför problem (kap 9 sid 2) varför? Vad ma aser behöver ie vara hela saige ie es delvis Slumpmässiga urval garaerar (om de görs rä) vad ma kallar väevärdesrikiga skaigar med bra precisio. A preseera och sammafaa empiriska observaioer (empirisk fördelig). Exploraiv aalys! A jämföra med e eoreisk modell (saolikhesfördelig). Tabeller Grafisk framsällig Me äve Sammafaade må medelvärde, media, adelar, sadardavvikelse i e uppsäig empiriska observaioer, daa Variabler Kvaiaiva variabler Aar umeriska värde Kvaliaiva variabler Aar icke-umeriska värde Koiuerliga variabler Ka aa samliga värde iom e iervall Ka vara ädlig eller oädlig Diskrea variabler Ka aa edas vissa värde Skalor Värdea som e variabel ka aa ages på olika skalyper: Nomialskala icke-umerisk, lai ome = am Ex. bilmärke, yrke m.m. Ordialskala Icke-umerisk me ka ordas Ex. bra, bäre, bäs Iervallskala Numeriska värde där avsåde är väldefiierade me ie kvoer Ex. Celsiusskala Kvoskala 2 är vå ggr sörre ä 3

Ordial Diskre Nomial 22--5 Sammafaig Frekvesabeller Variabelyp Skalyp Diskre Koiuerlig Nomial X - Ordial X - Iervall X X Kvo X X Kvaliaiv Kvaiaiv Kvaliaiva omial och ordial Kvaiaiva diskre och klassidelad koiuerlig Räka aale som faller iom varje defiierad kaegori Olika variabelyper och skalor kräver olika abellyper och diagramyper! Glassmak Frekves Rel. frekv. Choklad 7 35, % Vailj 5 25, % Sörs förs! Jordgubb 45 22,5% Hallo 3 5, % Lakris 5 2,5 % Mis sis! Summa 2 % Frekvesabeller 2 Klassidelig Beyg Frekves Rel. frekv. Säms 3 5, % Dålig 55 22,5 % OK 8 4,% God 2, % Bäs 5 7,5 % Summa 2 % Aal fel Frekves Rel. frekv. 5 2,5 % 2 3 5, % 3 7 35,% 4 45 22,5 % 5 5 25, % Summa 2 % Orda efer ragordige på skala! Orda efer sorleksordig! När e variabel är koiuerlig eller äsa koiuerlig (hur måga decimalers oggrahe?) Gruppera ärliggade ill samma klass. Klassbredd måse defiieras Ex. -4,99; 5,-9,99;,-4,99 Samma klassbredd eller olika? Ex. åldersgrupper ka variera iblad Frekvesera ka sammasällas klassvis i e abell. 4

22--5 Grafisk framsällig Hisogram Frekveser (absolua el. relaiva) Sapeldiagram Kvaliaiva, omial och ordial Orda på mosvarade sä som med frekvesabeller Uppdelade saplar Cirkeldiagram Kvaliaiva, omial Solpdiagram Kvaiaiva, diskre Hisogram Kvaiaiva, klassidelad koiuerlig Hisogram aväds är ma har koiuerlig variabel. Samma som med abeller, klassbreddera måse defiieras. Frekvese i e klass ska avspeglas i sapels area, ie dess höjd! Om lika klassbredd kommer höjde bli proporioell mo frekvese. Öppa klasser (ex. >65) markeras med sreckade lijer Efersom vi ie ve var de sluar ka vi ie vea vad area är! Lägesmå Lägesmå 2 Empiriska lägesmå Arimeisk medelvärde x x i i Käslig för exrema värde Ex. 2, 3, 4, 5 x 3,5 Ex. 2, 3, 4, 25 x 8,5 Sickprovsmedelvärde mosvaras av de eoreiska och absraka väevärde Mediae delar e daa maerial i mie, dvs. 5 % av observaioera ligger på vara sida om mediae Ragorda observaioera udda media = miersa jäm media = medelvärde av de vå ärmas mie Ex. 2, 3, 4, 5 media = 3,5 Ex. 2, 3, 4, 25 media = 3,5 5

22--5 Spridigsmå Tchebysheffs olikhe Sickprovsvariase (Näsa) samma defiiio som de eoreiska fördeliges varias Geomsilig kvadrera avsåd ill medelvärde s 2 - i ( x i x) Obs! - isf Medför bäre egeskaper 2 k är e al s.a. k För alla empiriska fördeligar gäller a adele observaioer som ligger i iervalle Ex. ( x ks, x ks) är mis /k 2 k = adele > / 2 = k = 2 adele > /2 2 =,75 k = 3 adele > /3 2 =,8889 k = 4 adele > /4 2 =,9735 Spridigsmå 2 Boxploar Kvariler och kvarilavsåd q = :a kvarile 25 % edaför, 75 % ovaför q 3 = 3:e kvarile 75 % edaför, 25 % ovaför Beräkas elig samma möser som mediae (se kap sid 7) IRQ = Kvarilavsåd = q 3 q (eg. ierquarile rage) Behöver misa och sörsa värde media, försa och redje kvariler defiiera ev. exremvärde Ouliers: elig e defiiio (Tukey) värde som ligger mer ä,5 ggr IRQ ill väser om q eller ill höger om q 3. Exrema ouliers: om avsåde är sörre 3 ggr IRQ 6

22--5 Boxploar 2 Flera variabler Exempel Varför ia på flera samidig? Mi Media q q 3 2 3 4 5 6 7 8,5 ggr IRQ IRQ Sörsa värde som ej är exrem,5 ggr IRQ Exremvärde Max Sambadsaalys Fis de söd eller ie i daa för e sambad (beroede) mella olika variabler? Sudera korsabeller och olika grafer/diagram Frekvesabeller Beskrivade må Korsabeller, ma korsar vå eller fler variabler. Absolua eller relaiva frekveser Me u ka vi välja: - simulaa relaiva frekv. - beigade relaiva frekv. Vi suderade beigade fördeligar och dessas väevärde och variaser. De ka vi givevis göra med empiriska daa. Jämföra vå eller flera grupper map läge och spridig. Med de seare är de ofare läare a uppäcka sambad. Se ex. kap 2 sid 5. 7

22--5 Kvoabeller Kvoabeller 2 Besläka begrepp (SCB): magiudabeller Isf medelvärde praar ma ofa (på SCB) om oaler Dvs. de uppsummerade eller aggregerade värde för e variabel y beiga på värde på e aa x Ma ka försås korsa flera förklarigsvariabler och aggregera e resposvariabel Se.ex. abell 2.6 sid För e redovisigsgrupp g: Kvo: medelvärde Toal: Adel: specialfall av medelvärde. p där Ag g x i x g g xig x g i x xig g x i g xig, omi haregeskapa, aars x i F2 Deskripio fors Saplade yor Grafisk framsällig flera variabler Varia av sapeldiagram Saplade saplar (kaegoriska daa) Absolua frekveser per grupp (simula fördelig) 8 6 4 2 2 3 4 Serie3 Serie2 Serie Absolua frekveser per grupp (simula fördelig) 8 6 4 2 2 3 4 Serie3 Serie2 Serie Relaiva frekveser per grupp (beigad fördelig) % 8% 6% 4% 2% % 2 3 4 Serie3 Serie2 Serie Relaiva % frekveser 8% per grupp 6% 4% (beigad för- 2% delig) % 2 3 4 Serie3 Serie2 Serie 8

22--5 Sapeldiagram Boxploar ige Grupperade saplar Jämföra grupper 7 6 5 * * * * 4 3 2 Serie Serie2 Serie3 * * 2 3 4 2 3 4 5 6 7 8 Pukploar Pukploar 2 Varje alpar represeeras av e puk: 6 5 4 3 2 2 22 24 26 28 3 32 34 Oerhör vikig isrume är ma suderar sambad mella (koiuerliga) variabler! Vad lear ma efer? Sarka eller svaga sambad Posiiva eller egaiva sambad Lijära eller icke-lijära sambad Avvikade och exrema värde huvudsaklige vå yper me mer om de på äsa kurs! 9

22--5 Pukploar 3 Kovarias och korrelaio Ex. Ascomb s daa se Sickprovsmosvarigheera ill kovarias och korrelaio i e simula bivaria fördelig s xy - - i ( x x)( y i i i y) xiyi xy r xy sxy s s x y A jämföra med pukploara! Jämföra empiri och modell Jämföra e empirisk fördelig med e eoreisk fördelig Forsa läsig Avsi 2.5 Samspelseffek Avsi 2.6 Sadardpopulaiosmeode Läs själva me särskil 2.5 fis aledig a åerkomma ill är i läser Regressiosaalys De empiriska visas i e hisogram, de eoreiska som e graf

22--5 Tidsserier Tidsserier När vi suderar e variabel över id Beeckas ofa X Sor X för a är sokasisk Idex för id Vad umärker idsserieaalys jmfr med värsisdaa? Upprepade mäigar över id Beroede observaioer Två sä beskrivs i Nyquis Dekompoerig, uppdelig i kompoeer Sokasisk process Frågesälligara kua ill series uvecklig över id,.e.x förädrigar, reder och säsogsmässiga variaioer mm. (Se Kap 3 sid 4) Grafisk framsällig Kompoeer Kurvdiagram, ide på x-axel och observaioera mo y-axel. Pukera förbids med lijer. 4 3,5 3 2,5 2,5,5 975 976 977 978 979 98 98 982 Mjölk Sockerdricka År Mjölk Sockerdricka 975,34,2 976,43,33 977,63,38 978,92,46 979 2,7,5 98 2,4,66 98 2,87,84 982 3,38 2, Ma äker sig a varje observaio besår av fyra delar Tred Kojukur Säsog Slump X Tr K S ε Hur sor del var och bidrar med varierar Dels kompoeeras uvecklig över och sorlek

22--5 Dekompoerig Sokasiska processer Eklase variae: :a ordiges auoregressiv process, eller AR() X μ ρ( X μ) ε Ofa me ie allid fimpar ma lägesparameer geom a isälle ia på Y = X μ Muliplikaiv modell: X = Tr C S ε Y ρy ε Sokasiska processer 2 Ekla idex 6 5 4 3 2 - -2-3 -4-5 ρ =,9 Mjukare, små förädrigara, slumpfele midre Välj e basidpuk ( = ) Jämför samliga observaioer mo dea idpuk Idex X X 3 2 - -2-3 ρ =,4 Taggigare, hoppar mer, slumpfele slår igeom mer Visar edas förädrig, ie ivåer Edas jämföra mo basåre År X Idex 975,6, 976,72 6,7 977,96 2,6 978 2,3 43,3 979 2,48 54,5 98 2,89 79,9 98 3,44 24,2 982 4,6 252,2 2

22--5 Ekla idex 2 Sammasaa idex I grafisk form: Origial Idex 4,5 4, 3,5 3, 2,5 2,,5,,5, 975 976 977 978 979 98 98 982 3, 25, 2, 5,, Mjölk Sockerdricka Mjölk Sockerdricka När ma vill mäa.ex. de allmäa prisivå och dess förädrigar (iflaio). Ska edas mäa prisivås förädrigar och ie påverkas av förädrigar i kosumees levadsivå. E prisidex ska mäa prisivås förädrigar vid oförädrad levadsivå. 5,, 975 976 977 978 979 98 98 982 Sammasaa idex 2 Sammasaa idex 3 Ex. priser på ågra varor: 98 982 Kosym 845 932 Skjora 2 7 Herrsockor 7 9 Förädrig? Summera prisera och jämför summora? Jämför varje vara för sig och a arimeisk medelvärde av förädrigara? Väg varje vara mo kvaieera, dvs. aale sålda av var och e Idex PQ Vilka kvaieer ska ma välja? År = eller år? P Q 3

22--5 Sammasaa idex 4 Sammasaa idex 5 Laspeyres idex: Kvaieer vid basåre = Idex L PQ Paasche idex: Kvaieer ievarade år Idex P P Q PQ P Q Edgeworh idex: Sie av kvaieer vid basåre = och PQ, E Idex P Q, Fishers idealidex: Geomerisk medelvärde av Laspeyres och Paasches Idex Idex Idex L P 4