Tillämpad statistik (A5), HT15 Föreläsning 2: Obundet slumpmässigt urval 1
|
|
- Georg Jakobsson
- för 6 år sedan
- Visningar:
Transkript
1 Tillämpad statistik (A5), HT15 Föreläsning 2: Obundet slumpmässigt urval 1 Ronnie Pingel Statistiska institutionen Senast uppdaterad:
2
3 Syfte För många frågeställningar finns data inte tillgängligt. Datainsamling är kostsamt. Vi måste på ett bra sätt samla in tillförlitlig data som kan besvara vår fråga. Exempel: Literary Digest År 1936 kämpade USA med efterverkningar från depressionen. Det var valår och kandidaterna var president Roosevelt och republikanen Landon. Med 2,4 milj individer i undersökningen förutsade The Literary Digest att Roosvelt skulle få 44% av rösterna. I valet fick Roosevelt 62% av rösterna (inte långt efteråt gick tidningen i konkurs). I samma val lyckades George Gallup med endast individer förutsäga att Roosevelt skulle vinna valet (56%). Vad gick snett för the Literary Digest och varför lyckades Gallup?
4 Målet med en surveyundersökning Mål för inferens (Se Föreläsning 1) Designbaserad ansats: Målet är att beskriva en hel (ändlig) population (t ex skatta ett medelvärde, median eller variation). Om hela populationen vore känd så skulle det inte finnas någon osäkerhet! Populationens värden betraktas som fixa (ej slumpmässiga). Modellbaserad ansats: Målet är att skatta en parameter i en teoretiskt modell. Mål: Öka kunskapen om ett fenomen och ge en förklaring.
5 Populationen? Populationen är en mängd objekt (element) som en undersökning ska uttala sig om. Intressepopulation - den mängd objekt man idealt vill uttala sig om. Målpopulation - den mängd objekt man väljer att rikta sig till i undersökningen. Rampopulation - den mängd objekt som kan nås med hjälp av information i en ram. (Ramen är ofta en förteckning eller lista) Undersökningspopulation - den delmängd av rampopulationen som faller inom målpopulationen, det vill säga de objekt vi faktiskt kan nå och som ingår i målpopulationen.
6 Populationen? Exempel: Strukturundersökning för lantbruket I undersökningen av lantbrukets struktur av Statens jordbruksverk är intressepopulationen samtliga åkrar och husdjur inom svenskt lantbruk. Målpopulationen är bl a lantbruksföretag med minst 2,1ha åkermark eller tillräckligt stor djurbesättning. Företagen är våra objekt, definierade som lantbruksverksamhet med en och samma ledning. Rampopulationen är företag som ingår i den senaste versionen av Lantbruksregistret.
7 Populationen? Källa: - från teori till praktik (SCB, 2008)
8 sram sramar är förteckningar, register eller kartor som urvalet baseras på. När rampopulation och målpopulation inte sammanfaller uppstår ett täckningsproblem: Övertäckning innebär att rampopulationen innehåller objekt som inte ingår i målpopulationen. Undertäckning innebär att det finns objekt i målpopulationen som vi inte kan nå. I regel är undertäckning allvarligare eftersom det är svårare att identifiera och kan leda till allvarliga systematiska fel.
9 sramen Andra krav som man ställa på en bra är: Hög aktualitet. Information om objekten så att de går att identifiera och lokalisera. Dels så dubbletter kan identifieras, dels så att objekten kan nås med olika metoder. Gör det även möjligt att samköra register om tillstånd finns. Hjälpinformation, dvs information om hur objekten är ordnade i listan eller variabler som ger extra information om objekten. Ramproblem uppstår om populationen är rörlig över tid och/eller rum.
10 Ej listbara ar Ibland är målpopulationens bara teoretiskt listbar. undersökningen IBIS 1 intervjuas var n:te person vid relevanta gränsövergångar. För att spegla det verkliga passagerarflödet från en gränsstation tilldelas varje intervju sedan en vikt. IBIS definierar bort: Anställda i Sverige, Ambassad- och militärpersonal, Yrkesförare, Besättningspersonal, Transit på flygplats, De som vistats i landet mer än 365 dagar kommer inte med som respondenter eftersom de per definition inte gör ett besök. De är definierade som boende. 1 Resultat från den nationella gränsundersökningen IBIS 2014, inkommande besökare i Sverige, Tillväxtverket
11 Ej listbara ar Mabunda et al 2 hade inte tillgång till en med barn. Mål: This study aims to characterize the malaria transmission intensities and to estimate the disease burden that may help guide control programme. Intressepopulation: Barn Målpopulation: Barn under 10 år : 24 slumpmässigt valda distrikt. Totalt undersöktes of 8816 barn under 10 år. Datainsamling: Besöksintervjuer mellan feb 2002 april Mabunda, Samuel, et al. Ä country-wide malaria survey in Mozambique. I. Plasmodium falciparum infection in children in different epidemiological settings.malaria journal 7.1 (2008): 216
12 Begreppen i NTU Från Nationella trygghetsundersökningen (NTU) 2014, BRÅ Mål: Undersöka utsatthet för brott, de utsattas erfarenheter och kontakter med rättsväsendet samt allmänhetens trygghet och förtroende för rättsväsendet. Intresse: Boende i Sverige
13 Begreppen i NTU Målpopulation: Personer stadigvarande bosatta i Sverige, år. Bosatt i Sverige är den som är folkbokförd i Sverige och inte vistas utomlands långvarigt. Personer som är folkbokförda i Sverige men saknar adress (exempelvis bostadslösa) och personer som vistas på institution (exempelvis fängelse) ingår. Asylsökande ingår ej. Personer under 18 år ingår i undersökningen eftersom ungdomar är en intressant grupp att studera när det gäller utsatthet för brott. Den nedre åldersgränsen valdes då det i den registerbaserade statistiken över anmälda brott i vissa delar särredovisas om offret är 15 år eller äldre. Skälet till en övre åldersgräns är att erfarenheter visar att en stor del av de äldsta inte vill, eller har möjlighet, att delta i denna typ av undersökningar och att bortfallet i de äldsta åldersgrupperna därför blir särskilt stort
14 Begreppen i NTU sram: registret över totalbefolkningen (RTB), år. Varje år identifieras ett mindre antal individer i urvalet som övertäckning personer som flyttat utomlands, avlidit eller har skyddad identitet. Registret över totalbefolkningen (RTB) täcker Sveriges stadigvarande befolkning på ett bra sätt. Enligt SCB:s förändras Sveriges befolkning sakta vad beträffar det totala antalet personer och befolkningens struktur, att täckningsfelet är försumbart. Man bör dock notera att det är befolkningens utseende vid undersökningens genomförande som ligger till grund för urvalet, trots att undersökningen för frågeområdet utsatthet för brott belyser utsatthet under året före undersökningen sstorlek: personer Datainsamlingsmetod: telefonintervjuer, kompletterade med post- och webbenkäter för dem som avböjer telefonintervju och personer som ej kunnat nås per telefon. Datainsamlingsperiod: januari maj
15 Objekt i population och Om uppgiftskällan är en person kallas individen uppgiftslämnare eller respondent. Populationsobjekten (enheter i målpopulationen som vi vill utala oss om) och observationsobjekten (enheterna i en och urvalet) sammanfaller oftast, men det finns undantag. Ett exempel är undersökningar av hushåll. Man är intresserad av variabeln hushållsinkomst, som för ett hushåll är summan av hushållsmedlemmarnas inkomster. Observationsobjekten utgörs då av hushållsmedlemmar medan populationsobjekten är hushåll.
16 Begrepp i Mängd mat och dryck via avloppet en enkätundersökning i svenska hushåll, Naturvårdsverket Målet med denna studie var att få reda på hur mycket mat och dryck som hushållen häller via avloppet i Sverige totalt under ett år och per person. Ytterligare mål var att ta reda på vilken typ av mat och dryck som hälls, anledningar till att det hälls samt skillnader i mängder mellan olika typer av hushåll Därför genomfördes en enkätundersökning.
17 Begrepp i Mängd mat och dryck via avloppet en enkätundersökning i svenska hushåll sram: RTB, 30/ år eller äldre för att undvika att skicka ut enkäter till för unga individer. sramen bestod av ungefär individer. RTB består av individer, ej hushåll. Finns inget hushållsregister. Eftersom tillgång enbart finns till individregister och inte hushållsregister dras urvalet genom ett så kallat nätverksurval. Det innebär att ett urval av individer dras ur RTB och individerna kopplas sedan ihop med ett hushåll genom svaren. : sstorleken var 2050 individer, inkl. beräknad övertäckning på ca 50 individer. Brukligt på SCB att dra urval med övertäckning då det kan hända att någon dör eller flyttar från Sverige från tiden man drar urvalet till att enkäten skickas ut
18 Den ändliga populationen Populationen består av N element. Beteckna k:te elementet med sitt nummer k. Den ändliga populationen U kan då skrivas som U = {1,..., k,..., N}. Låt x beteckna en variabel och låt x k vara värdet x för element k i populationen.
19 Vad ska undersökas? En parameter är en konstant som beskriver en variabel i populationen U och om hela populationen är känd ges det aritmetiska medelvärdet för en variabel i populationen av: µ = x 1 + x x N N = 1 N N i=1 Notera att observationerna i det här fallet inte är slumpvariabler, utan fixa. Andra vanliga parametrar är totalen och variansen: x i τ = N x i = Nµ σ 2 = 1 N N (x i µ) 2 i=1 i=1
20 Vad ska undersökas? Exempel: Inkomstfördelningen i en kommun En kommun planerar budget och vill veta invånarnas inkomster. Populationen är kommuninvånarna, inkomst är variabeln och värdena erhålls via inkomstdeklarationerna. Total inkomst τ, medelinkomst µ samt inkomstvarians σ 2 kan enkelt beräknas. Måtten beskriver inkomstfördelningen och ger ev. all information som kommunen behöver. Om kommunen har skattebetalare är µ = x 1 + x x = i=1 x i och σ 2 = (x i µ) i=1
21 Vad är ett urval? Vi betecknar ett urval s. Ett urval är vilken delmängd som helst av populationen U. Låt S beteckna mängden av de 2 N möjliga urvalen från U (inklusive hela U och den tomma mängden ), dvs S = {s 1,..., s l..., s 2 N} Exempel Låt U = {1, 2, 3}. Det finns 2 N = 2 3 = 8 möjliga mängder från U: s 1 = {1, 2, 3}, s 2 = {1, 2}, s 3 = {1, 3}, s 4 = {2, 3} s 5 = {1}, s 6 = {2}, s 7 = {3}, s 8 = { }
22 Varför urval? Motiv för urvalsundersökning: Snabbare, billigare, bättre mätmetoder, fler frågor, ibland enda alternativet. Motiv för totalundersökning (census): Redovisning av resultaten i delgrupper eller en liten population som inte motiverar ett urval.
23 Vad är ett sannolikhetsurval? Ett sannolikhetsurval innebär att man tilldelar sannolikheter till de möjliga urvalen, Pr(S = s). Notera att för många av urvalen är sannolikheten noll, Pr(S = s) = 0. Dessutom innebär ett sannolikhetsurval att varje element i populationen har en känd inklusionssannolikhet (sannolikhet att komma med i urvalet) och denna ska vara större än 0.
24 Varför sannolikhetsurval? Genom att göra ett slumpmässigt urval: undviker man systematiska fel. Att utöka stickprovsstorleken hjälper inte. erhålls en samplingfördelning som kan användas för att generalisera resultaten till den ändliga populationen. Samplingfördelningen bygger på vår stickprovsdesign, där alla sannolikheter är kända. Eftersom vi själva har designat randomiseringen behöver vi därför inte göra några modellantaganden!
25 Därför sannolikhetsurval En av 1900-talets främsta statistiker, Jerzy Neyman, presenterade 1934 On the Two Different Aspects of the Representative Method: The Method of Stratified Sampling and the Method of Purposive Selection. Artikeln jämförde sannolikheturval och subjektiva urval och slog definitivt hål på idén med subjektiva urval (även om det skulle dröja innan sannolikhetsurval verkligen fick genomslag i praktiken). I artikeln presenterades även Neyman-allokeringen. Dessutom, i en bilaga, presenterades teorin för konfidensintervall...
26 Exempel på stora urvalsundersökningar med sannolikhetsurval Arbetskraftsundersökningen, SCB Survey of Income and Living Conditions, Eurostat Undersökningen av levnadsförhållanden, SCB National Crime Victimisation Survey, EU, BRÅ European health interview survey, EU Time use survey, EU Företagens investeringsplaner, SCB World value Survey Inköpschefsindex Nöjd Kund Index Trafikflödesmätningar, Vägverket Omnibusundersökningar, SIFO
27 Hur avgör vi om en metod är bra eller dålig? Utgångspunkten: Från ett slumpmässigt urval skattar vi värdet på en okänd parameter, θ. Det blir alltid (i princip) en differens mellan skattning och parametervärde: ˆθ θ. Tänk nu (hypotestiskt) att vi upprepade gånger drar nya stickprov och att vi i varje stickprov gör en skattning ˆθ 1, ˆθ 2, ˆθ 3, ˆθ Värdet på ˆθ och differensen ˆθ θ beror på vilket stickprov som dragits. ˆθ och differensen är slumpvariabler. Genom att studera ˆθ θ kan vi få en uppfattning om en metod är bra eller dålig.
28 Hur avgör vi om en metod är bra eller dålig? Exempel: Stickprovsmedelvärdet som en estimator för µ Vi vill skatta populationsmedelvärdet µ. Vi drar ett slumpmässigt urval och använder stickprovsmedelvärdet. Differensen blir: x µ Om vi (hypotetiskt) upprepar undersökningen många gånger får vi många stickprovsmedelvärden: x 1, x 2, x 3, x 4,.... För att se om en metod är bra eller dålig studerar vi slumpvariabeln x µ.
29 Kriterium 1: Bias Medelvärdet för ˆθ 1, ˆθ 2, ˆθ 3, ˆθ 4... betecknas som väntevärdet E(ˆθ). En estimator är väntevärdesriktig (vvr, unbiased) om följande gäller E(ˆθ) θ = 0 dvs E(ˆθ) = θ Det innebär att avvikelserna mellan skattningarna och det sanna parametervärdet i genomsnitt är 0. Om E(ˆθ) θ har estimatorn en bias (ett systematiskt fel).
30 Kriterium 2: Precision (Varians) Det är vidare önskvärt att estimatorn ger en god precision (liten osäkerhet). Variansen för ˆθ mäter hur de olika värdena på ˆθ varierar från stickprov till stickprov. ] V (ˆθ) = E [(ˆθ E(ˆθ)) 2 Om estimatorn är väntesvärdesriktig kan vi skriva detta som ] V (ˆθ) = E [(ˆθ θ) 2 = E(ˆθ 2 ) θ 2. En väntevärdesriktig estimator är effektivare om den har lägre varians än en annan vvr estimator.
31 Bias och precision
32 Läsanvisningar för F2 D: 4, relevanta delar i tekniska bilagor i rapporter i föreläsningsmaterialet
33 Övningsuppgifter för F2 D: 11:23
Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat urval
Tillämpad statistik (A5), HT15 Föreläsning 5: Stratifierat Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-06 En stratifierad sundersökning: NTU2014 Från NTU2014 Från NTU2014 Dellens
Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder
Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga smetoder Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-11 Några övriga smetoder OSU-UÅ (med eller utan stratifiering) förutsätter
Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap )
F3 Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap 9.1-9.4) Urval Anta att vi ska göra en urvalsunderökning och samla in primärdata Totalundersökning ofta inte möjlig För dyrt Tar
Föreläsning 4. Kapitel 5, sid Stickprovsteori
Föreläsning 4 Kapitel 5, sid 127-152 Stickprovsteori 2 Agenda Stickprovsteori Väntevärdesriktiga skattningar Samplingfördelningar Stora talens lag, Centrala gränsvärdessatsen 3 Statistisk inferens Population:
Urval. Slumpmässiga urval (sannolikhetsurval) Fördelar med slumpmässiga urval
Urval F3 Urvalsmetoder: Sannolikhetsurval resp. icke-sannolikhetsurval, OSU (kap 9.1-9.4) Ursprung: Linda Wänström Anta att vi ska göra en urvalsunderökning och samla in primärdata Totalundersökning ofta
Föreläsning 11: Mer om jämförelser och inferens
Föreläsning 11: Mer om jämförelser och inferens Matematisk statistik David Bolin Chalmers University of Technology Maj 12, 2014 Oberoende stickprov Vi antar att vi har två oberoende stickprov n 1 observationer
Planeringen av en statistisk undersökning
F2 Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik (kap 2.5, 4) Planeringen av en statistisk undersökning Tre huvudfrågor: Vem ska undersökas? Vad ska undersökas?
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Vem ska undersökas? Vem ska undersökas? Planeringen av en statistisk undersökning. Tre huvudfrågor: Vad ska undersökas? Hur ska undersökningen göras?
F2 Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik (kap 2.5, 4) Planeringen av en statistisk undersökning Tre huvudfrågor: Vem ska undersökas? Vad ska undersökas?
Föreläsning 6 (kap 6.1, 6.3, ): Punktskattningar
Föreläsning 6 (kap 6.1, 6.3, 7.1-7.3): Punktskattningar Marina Axelson-Fisk 4 maj, 2016 Stickprov (sample) Idag: Stickprovsmedelvärde och varians Statistika (statistic) Punktskattning (point estimation)
Introduktion till statistik för statsvetare
och enkäter "Det finns inget så praktiskt som en bra teori" September 2011 och enkäter Inledning Inledning Om vi vill mäta en egenskap hos en population individer (individer kan vara personer, företag
Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik
F2 Undersökningsplanering Datakällor: officiell statistik, olika databaser, registerstatistik Planeringen av en statistisk undersökning Tre huvudfrågor: Vem ska undersökas? Vad ska undersökas? Hur ska
F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17
1/17 F8 Skattningar Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 14/2 2013 Inledande exempel: kullager Antag att diametern på kullager av en viss typ är normalfördelad N(µ,
Föreläsning 4. 732G19 Utredningskunskap I. Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin
Föreläsning 4 732G19 Utredningskunskap I Föreläsningsunderlagen bygger på underlag skapade av Kalle Wahlin Dagens föreläsning Systematiskt urval Väntevärdesriktiga skattningar Jämförelse med OSU Stratifierat
Studietyper, inferens och konfidensintervall
Studietyper, inferens och konfidensintervall Andrew Hooker Division of Pharmacokinetics and Drug Therapy Department of Pharmaceutical Biosciences Uppsala University Studietyper Experimentella studier Innebär
F1 Introduktion. Statistisk undersökning. Vad är statistik? Vad är en statistisk undersökning? Klassificering efter mål eller syfte med undersökningen
F1 Introduktion. Statistisk undersökning. Leif Ruckman och Christina Andersson Avdelningen för Nationalekonomi och Statistik Karlstads universitet Vad är statistik? 1. Statistiska uppgifter. T ex som underlag
Föreläsning 7. Statistikens grunder.
Föreläsning 7. Statistikens grunder. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper.ryden@math.uu.se 1MS008, 1MS777 vt 2016 Föreläsningens innehåll Översikt, dagens föreläsning: Inledande
, s a. , s b. personer från Alingsås och n b
Skillnader i medelvärden, väntevärden, mellan två populationer I kapitel 8 testades hypoteser typ : µ=µ 0 där µ 0 var något visst intresserant värde Då användes testfunktionen där µ hämtas från, s är populationsstandardavvikelsen
Jesper Rydén. Matematiska institutionen, Uppsala universitet Tillämpad statistik 1MS026 vt 2014
Föreläsning 1. Jesper Rydén Matematiska institutionen, Uppsala universitet jesper@math.uu.se Tillämpad statistik 1MS026 vt 2014 Varför tillämpad statistik? Användningsområden i medicin, naturvetenskap
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Föreläsning 8: Konfidensintervall
Föreläsning 8: Konfidensintervall Matematisk statistik Chalmers University of Technology Maj 4, 2015 Projektuppgift Projektet går ut på att studera frisättningen av dopamin hos nervceller och de två huvudsakliga
Urval. Varje element i populationen skall ha en känd sannolikhet (chans) som är större än 0 att bli utvald
F11 Repetition Undersökningar Olika slag av undersökningar Syftet Beskrivande Förklarande/utredande Framåtblickande Undersökningsplanering Vem ska undersökas? Målpopulation Rampopulation Vad ska undersökas?
Föreläsning G60 Statistiska metoder
Föreläsning 4 Statistiska metoder 1 Dagens föreläsning o Sannolikhet Vad är sannolikhet? o Slumpvariabel o Sannolikhetsfördelningar Binomialfördelning Normalfördelning o Stickprov och population o Centrala
Föreläsning 1: Introduktion. Vad är statistik?
Föreläsning 1: Introduktion Vad är statistik? 1 Statistiska undersökningar Ett gemensamt syfte för alla undersökningar är att få ökad kunskap om ett visst problemområde Det kanske viktigaste sättet att
Föreläsning 1. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 1 Statistik; teori och tillämpning i biologi 1 Kursens uppbyggnad 9 föreläsningar Föreläsningsunderlag läggs ut på kurshemsidan 5 lektioner Uppgifter från kursboken enligt planering 5 laborationer
Tentamen för kursen. Linjära statistiska modeller. 22 augusti
STOCKHOLMS UNIVERSITET MATEMATISK STATISTIK Tentamen för kursen Linjära statistiska modeller 22 augusti 2008 9 14 Examinator: Anders Björkström, tel. 16 45 54, bjorks@math.su.se Återlämning: Rum 312, hus
SF1901: SANNOLIKHETSTEORI OCH STATISTIKTEORI KONSTEN ATT DRA INTERVALLSKATTNING. STATISTIK SLUTSATSER. Tatjana Pavlenko.
SF1901: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 10 STATISTIKTEORI KONSTEN ATT DRA SLUTSATSER. INTERVALLSKATTNING. Tatjana Pavlenko 25 april 2017 PLAN FÖR DAGENS FÖRELÄSNING Statistisk inferens oversikt
Vad är officiell statistik? Föreläsning 2
Vad är officiell statistik? Föreläsning 2 Dan Hedlin Statistiska institutionen Stockholms universitet Inferens Observation/mätning Dan Hedlin, Statistiska institutionen 2 Accuracy of an estimate is achieved
Urvalsmetoder: Stratifierat urval (kap 9.5)
F4 Urvalsmetoder: Stratifierat urval (kap 9.5) Tidigare exempel Vi undersökte tidigare medellönen i ett företag med N = 500 anställda. Vi fick ett konfidensintervall: Vi vet att några förklaringsvariabler
Introduktion. Konfidensintervall. Parade observationer Sammanfattning Minitab. Oberoende stickprov. Konfidensintervall. Minitab
Uppfödning av kyckling och fiskleveroljor Statistiska jämförelser: parvisa observationer och oberoende stickprov Matematik och statistik för biologer, 10 hp Fredrik Jonsson vt 2012 Fiskleverolja tillsätts
F9 Konfidensintervall
1/16 F9 Konfidensintervall Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 18/2 2013 2/16 Kursinformation och repetition Första inlämningsuppgiften rättas nu i veckan. För att
Samplingfördelningar 1
Samplingfördelningar 1 Parametrar och statistikor En parameter är en konstant som karakteriserar en population eller en modell. Exempel: Populationsmedelvärdet Parametern p i binomialfördelningen 2 Vi
Analys av medelvärden. Jenny Selander , plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken
Analys av medelvärden Jenny Selander jenny.selander@ki.se 524 800 29, plan 3, Norrbacka, ingång via den Samhällsmedicinska kliniken Jenny Selander, Kvant. metoder, FHV T1 december 20111 Innehåll Normalfördelningen
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
Systematiskt urval, gruppurval, val mellan metoderna (kap , 9.10)
F5 Systematiskt urval, gruppurval, val mellan metoderna (kap 9.6-9.7, 9.10) Systematiskt urval Antag att vi vill undersöka medellönen i ett företag på N=1000 anställda och vill dra ett urval på n=100.
EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):
Lunds tekniska högskola Matematikcentrum Matematisk statistik FMSF50: Matematisk statistik för L och V OH-bilder på föreläsning 7, 2017-11-20 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIK- TEORIN (INFERENSTEORIN):
Population. Antal tänder. Urval
Population ID Antal tänder 1 12 2 14 3 15 4 28 5 16 6 11 7 24 8 19 9 23 10 21 Urval ID Antal tänder 2 14 4 28 8 19 10 21 Urvalsmetoder Population Urval Urval Urvalsmetoder Definitioner: Populationen består
Extra övningssamling i undersökningsmetodik. till kursen Regressionsanalys och undersökningsmetodik, 15 hp
Extra övningssamling i undersökningsmetodik HT10 till kursen Regressionsanalys och undersökningsmetodik, 15 hp Författad av Karin Dahmström 1. Utgå från en population bestående av 5 personer med följande
Planering av en undersökning Olika datainsamlingsmetoder Olika slag av variabler. Förra gången (F1) Siffror i tabeller och diagram Metoder Begrepp
F2 Planering av en undersökning Olika datainsamlingsmetoder Olika slag av variabler Förra gången (F1) Vad är statistik? Siffror i tabeller och diagram Metoder Begrepp Element, enhet, individ Population
KVALITETSDEKLARATION. IT bland individer. Statistiska Centralbyrån (12) Ämnesområde Levnadsförhållanden
2017-12-06 1 (12) KVALITETSDEKLARATION IT bland individer Ämnesområde Levnadsförhållanden Statistikområde Levnadsförhållanden Produktkod LE0108 Referenstid 2017 2017-12-06 2 (12) Statistikens kvalitet...
Kap 6: Normalfördelningen. Normalfördelningen Normalfördelningen som approximation till binomialfördelningen
Kap 6: Normalfördelningen Normalfördelningen Normalfördelningen som approximation till binomialfördelningen σ μ 1 Sats 6 A Om vi ändrar läge och/eller skala på en normalfördelning så har vi fortfarande
Föreläsning 12: Regression
Föreläsning 12: Regression Matematisk statistik David Bolin Chalmers University of Technology Maj 15, 2014 Binomialfördelningen Låt X Bin(n, p). Vi observerar x och vill ha information om p. p = x/n är
Vi har en ursprungspopulation/-fördelning med medelvärde µ.
P-värde P=probability Sannolikhetsvärde som är resultat av en statistisk test. Anger sannolikheten för att göra den observation vi har gjort eller ett sämre / mer extremt utfall om H 0 är sann. Vi har
Hur gör de egentligen?
Hur gör de egentligen? bra statistik alltså! Vad är statistik? Ordet statistik kan ha olika betydelser. Vanligen menar man sifferuppgifter om förhållandena i samhället. Ursprungligen var det ordagrant
Kvantitativa metoder del 2. Kandidatprogrammet i folkhälsovetenskap, HT -11
Kvantitativa metoder del 2 Kandidatprogrammet i folkhälsovetenskap, HT -11 Disposition Kvantitativa metoder, enkätmetodik, epidemiologi, biostatistik Syfte/målformulering Undersökningsplan Urvalsram/urval
F3 Introduktion Stickprov
Utrotningshotad tandnoting i arktiska vatten Inferens om väntevärde baserat på medelvärde och standardavvikelse Matematik och statistik för biologer, 10 hp Tandnoting är en torskliknande fisk som lever
EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):
Lunds tekniska högskola Matematikcentrum Matematisk statistik Matematisk statistik AK för ekosystemteknik, FMSF75 OH-bilder 2018-09-19 EXEMPEL PÅ FRÅGESTÄLLNINGAR INOM STATISTIKTE- ORIN (INFERENSTEORIN):
Föreläsning 1. 732G60 Statistiska metoder
Föreläsning 1 Statistiska metoder 1 Kursens uppbyggnad o 10 föreläsningar Teori blandas med exempel Läggs ut några dagar innan på kurshemsidan o 5 räknestugor Tillfälle för individuella frågor Viktigt
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06
Föreläsningsmanus i matematisk statistik för lantmätare, vecka 5 HT06 Bengt Ringnér September 20, 2006 Inledning Detta är preliminärt undervisningsmaterial. Synpunkter är välkomna. 2 Väntevärde standardavvikelse
SF1901 Sannolikhetsteori och statistik I
SF1901 Sannolikhetsteori och statistik I Jimmy Olsson Föreläsning 10 27 november 2017 1 / 28 Idag Mer om punktskattningar Minsta-kvadrat-metoden (Kap. 11.6) Intervallskattning (Kap. 12.2) Tillämpning på
F10. Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval
F10 Ytterligare urvalsmetoder och skattningsmetoder (kap 9.8, 9.9) Flerstegsurval Anta att man vill göra ett urval som täcker ett stort geografiskt område vill använda besöksintervju som insamlingsmetod
FÖRELÄSNING 7:
FÖRELÄSNING 7: 2016-05-10 LÄRANDEMÅL Normalfördelningen Standardnormalfördelning Centrala gränsvärdessatsen Konfidensintervall Konfidensnivå Konfidensintervall för väntevärdet då variansen är känd Samla
ESS011: Matematisk statistik och signalbehandling Tid: 14:00-18:00, Datum:
ESS0: Matematisk statistik och signalbehandling Tid: 4:00-8:00, Datum: 20-0-2 Examinatorer: José Sánchez och Bill Karlström Jour: Bill Karlström, tel. 070 624 44 88. José Sánchez, tel. 03 772 53 77. Hjälpmedel:
Sannolikheter och kombinatorik
Sannolikheter och kombinatorik En sannolikhet är ett tal mellan 0 och 1 som anger hur frekvent en händelse sker, där 0 betyder att det aldrig sker och 1 att det alltid sker. När vi talar om sannolikheter
FÖRELÄSNING 8:
FÖRELÄSNING 8: 016-05-17 LÄRANDEMÅL Konfidensintervall för väntevärdet då variansen är okänd T-fördelningen Goodness of fit-test χ -fördelningen Hypotestest Signifikansgrad Samla in data Sammanställ data
Enkätmetodik felkällor. Kandidatprogrammet i folkhälsovetenskap, HT -11
Enkätmetodik felkällor Kandidatprogrammet i folkhälsovetenskap, HT -11 Problemformulering /målsättning Undersökningsplan Urvalsram Mätinstrument Urval Mätning Databehandling Statistisk analys Analys/ utvärdering
Repetitionsföreläsning
Slumpförsök Repetitionsföreläsning Föreläsning 15 Sannolikhet och Statistik 5 hp Med händelser A B... avses delmängder av ett utfallsrum. Slumpförsök = utfallsrummet + ett sannolikhetsmått P. Fredrik Jonsson
Kommun och landsting 2016
SVENSKT KVALITETSINDEX Kommun och landsting 2016 SKL 1 Vid frågor eller för ytterligare information: Johan Parmler 0731-51 75 98 Johan.Parmler@kvalitetsindex.se SVENSKT KVALITETSINDEX 2 Förord Svenskt
IT bland individer 2006
IT bland individer 2006 IT0102 A. Allmänna uppgifter A.1 Ämnesområde Informationsteknik A.2 Statistikområde Användning och tillgång av IT i företag och bland individer A.3 Statistikprodukten ingår ej i
Kvantitativa metoder en introduktion. Mikael Nygård, Åbo Akademi, vt 2018
Kvantitativa metoder en introduktion Mikael Nygård, Åbo Akademi, vt 2018 Vad är kvantitativ metod? Kvantitativa (siffermässiga) analyser av verkligheten: beskrivning och förklaringar av fenomen i fokus!
Föreläsning 2. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 2 Statistik; teori och tillämpning i biologi 1 Normalfördelning Samplingfördelningar och CGS Fördelning för en stickprovsstatistika (t.ex. medelvärde) kallas samplingfördelning. I teorin är
Härledning av Black-Littermans formel mha allmänna linjära modellen
Härledning av Black-Littermans formel mha allmänna linjära modellen Ett sätt att få fram Black-Littermans formel är att formulera problemet att hitta lämpliga justerade avkastningar som ett skattningsproblem
Föreläsning 12: Repetition
Föreläsning 12: Repetition Marina Axelson-Fisk 25 maj, 2016 GRUNDLÄGGANDE SANNOLIKHETSTEORI Grundläggande sannolikhetsteori Utfall = resultatet av ett försök Utfallsrum S = mängden av alla utfall Händelse
Statistikens betydelse och nytta för samhället
Statistikens betydelse och nytta för samhället SCB i Varför är SCB i Almedalen? Utveckla, framställa och sprida statlig statistik Förse våra användare med statistik som underlag för beslutsfattande, debatt
Slumpmässiga resp ickeslumpmässiga. urval. Olika feltyper i en undersökning. Förra gången (F6)
F7 Slumpmässiga resp ickeslumpmässiga urval. Förra gången (F6) Standardiseringsmetoder När vi vill jämföra medelvärden i olika grupper/populationer och standardisera dessa utifrån kända faktorer Standardpopulationsmetoden
Vad tycker de äldre om äldreomsorgen? Metodbeskrivning
Vad tycker de äldre om äldreomsorgen? 2018 Metodbeskrivning Innehåll Metodbeskrivning... 3 Statistikens innehåll... 3 Målpopulation... 3 Rampopulation... 3 Mätinstrumentet... 4 Datainsamling... 5 Insamlingsperiod...
Några begrepp. Vad är statistik? Data. Grundläggande begrepp Olika slag av undersökningar
Några begrepp F1 Grundläggande begrepp Olika slag av undersökningar Element, enhet, individ, unit, object, individual, subject Människor, bilar, företag, olika händelser, Population En mängd av enheter
F14 HYPOTESPRÖVNING (NCT 10.2, , 11.5) Hypotesprövning för en proportion. Med hjälp av data från ett stickprov vill vi pröva
Stat. teori gk, ht 006, JW F14 HYPOTESPRÖVNING (NCT 10., 10.4-10.5, 11.5) Hypotesprövning för en proportion Med hjälp av data från ett stickprov vill vi pröva H 0 : P = P 0 mot någon av H 1 : P P 0 ; H
Tidigare exempel. Några beteckningar. Stratifierat urval
Tidigare exempel F4 Urvalsmetoder: (kap 9.5) Ursprung: Linda Wänström Vi undersökte tidigare medellönen i ett företag med N = 500 anställda. Vi fick ett konfidensintervall: Vi vet att några förklaringsvariabler
Statistiska centralbyråns författningssamling
SCB-FS 2016:17 Utkom från trycket den 28 september 2016 Statistiska centralbyråns föreskrifter om kvalitet för den officiella statistiken; beslutade den 14 juni 2016. Statistiska centralbyrån (SCB) föreskriver
TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder
TAMS65 - Föreläsning 2 Parameterskattningar - olika metoder Martin Singull Matematisk statistik Matematiska institutionen Innehåll Fö2 Punktskattningar Egenskaper Väntevärdesriktig Effektiv Konsistent
TMS136. Föreläsning 10
TMS136 Föreläsning 10 Intervallskattningar Vi har sett att vi givet ett stickprov kan göra punktskattningar för fördelnings-/populationsparametrar En punkskattning är som vi minns ett tal som är en (förhoppningsvis
IT bland individer 2005
IT bland individer 2005 IT0102 A. Allmänna uppgifter A.1 Ämnesområde Informationsteknik A.2 Statistikområde Användning och tillgång av IT i företag och bland individer A.3 Statistikprodukten ingår ej i
Konsten att fånga, sammanfatta och tolka resultat och mätningar. Marie Lindkvist Epidemiologi och global hälsa
Konsten att fånga, sammanfatta och tolka resultat och mätningar Marie Lindkvist Epidemiologi och global hälsa Vetenskap Vad är vetenskap? Systematisk kunskap Vad är skillnaden mellan vardaglig kunskap
Föreläsning 4. NDAB01 Statistik; teori och tillämpning i biologi
Föreläsning 4 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Icke-parametriska test Mann-Whitneys test (kap 8.10 8.11) Wilcoxons test (kap 9.5) o Transformationer (kap 13) o Ev. Andelar
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik Chalmers University of Technology April 27, 2015 Tvådimensionella fördelningar Definition En två dimensionell slumpvariabel (X, Y ) tillordnar två numeriska
Föreläsning 5. Kapitel 6, sid Inferens om en population
Föreläsning 5 Kapitel 6, sid 153-185 Inferens om en population 2 Agenda Statistisk inferens om populationsmedelvärde Statistisk inferens om populationsandel Punktskattning Konfidensintervall Hypotesprövning
SF1922/SF1923: SANNOLIKHETSTEORI OCH INTERVALLSKATTNING. STATISTIK. Tatjana Pavlenko. 24 april 2018
SF1922/SF1923: SANNOLIKHETSTEORI OCH STATISTIK FÖRELÄSNING 11 INTERVALLSKATTNING. Tatjana Pavlenko 24 april 2018 PLAN FÖR DAGENS FÖRELÄSNING Vad är en intervallskattning? (rep.) Den allmänna metoden för
Hushållens icke-vinstdrivande organisationer 2005
STATISTISKA CENTRALBYRÅN 1(8) Hushållens icke-vinstdrivande organisationer 2005 1 Inledning Emma-projektet, eller paraplyprojektet för förbättring av den ekonomiska statistiken, omfattar i huvudsak förbättringsförslagen
F22, Icke-parametriska metoder.
Icke-parametriska metoder F22, Icke-parametriska metoder. Christian Tallberg Statistiska institutionen Stockholms universitet Tidigare när vi utfört inferens, dvs utifrån stickprov gjort konfidensintervall
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Grunderna i sannolikhetslära 2 Innehåll 1 Grunderna i sannolikhetslära 2 Satistik och sannolikhetslära Statistik handlar om att utvinna information från data. I praktiken inhehåller de data
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar
Matematisk statistik 9 hp, HT-16 Föreläsning 10: Punktskattningar Anna Lindgren (Stanislav Volkov) 31 oktober + 1 november 2016 Anna Lindgren anna@maths.lth.se FMS012/MASB03 F10: Punktskattning 1/18 Matematisk
Grundläggande matematisk statistik
Grundläggande matematisk statistik Kontinuerliga fördelningar Uwe Menzel, 8 www.matstat.de Begrepp fördelning Hur beter sig en variabel slumpmässigt? En slumpvariabel (s.v.) har en viss fördelning, d.v.s.
Vad är officiell statistik? Föreläsning 1
Vad är officiell statistik? Föreläsning 1 Dan Hedlin Statistiska institutionen Stockholms universitet -Dilbert, I want you to audit the software we have on our systems. - Why? - So we know what we have.
Föreläsning 3. NDAB02 Statistik; teori och tillämpning i biologi
Föreläsning 3 Statistik; teori och tillämpning i biologi 1 Dagens föreläsning o Inferens om två populationer (kap 8.1 8.) o Parvisa observationer (kap 9.1 9.) o p-värde (kap 6.3) o Feltyper, styrka, stickprovsstorlek
Bilaga 2: Teknisk beskrivning av ULF. Bilaga 2: Teknisk beskrivning av ULF 225
Bilaga 2: Teknisk beskrivning av ULF 225 Bilaga 2: Teknisk beskrivning av ULF 1 Inledning I denna bilaga ges en kortfattad beskrivning av undersökningens uppläggning. En mera utförlig redogörelse för tillvägagångssättet
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2019-06-07 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson Jourhavande
Laboration 3: Urval och skattningar
S0004M Statistik 1 Undersökningsmetodik. Laboration 3: Urval och skattningar Denna laboration handlar om slumpmässiga urval. Dessa urval ska användas för att uppskatta egenskaper hos en population. Statistiska
Föreläsning 5: Att generalisera
Föreläsning 5: Att generalisera Pär Nyman par.nyman@statsvet.uu.se 4 september 2015-1 - Generaliseringar Generalisering innebär att vi drar slutsatser om någonting annat än det vi har studerat. Vi använder
Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle
Tentamen Statistik och dataanalys 1, 5p Institutionen för matematik, natur- och datavetenskap, Högskolan i Gävle Lärare: Mikael Elenius, 2006-08-25, kl:9-14 Betygsgränser: 65 poäng Väl Godkänt, 50 poäng
PROGRAMFÖRKLARING I. Statistik för modellval och prediktion. Ett exempel: vågriktning och våghöjd
Statistik för modellval och prediktion att beskriva, förklara och förutsäga Georg Lindgren PROGRAMFÖRKLARING I Matematisk statistik, Lunds universitet stik för modellval och prediktion p.1/4 Statistik
TENTAMEN I STATISTIKENS GRUNDER 2
STOCKHOLMS UNIVERSITET Statistiska institutionen Michael Carlson HT2012 TENTAMEN I STATISTIKENS GRUNDER 2 2012-11-01 Skrivtid: kl 9.00-14.00 Godkända hjälpmedel: Miniräknare, språklexikon Bifogade hjälpmedel:
Tentamen i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder.
Tentamen 2014-12-05 i statistik (delkurs C) på kursen MAR103: Marina Undersökningar - redskap och metoder. Tillåtna hjälpmedel: Miniräknare och utdelad formelsamling med tabeller. C1. (6 poäng) Ange för
Tentamen i Matematisk statistik Kurskod S0001M
Tentamen i Matematisk statistik Kurskod S0001M Poäng totalt för del 1: 25 (10 uppgifter) Tentamensdatum 2019-01-18 Poäng totalt för del 2: 30 (3 uppgifter) Skrivtid 9.00 14.00 Lärare: Adam Jonsson, Mykola
STATISTIKENS FRAMSTÄLLNING
Statistikens framställning version 1 1 (8) STATISTIKENS FRAMSTÄLLNING Hushållens boende Ämnesområde Hushållens ekonomi Statistikområde Inkomster och inkomstfördelning Produktkod HE0111 Referenstid 31 december
Matematisk statistik för B, K, N, BME och Kemister
Matematisk statistik för B, K, N, BME och Kemister Föreläsning 5 Johan Lindström 12 september 216 Johan Lindström - johanl@maths.lth.se FMS86/MASB2 F5 1/23 Repetition Gauss approximation Delta metoden
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar
Föreläsning 8, Matematisk statistik 7.5 hp för E Punktskattningar Stas Volkov Stanislav Volkov s.volkov@maths.lth.se FMSF20 F8: Statistikteori 1/20 Översikt Exempel Repetition Exempel Matematisk statistik
Föreläsning 7: Punktskattningar
Föreläsning 7: Punktskattningar Matematisk statistik David Bolin Chalmers University of Technology April 7, 2014 Projektuppgift Projektet går ut på att genomföra ett statistiskt försök och analysera resultaten.
Mer om konfidensintervall + repetition
1/14 Mer om konfidensintervall + repetition Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 23/2 2011 2/14 Dagens föreläsning Skattningar som slumpvariabler Väntevärde Varians