Respondent-driven sampling med viktade vänskapsband - en simuleringsstudie
|
|
- Karolina Dahlberg
- för 6 år sedan
- Visningar:
Transkript
1 Respondent-driven sampling med viktade vänskapsband - en simuleringsstudie Tuure Antonangeli Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics
2 Kandidatuppsats 2013:5 Matematisk statistik Juni Matematisk statistik Matematiska institutionen Stockholms universitet Stockholm Matematiska institutionen
3 Å Ø Ñ Ø Ø Ø Ø ËØÓ ÓÐÑ ÙÒ Ú Ö Ø Ø Ã Ò ØÙÔÔ Ø ¾¼½ ØØÔ»»ÛÛÛºÑ Ø º Ùº»Ñ Ø Ø Ø Ê ÔÓÒ ÒØ¹ Ö Ú Ò ÑÔÐ Ò Ñ Ú Ø ÚÒ Ô Ò ¹ Ò ÑÙÐ Ö Ò ØÙ ÌÙÙÖ ÒØÓÒ Ò Ð ÂÙÒ ¾¼½ Ë ÑÑ Ò ØØÒ Ò Ò Ñ ØÓ Ö ØØ Ö ÙÖÚ Ð ÖÒ ÔÓÔÙÐ Ø ÓÒ Ö ÓÑ Ò Ö ÙÖÚ Ð ¹ Ö Ñ Ö Ò ÓÐÐ ÙÖÚ Ðº Å ØÓ Ò Ö ÙØ Ô ØØ ÐØ Ö Ö ÖÝØ Ö Ö Ò¹ Ú Ö ÖÒ ØØ Ó Ð ÒØÚ Ö Ö ØØ ØØ ÒÝ Ò Ú Ö ÑÐ ÖÙÔ¹ Ô Ò Ó Ò ÔÔÐ Ö ÖÑ Ø Ô ÔÓÔÙÐ Ø ÓÒ Ö ÓÑ Ö ÚÖ ØØ Ò ÒÓÑ ØÖ Ø ÓÒ ÐÐ ÙÖÚ Ð Ñ ØÓ Öº Ø Ò Ó ÐÐÑÒØ Ú Ö Ñ Ð Ø ØØ ØØ Ò Ö Ö ÚÒØ ÚÖ Ö Ø ØØÒ Ò Ö ÖÒ ØØ Ø ¹ ÔÖÓÚ Ø Ø Ñ Ò ÓÐÐ ÙÖÚ Ð Ú Ð Ø Ü ÑÔ ÐÚ ÖÓÖ Ô ØØ Ò Ú Ö Ñ ØÓÖ Ó Ð Ö Ø Ð Ö Ú ÖÖ ÔÖ ÒØ Ö ØØ ÒØ Ø ÔÖÓÚº Ê ÔÓÒ ÒØ¹ Ö Ú Ò ÑÔÐ Ò Ê Ë Ö Ò ÙØÚ Ò Ò Ú Ò ÓÐÐ ÙÖ¹ Ú Ð ÓÑ ÓÑ Ò Ö Ö Ò Ø Ú Ö Ó Ö ÙÔ ÑÔÐ Ò Ñ ØÓ¹ Ñ Ò Ñ Ø Ñ Ø ÑÓ ÐÐ ÓÑ ÒÓÑ ØØ ÒØ Ð ÒØ Ò Ò ÓÑ ÑÔÐ Ò ÔÖÓ Ò Ñ Ð Ö ÚÒØ ÚÖ Ö Ø ØØÒ Ò Ö Ú ÔÓÔÙ¹ Ð Ø ÓÒ Ò Ô Öº ØØ Ú ÒØ Ò Ò ÓÑ Ö Ö ØØ Ò ÐØ Ö ØÙ Ò Ö ÖÝØ Ö Ö Ò ÒØ ÔÓÔÙÐ Ø ÓÒ Ò Ñ Ð ØÓÖ ÒÒÓ¹ Ð Ø Ú Ð Ø ÒØ Ö ØÖÓÐ Ø Ø ÙÒ Ö Ò Ò Öº Ú Ø Ò Ñ ÒÒ ØÙ Ö ØØ ÙÒ Ö ÙÖ Ê Ë¹ ØØÒ Ò ÖÒ ÔÚ Ö ÓÑ Ò ÐØ Ö Ö Ö ÖÝØ Ö Ò ÒØ Ñ ÓÐ ØÓÖ ÒÒÓÐ Ø Ø Ú ÐÐ ÓÑ Ñ Ò Ø ÐÐØ Ö Ö Ð Ø ÓÒ Ö Ö ÒØ Ö Ú Ø Öº ËØÙ Ò ÙØ¹ Ö ÒÓÑ ØÓÖ ÑÙÐ Ö Ò Ö Ö Ú ÙÒ Ö Ö Ò Ð Ò ÀÁιÔÓ Ø Ú Ò Ø Ú ÔÓÔÙÐ Ø ÓÒ ÓÑ Ò Ö ÙÖÚ Ð Ö Ñ Ó Ö ØØ Ó ÐØ ÒØ¹ Ú Ö Ñ Ú Ø ÒØ Öº Ê ÙÐØ Ø Ò ØÝ Ö Ô ØØ Ê Ë¹ ØØÒ Ò ÖÒ Ú Ö ØØ Ö Ò Ð Ò ÀÁιÔÓ Ø Ú ÚÒ Ô Ò Ò Ö Ú Ø Ó ÒÒÓÐ Ø Ò ØØ Ú Ö ÀÁιÔÓ Ø Ú ÖÓÖ Ô ÙÑÑ Ò Ú Ú Ø ÖÒ Ô Ò Ó Ð ÓÒØ Ø Öº ÇÑ ÒÒÓÐ Ø Ò ØØ Ú Ö ÀÁιÔÓ Ø Ú Ö ¹ ÑÓØ ÖÓÖ Ô ÒØ Ð Ø ÓÒØ Ø Ö Ò Ñ Ò ÒØ Ó ÖÚ Ö Ò Ö Ø ÖÖ ÚÚ Ð Ö Ê Ë¹ ØØÒ Ò ÖÒ Ñ ÖØ Ñ Ø ÓÚ Ø ÐРغ ÈÓ Ø Ö Å Ø Ñ Ø Ø Ø Ø ËØÓ ÓÐÑ ÙÒ Ú Ö Ø Ø ½¼ ½ ËÚ Ö º ¹ÔÓ Ø ØÙÙÖ º ÒØÓÒ Ò Ð ÓØÑ ÐºÓѺ À Ò Ð Ö Â Ò Å ÐÑÖÓ º
4 Abstract Snowball sampling is a method for collecting samples from a population that lacks a sampling frame, where in order to find new individuals in the targetgroup, participants recruite people into the study from their own social network. The method is mainly used for populations that are hard to reach with traditional sampling methods. It is however considererd impossible to generate unbiased estimates from samples obtained by snowball sampling, e.g. because individuals with a large number of people in their social network are overrepresented in the study. Respondent-Driven Sampling, RDS, is an extension of snowball sampling which combines a more efficient and advanced sampling methodology with a mathematical model, which through some assumptions about the sampling process can produce unbiased population estimates. One of the assumpions is that a participant recruits randomly from his peers in the population. This assumption is, however, implausible. The purpose of this study is to investigate how the RDS estimates are affected if a participant recruits from the social network with unequal probabilities, i.e. if the relationships have different weights. The study is performed through computer simulation where we estimate the proportion that is HIV-positive in a fictitious population that lacks a sampling frame and has a social network with weighted edges. The results imply that RDS overestimates the proportion of HIV-positive individuals in the case where the relationships are weighted and the probability of being HIV-positive depends on the sum of the weights of the individuals social contacts. On the other hand, if the probability of being HIV-positive depends on the number of contacts, no notable difference can be observed in the RDS estimates when compared with the unweighted case.
5 Förord Denna uppsats utgör ett självständigt arbete i matematisk statistik om 15hp. Ett stort tack riktas till min handledare Jens Malmros och alla mina vänner på matematiska institutionen för värdefull hjälp och goda råd.
6 Innehåll 1 Introduktion Bakgrund Respondent driven sampling RDS Teori Något om grafer och deras relation till RDS-studier Något om Markovkedjor i diskret tid RDS-process som en Markovkedja i diskret tid Härledning av RDS-skattaren Syfte 9 4 Metod Generering av nätverket Allokering av HIV-status Allokering proportionellt mot grad Allokering proportionellt mot styrka Slumpvandringen och RDS-skattningen Modeller och resultat Modell Modell Modell Modell Modell Modell Slutsatser 26 7 Diskussion 26 A Låddiagram 29 A.1 Modell A.2 Modell A.3 Modell A.4 Modell A.5 Modell A.6 Modell B Fördelningar 35
7 1 Introduktion 1.1 Bakgrund Ett vanligt sätt att skatta egenskaper hos en stor population är genom att undersöka ett slumpmässigt urval av enheter. Slumpmässiga urval kräver dock en urvalsram uppgifter om mängden enheter från vilka man drar urvalet. Detta innebär i praktiken en lista över de enheter som man vill undersöka, som innehåller all nödvändig information om målpopulationen som behövs för att kunna utföra urvalet korrekt samt skatta egenskaperna man är ute efter [7]. Exempel på sådan information är bland annat storleken hos populationen och kontaktuppgifter [7]. Det finns målpopulationer som inte går att undersöka med hjälp av traditionella slumpmässiga urval, eftersom en lämplig urvalsram saknas. Dessa målgrupper kallas för dolda populationer (eng. hidden populations) [4]. Dolda populationer är ofta utsatta delar av samhället såsom prostituerade, drogmissbrukare eller hemlösa, på vilka traditionella undersökningsmetoder (exempelvis telefon- eller enkätundersökningar) inte kan appliceras. Ytterligare problematik skapas ofta av att individerna i målgruppen är motvilliga att samarbeta på grund av att deras beteende är juridiskt och/eller socialt oacceptabelt [4]. En av metoderna som tidigare användes för att undersöka dolda populationer är snöbollsurval (eng. snowball sampling, chain-referral sampling), där individerna som som deltar i undersökningen refererar vidare i sitt sociala nätverk för att hitta nya personer som tillhör målgruppen [4]. Med andra ord, en individ som deltar i undersökningen rekryterar ett antal vänner eller bekanta för att medverka i undersökningen. Metoden utvecklades från 1940-talet och framåt och ansågs länge vara den bästa tekniken för att utforska dolda populationer [4] [3]. Urvalet av individerna i en snöbollsurval sker dock inte slumpmässigt, och den traditionella snöbollssamplingsmetoden leder till väldokumenterade systematiska avvikelser [4]. Källor till systematiska avvikelser är till exempel att människor tenderar att rekrytera andra som tillhör samma etnicitet, inkomstgrupp eller dylikt [9]. Som ett illustrerande exempel kan man betrakta fallet där man vill undersöka andelen HIV-positiva bland sprutmissbrukande kvinnor. Om en deltagare förutom att vara en sprutmissbrukande kvinna, också är prostituerad, kan det befaras att personen väljer att rekrytera andra kvinnor som är både sprutmissbrukare och prostituerade. Tendensen att deltagarna väljer kvinnor som också är prostituerade kan göra att det skapas systematiska fel som man inte har kontroll över. Ett annat problem med snöbollsurvalsbaserade undersökningar är att sannolikheten att en individ ur populationen deltar i urvalet är beroende av antalet individer som man har i sitt sociala krets [4]. Människor med en omfattande social krets är överrepresenterade i urvalet, eftersom det finns flera möjliga vägar att nå en sådan individ [4]. Ifall även egenskapen som undersöks beror på storleken på den sociala kretsen blir resultatet ej väntevärdesriktigt. Ett exempel där storleken på den sociala kretsen kan påverka resultaten är om man vill skatta andelen HIV-positiva bland sprutmissbrukare: Man kan förmoda att det är 1
8 mer sannolikt att en individ är HIV-positiv om individen har många sprutmissbrukande vänner, eftersom sprutmissbrukare har benägenhet att dela använda sprutor med varandra. 1.2 Respondent driven sampling RDS Undersökningar baserade på snöbollsurval ger alltså i allmänhet systematiska fel i de alstrade skattningarna [4]. Det finns dock en variant av snöbollsurval, Respondent-driven sampling, där man med ett antal antaganden skapar en matematisk modell av händelseförloppet och på så sätt genererar väntevärdesriktiga estimatorer för egenskaperna hos populationen. Respondent driven sampling är en teknik som utvecklades av Douglas Heckathorn 1997 i samband med en forskningsprojekt om HIV-spridning bland drogmissbrukare [9]. Metoden använder sig bland annat av teorin för Markovkedjor, och det har visats att RDS-baserade skattningar minskar de systematiska avvikelserna jämfört med skattningar som baseras på traditionell snöbollsurval [4]. Såsom snöbollsurvalsmetoden är RDS ett effektivt sätt att penetrera populationer som i allmänhet är svåra för en forskare att nå. Samplingsprocessen startar med ett eller flera frö [4]. Frön är de första deltagarna i undersökningen som vanligen inte bestäms slumpmässigt, utan är i praktiken lättillgängliga personer som man vet tillhör målgruppen [4]. Ett frö kan således kontaktas till exempel på ett stödcenter, vårdcentral eller i fallet sprutmissbrukare, på en sprutbytescentral. Fröet tilldelas efter intervjun ett bestämt antal kuponger som han eller hon skall utdela till sina bekanta som också tillhör målgruppen. De personer som tilldelats en kupong får möjligheten att bli intervjuade mot en belöning, som ges även till kupongutdelaren. Efter intervjun tilldelas de intervjuade individerna nya kuponger och upprepar rekryteringsprocessen bland sina bekanta i populationen. Antalet kuponger som en deltagare ges för att sedan dela ut är alltid begränsat [4]. Viktiga skillnader mellan vanligt snöbollsurval och Respondent-driven sampling är: 1. RDS motiverar en deltagare att rekrytera nya individer till studien genom att erbjuda ytterligare en belöning när dessa deltar i studien [4]. 2. En deltagare behöver inte namnge de individer som skall rekryteras en viktig egenskap när man undersöker människor som av diverse anledningar vill förbli anonyma [4]. 3. Kupongerna som delas ut vid intervjutillfället har ett specifikt serienummer för att övervaka vem som har rekryterat vem. Antalet kuponger är också alltid begränsat. På så sätt är det möjligt att erhålla en helhetsbild över rekryteringsprocessen [8]. 2 Teori Innan studien kan fortsätta vidare tar vi upp bakgrund om grafteori samt något om Markovkedjor i diskret tid, samt hur dessa är relaterade till rekryterings- 2
9 processen. I detta Avsnitt härleds även formeln för RDS-skattningen som är relevant för denna studie. 2.1 Något om grafer och deras relation till RDS-studier I detta Avsnitt kommer vi att gå igenom de nödvändiga begreppen inom grafteorin som behövs för denna studie. För en mera omfattande introduktion till grafteorin hänvisas till boken Discrete and Combinatorial Mathematics av Ralph P. Grimaldi, Avsnitt 11. Definition 2.1. Graf: Låt V = {v 1, v 2,...} vara en ändlig och icke-tom mängd, och låt E V V. Paret (V, E) kallas en graf på V, där V är mängden noder (eng. vertices) och E = {e 1, e 2,...} är dess mängd riktade eller oriktade kanter (eng. edges). En sådan graf betecknas G = (V, E). [1] En graf är således en mängd punkter noder som kan bindas samman med riktade eller oriktade linjer kanter, se Figur 1. Om u, v V och kanten mellan noderna u och v är riktad från u till v, innebär det att man kan gå från u till v men inte från v till u. Ett enkelt exempel är att noderna representerar städer, och kanterna motsvarar ett nätverk av vägar mellan städerna [1]. Om kanterna är riktade kan man tänka sig att vägen mellan två städer är enkelriktad. I denna studie kommer vi inte att betrakta grafer som innehåller så kallade loopar (eng. loops), som är kanter som leder tillbaka till samma nod [1]. Till varje kant e i i en graf kan tilldelas ett positivt reellt tal som kallas för vikten för kanten och i denna studie benämns som v(e i ). Ifall en graf har egenskapen att den innehåller viktade kanter, kallas grafen för en viktad graf (eng. weighted graph). [1] Ett socialt nätverk kan beskrivas som en graf där noderna i grafen representerar individerna i det sociala nätverket. Om det finns en kant mellan noderna, förekommer det någon form av relation mellan dessa individer. En relation innebär bekantskap, vänskap, sexuell kontakt eller dylikt. I denna studie innebär en kant mellan två personer att det finns möjlighet till rekrytering. (a) Oriktad graf (b) Riktad graf Figur 1: En illustration av en graf med fyra noder, riktad och oriktad version. Hämtad från %28matematyka%
10 Definition 2.2. Grad: Låt G vara en oriktad graf. För alla noder v i G definieras graden av v som antalet kanter som leder till v. [1] Med andra ord, graden för nod v är antalet noder som kan nås genom att endast åka längs en kant, se Figur 2. I en RDS-studie motsvarar graden för en person det teoretiska antalet individer som personen kan rekrytera [8]. En deltagare anger sin grad vid intervjutillfället. Figur 2: Illustration av noder med grad 0-4. Figuren hämtad från [5]. 2.2 Något om Markovkedjor i diskret tid I detta delavsnitt utgår vi från boken Introduction to Probability Models, 9 th edition av Sheldon M. Ross. Låt {X n ; n = 0, 1, 2,...} vara en sekvens av stokastiska variabler som tar värden i en uppräknelig mängd S. Om sägs {X n ; P (X n+1 = j X n = i, X n 1 = i n 1,..., X 1 = i 1, X 0 = i 0 ) = P (X n+1 = j X n = i) = P ij [0, 1] n = 0, 1, 2,...} vara en Markovkedja. Om Markovkedjan befinner sig i tillstånd i, finns det en given sannolikhet P ij för övergång till tillstånd j; i, j S. En viktig egenskap hos Markovkedjor är att sannolikhetsfördelningen för X n+1 endast beror på det nuvarande tillståndet X n, och är oberoende av vilka tillstånd som besökts innan, det vill säga oberoende av X n 1, X n 2,..., X 1, X 0. Ett vanligt sätt att illustrera Markovkedjor är riktade grafer (Figur 1b), där noderna representerar tillstånden som Markovkedjan kan befinna sig i. Om det finns en pil från tillstånd i till tillstånd j, innebär det att en sådan övergång är möjlig med sannolikhet P ij. Om P ij är 0 är övergången ej möjlig och ingen pil ritas mellan tillstånden. Övergångssannolikheterna för en Markovkedja brukar beskrivas med hjälp av en så kallad övergångsmatris P som består av elementen P ij, så för S N och i, j = 0, 1, 2,... har vi 4
11 P 00 P 01 P 0j P 10 P 11 P 1j P = P i0 P i1 P ij Notera att en övergång alltid måste ske i varje tidssteg, även om övergången sker tillbaka till samma tillstånd, och att elementena i varje rad i P summeras till 1. Exempel 2.1. Låt oss exempelvis betrakta övergångsmatrisen för den oriktade grafen i Figur 1a, och antag att sannolikheten för en övergång till ett annat tillstånd är lika stor för alla möjliga övergångar. Då gäller att P = Exempel 2.2. Låt oss istället betrakta övergångsmatrisen för den riktade grafen i Figur 1b, och antag att sannolikheten för en övergång till ett annat tillstånd är lika stor för alla möjliga övergångar. Då gäller att P = Antag nu att systemet befinner sig i tillstånd i. Om det är möjligt att nå tillstånd j i n N steg, sägs tillstånd j vara accessibelt (eng. accessible) från tillstånd i och vi skriver i j. Om i j och i j sägs det att tillstånden kommunicerar och vi skriver i j. Denna relation är en ekvivalensrelation och alltså har följande egenskaper: tillstånd i kommunicerar med tillstånd i om tillstånd i kommunicerar med tillstånd j, så kommunicerar tillstånd j med tillstånd i Om tillstånd i kommunicerar med tillstånd j och tillstånd j kommunicerar med tillstånd k, så kommunicerar tillstånd i med tillstånd k. Tillstånd som kommunicerar med varandra sägs tillhöra samma klass. Till exempel har Markovkedjan som illustreras i Figur 1b klasserna {1},{2} och {3, 4}. Om det endast finns en klass, sägs Markovkedjan vara irreducibel. För godtyckligt tillstånd i, låter vi f i vara sannolikheten att återvända till tillstånd i givet att vi startar processen i tillstånd i. Om f i = 1 sägs tillstånd i 5
12 vara rekurrent. Ifall f i < 1 sägs tillstånd i vara transient. Tillstånd i sägs ha perioden d om sannolikheten att återkomma till tillstånd i i n steg är noll, om n inte är delbart med d, och d är det minsta heltalet med denna egenskap. Om tillstånd i har perioden 1, sägs tillståndet vara aperiodiskt. Markovkedjor med ändligt många tillstånd, som är irreducibla och där alla tillstånden är aperiodiska är ergodiska. Sådana markovkedjor är av intresse i denna studie eftersom det för en irreducibel och ergodisk Markovkedja med N < tillstånd existerar en unik asymptotisk fördelningsvektor π = (π 1, π 2,..., π N ). Med andra ord, om vi låter Markovkedjan pågå tillräckligt länge, konvergerar den genomsnittliga andelen tid som vi tillbringar i tillstånd i mot π i. 2.3 RDS-process som en Markovkedja i diskret tid Vi fortsätter med att beskriva den bakomliggande teorin som möjliggör RDSskattningarna. Följande antaganden måste vara uppfyllda för RDS-baserade studier [8]: 1. Reciprocitet Reciprocitet innebär att ett eventuellt förhållande mellan två personer är ömsesidig; om individ A anser att individ B är dess vän, så anser individ B att individ A är dess vän. En eventuell rekrytering kan alltså ske åt båda hållen. I grafteoretiska termer innebär detta att det sociala nätverket beskrivs av oriktade kanter En individ korrekt anger sin grad i nätverket. Detta är av stor vikt eftersom den genomsnittliga graden hos en population U, och den genomsnittliga graden hos en delpopulation A U kommer att vara nödvändiga för att göra en RDS-skattning av andelen av befolkningen som tillhör typ A. 3. När en deltagare rekryterar en annan individ har alla närliggande noder samma sannolikhet att bli rekryterade. Med andra ord, om graden för person A är n, är sannolikheten att rekrytera person B (som A har en relation till) lika med 1/n. För att förenkla modelleringen i denna studie antas även att processen startar med endast ett frö, samt att data som undersöks är av binär karaktär (Ja, Nej), (+,-), (0,1). Dessutom antar vi att en deltagare endast får en kupong vid intervjutillfället. Detta innebär att en individ endast kan rekrytera en person i det sociala nätverket som han eller hon har någon form av förhållande till. Dessa antaganden är dock inga krav för att RDS generellt skall fungera. Det faktum att en individ endast kan rekrytera en annan individ gör att rekryteringsprocessen enkelt kan beskrivas som en slumpvandring på det sociala nätverket. Slumpvandringen modelleras bäst med en Markovkedja i diskret tid med tillståndsrum {1, 2, 3,...}, där tillståndet som Markovkedjan befinner sig i motsvarar en individ som blir intervjuad i studien. Om det finns en kant 1 RDS på delvis riktade nätverk kan studeras i [5]. 6
13 mellan två individer, innebär det att en övergång mellan dessa två tillstånd kan ske. Om antalet individer i hela målpopulationen är N, har Markovkedjan således en motsvarande övergångsmatris av dimension N N. De tillstånd som Markovkedjan besöker utgör urvalet av individer. Övergångsmatrisen för slumpvandringen antas vara irreducibel, det vill säga ifall vi startar från ett givet tillstånd, kan alla andra tillstånd nås efter ett ändligt antal övergångar. Notera att en individ enligt modellen kan rekryteras mer än en gång. Trots detta antas (givetvis) att en individ inte rekryterar sig själv, vilket innebär att diagonalelementena i övergångsmatrisen är noll. I praktiken betyder irreducibiliteten att givet ett godtyckligt frö, sträcker sig det sociala nätverket över hela målpopulationen. Detta är naturligtvis ett idealiserat scenario, men faktum är att felen som uppstår med detta antagande visar sig vara små [8]. Inom nätverksteorin är det känt att de flesta nätverk innehar en sammanhängande delmängd noder som kallas för den stora komponenten (eng. giant component) [8]. Ifall den genomsnittliga graden för noderna är 5, så visar det sig att den stora komponenten utgör 99% av hela populationen [8]. Alltså kommer endast isolerade noder eller små grupperingar hamna utanför komponenten [5]. För att minimera risken att hamna utanför den stora komponenten då begynnelsedeltagaren väljs, kommer vi i denna studie endast betrakta fall där den genomsnittliga graden för noderna är 10 eller större. Eftersom processen beskrivs av en ergodisk Markovkedja vet vi att det finns en unik asymptotisk fördelning för tillstånden [6]. Detta medför att efter att processen har fortgått under en tillräckligt lång tid så kan vi räkna ut sannolikheterna att befinna oss i vart och ett av tillstånden, oberoende av begynnelsetillståndet (fröet). Alltså finns det en konvergens i förloppet. 2.4 Härledning av RDS-skattaren I detta delavsnitt utgår vi från artikeln Probability Based Estimation Theory for Respondent Driven Sampling, (2008) av Erik Volz och Douglas D. Heckathorn. Därför anses det lämpligt att införa liknande beteckningar som i denna artikel. Notationen finns listad i Tabell 1. Tabell 1: Notation som används i Avsnitt 2.4 U är mängden av alla individer i populationen S är mängden av alla individer i urvalet A, B,... är disjunkta mängder av individer N är antalet individer i populationen n är antalet individer i urvalet P A, P B,... är andelen av populationen som tillhör A, B,... σ AB är den skattade sannolikheten att en individ i A rekryterar någon i B δ i är graden hos individ i δ X är den genomsnittliga graden hos individerna i en mängd X Låt oss ha ett socialt nätverk där antalet individer är N. Om det finns en 7
14 kant mellan noderna i och j; i, j = 1,..., N, och δ i är graden hos individ i så är övergångssannolikheten från nod i till nod j lika med 1/δ i. Denna övergångssannolikhet betecknas σ ij. Låt σ vara övergångsmatrisen. Matrisen σ kommer alltså att vara en matris av storlek N N med σ ij = 0 om en övergång inte är möjlig och σ ij = 1/δ i om en övergång är möjlig. Det är möjligt att härleda att vektorn x, där elementena x i = δ i N j=1 δ, (1) j är den asymptotiska fördelningsvektorn för tillstånden [8]. Ekvation (1) kan skrivas om för att beräkna sannolikheten p i att en specifik individ i i det sociala nätverket blir utvald för intervju: som skattas med δ i p i = N δ U δ i ˆp i = N ˆδ U där ˆδ U är den skattade genomsnittliga graden i det sociala nätverket. Den skattas med en så kallad Hansen & Hurwitz estimator standardestimator i fallet slumpmässigt urval med återläggning från en population där enheterna har olika sannolikheter att bli utvalda: ˆδ U = S δ i/np i S 1/np i = n S δ 1 i. (2) Eftersom vi i denna studie begränsar oss till binära utfall, kan vi dela upp målgruppen i två delmängder; typ A och typ B. Typ A och typ B kan exempelvis betyda HIV-positiv respektive HIV-negativ. Om vi vill skatta den genomsnittliga graden hos en delmängd A U kan man använda Ekvation (2) direkt, så att ˆδ A = n A A S δ 1 i där A S är mängden individer i urvalet som tillhör typ A och n A är antalet individer i urvalet som tillhör typ A. Låt nu y i vara en egenskap hos individ i som man är intresserad av att undersöka, och låt T y vara det totala värdet av y i hela populationen U, det vill säga T y = U y i. Även T y kan skattas med en Hansen & Hurwitz estimator, så att ˆT y = 1 n S y i = 1 ˆδ U N ˆp i n δ i S = ˆδ U N n S δ 1 i y i. (3) Vi ser att Ekvation (3) innehåller N storleken på målgruppen. Denna storhet antas dock vara okänd eftersom vi har med dolda populationer att göra. Om vi däremot vill skatta medelvärdet av y i populationen faller N bort från Ekvation (3), eftersom medelvärdet av y beräknas som Ty N totala värdet av y delat med storleken på populationen. Alltså 8
15 ˆȳ = ˆδ U n S δ 1 i y i = S δ 1 i y i S δ 1 i där vi i den andra olikheten har utnyttjat Ekvation (2). Låt nu y vara en binär variabel som beskrivs av indikatorfunktionen { 1 om individ i tillhör grupp A, y i = 0 om individ i inte tillhör grupp A. Därmed kan vi göra omskrivningen δ 1 i y i = δ 1 i. S A S Låt P A vara andelen av målgruppen som tillhör typ A. En väntevärdesriktig skattning ˆP A ges således av 3 Syfte ˆP A = A S δ 1 i. (4) S δ 1 i I början av Avsnitt 2.3 presenterades 3 villkor som måste uppfyllas för att RDS skall kunna generera väntevärdesriktiga skattningar. Syftet med denna studie är att med hjälp av datorsimuleringar undersöka hur RDS-skattningarna påverkas om antagande nummer 3 inte uppfylls. Med andra ord, vad händer om det inte är samma sannolikhet för alla närliggande noder att bli rekryterade? Givet att en individ har n stycken personer i sin sociala krets, är det inte troligt att alla har samma sannolikhet att bli rekryterade, utan troligtvis beror sannolikheten att bli rekryterad på relationen. En person tenderar förmodligen att rekrytera en god vän snarare än en bekant. I denna uppsats inför vi därför viktade vänskapsband, där vikten för vänskapsbandet anger nivån på relationen. Till exempel, om individ A har två kontakter varav en med vikten 2 och en med vikten 1, är det dubbelt så sannolikt att individ A rekryterar kontakten med vikten 2. 4 Metod Vi antar för enkelhetens skull den fiktiva situationen att vi undersöker andelen HIV-positiva individer i en dold population. Således blir den så kallade grupp A som beskrevs i Avsnitt 2.4 delmängden av individer i populationen som är HIV-positiva. Andelen HIV-positiva individer betecknas därmed som P HIV. Studien utförs med hjälp av data som genereras i en Matlab-simulering. Analysen av det erhållna datamaterialet sker i första hand genom grafisk undersökning av låddiagram, men resultaten kommer även att presenteras i tabeller. 9
16 I Avsnitten presenteras en schematisk beskrivning av hur simuleringsprocessen utförs. I samband med beskrivningen presenteras även ett illustrerande exempel. 4.1 Generering av nätverket 1. Vi skapar N stycken noder som motsvarar individerna i målpopulationen. Exempel 4.1. För att få ett hanterbart exempel väljer vi N = 5. Dessa illustreras i Figur 3. Figur 3: 5 stycken noder som motsvarar en population av 5 individer. 2. Nu bestäms vilka av dessa N stycken individer som har kontakt med varandra. Låt oss bilda en matris A av storlek N N som har egenskapen att A ij = A ji Ber( λ /N) 2 och A ii = 0; 1 < λ < N; i, j = 1, 2,..., N. Denna matris tilldelar slumpmässigt kanter mellan noderna. Kanterna som genereras representerar vänskapsband mellan individerna i studien. Ifall A ij = A ji = 1 finns det en kant mellan noderna i och j, ifall A ij = A ji = 0 finns det ingen kant. Summan av elementena på rad i i A är således antalet kontakter som individ i har i det sociala nätverket, det vill säga graden för individ i. Låt D i vara graden för individ i. Notera att D i blir således summan av N 1 (element A ii = 0 i = 1, 2,..., N) stycken Ber( λ /N)- fördelade stokastiska variabler. Detta innebär att D i Bin(N 1, λ /N). d Eftersom N kan anses vara stort kan vi utnyttja oss av att D i Y där Y Po(λ). Detta kan verifieras genom att beräkna den sannolikhetsgenererande funktionen för D i : g Di (t) = = ( 1 λ N + λ ) N 1 ( N t = 1 + ( 1 + ) N ( λ(t 1) 1 + N λ(t 1) N λ(t 1) N ) 1 ) N 1 e λ(t 1) 1 = e λ(t 1) = g Y (t) då N, 2 Detaljer om fördelningarna som används i denna studie återfinns i Bilaga B. 10
17 där Y Po(λ) [2]. Exempel 4.1 (fortsättning). Om vi väljer λ = 2 kan A i vårt exempel med N = 5 individer se ut som följande: A = Figur 4: Grafen som genereras av matrisen A i Exempel 4.1. Kanterna motsvarar vänskapsband mellan individerna i populationen. 3. Vi skapar en matris B av storlek N N sådan att om A ij = A ji = 1, så är B ij = B ji ett utfall av en stokastisk variabel V. Elementena i B motsvarar vikten av vänskapsbandet där djupet på relationen ökar med ökande vikt. Notera att B ij = B ji inte kan tilldelas värdet noll, eftersom kontakten i så fall stryks helt och hållet och då skulle inte graden för individ i vara densamma som i A. Man kan nu tänka sig att det istället för en enkel kant mellan två noder finns en kant med en stokastisk vikt motsvarade vikten för relationen, och att det är större sannolikhet för övergång till en nod som förbinds med en kant med högre vikt. Exempel 4.1 (fortsättning). Om vi låter B ij = B ji U(4) kan matrisen B se ut som följande: B =
18 Figur 5: Den viktade grafen som skapas av matrisen B i Exempel 4.1. Enligt modellen känner individerna 2 och 1 med vikten 4 i deras vänskapsband, varandra bättre än individerna 2 och 3, som endast har vikten 1 i vänskapsbandet. 4. Matrisen B normaliseras så att varje vikt mellan två individer divideras med totala viktsumman för individen. Med andra ord, varje element i B delas med radsumman för raden där elementet befinner sig i. På så sätt har vi konstruerat en övergångsmatris C för en Markovkedja i diskret tid där övergångssannolikheten beror på djupet för relationen. Exempel 4.1 (fortsättning). Genom att normalisera B erhålls matrisen C = Nätverket som matrisen C genererar illustreras i Figur 6. 12
19 Figur 6: Grafen med övergångssannolikheterna som fås ur C i Exempel 4.1. Till exempel, sannolikheten att individ 2 rekryterar individ 3 är 1 /9 medan sannolikheten att individ 2 rekryterar individerna 1 eller 5 är 4 / Allokering av HIV-status Allokering proportionellt mot grad Låt D i vara graden för individ i och låt D = (D 1, D 2,..., D N ). Som vi redan konstaterat i delavsnitt 4.1 så är D i Po(λ) fördelad för stora värden på N. Låt vidare H i vara en stokastisk variabel som indikerar om individ i i populationen är HIV-positiv eller ej, så att { 1 om individ i är smittad H i = (5) 0 om individ i inte är smittad och H = (H 1, H 2,..., H N ). För att få en positiv korrelation mellan vektorerna D och H gör vi i enlighet med [5] följande ansats: ( P (H i = 1) = min 1, p ) ( 0 D i = min 1, p ) 0 D i E[D i ] λ där p 0 är en parameter som vi kan manipulera för att bestämma en sann proportion av populationen som är HIV-positiv. Ekvation (6) innebär att sannolikheten att individ i är HIV-positiv ökar linjärt med ökande grad, dock med villkoret att sannolikheten alltid är mindre än eller lika med 1. Givetvis gäller att P (H i = 0) = 1 P (H i = 1). För att bestämma vilka individer i målpopulationen som är HIV-positiva genereras en vektor H = (H 1, H 2,..., H N ) där H i, i = 1,..., N har egenskaperna som beskrivs i ekvationerna (5) och (6). För varje H i, i = 1,..., N genereras ett motsvarande slumptal r i som är ett utfall av en U(0, 1)-fördelning. Ifall r i < min(1, p0 Di λ ) sätts H i = 1, annars sätts H i = 0. (6) 13
20 Exempel 4.1 (fortsättning). Låt oss i vårt exempel med N = 5 och λ = 2 välja p 0 = 0.4. En datorsimulering ger följande värden: Tabell 2: Allokering av HIV bland individerna i exempel 4.1. Allokeringen görs enligt Ekvation (6) med N = 5, λ = 2 och p 0 = 0.4. r i U(0, 1) genereras i Matlab. i D i P (H i = 1) r i H i Detta innebär att i det sociala nätverket som illustreras i Figur 4 är individerna 1,2 och 5 HIV-positiva Allokering proportionellt mot styrka Som redan bekrivits i Avsnitt 4.1 tilldelas vänskapen mellan individerna i och j en stokastisk vikt. I denna studie låter vi vikten för relationen mellan två individer vara ett utfall av en stokastisk variabel V. Vi definierar styrkan för individ i som viktsumman, det vill säga S i = D i j=1 V j, där V j är vikten för individ i:s j:te kant och där V 1, V 2,... är oberoende och lika fördelade. Notera att S i är således en summa av ett stokastiskt antal stokastiska variabler. Låt H i definieras av Ekvation (5) och låt S = (S 1, S 2,..., S N ) där S i är styrkan för individ i. För att få en positiv korrelation mellan vektorerna H = (H 1, H 2,..., H N ) och S = (S 1, S 2,..., S N ) låter vi analogt med Ekvation (6) ( P (H i = 1) = min 1, p ) 0 S i (7) E[S i ] där vi enligt [2] har E[S i ] = E[D i ] E[V ]. Vektorn H genereras på samma sätt som i Avsnitt Exempel 4.1 (fortsättning). Tabell 3 illustrerar en generering av H - givet att sannolikheten att vara HIV-positiv beror på styrkan. Tabell 3: Allokering av HIV bland individerna i exemplet. Allokeringen görs enligt Ekvation (7) med V U(4), N = 5, λ = 2 och p 0 = 0.4. i S i P (H i = 1) r i H i
21 4.3 Slumpvandringen och RDS-skattningen Vi utgår från övergångsmatrisen C som genereras enligt beskrivning i Avsnitt 4.1. Vi skapar en tillståndsvektor T = (T 1, T 2,..., T n ) som anger vilka tillstånd som besöks i Markovkedjan, och där n är storleken på urvalet. T k motsvarar den k:te deltagaren i urvalet, och alltså motsvarar T 1 fröet i undersökningen. Fröet väljs slumpmässigt ur hela populationen. Låt fröet vara individ i {1,..., N} i undersökningen. Detta innebär att vi befinner oss på rad i i övergångsmatrisen C. Låt C i vara rad i i C och låt C i vara vektorn vars element är den kumulativa summan av elementena i C i. Vi påminner om att element C ij är sannolikheten för övergång från tillstånd i till tillstånd j, såsom beskrevs i Avsnitt 2.2. För att bestämma tillstånd T 2 genereras ett slumptal r U(0,1). Beroende på vilket intervall i den kumulativa summan av rad i i C r hamnar bestäms T 2. Om r hamnar mellan det j 1:e och det j:e elementet i C i, är T 2 = j. Processen upprepas för att bestämma T 3, T 4, till och med T n, tills urvalet är klart. För varje tillstånd T 1, T 2,..., T n som besöks under Markovprocessen är det möjligt att kontrollera dess grad, dess styrka samt om tillståndet motsvarar en individ som är HIV-positiv eller ej. En RDS-skattning av andelen HIV-positiva i populationen görs enligt Ekvation (4). 5 Modeller och resultat I detta avsnitt presenteras resultaten av simuleringarna. Vi kommer att utföra simuleringarna med varierande värden på parametern λ den genomsnittliga graden för individerna i populationen, samt varierande värden på p 0 (se ekvationerna (6) och (7)). Dock kommer parametervärdena N = 1000 och n = 500 användas genomgående. Olika fördelningar för vikterna kommer också att testas. Tabell 4 illustrerar en sammanfattning av modellerna som används i studien. Tabell 4: Sammanfattning av modellerna Modell Viktfördelning Allokering av HIV Parametervariationer 1 U(m) Proportionellt mot grad m = 1, 2, 5, 10 λ = 10, 15 p 0 = 0.15, U(m) Proportionellt mot styrka 3 Exp(µ) Proportionellt mot grad µ = 1 /2, 1 λ = 10, 15 p 0 = 0.15, Exp(µ) Proportionellt mot styrka 5 U(0,1) Proportionellt mot grad λ = 10, 15 6 U(0,1) Proportionellt mot styrka p 0 = 0.15,
22 Figurerna 7-12 illustrerar i form av låddiagram avvikelsen för RDS-skattningarna från den sanna andelen HIV-positiva i populationen. Mera omfattande låddiagram återfinns i Bilaga A. 5.1 Modell 1 I den första modellen antar vi att vikterna är utfall av en U(m)-fördelning. Dessutom antar vi att sannolikheten att vara HIV-positiv beror på graden hos individen enligt Ekvation (6). Parametervärdena som vi använder i simuleringarna är m = 1, 2, 5 och 10; λ = 10 och 15 samt p 0 = 0.15 och Notera att parametervärdet m = 1 motsvarar det oviktade fallet. Vi utför 100 stycken simuleringar av rekryteringsprocessen för alla kombinationer av m, λ och p 0, där varje enskild simulering kommer att generera ett socialt nätverk av 1000 individer med en stokastisk sann andel HIV-positiva individer. I Tabell 5 presenteras den genomsnittliga avvikelsen från det sanna värdet, det vill säga ˆP (i) ( ) (i) ˆP HIV 100 P (i) HIV i=1 (i) där HIV och P HIV är det i:te elementet i vektorn bestående av de 100 RDSskattningarna respektive de 100 sanna värden. I Tabell 6 presenteras MSE (Mean Square Error) av ˆP HIV, vilket beräknas som i=1 (8) ( 2 (i) ˆP HIV 100 HIV) P (i). (9) Tabell 5: Genomsnittlig avvikelse av RDS-skattningen från det sanna värdet för Modell 1. m p 0 λ Tabell 6: MSE av RDS-skattning ˆP HIV i Modell 1 m p 0 λ
23 (a) λ = 10 p 0 = 0.15 (b) λ = 15 p 0 = 0.15 (c) λ = 10 p 0 = 0.50 (d) λ = 15 p 0 = 0.50 Figur 7: Låddiagram över ˆP HIV P HIV, Modell 1. De radvisa värdena i Tabell 5 håller sig i samma storleksordning för varierande värden på m. Man kan även i Tabell 6 observera att MSE varierar extremt lite och osystematiskt för samtliga permutationer av λ och p 0. Ur tabellerna 5 och 6 anses man inte kunna urskilja något systematisk fel i de fall där m 1. Detta bekräftas även genom att observera låddiagrammen för Modell 1 i Figur 7. Boxplottarna för RDS-skattningarna håller sig till synes på samma nivå, kring värdet noll, oberoende av parametern m. 5.2 Modell 2 Även i den andra modellen antas vikterna vara utfall av en U(m)-fördelning. Däremot poneras att sannolikheten att vara HIV-positiv beror på styrkan hos individen enligt Ekvation (7), där vi således får att E[S i ] = E[D i ] E[V ] = λ(m + 1). 2 17
24 På samma sätt som i Modell 1 används parametervärdena m = 1, 2, 5 och 10; λ = 10 och 15 samt p 0 = 0.15 och 0.50, och även här motsvarar parametervärdet m = 1 det oviktade fallet. Vi utför 100 stycken simuleringar av rekryteringsprocessen för alla kombinationer av m, λ och p 0. I Tabell 7 presenteras den genomsnittliga avvikelsen från det sanna värdet som beräknas enligt Ekvation (8), medan i Tabell 8 presenteras MSE av ˆP HIV, som beräknas enligt Ekvation (9). Tabell 7: Genomsnittlig avvikelse av RDS-skattningen från det sanna värdet i Modell 2. m p 0 λ Tabell 8: MSE av RDS-skattning ˆP HIV i Modell 2. m p 0 λ I de fall där p 0 = 0.50 (figurerna 8c och 8d), kan en måttlig ökning av ˆP HIV P HIV observeras för ökande värde på m. Detta är ett tecken på att individer med högre styrka som även har högre sannolikhet att vara HIV-positiva är överrepresenterade i urvalet, och på så sätt har skapat ett systematiskt fel i RDS-skattningen. Detta stärks av det som kan observeras i Tabell 7, där den genomsnittliga avvikelsen mellan RDS-skattningen och det sanna värdet ökar för ökande värde på m i de fall där p 0 = Detta skulle innebära att RDS överskattar andelen HIV-positiva i populationen givet Modell 2. Om man istället observerar figurerna 8a och 8b kan man inte se denna effekt lika tydligt då p 0 = Man kan ur Tabell 7 avläsa att den genomsnittliga skillnaden mellan RDS-skattningen och det sanna värdet möjligtvis skulle kunna öka för ökande värde på m, men inget definitivt uttalande kan göras. En kvalificerad gissning är att RDS-skattningen överskattar andelen HIV-positiva i populationen även i de fall där p 0 = 0.15, fastän effekten inte syns så tydligt i dessa fall. 18
25 (a) λ = 10 p 0 = 0.15 (b) λ = 15 p 0 = 0.15 (c) λ = 10 p 0 = 0.50 (d) λ = 15 p 0 = 0.50 Figur 8: Låddiagram över RDS-skattningen minus det sanna värdet, Modell Modell 3 I denna modell antar vi att V Exp(µ), samt att sannolikheten att vara HIVpositiv beror på graden hos individen enligt Ekvation (6). Vi undersöker hur RDS-skattningen påverkas med parametervärdena µ = 1 /2 och 1; λ = 10 och 15 samt p 0 = 0.15 och Vi utför 100 stycken simuleringar av rekryteringsprocessen för alla kombinationer av µ, λ och p 0. I Tabell 9 presenteras den genomsnittliga avvikelsen från det sanna värdet som beräknas enligt Ekvation (8), medan i Tabell 10 presenteras MSE av ˆP HIV, som beräknas enligt Ekvation (9). 19
26 Tabell 9: Genomsnittlig avvikelse av RDS-skattningen från det sanna värdet i Modell 3. µ p 0 λ 1/ Tabell 10: MSE av RDS-skattning ˆP HIV i Modell 3. µ p 0 λ 1/ Enligt de erhållna resultaten i Modell 3 verkar RDS-skattningarna inte rubbas avsevärt. Ur samtliga låddiagram (Figur 9) kan man se att mätvärdena samlas kring noll. Man kan dessutom ur Tabell 9 observera att den genomsnittliga skillnaden mellan RDS-skattningen och det sanna värdet är liten för alla kombinationer av λ, µ och p 0. Man kan i detta fall alltså dra samma slutsatser som för Modell 1 nämligen att de viktade vänskapsbandens effekt är tämligen liten. 20
27 (a) λ = 10 p 0 = 0.15 (b) λ = 15 p 0 = 0.15 (c) λ = 10 p 0 = 0.50 (d) λ = 15 p 0 = 0.50 Figur 9: Låddiagram över RDS-skattningen minus det sanna värdet, Modell Modell 4 Vi antar en identisk modell som Modell 3, förutom att sannolikheten att vara HIV-positiv beror på styrkan hos individen enligt Ekvation (7). E[S i ] i Ekvation (7) blir således E[S i ] = E[D i ] E[V ] = λ 1 µ = λ µ. På samma sätt som i Modell 3 undersöker vi för parametervärdena µ = 1 /2 och 1; λ = 10 och 15 samt p 0 = 0.15 och Den genomsnittliga avvikelsen av RDS-skattningen från det sanna värdet samt MSE av ˆP HIV presenteras i tabellerna 11 respektive
28 Tabell 11: Genomsnittlig avvikelse av RDS-skattningen från det sanna värdet i Modell 4. µ p 0 λ 1/ Tabell 12: MSE av RDS-skattning ˆP HIV i Modell 4. µ p 0 λ 1/ (a) λ = 10 p 0 = 0.15 (b) λ = 15 p 0 = 0.15 (c) λ = 10 p 0 = 0.50 (d) λ = 15 p 0 = 0.50 Figur 10: Låddiagram över RDS-skattningen minus det sanna värdet, Modell 4. 22
29 I Modell 4 kan man i låddiagrammen se att RDS-skattningarna överskattar andelen HIV-positiva i de flesta av de 100 simuleringarna. Detta syns tydligast i de fall där p 0 är satt till 0.5 (figurerna 10c och 10d), där vi kan observera att samtliga mätvärden mellan den första och den tredje kvartilen i boxplottarna ligger ovanför värdet noll. Även om effekten inte är så stark då p 0 = 0.15 (figurerna 10a och 10b) ser vi även i dessa fall att den absolut största delen av mätvärdena ligger ovanför värdet noll. Våra observationer stämmer också överens med den genomsnittliga skillnaden mellan RDS-skattningarna och det sanna värdet (Tabell 11), där samtliga värden är större än noll och dessutom till beloppet större än i simuleringarna där väskapsbanden är oviktade (tabellerna 5 och 7, m = 1). Hur mycket RDS-skattningarna påverkas av viktade vänskapsband tycks bero på parametrarna λ, p 0 och µ, samt deras eventuella samverkan. En djupare analys av hur valet av parametrarna påverkar resultaten utelämnas från denna studie, men slutsatsen som dras är att RDS överskattar andelen HIV-positiva individer i populationen givet Modell Modell 5 I den femte modellen sätter vi vikterna till utfall av en U(0,1)-fördelning. Vi ponerar att sannolikheten att vara HIV-positiv beror på graden hos individen enligt Ekvation (6). Som vanligt undersöker vi hur RDS-skattningen påverkas med parametervärdena λ = 10 och 15 samt p 0 = 0.15 och Vi utför 100 stycken simuleringar av rekryteringsprocessen för alla kombinationer av λ och p 0. I Tabell 13 presenteras den genomsnittliga avvikelsen från det sanna värdet som beräknas enligt Ekvation (8), medan i Tabell 14 presenteras MSE av ˆP HIV, som beräknas enligt Ekvation (9). Tabell 13: Genomsnittlig avvikelse av RDS-skattningen från det sanna värdet i Modell 5. p 0 λ ˆPHIV P HIV Tabell 14: MSE av RDS-skattning ˆP HIV i Modell 5. p 0 λ MSE( ˆP HIV )
30 (a) λ = 10 p 0 = 0.15 (b) λ = 15 p 0 = 0.15 (c) λ = 10 p 0 = 0.50 (d) λ = 15 p 0 = 0.50 Figur 11: Låddiagram över RDS-skattningen minus det sanna värdet, Modell 5. Såsom för de tidigare nämnda modeller där sannolikheten att vara HIV-positiv beror på graden hos individen enligt Ekvation (6), kan man inte observera stora avvikelser för RDS-skattningarna. Samtliga mätvärden (Figur 11) verkar vara symmetriskt samlade kring noll, och inga större avvikelser kan noteras i tabellerna 13 och Modell 6 I den sjätte och sista modellen sätter vi vikterna till utfall av en U(0,1)-fördelning. Vi ansätter sannolikheten att vara HIV-positiv beror på styrkan hos individen enligt Ekvation (7), där vi i detta fall får E[S i ] = E[D i ] E[V ] = λ 1 2 = λ 2. Som vanligt undersöker vi hur RDS-skattningen påverkas med parametervärdena λ = 10 och 15 samt p 0 = 0.15 och Vi utför 100 stycken simuleringar av rekryteringsprocessen för alla kombinationer av λ och p 0. I Tabell 15 presenteras den genomsnittliga avvikelsen från det sanna värdet som beräknas enligt Ekvation (8), medan i Tabell 16 presenteras MSE av ˆP HIV, som beräknas enligt Ekvation (9). 24
31 Tabell 15: Genomsnittlig avvikelse av RDS-skattningen från det sanna värdet i Modell 6. p 0 λ ˆPHIV P HIV Tabell 16: MSE av RDS-skattning ˆP HIV i Modell 6. p 0 λ MSE( ˆP HIV ) (a) λ = 10 p 0 = 0.15 (b) λ = 15 p 0 = 0.15 (c) λ = 10 p 0 = 0.50 (d) λ = 15 p 0 = 0.50 Figur 12: Låddiagram över RDS-skattningen minus det sanna värdet, Modell 6. 25
32 I Figur 12 kan vi se att RDS-skattningen tenderar att vara högre än det sanna värdet. Detta syns tydligast i de fall där p 0 är ansatt till 0.5, men även i en viss grad i de fall där p 0 = Detta stärks av det man kan observera i Tabell 15, där samtliga värden är större än noll, och jämförelsevis stora i de fall där p 0 = Notera speciellt hur mycket storleken för den genomsnittliga skillnaden varierar för varierande värden på λ och p 0. Slutsatsen i Modell 6 är att RDS överskattar andelen HIV-positiva i populationen, och storleken på det systematiska felet är rätt så beroende på valet av parametrarna λ och p 0. 6 Slutsatser En grafisk undersökning av resultaten av simuleringarna tyder på att RDS med viktade vänskapsband överskattar andelen HIV positiva i populationen givet att sannolikheten att vara HIV-positiv beror på styrkan hos individen enligt Ekvation (7). Hur mycket RDS-skattningen påverkas beror på den genomsnittliga graden hos individerna i populationen (λ), samt den sanna andelen HIVsmittade i populationen. RDS med viktade vänskapsband verkar inte felskatta avsevärt andelen HIVpositiva ifall sannolikheten att vara HIV-positiv beror på graden enligt Ekvation (6). 7 Diskussion I ett viktat nätverk är det större sannolikhet för en individ med hög styrka att delta i undersökningen. Detta motiveras med följande tankegång: Antag matrisen B som beskrevs i Avsnitt 4.1, och antag att summan av elementena på rad k {1,..., N} är mycket stor jämfört med summan av elementena på de andra raderna, trots att graden inte skiljer sig mycket åt. Således är styrkan för individ k stor medan graden är i samma storleksordning som för resten av individerna i populationen. Eftersom matrisen B är symmetrisk kring diagonalen (på grund av reciprocitetsantagandet, se Avsnitt 2.3), så är även elementena på kolumn k jämförelsevis stora. När man sedan normaliserar B genom att dela elementena med radsumman, försvinner de stora vikternas effekt på rad k. Däremot förblir elementena på kolumn k stora. Således är det större sannolikhet att övergå till tillstånd k från alla andra tillstånd. Denna motivering kan naturligtvis tillämpas på fall där flera rader har i jämförelse stora viktsummor. Detta innebär att det är större sannolikhet att övergå till just dessa tillstånd som alltså kommer att bli överrepresenterade i urvalet. Om sannolikheten att vara HIV-positiv beror på graden hos individen, kommer det inte spela någon roll om den k:te raden har en jämförelsevis stor viktsumma. De individer som har stor viktsumma kommer ändå att tilldelas HIV proportionellt mot deras grad, som vi antog var i samma storleksordning som för resten av populationen. Det har således inte så stor betydelse om individer med stor 26
33 viktsumma blir översamplade, eftersom de ändå utgör ett representativt urval av hela populationen i detta fall. Detta leder till att RDS-skattningarna till synes inte rubbas av viktade vänskapsband i de fall där sannolikheten att vara HIV-positiv beror på graden. Om man däremot ponerar att sannolikheten att en individ är HIV-positiv beror på styrkan så att ju högre styrka, desto högre sannolikhet att vara HIV-positiv, kommer det faktum av individer med hög styrka är överrepresenterade definitivt skapa ett systematiskt fel i RDS-skattningarna. Denna tankegång förklarar givetvis inte hela verkligheten, utan är snarare förklaringen till en tendens. Det är i våra modeller inte så sannolikt att vissa individer har en hög styrka, trots att deras grad är i samma storleksordning som för resten av populationen. Därför kommer effekten i den ovannämnda tankegången att dämpas av att det finns en positiv korrelation mellan vikt och styrka en individ med hög styrka har med stor sannolikhet även en hög grad. Vi har i denna uppsats inte gått så djupt in på huruvida de nämnda modellerna är verklighetsbaserade, utan tanken med denna studie har varit att undersöka om RDS fungerar under extremare modeller än de som tidigare antagits (se Avsnitt 2.3). Förslag till framtida forskning om ämnet är hur viktade vänskapsband påverkar RDS-skattningarna ur ett teoretiskt perspektiv, med utgångspunkt i teorin för Markovkedjor i diskret tid och deras asymptotiska fördelningar, möjligtvis för att kunna teoretiskt erhålla väntevärdesriktiga skattare med färre antaganden än de som i dagsläget behövs. 27
Inferens på sociala nätverk i "gömda" populationer
Inferens på sociala nätverk i "gömda" populationer Anni Pilbacka Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2010:2 Matematisk statistik April 2010
Erdös-Rényi-grafer. Jiong Cao. Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics
Erdös-Rényi-grafer Jiong Cao Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2010:1 Matematisk statistik Januari 2010 www.math.su.se Matematisk statistik
Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 3 MATEMATISK STATISTIK AK FÖR CDIFYSIKER, FMS012/MASB03, HT12 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla
Markovkedjor. Patrik Zetterberg. 8 januari 2013
Markovkedjor Patrik Zetterberg 8 januari 2013 1 / 15 Markovkedjor En markovkedja är en stokastisk process där både processen och tiden antas diskreta. Variabeln som undersöks kan både vara numerisk (diskreta)
Ì ÆÌ Å Æ ËØ Ø Ø ÑÓ ÐÐ Ö Ò Ö Á ÌÅ˽ ¼ ÑÒ Ò Ò ½ Ñ Ö ¾¼¼ Ð Ô Îº ÂÓÙÖ ÂÓ Ò Ù Ø Ú ÓÒ Ò Òº ½ À ÐÔÑ Ð ÍØ Ð ÓÖÑ Ð ÑÐ Ò Ñ Ø ÐÐ Ö Ì Ô ÙÖ Ò ÒÚÒ ÓÖ Ð Ø Ó ØÝÔ Ó Ò Ö Ò Ó º ÈÓÒ Ö Ò Ò ÍÔÔ Ø ÖÒ Ö Ú ÖÚ Ð ØÝÔ Ö Ò Ø ØØ ÐØ
ÁÒÒ ÐÐ ½ ÁÒØÖÓ Ù Ø ÓÒ ½ ½º½ ÝÒ Ñ Ð Ø Ð Ò Ö Ò Ú ÔØ Ú È ¹Ð Ö º º º º º º º ½ ½º¾ ÃÓÖØ ÓÑ ØÓÖ ÑÙÐ Ö Ò Ö º º º º º º º º º º º º º º º º º º º º ¾ ¾ Ø Ð Ö
ÝÒ Ñ Ð Ø Ð Ò Ö Ò Ö ÔØ Ú È ¹Ð Ö Ö ØÓ Ö Ê ÑÕÙ Ø Ê Ö Ò Ö Ê Ö Ä ÓÒ Ö Ø Ò Ä Æ Ð ÓÒ Ò Ö Ë ÖÐÙÒ Ù Ø Ú Ì ÒÓ ½¾ Ñ ¾¼¼ ÁÒÒ ÐÐ ½ ÁÒØÖÓ Ù Ø ÓÒ ½ ½º½ ÝÒ Ñ Ð Ø Ð Ò Ö Ò Ú ÔØ Ú È ¹Ð Ö º º º º º º º ½ ½º¾ ÃÓÖØ ÓÑ ØÓÖ ÑÙÐ
Föreläsning 13 5 P erceptronen Rosen blatts p erceptron 1958 Inspiration från mönsterigenk änning n X y = f ( wjuj + b) j=1 f där är stegfunktionen.
Ä Ò Ö Ó ÃÓÑ Ò ØÓÖ ÓÔØ Ñ Ö Ò Ö Ö Ã Ð Å Ø Ñ Ø ÒØÖÙÑ Ö Ð Ò Ò ½ Æ ÙÖ Ð ÒØÚ Ö ÁÒØÖÓ Ù Ø ÓÒ È Ö ÔØÖÓÒ Ð Ö Ð Ö ËÙÔÔÓÖØ Î ØÓÖ Å Ò ÀÓÔ Ð ÓÐØÞÑ ÒÒÑ Ò Ò ÁÒØÖÓ Ù Ø ÓÒ ØØ ÒÝØØ Ö Ò Ò ØØ È Ö ÐÐ ÐÐ Ø Ø Ö Ò Ø ÁÒÐÖÒ Ò ÇÔØ
x + y + z = 0 ax y + z = 0 x ay z = 0
LUNDS TEKNISKA HÖGSKOLA MATEMATIK TENTAMENSSKRIVNING LINJÄR ALGEBRA 2011-12-13 kl 1419 INGA HJÄLPMEDEL Lösningarna skall vara försedda med ordentliga motiveringar Alla koordinatsystem får antas vara ortonormerade
TAMS79: Föreläsning 10 Markovkedjor
TAMS79: Föreläsning 0 Markovkedjor Johan Thim december 08 0. Markovkedjor Vi ska nu betrakta en speciell tidsdiskret diskret stokastisk process, nämligen Markovkedjan. Vi börjar med en definition Definition.
Sekventiellt t-test av skillnaden i väntevärden mellan två normalfördelade stickprov
Sekventiellt t-test av skillnaden i väntevärden mellan två normalfördelade stickprov Jenny Areskogh Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2009:9
ÁÒÒ ÐÐ ÓÑ ØÖ Ð Ö Ð Ñ ÒØ ÓÔ ÒØÓ Ð¹Ã Û Ö ÞÑ Ð Ö Ø Ð Ö ÔÖ Ø ÙØ ÓÖÑ ÙÒ Ö ½ ¼¼¹ Ó ½ ¼¼¹Ø Рغ Î Ø º ÖØ ¾
Å Ø Ñ Ø Ò ¾¼½¾¹¼ ¹½ Æ Ö Ò Ð Ð Ö Ò ØÓÖ Æ Ð Ö ÓÒ Ò Ð º Ö ÓÒ Úº ½ ÁÒÒ ÐÐ ÓÑ ØÖ Ð Ö Ð Ñ ÒØ ÓÔ ÒØÓ Ð¹Ã Û Ö ÞÑ Ð Ö Ø Ð Ö ÔÖ Ø ÙØ ÓÖÑ ÙÒ Ö ½ ¼¼¹ Ó ½ ¼¼¹Ø Рغ Î Ø º ÖØ ¾ Ð Ö Ð Ñ ÒØ ÓÑ ØÖ Ð Ñ ÒØ ÙÔÔ Ú Ö Ö Ú Ò
Tentamen i TMME32 Mekanik fk för Yi
Ì ÒØ Ñ Ò ÌÅÅ ¾ Ì Æ½µ Å Ò Ö Ì ÒØ Ñ Ò ØÙÑ ¾¼½ ¹¼ ¹½ к ½ ¹½ º Ü Ñ Ò ØÓÖ Ä Ö ÂÓ Ò ÓÒº ÂÓÙÖ Ú Ò Ä Ö ÂÓ Ò ÓÒº Ì Ð ÓÒ ¼½ ¹¾ ½½¾¼º Ö Ø ÒØ Ñ Ò ÐÓ Ð Ò Ðº ½ Ó ½ º ¼º À ÐÔÑ Ð Ê ØÚ Ö ØÝ ÑØ ØØ ¹ Ð ÓÖµ Ñ ÒØ Ò Ò Ö Ò
x 2 + ax = (x + a 2 )2 a2
ÅÐ Ö Î ½ ½º ÒØ Ñ Å ÔÐ º ¾º Î Ö Ô Ø Ø ÓÒ Ú Ð Ò Ö Ð Ö º º ÇÐ ØØ ØØ Ö ÔÖ ÒØ Ö ÑÒ Ö ÔÐ Ò Ø»ÖÙÑÑ Øº µ ÁÐÐÙ ØÖ Ö Ð Ø Ö Ð Ñ Å ÔÐ Ð Ö Ò Ò Ð Ø Ò Ö µ ÐÐ Ø Ü Ð Ò Ö Ó Ò Ö Ö ÙÖÚÓÖ º Á Å ÔРй Ð Ø Ö Ñ Ò ÙÒ Ö Ô ÙÖ ÙÖÚ
Stapeldiagram. Stolpdiagram
Á Î Ù Ð Ö Ò Ö Ñ ¹ Ö Ö Å ØÖ Ö Ó Ð Ö ÇÖ ÒØ Ö Ò º Ä ÐÚºµ ½ À ØÓ Ö Ñ Ó Ø Ô Ð Ö Ñ Å ÓÑÑ Ò ÓÒ Ö Ø Ñ Ó Ø Ò Ñ Ò Ö Ø Ø Ô Ð Ö Ñ Ö Ô Ø Ú ØÓ Ö Ñº ØÓÐÔ Ö Ñ ËÝÒØ ܺ Ö Üµ Ê Ø Ö ØØ Ø Ô Ð Ö Ñ Ú Ö Ð Ñ ÒØ Ò Üº Ø Ñ Üµ Ê Ø
s N = i 2 = s = i=1
ÁÒØÖÓ Ù Ø ÓÒ Ø ÐÐ Å ÌÄ ¹ÔÖÓ Ö ÑÑ Ö Ò Ð ÓÖ ØÑ Ö ËÖ ÔØ¹ Ó ÙÒ Ø ÓÒ Ð Ö ÄÓ ÙØØÖÝ Î ÐÐ ÓÖ Ø Ö ¹ Ø Ö Ê Ô Ø Ø ÓÒ Ø Ö ÐÓÓÔ Öµ ÓÖ¹ Ø Ö Û Ð ¹ Ø Ö ½ ÖÒ ÔÖÓ Ð Ñ Ø ÐÐ ÔÖÓ Ö Ñ ÒÐ Ò Ò Ò Ø ÐÐ ØØ Ö Ú ØØ ÔÖÓ Ö Ñ ØØ ÔÖÓ
ÁÒØÖÓ ÙØ ÓÒ ËÎ ÈÖÓ Ö ÑÑ Ø ÓÒ Ï Ä Ò Ò ÓÖÑ Ø ÕÙ Ë Ø Ò Î Ö Ð Ú Ö Ð ºÙÒ º Ö ÛÛÛº ºÙÒ º Ö» Ú Ö Ð ÕÙ Ô ËÓ ¹ ÍÒ Ú Ö Ø Æ ËÓÔ ¹ ÒØ ÔÓÐ ¾ ÒÓÚ Ñ Ö ¾¼¼
ÁÒØÖÓ ÙØ ÓÒ ËÎ Ä Ò Ò ÓÖÑ Ø ÕÙ Ú Ö Ð ºÙÒ º Ö ÛÛÛº ºÙÒ º Ö» Ú Ö Ð ÕÙ Ô ËÓ ¹ ÍÒ Ú Ö Ø Æ ËÓÔ ¹ ÒØ ÔÓÐ ¾ ÒÓÚ Ñ Ö ¾¼¼ Ç Ø Ð Ò ½½ ½ ¾ ÓÒÒ ØÖ Ð ÔÖ Ò Ô ËÎ ÓÒÒ ØÖ Ð ØÖÙØÙÖ ³ÙÒ Ö Ú ÓÒÒ ØÖ Ð ÙÖ Ë ÚÓ Ö Ö ÖÓÙÔ Ö ÙÒ
f(x) = f t (x) = e tx f(x) = log x X = log A Ö Ð e X = A f(x) = x X = A Ö Ð X 2 = A. (cosa) 2 + (sin A) 2 = I, p (k) (α) k=0
½»¾¹¼ ÙÒ Ø ÓÒ Ö Ú Ñ ØÖ Ö Ë Ø ÙØ Ö Ú p(a) Ö p(x) Ö ØØ ÔÓÐÝÒÓѺ ÆÙ ÐÐ Ú Ú ÙÖ Ñ Ò Ò Ò Ö f(a) Ö Ñ Ö ÐÐÑÒÒ ÙÒ Ø ÓÒ Öº Ü ÑÔ Ð Ô ÙÒ Ø ÓÒ Ö f(x) ÓÑ Ò Ú Ö ÒØÖ Ö f(x) = f t (x) = e tx ÓÑ Ö e ta Ö ËÝ Ø Ñ Ó ØÖ Ò ÓÖÑ
Ö Ò histogramtransformationº
ÍÐØÖ Ð Ù Ð ÓÖ Ø ÓÒ ÌË ½ Å Ò Ð Ö ÍØÚ Ð Ú Å Ø Ò Ö ÓÒ ÁÅ̵ ¾¼½ ÍÔÔ Ø Ö Ú Å Ö Å ÒÙ ÓÒ ÎÄ ÁË µ ¾¼½ ÓÒØ ÒØ ÍÔÔ Ø Ò Ä Ò Ê ¹ Ø Ò Ê ÒÒ ØÖÐ Ó ÓÙÖ ÖØÖ Ò ÓÖÑ Ò Ð ÒÚ ÐÓÔÔ Ø Ø ÓÒ ÒÚ ÐÓÔÔ Ø Ø ÓÒ Ñ Ú Ö ØÙÖ ËÙ ÑÔÐ Ò Ò
Î Ö Ä Ì ½º Ì Ö Ò Ø ÜØ¹ Ð ÓÑ ÒÔÙØº ¾º ÈÖÓ Ö Ö Ð Ò Ó ØÑÑ Ö Ø ÓÔØ Ñ Ð ÙØ Ò Øº º Ö ÙØ Ò ÎÁ¹ Ð Ú ¹ÁÒ Ô Ò ÒØµº º ÎÁ¹ Ð Ò Ò ÓÒÚ ÖØ Ö Ø ÐÐ Ü ÑÔ ÐÚ Ò È ¹ к
ÐÐÑÒØ ÓÑ Ä Ì Ä Ì Ö Ò Ú Ö ÙØÚ Ð Ò Ú Ì ¹ Ý Ø Ñ Ø ÓÑ ÙØÚ Ð Ô ¼¹Ø Рغ Ì ÐÐØ Ö ØÚ Ò Ö µ Ö ÒØ Ò ØØ ØÒ Ñ Ö Ô ÒÒ ÐÐ Ò ÓÖÑ Ø Ö Ò º Ò ÐØ ØØ Ô ØÖÙ ØÙÖ Ö Ó ÙÑ ÒØ ÁÒÒ ÐÐ ÖØ Ò Ò ÃÐÐ ÖØ Ò Ò ÓØÒÓØ Ö Ê Ö Ò Ö ØÓ Ø Ò Ö
u(t) = u 0 sin(ωt) y(t) = y 0 sin(ωt+ϕ)
Ã Ô ¹ ÑÔ Ö ÑÓ ÐÐ Ö Ò ÌÚ ÖÙÒ ÔÖ Ò Ô Ö Ö ØØ Ý Ñ Ø Ñ Ø ÑÓ ÐÐ Ö ÓÑ Ò Ö Ó Ø µ Ý Ð Ø ÑÓ ÐÐ Ý º ÒÚÒ Ò ØÙÖÐ Ö Ñ Ð Ò Ò Ö Ð Ò Æ ÛØÓÒ Ð Ö Ø Øµº Á Ð Ò Ú ÝÔÓØ Ö Ó ÑÔ Ö Ñ Ò µº Ë Ã Ô ¾ ÑÔ Ö ÑÓ ÐÐ Ö Ò ÒÒ Ø Ò ÑÒ ËÝ Ø Ñ
Anpassning av copulamodeller för en villaförsäkring
Anpassning av copulamodeller för en villaförsäkring Emma Södergren Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2012:9 Matematisk statistik December
Lektionsanteckningar 11-12: Normalfördelningen
Lektionsanteckningar 11-12: Normalfördelningen När utfallsrummet för en slumpvariabel kan anta vilket värde som helst i ett givet intervall är variabeln kontinuerlig. Det är väsentligt att utfallsrummet
Markovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 3 Markovprocesser 16 April 2015 Johan Westerborn Markovprocesser (1) Föreläsning 3 Föreläsningsplan 1 Förra Föreläsningen 2 Markovprocesser
Ö ÙÔ ØÙ Ú ÖÖ Ö ÓØÐ Ò Ä Ö ÆÓÖ Ò ËÚ Ö Ñ Ø ÓÖÓÐÓ Ó Ý ÖÓÐÓ Ò Ø ØÙØ ÆÓÖÖ Ô Ò ¾¼ Ñ Ö ¾¼½¾ ÁÒÒ ÐÐ ½ ÖÙÒ ¾ ÍØÖ Ò Ò ÃÓÑÔÐ ØØ Ö Ò Ö Ö Å ØÓ º½ Ö Ò Ò Ú Ö ØÝ º º º º º º º º º º º º º º º º º º º º º º º º º¾ Ð ÓÖ
Markovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 3 Markovprocesser 13 April 2016 Johan Westerborn Markovprocesser (1) Föreläsning 3 Föreläsningsplan 1 Förra Föreläsningen 2 Markovprocesser
ËØÝÖÒ Ò Ú Ð Ò Ñ Ò ØÓÖ ØØ ÔÖÓ Ø Ö ÁË ÓÖ ÓÒ Ý Ø Ñ ½ Ù Ù Ø ¾¼¼¾ ÂÓ Ò Ð Ò ÜÜÜÜÜܹÜÜÜÜ È Ö Ö ¼ ½½¹ Ô ÖÓ ÁÒÒ ÐÐ ½ ÁÒÐ Ò Ò ¾ Ð Ò Ò ¾º½ ÃÓÒ ØÖÙ Ø ÓÒ º º º º º º º º º º º º º º º º º º º º º º º º º º ¾º¾ ÀÖ
2E I L E I 3L E 3I 2L SOLUTIONS
Ä Ò Ô Ò ÍÒ Ú Ö Ø Ø Ú ÐÒ Ò Ò Ö ÀÐÐ Ø Ø ÐÖ Ò Ð Ä ÖÑ Ö Ð Á Ì ÓÖ Ð Á ÒÙÑÑ Ö Ì ÆÌ Å Æ ÌÅÅÁ½ ¹ ÀÐÐ Ø Ø ÐÖ ÖÙÒ ÙÖ ¾¼½ ¹¼ ¹¾ ½ ½º Ò Ö ØØ ÙÔÔÐ Ð ÓÖ Ú ØÐ Ö ØØ Ú Ò ÐÙÑ Ò ÙÑÔÖÓ Ðº ÒÒ Ð Ð Ø Ñ Ò ÔÙÒ ØÐ Ø F Ô Ñ ØØº ÀÙÖ
ÝÖ Ö Ò ØØ Ò Ø ÓÒ Ù ØÖ Ø ÓÒ ÑÙÐØ ÔÐ Ø ÓÒ Ó Ú ÓÒ Ö ØÑ Ø ÙØØÖÝ ÙØ Ö Å ÌÄ Ñ ÓÔ Ö ØÓÖ ÖÒ ¹» Ü ÑÔ Ðº ÇÑ Ø Ö ØÑ Ø ÙØØÖÝ Ø ½ ¾ Ò Ú Å ÌÄ ¹ÔÖÓÑÔØ Ò ÒÑ ØÒ Ò Ò Ú
ÁÒØÖÓ Ù Ø ÓÒ Ø ÐÐ Å ÌÄ Ö ØÑ Ø ÙØØÖÝ Å Ø Ñ Ø ÙÒ Ø ÓÒ Ö Ø ØÝÔ Ö Ó Ú Ö Ð Ö Î ØÓÖ Ö»Ð ØÓÖ ½ ÝÖ Ö Ò ØØ Ò Ø ÓÒ Ù ØÖ Ø ÓÒ ÑÙÐØ ÔÐ Ø ÓÒ Ó Ú ÓÒ Ö ØÑ Ø ÙØØÖÝ ÙØ Ö Å ÌÄ Ñ ÓÔ Ö ØÓÖ ÖÒ ¹» Ü ÑÔ Ðº ÇÑ Ø Ö ØÑ Ø ÙØØÖÝ
Grafer och grannmatriser
Föreläsning 2, Linjär algebra IT VT2008 Som avslutning på kursen ska vi knyta samman linjär algebra med grafteori och sannolikhetsteori från första kursen. Resultatet blir så kallade slumpvandringar på
Matematisk statistik för D, I, Π och Fysiker
Matematisk statistik för D, I, Π och Fysiker Föreläsning 9 Johan Lindström 16 oktober 2018 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03 F9 1/26 Johan Lindström - johanl@maths.lth.se FMSF45/MASB03
Ð ÓÖ Ø Ñ Ö ÙÖ Ä Ò ½ Å ËË ¹ ÁÒØÖÓ ÙØ ÓÒ ÔÖÓ Ö ÑÑ Ø ÓÒ Â Î Ë Ø Ò Î Ö Ð Ú Ö Ð ºÙÒ º Ö ÛÛÛº ºÙÒ º Ö» Ú Ö Ð ÕÙ Ô ËÓ ¹ ÍÒ Ú Ö Ø Æ ËÓÔ ¹ ÒØ ÔÓÐ ¾ Ñ Ö ¾¼¼
Ä Ò ½ Å ËË ¹ ÁÒØÖÓ ÙØ ÓÒ ÔÖÓ Ö ÑÑ Ø ÓÒ Â Î Ú Ö Ð ºÙÒ º Ö ÛÛÛº ºÙÒ º Ö» Ú Ö Ð ÕÙ Ô ËÓ ¹ ÍÒ Ú Ö Ø Æ ËÓÔ ¹ ÒØ ÔÓÐ ¾ Ñ Ö ¾¼¼ Ç Ø Ð Ò Ö Ö ÙÒ Ð ÓÖ Ø Ñ Ö ÙÖ Ú ÙÒ ÙÐ Ø Ø Ø Ð Ö Ð Ð Ò ÒØÖ Ô Ö Ö ÙÖÖ Ò Ø Ð ÓÖ Ø Ñ
1 = 2π 360 = π ( 57.3 ) 2π = = 60 1 = 60. 7π π = 210
ÁÒØÖÓ Ù Ø ÓÒ ÙÖ Ñ Ø Ñ Ø Å»Ì Æ Ð Ö ÓÒ ¾¼½¾¹¼ ¹¾ ½ Á Ñ» ܺ ÐÙÐÙ ÓÑÔÐ Ø ÓÙÖ º Ì ÌÖ ÓÒÓÑ ØÖ ÙÒØ ÓÒ È. Î Ò ÐÑØØ Ø Ö Ò Ö Ë ÒÙ Ó ÒÙ Ó Ø Ò Ò º Ò Ø ÓÒ Öº ÌÖ ÓÒÓÑ ØÖ ÙÒ Ø ÓÒ Ö Ó Ö Ö Ö ÌÖ ÓÒÓÑ ØÖ ÒØ Ø Ø Ö ÌÖ Ò Ð
Markovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 2 Markovprocesser 4 April 2016 Johan Westerborn Markovprocesser (1) Föreläsning 2 Föreläsningsplan 1 Förra Föreläsningen 2 Absorption
Markovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 5 Markovprocesser 24 April 2015 Johan Westerborn Markovprocesser (1) Föreläsning 5 Föreläsningsplan 1 Förra Föreläsningen 2 Poissonprocessen
Markovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 5 Markovprocesser 2 Maj 2016 Johan Westerborn Markovprocesser (1) Föreläsning 5 Föreläsningsplan 1 Förra Föreläsningen 2 Poissonprocessen
Markovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 2 Markovprocesser 30 Mars 2015 Johan Westerborn Markovprocesser (1) Föreläsning 2 Föreläsningsplan 1 Förra Föreläsningen 2 Absorption
1 S nr = L nr dt = 2 mv2 dt
Ë Ñ Ò ÖÚÓÖØÖ Ö Ð Ó ÓÒ ËØÖ Ò Ò Ö ÖÓ Ö Ø ¾½º Å ¾¼¼ ÁÒ ÐØ Ú ÖÞ Ò ½ ÏÓÖÙÑ Ø³ ¾ ¾ Ö Ð Ø Ú Ø ÈÙÒ ØØ Ð Ò ¾ ¾º½ Ï Ö ÙÒ ÒØ Ö Ð Ö Ö Ð Ø Ú Ø ÈÙÒ ØØ Ð Ò º º º º º º º º º ¾ ¾º¾ Ê Ô Ö Ñ ØÖ ÖÙÒ ÒÚ Ö ÒÞ º º º º º º º
σ ϕ = σ x cos 2 ϕ + σ y sin 2 ϕ + 2τ xy sinϕcos ϕ
ÃÓÑÔÐ ØØ Ö Ò ÓÖÑ Ð ÑÐ Ò Ì Ò Ñ Ò Ú º Ö ÀÐÐ Ø Ø ÐÖ ÄÙÒ ÍÒ Ú Ö Ø Ø Ù Ù Ø ¾¼½¾ ½ ËÔÒÒ Ò Ö τ σ ÆÓÖÑ Ð ÔÒÒ Ò σ = ÔÒÒ Ò ÓÑÔÓÒ ÒØ Ú Ò ÐÖØ ÑÓØ Ò ØØÝØ Ë ÙÚ ÔÒÒ Ò τ = ÔÒÒ Ò ÓÑÔÓÒ ÒØ Ø Ò ÒØ ÐÐØ Ø ÐÐ Ò ØØÝØ ËÔÒÒ Ò
e x/1000 för x 0 0 annars
VK Matematiska institutionen avd matematisk statistik TENTAMEN I 5B506 MATEMATISK STATISTIK GRUNDKURRS FÖR D OCH F, 5B504 MATEMATISK STATISTIK GRUNDKURS FÖR ÄLDRE OCH 5B50 MARKOVPROCESSER ONSDAGEN DEN
Laboration 2: Sannolikhetsteori och simulering
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK LABORATION 2 MATEMATISK STATISTIK AK FÖR CDIFYSIKER, FMS012/MASB03, HT13 Laboration 2: Sannolikhetsteori och simulering Syftet med den här
F9 SAMPLINGFÖRDELNINGAR (NCT
Stat. teori gk, ht 006, JW F9 SAMPLINGFÖRDELNINGAR (NCT 7.1-7.4) Ordlista till NCT Sample Population Simple random sampling Sampling distribution Sample mean Standard error The central limit theorem Proportion
Verktyg för visualisering av MCMC-data. JORGE MIRÓ och MIKAEL BARK
Verktyg för visualisering av MCMC-data JORGE MIRÓ och MIKAEL BARK Examensarbete Stockholm, Sverige 2010 Verktyg för visualisering av MCMC-data JORGE MIRÓ och MIKAEL BARK Examensarbete i datalogi om 15
PLANERING MATEMATIK - ÅK 7. Bok: X (fjärde upplagan) Kapitel : 1 Tal och räkning Kapitel : 2 Stort, smått och enheter. Elevens namn: Datum för prov
PLANERING MATEMATIK - ÅK 7 HÄLLEBERGSSKOLAN Bok: X (fjärde upplagan) Kapitel : 1 Tal och räkning Kapitel : 2 Stort, smått och enheter Elevens namn: markera med kryss vilka uppgifter du gjort Avsnitt: sidor
ÃÓÑÔÙØØÓÒÐÐ ÁÒØÐÐÒ ÐÓÖØÓÒ ¾ Ê ËÚÒÖ ÖÞ ÅÙ Ø ÀÒ ÇÐÓ ÓÒ ÑÖ ¾¼¼¾ ÁÒÒÐÐ ½ ËÝØØ Ñ ÒÒ ÐÓÖØÓÒ ¾ ÌÓÖ ÒÐÝ º½ ÖÙ º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º º½º½ ÅÖ ÖÙ º º º º º º º º º º º º
Laboration 3: Enkla punktskattningar, styrkefunktion och bootstrap
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORLABORATION 3, HT -06 MATEMATISK STATISTIK FÖR F, PI OCH NANO, FMS 012 MATEMATISK STATISTIK FÖR FYSIKER, MAS 233 Laboration 3: Enkla punktskattningar,
Stokastiska processer och simulering I 24 augusti
STOCKHOLMS UNIVERSITET LÖSNINGAR MATEMATISKA INSTITUTIONEN Stokastiska processer och simulering I Avd Matematisk statistik 24 augusti 2016 Lösningar Stokastiska processer och simulering I 24 augusti 2016
MVE051/MSG Föreläsning 7
MVE051/MSG810 2016 Föreläsning 7 Petter Mostad Chalmers November 23, 2016 Överblick Deskriptiv statistik Grafiska sammanfattningar. Numeriska sammanfattningar. Estimering (skattning) Teori Några exempel
0, x a x a b a 1, x b. 1, x n. 2 n δ rn (x), { 0, x < rn δ rn (x) = 1, x r n
Ë ÒÒÓÐ Ø ÐÖ È ÚÓ Ë ÐÑ Ò Ò ÒÙ Ö ¾¼½¼ ÁÒÒ ÐÐ ½ Ö ÐÒ Ò ÙÒ Ø ÓÒ Ö Ó ÒÒÓÐ Ø ÑØØ ¾ ¾ ËØÓ Ø Ú Ö Ð Ö ÇÑ ÈÓ ÓÒ¹ Ö ÐÒ Ò Ò ½¼ º½ ÈÓ ÓÒ Ö ÐÒ Ò ÓÑ ÖÒ Ö ÐÒ Ò Ö ÒÓÑ Ð Ö ÐÒ Ò º ½½ º¾ ÈÓ ÓÒ¹ Ö ÐÒ Ò ÓÑ Ò ÑÓ ÐÐ Ö Ó ÖÙØ Ó
Exempel. Vi observerar vädret och klassificerar det i tre typer under en följd av dagar. vackert (V) mulet (M) regn (R)
Exempel Vi observerar vädret och klassificerar det i tre typer under en följd av dagar. vackert (V mulet (M regn (R Exempel Vackert idag vackert imorgon sannolikheten 0.6 Vackert idag mulet imorgon sannolikheten
Frågetimmar inför skrivningarna i oktober
MATEMATIK Frågetimmar inför skrivningarna i oktober (Tomas Carnstam, Johan Richter, ) fredag 9 oktober 55 7 (Obs) tisdag 2 oktober 05 2 onsdag 24 oktober 05-2 torsdag 25 oktober 05 2 fredag 26 oktober
Markovprocesser SF1904
Markovprocesser SF1904 Johan Westerborn johawes@kth.se Föreläsning 4 Markovprocesser 20 April 2015 Johan Westerborn Markovprocesser (1) Föreläsning 4 Föreläsningsplan 1 Förra Föreläsningen 2 Innbäddade
Ö ÆË Ò Ö ÚÒ Ò Ö Ð Ö Î À ØÓÖ Ó Ò Ö ÐÐ Ö ÚÒ Ò Ò Ð Ö Ø Ò Æ ÑÒ ÖÚ ÖÒ ÐÐ Ö ÒØÐ Ò ÐÚ ÓÒ Ö Ó Ö ÒÒ Ðк ÍÔÔ Ð ÔÖÓ Ò ÐÐ Ö ÙÖ Ñ Ò Ð Ø Ö Ø º ÇÔ Ö Ø Ú Ô Ø Öº Ë Ö Ø
Ö ÆË Ò Ö ÚÒ Ò Ö Ð Ö Î À ØÓÖ Ó Ò Ö ÐÐ Ö ÚÒ Ò Ò Ð Ö Ø Ò Æ ÑÒ ÖÚ ÖÒ ÐÐ Ö ÒØÐ Ò ÐÚ ÓÒ Ö Ó Ö ÒÒ Ðк ÍÔÔ Ð ÔÖÓ Ò ÐÐ Ö ÙÖ Ñ Ò Ð Ø Ö Ø º ÇÔ Ö Ø Ú Ô Ø Öº Ë Ö Øº Ö ÑØ º ÌÀÆÇ»ËÍÆ Ì Ë ½ ÓÔÝÖ Ø ÅÒ Æ Ð ÓÒ ¾¼¼¾ À ØÓÖ
Ä Ò Ô Ò ÙÒ Ú Ö Ø Ø ÄÖ ÖÔÖÓ Ö ÑÑ Ø Å Ö Ã Ð Ö Ò ÅÓØ Ú Ø ÓÒ Ó ÐÚÙÔÔ ØØÒ Ò ÀÙÖ Ò Ò ÐÖ Ö ÔÚ Ö Ü Ñ Ò Ö Ø ½¼ ÔÓÒ ÄÁÍ¹Ä Ê¹Ä¹ ¹¹¼»½¼ ¹¹Ë À Ò Ð Ö ÂÓ Ñ Ë ÑÙ Ð ÓÒ
Ä Ò Ô Ò ÙÒ Ú Ö Ø Ø ÄÖ ÖÔÖÓ Ö ÑÑ Ø Å Ö Ã Ð Ö Ò ÅÓØ Ú Ø ÓÒ Ó ÐÚÙÔÔ ØØÒ Ò ÀÙÖ Ò Ò ÐÖ Ö ÔÚ Ö Ü Ñ Ò Ö Ø ½¼ ÔÓÒ ÄÁÍ¹Ä Ê¹Ä¹ ¹¹¼»½¼ ¹¹Ë À Ò Ð Ö ÂÓ Ñ Ë ÑÙ Ð ÓÒ ÁÒ Ø ØÙØ ÓÒ Ò Ö Ø Ò Ú Ø Ò Ô Ó ÐÖ Ò Ú ÐÒ Ò ÁÒ Ø ØÙØ
Tentamen i FMS180/MASC03 Markovprocesser
Matematisk statistik Matematikcentrum Lunds Universitet Tentamen i FMS80/MASC03 Markovprocesser 009-05-5 Lösningsförslag. Följande är en möjlighet. 6 5 3 4 Här är tillstånden, och 3 transienta, tillstånd
Föreläsning 1. Repetition av sannolikhetsteori. Patrik Zetterberg. 6 december 2012
Föreläsning 1 Repetition av sannolikhetsteori Patrik Zetterberg 6 december 2012 1 / 28 Viktiga statistiska begrepp För att kunna förstå mer avancerade koncept under kursens gång är det viktigt att vi förstår
ÈÖÓ Ö ÑÚ Ö Ö ÙÒ ÖÚ Ò Ò ÓÑ Ö Ò ¹ Ò ¹ ÓÙÒ ¹Ñ ØÓ Ò Ã Ò Ø Ö Ø ÒÓÑ Ú Ð Ò Ò Ö ÙØ Ð Ò Ò Ò Ú ÐÑ Ö ÂÓÒ Ø Ò Ð Ø Ø ÝÐÐ Ö Ò Ø ÒÒ ÙÖ Ö Ò Ê ÑÐ ÂÓ Ò Î ÐÐÝ ÓÒ ÁÒ Ø ØÙØ ÓÒ Ò Ö Ñ Ø Ñ Ø Ú Ø Ò Ô Ö ÐÑ Ö Ø Ò ÓÐ Ø ÓÖ ÙÒ Ú Ö
Tentamen i Beräkningsvetenskap II, 5.0 hp, Del A
Uppsala universitet Institutionen för informationsteknologi Beräkningsvetenskap Tentamen i Beräkningsvetenskap II, 5.0 hp, 2016-03-16 Del A 1. (a) Beräkna lösningen Ù vid Ø = 03 till differentialekvationen
F2 Introduktion. Sannolikheter Standardavvikelse Normalapproximation Sammanfattning Minitab. F2 Introduktion
Gnuer i skyddade/oskyddade områden, binära utfall och binomialfördelningar Matematik och statistik för biologer, 10 hp Fredrik Jonsson Januari 2012 I vissa områden i Afrika har man observerat att förekomsten
Introduktion till statistik för statsvetare
och enkäter "Det finns inget så praktiskt som en bra teori" September 2011 och enkäter Inledning Inledning Om vi vill mäta en egenskap hos en population individer (individer kan vara personer, företag
4 Diskret stokastisk variabel
4 Diskret stokastisk variabel En stokastisk variabel är en variabel vars värde bestäms av utfallet av ett slumpmässigt försök. En stokastisk variabel betecknas ofta med X, Y eller Z (i läroboken används
Stokastiska processer och simulering I 24 maj
STOCKHOLMS UNIVERSITET LÖSNINGAR MATEMATISKA INSTITUTIONEN Stokastiska processer och simulering I Avd. Matematisk statistik 24 maj 2016 Lösningar Stokastiska processer och simulering I 24 maj 2016 9 14
Stokastiska processer
Stokastiska processer Fredrik Olsson, fredrik.olsson@iml.lth.se Avdelningen för produktionsekonomi Lunds tekniska högskola, Lunds universitet Dessa förläsningsanteckningar kommer att behandla diskreta
ÁÒÒ ÐÐ Á ÝÖ ÖÒ ÓÑ ËÙÖ Ð¹ Ö ÓÑ ØØ Ö ÁÁ ÌÖ Ö ÓÑ Ñ Ò Ñ Ø ÒÒ Ø ÐÐ Ó Ò Ð Ø Ö ÁÁÁ йÀ Ò Ö Ñ Ö Ð ÓÒ ÁÎ Ò Ö Ø ÖÙÒ Ò Î Ò Ò Ö ÖÙÒ Ò ÃÒÒ ÓÑ ÓÑ ÚÖ Ö Ð ÓÒ Á ¹ Ð Ñ
ØÖ ÖÙÒ ÖÒ Ë Ý ¹ÙйÁ Ð Ñ ÅÓ ÑÑ Á Ò Ð¹Ï Á ÐÐ Æ ÑÒ Ò Æ Ö Ò ÖÑ ÖØ Ë ÑÑ Ò ØØÒ Ò ÐÐ Ö Ñ Ö Ø ÐÐ ÐÐ Ó Ñ Ö Ó ÚÐ Ò Ð Ö Ú Ö Ñ ÈÖÓ Ø Ò ÅÓ ÑÑ º ØØ Ö ØÖ ÖÙÒ ÖÒ ÒØÐ Ò Ø Ò ÖÒ ÖÙй Ø ºÓÑ Ñ Ö Ø ÐÐØ Ð ÓÑ Ö Ú Ò Ñ Ð Ø Ö Ð
ËÐ ½ ØØ ÒØÖÖ ÒÙÑÖ Ø ÚÖØÙÖµ ÐØ ÓÑ ÖØ ÖÒ Ð ËÐ ¾ ÁÒØÖÐÖ Ê ÈÖÓÐÑØ (Ü) Ü ÖÖ ÓÑ (Ü) Ö ÚÒ Ò Ø ÒÖ ÑØÔÙÒØÖ Ü Ò Ø (Ü) Òµ ÆÙÑÖ Ð ÒÒ ÔÖÒÔ ÖØ Ö Ü Ú Ð Ò ÔÙÒØÖ Ü 0 Ü ÜÆ Ö Ü 0 = ÜÆ = ÇÑ Ú ØÒØ ÒÐÒÒ ØÐÒ = = Æ Ö ØØ ÒØÖÒÒ
Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga urvalsmetoder
Tillämpad statistik (A5), HT15 Föreläsning 6: Några övriga smetoder Ronnie Pingel Statistiska institutionen Senast uppdaterad: 2015-11-11 Några övriga smetoder OSU-UÅ (med eller utan stratifiering) förutsätter
Nätverksmodeller med preferential attachment
Nätverksmodeller med preferential attachment Bjarne Kampegård Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats 2010:4 Matematisk statistik Juni 2010 www.math.su.se
Å Ø Ñ Ø Ø Ø Ø ÌÓÑÑÝ ÆÓÖ Ö ¾ Ù Ù Ø ¾¼¼ ÓÖÑÐ Ö Ó Ø ÐÐ Ö Ø ÐÐ Å Ø Ñ Ø Ø Ø Ø Ô ÙÒ Ú Ö Ø Ø Ó Ø Ò ÓÐÓÖ
ÅØÑØ ØØ Ø ÌÓÑÑÝ ÆÓÖÖ ¾ ÙÙ Ø ¾¼¼ ÓÖÑÐÖ Ó ØÐÐÖ ØÐÐ ÅØÑØ ØØ Ø Ô ÙÒÚÖ ØØ Ó ØÒ ÓÐÓÖ ËÒÒÓÐØ ØÓÖ ËÒÒÓÐØ ØÓÖ ÄÓÖÑ ÒÒÓÐØ ÖÐÒÒ Ô ØØ ÒÐØ ÙØÐÐ ÖÙÑ Ë ÇÑ ÐÐ ÙØÐÐ Ö Ð ÒÒÓÐ ÐÐÖ Ö Ò ÒÐ ØØ È µ Ò µ Ò Ëµ ØØ Ö Ò Ð ÒÒÓÐØ ÒØÓÒÒº
¾ ½ ½¼ ÈÖÓ Ö ÑÑ Ö Ò Ø Ò Ö Ì½ Ä ÓÖ Ø ÓÒ Ö Ð Ö Ø ¾¼¼¼»¾¼¼½ ÝÐÐ ØØ Ò ÑÒ Ó Ô Ö ÓÒÒÙÑÑ Ö Ñ Ð ÐÐ Ö ÑÓØ Ú Ö Ò º Ç Ë ÇÑ ÒØ ÒÒ Ú ØØ Ò Ø Ñ Ú Ö ÓÚ Ò Ò Ò Ö Ù Ò Ò Ú ØØ Ò Ö Ùй Ø Ø Ø Ö ÔÔÓÖØ Ö Ó Ò Ö ÔÔÓÖØ Ö Ò Ý Ø Ñ
Demonstration av laboration 2, SF1901
KTH 29 November 2017 Laboration 2 Målet med dagens föreläsning är att repetera några viktiga begrepp från kursen och illustrera dem med hjälp av MATLAB. Laboration 2 har följande delar Fördelningsfunktion
Ê Ò ÓÑ Û Ð Ò Ö Ò ÓÑ Ò ÖÝ ÙÖÚ Ý Ó ÓÑ Ö ÒØ Ö ÙÐØ Ö Ò Ò ÀÓÐÐ Ò Ö Â «Ö Ý º ËØ ØÖ Ø ÁÒ Ø Ô Ô Ö Û Ú ÙÖÚ Ý Ó ÓÑ Ö ÒØ Ö ÙÐØ ÓÖ Ö Ò ÓÑ Û Ð Ò Ö Ò ÓÑ Ò ÖÝ ÊÏÊ˵º
Ê Ò ÓÑ Û Ð Ò Ö Ò ÓÑ Ò ÖÝ ÙÖÚ Ý Ó ÓÑ Ö ÒØ Ö ÙÐØ Ö Ò Ò ÀÓÐÐ Ò Ö Â «Ö Ý º ËØ ØÖ Ø ÁÒ Ø Ô Ô Ö Û Ú ÙÖÚ Ý Ó ÓÑ Ö ÒØ Ö ÙÐØ ÓÖ Ö Ò ÓÑ Û Ð Ò Ö Ò ÓÑ Ò ÖÝ ÊÏÊ˵º ÇÒ ½ Û Ö Ú Ò Ö Ò ÓÑ Û Ð Û Ø º º º ÒÖ Ñ ÒØ Ò Ö Ò ÓÑ
1 Minkostnadsflödesproblem i nätverk
Krister Svanberg, april 2012 1 Minkostnadsflödesproblem i nätverk Ett nätverk består av en given mängd noder numrerade från 1 till m (där m är antalet noder) samt en given mängd riktade bågar mellan vissa
( ) = 3 ( + 2)( + 4) ( ) =
ÊÒÚÒÒÖ ØÐÐ ÔØÐ ÓÑÔÒØ º½ ËÖÚ Ý ØÑÒ ÒÒ Ô ØÐÐ ØÒ ÓÖѺ ÒØ ØØ Ù Ö Ò ÒÐ Ó Ý ÙØ ¹ Òк µ µ Ý(Ø) + Ý(Ø) 2 Ý(Ø) + 3 Ý(Ø) 5 µ 4 Ú(Ø) + 5Ú(Ø) 2 Ý(Ø) + 2Ý(Ø) 5Ú(Ø) µ Ú(Ø) + 2Ú(Ø) 3 Ý(Ø) + 7 Ý(Ø) + 4Ý(Ø) 5Ú(Ø) µ Ý (3)
Dlnx = 1 x. D 1 4 x4 = 1 4 4x3 = x 3. F(x) = x3 + x2. + x2. F (x) = G (x) = x 2 + x = f(x). Ó G(x) =
ÃÓÑÔ Ò ÙÑ ÈÖÓÔ ÙØ Ñ Ø Ñ Ø ÁÁ Ò Ð ÙÔ Ö Ø Ø Ú Å Ð Ò À Å Ø Ñ Ø Ò Ø ØÙØ ÓÒ Ò Ó Ñ Ó ¾¼¼ ÁÒÒ ÐÐ ½ ÁÒÐ Ò Ò ¾ ÁÒØ Ö Ð Ö ¾º½ Ö Ú Ø Ó ÔÖ Ñ Ø Ú ÙÒ Ø ÓÒ º º º º º º º º º º º º º º º º º º ¾º¾ ÈÖ Ñ Ø Ú ÙÒ Ø ÓÒ Ø ÐÐ
Finns det över huvud taget anledning att förvänta sig något speciellt? Finns det en generell fördelning som beskriver en mätning?
När vi nu lärt oss olika sätt att karaktärisera en fördelning av mätvärden, kan vi börja fundera över vad vi förväntar oss t ex för fördelningen av mätdata när vi mätte längden av en parkeringsficka. Finns
Ë ÑÑ Ò ØØÒ Ò ÃÓ ÑÓÐÓ ÑÑ ÙØ ÖÓØØ Ö Ð Ò Ñ Ø Ò Ö Ö ÒÓÑ Ò ÓÑ Ó ÖÚ Ö Ø ÍÒ Ú Ö ÙѺ ÍÖ ÔÖÙÒ Ø Ö Ö Ø Ð ÜØ Ö Ú Ñ¹ Ñ ØÖÐÒ Ò Ö Ö Ð Ø ÚØ Ó ÒØ Ñ Ò ØÖÓ ÓÑÑ ÙÖ ÓÐÐ Ó
ËÔ ØÖ Ð Ò ÐÝ Ú ÑÑ ÙØ ÖÓØØ Ò ØÙ ØØ Ú ÍÒ Ú Ö ÙÑ Ñ Ø Ò Ö Ö ÒÓÑ Ò Ú Ò Ë Ó Ó Ø º Ö Ö Ò Ð Ö ÖÓ Ø º Ë ½¼ Ü Ñ Ò Ö Ø ÒÓÑ Ø Ò Ý ÖÙÒ Ò Ú ½ ¼ Ô À Ò Ð Ö Ð Ü ÊÝ ÁÒ Ø ØÙØ ÓÒ Ò Ö Ý Ë ÓÐ Ò Ö Ø Ò Ú Ø Ò Ô ÃÙÒ Ð Ì Ò ÓÐ Ò
Slutstorlekar hos Reed Frost-epidemier på slumpgrafer skapade enligt den viktade kongurationsmodellen
Slutstorlekar hos Reed Frost-epidemier på slumpgrafer skapade enligt den viktade kongurationsmodellen Anders Carlsson Kandidatuppsats i matematisk statistik Bachelor Thesis in Mathematical Statistics Kandidatuppsats
P(X nk 1 = j k 1,..., X n0 = j 0 ) = j 1, X n0 = j 0 ) P(X n0 = j 0 ) = etc... P(X n0 = j 0 ) ... P(X n 1
Kaitel 1 Mer Markovkedjor Med att secificera en Markovkedja menar vi att man bestämmer övergångsmatrisen P. Detta säger ju allt om dynamiken för rocessen. Om vi dessutom vet hur kedjan startar, dvs startfördelningen
1.1 Diskret (Sannolikhets-)fördelning
Föreläsning III. Diskret (Sannolikhets-)fördelning Med diskret menas i matematik, att något antar ett ändligt antal värden eller uppräkneligt oändligt med värden e.vis {, 2, 3,...}. Med fördelning menas
Statistik 1 för biologer, logopeder och psykologer
Innehåll 1 Hypotesprövning Innehåll Hypotesprövning 1 Hypotesprövning Inledande exempel Hypotesprövning Exempel. Vi är intresserade av en variabel X om vilken vi kan anta att den är (approximativt) normalfördelad
markera med kryss vilka uppgifter du gjort Avsnitt: sidor ETT ETT TVÅ TVÅ TRE TRE FYRA FYRA klart
PLANERING MATEMATIK - ÅK 8 Bok: Y (fjärde upplagan) Kapitel : 1 Bråk och procent Kapitel : 2 Bråk och potenser Elevens namn: markera med kryss vilka uppgifter du gjort Avsnitt: sidor ETT ETT TVÅ TVÅ TRE
Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla punktskattningar
Lunds tekniska högskola Matematikcentrum Matematisk statistik Laboration 3 Matematisk statistik AK för CDIFysiker, FMS012/MASB03, HT15 Laboration 3: Stora talens lag, centrala gränsvärdessatsen och enkla
Imperativ programering
Imperativ programering Lösningen till Inlämningsuppgift 1A sommaren 2007 Jesper Wilhelmsson 21 juni 2007 1 Program 1 1.1 C - غ ÒÙ Ø Óº ÒÙ Ø º ÒØ Ñ Ò µ Ö ÓÖ ³ ³ ³ ³ µ ÔÖ ÒØ ± µ ÔÖ ÒØ Ò µ Ö ØÙÖÒ ÁÌ ËÍ ËË
bli bekant med summor av stokastiska variabler.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 2 MATEMATISK STATISTIK FÖR E FMSF20 Syfte: Syftet med dagens laborationen är att du skall: få förståelse för diskreta, bivariate
Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling. Tentamensdatum: 28 maj 2018 Tid: 9-13
Matematisk Statistik 7,5 högskolepoäng Provmoment: Tentamen 6,5 hp Ladokkod: A144TG Tentamen ges för: TGMAI17h, Maskiningenjör - Produktutveckling Tentamensdatum: 28 maj 2018 Tid: 9-13 Hjälpmedel: Miniräknare
Bok: Z (fjärde upplagan) Kapitel : 1 Taluppfattning och tals användning Kapitel : 2 Algebra
PLANERING MATEMATIK - ÅR 9 Bok: Z (fjärde upplagan) Kapitel : 1 Taluppfattning och tals användning Kapitel : 2 Algebra Elevens namn: markera med kryss vilka uppgifter du gjort Avsnitt: sidor ETT ETT TVÅ
Införande av objektorienterade mönster för ökad förändringsbarhet i mjukvarusystem
Avdelning för datavetenskap Andréas Jonsson Införande av objektorienterade mönster för ökad förändringsbarhet i mjukvarusystem Introduction of object oriented patterns to increase software modifiability
Två innebörder av begreppet statistik. Grundläggande tankegångar i statistik. Vad är ett stickprov? Stickprov och urval
Två innebörder av begreppet statistik Grundläggande tankegångar i statistik Matematik och statistik för biologer, 10 hp Informationshantering. Insamling, ordningsskapande, presentation och grundläggande
Svenska Matematikersamfundet MEDLEMSUTSKICKET
Svenska Matematikersamfundet MEDLEMSUTSKICKET 15 oktober 2009 Redaktör: Ulf Persson Ansvarig utgivare: Tobias Ekholm Dinner with the Devlin: Persson Logikern Pelle Lindström död: Dag Westerståhl More Sex.
Föreläsn. anteckn. TMV206-VT13. Vecka 6-7. Egenvärden och Egenvektorer. Kap. 8-9
Föreläsn. Anteckn., Linjär algebra IT VT2013/Genkai Zhang 1 Föreläsn. anteckn. TMV206-VT13. Vecka 6-7. Egenvärden och Egenvektorer. Kap. 8-9 Det tredje huvuda momentet av kursen är egenvektorer/egenvärden
F8 Skattningar. Måns Thulin. Uppsala universitet Statistik för ingenjörer 14/ /17
1/17 F8 Skattningar Måns Thulin Uppsala universitet thulin@math.uu.se Statistik för ingenjörer 14/2 2013 Inledande exempel: kullager Antag att diametern på kullager av en viss typ är normalfördelad N(µ,
SF1901: Sannolikhetslära och statistik
SF9: Sannolikhetslära och statistik Föreläsning 3. Stokastiska variabler, diskreta och kontinuerliga Jan Grandell & Timo Koski 8.9.28 Jan Grandell & Timo Koski () Matematisk statistik 8.9.28 / 45 Stokastiska
Ø Ú Ø Ò Ô Ö Ø Ò Ç Ð ÓÒ ² Ñ Ð À Ú Ð Ö Ò Ú Ö Ü Ñ Ò Ö Ø ¾¼¼¼ ¼ ÒÒ Ö ÔÔÓÖØ Ö Ö Ú Ò ÓÑ Ò Ð Ú Ø Ö Ø ÓÑ ÖÚ Ö ØØ Ö ÐÐ Ò Ò Ø Ü Ñ Ò Ø Ú Ø Ò Ôº ÐÐØ Ñ Ø Ö Ð ÒÒ Ö ÔÔÓÖØ Ú Ð Ø ÒØ Ö ÚÖØ Ø Ö Ð Ú Ø ØÝ Ð Ø ÒØ Ö Ø Ó Ò Ø
4.1 Grundläggande sannolikhetslära
4.1 Grundläggande sannolikhetslära När osäkerhet förekommer kan man aldrig uttala sig tvärsäkert. Istället använder vi sannolikheter, väntevärden, standardavvikelser osv. Sannolikhet är ett tal mellan
TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL
Avd. Matematisk statistik TENTAMEN I SF1904 MARKOVPROCESSER FREDAGEN DEN 17 AUGUSTI 2018 KL 8.00 13.00. Examinator: Björn-Olof Skytt tel. 790 86 49 Kursansvarig: Björn-Olof Skytt tel. 790 86 49 Tillåtna
7.5 Experiment with a single factor having more than two levels
7.5 Experiment with a single factor having more than two levels Exempel: Antag att vi vill jämföra dragstyrkan i en syntetisk fiber som blandats ut med bomull. Man vet att inblandningen påverkar dragstyrkan
Ð ËÅ ½¹½¾¹¼¾ ½ ÅØØ ØÐ ÔÔÒÒ ÇÖÖÒÒ ÖÐÖ ÑØØ ÔÔÒØ ÐÓÒ ½º¾ Ñ ¼ ØÒÓÐÓÖ ÒÖÚÖÒº ¾ ÓÖÑÐ µ ÌÐÐ ÑØ ÓÖÖÒ ÚÐ ÓÖ ÂÓÑ ÅÐÐ ÚÖº µ ÌÐÐ ÑØ ÖØÖÖ ÚÐ Ö ÒÒ Ö ÓÒ ÚÖº µ ÌÐÐ Ù ØÖÒ ÑÒ ÚÐ ÌÓÑ ÏÖ ÜØÙ ÑÙ ÑØ ÂÓÒ ÀÖ ØÖØÙ ¹ ÑÙ º µ ÁÒ
Laboration 5: Regressionsanalys. 1 Förberedelseuppgifter. 2 Enkel linjär regression DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK Laboration 5: Regressionsanalys DATORLABORATION 5 MATEMATISK STATISTIK FÖR I, FMS 012, HT-08 Syftet med den här laborationen är att du skall
DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03. bli bekant med summor av stokastiska variabler.
LUNDS TEKNISKA HÖGSKOLA MATEMATIKCENTRUM MATEMATISK STATISTIK DATORÖVNING 2 MATEMATISK STATISTIK FÖR D, I, PI OCH FYSIKER; FMSF45 & MASB03 Syfte: Syftet med dagens laborationen är att du skall: få förståelse
2.1 Mikromodul: stokastiska processer
2. Mikromodul: stokastiska processer 9 2. Mikromodul: stokastiska processer 2.. Stokastiska variabler En stokastiskt variabel X beskrivs av dess täthetsfunktion p X (x), vars viktigaste egenskaper sammanfattas
Vattenabsorption i betong under inverkan av temperatur
LUNDS TEKNISKA HÖGSKOLA LUNDS UNIVERSITET Avd Byggnadsmaterial Vattenabsorption i betong under inverkan av temperatur Tina Wikström Rapport TVBM-5084 Lund 2012 ISRN: LUTVDG/TVBM--12/5084--SE (1-66) ISSN: