Genomsnittligt sökdjup i binära sökträd

Relevanta dokument
H1009, Introduktionskurs i matematik Armin Halilovic POLYNOM, POLYNOMDIVISION, ALGEBRAISKA EKVATIONER, PARTIALBRÅKSUPPDELNING. vara ett polynom där a

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n grad( P(

Lösningar och kommentarer till uppgifter i 1.1

Armin Halilovic: EXTRA ÖVNINGAR

Föreläsning 10: Kombinatorik

. Mängden av alla möjliga tillstånd E k kallas tillståndsrummet.

Uppgifter 3: Talföljder och induktionsbevis

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

Datorövning 2 Fördelningar inom säkerhetsanalys

Induktion LCB Rekursion och induktion; enkla fall. Ersätter Grimaldi 4.1

Borel-Cantellis sats och stora talens lag

x 1 x 2 x 3 x 4 x 5 x 6 HL Z x x x

Vad är det okända som efterfrågas? Vilka data är givna? Vilka är villkoren?

Föreläsning G04: Surveymetodik

ENDIMENSIONELL ANALYS B1 FÖRELÄSNING VI. Föreläsning VI. Mikael P. Sundqvist

Cartesisk produkt. Multiplikationsprincipen Ï Ï Ï

Tentamenskrivning, , kl SF1625, Envariabelanalys för CINTE1(IT) och CMIEL1(ME ) (7,5hp)

SANNOLIKHETER. Exempel. ( Tärningskast) Vi har sex möjliga utfall 1, 2, 3, 4, 5 och 6. Därför är utfallsrummet Ω = {1, 2, 3, 4, 5,6}.

Induktion och Binomialsatsen. Vi fortsätter att visa hur matematiska påståenden bevisas med induktion.

F4 Matematikrep. Summatecken. Summatecken, forts. Summatecken, forts. Summatecknet. Potensräkning. Logaritmer. Kombinatorik

Introduktion till statistik för statsvetare

Kompletterande kurslitteratur om serier

4. Uppgifter från gamla tentor (inte ett officiellt urval) 6

101. och sista termen 1

Digital signalbehandling Alternativa sätt att se på faltning

Sannolikheten. met. A 3 = {2, 4, 6 }, 1 av 11

DEL I. Matematiska Institutionen KTH

c n x n, där c 0, c 1, c 2,... är givna (reella eller n=0 c n x n n=0 absolutkonvergent om x < R divergent om x > R n n lim = 1 R.

LINJÄRA DIFFERENTIALEKVATIONER AV HÖGRE ORDNINGEN

Andra ordningens lineära differensekvationer

Uppsala Universitet Matematiska Institutionen Thomas Erlandsson

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

Statistisk analys. Vilka slutsatser kan dras om populationen med resultatet i stickprovet som grund? Hur säkra uttalande kan göras om resultatet?

Inledande matematisk analys. 1. Utred med bevis vilket eller vilka av följande påståenden är sana:

Datorövning 2 Fördelningar inom säkerhetsanalys

TAMS15: SS1 Markovprocesser

MS-A0409 Grundkurs i diskret matematik I

Hambley avsnitt 12.7 (även 7.3 för den som vill läsa lite mer om grindar)

Intervallskattning. c 2005 Eric Järpe Högskolan i Halmstad. Antag att vi har ett stickprov x 1,..., x n på X som vi vet är N(µ, σ) men vi vet ej

Visst kan man faktorisera x 4 + 1

Minsta kvadrat-metoden, MK. Maximum likelihood-metoden, ML. Medelfel. E(X i ) = µ i (θ) MK-skattningen av θ fås genom att minimera

Inledande matematisk analys (TATA79) Höstterminen 2016 Föreläsnings- och lekionsplan

TENTAMEN I MATEMATISK STATISTIK Datum: 13 mars 08

θx θ 1 om 0 x 1 f(x) = 0 annars

Föreskrift. om publicering av nyckeltal för elnätsverksamheten. Utfärdad i Helsingfors den 2. december 2005

Föreläsning G70, 732G01 Statistik A. Föreläsningsunderlagen är baserade på underlag skrivna av Karl Wahlin

2. Konfidensintervall för skillnaden mellan två proportioner.

Uppsala Universitet Matematiska Institutionen Bo Styf. Genomgånget på föreläsningarna Föreläsning 26, 9/2 2011: y + ay + by = h(x)

Linjär Algebra (lp 1, 2016) Lösningar till skrivuppgiften Julia Brandes

Databaser - Design och programmering. Databasdesign. Funktioner. Relationsmodellen. Relationsmodellen. Funktion = avbildning (mappning) Y=X 2

Fourierserien. fortsättning. Ortogonalitetsrelationerna och Parsevals formel. f HtL g HtL t, där T W ã 2 p, PARSEVALS FORMEL

RESTARITMETIKER. Avsnitt 4. När man adderar eller multiplicerar två tal som t ex

vara ett polynom där a 0, då kallas n för polynomets grad och ibland betecknas n = grad( P(

Databaser - Design och programmering. Databasdesign. Kravspecifikation. Begrepps-modellering. Design processen. ER-modellering

Ekvationen (ekv1) kan beskriva en s.k. stationär tillstånd (steady-state) för en fysikalisk process.

Multiplikationsprincipen

Trigonometriska polynom

Lycka till! I(X i t) 1 om A 0 annars I(A) =

Tentamen i Sannolikhetsteori III 13 januari 2000

Bilaga 1 Formelsamling

Enkel slumpvandring. Sven Erick Alm. 9 april 2002 (modifierad 8 mars 2006) 2 Apan och stupet Passagesannolikheter Passagetider...

MS-A0409 Grundkurs i diskret matematik Sammanfattning, del I

b) Bestäm det genomsnittliga antalet testade enheter, E (X), samt även D (X). (5 p)

Konsoliderad version av. Styrelsens för ackreditering och teknisk kontroll föreskrifter (STAFS 1993:18) om EEG-märkning av färdigförpackade varor

Resultatet av kryssprodukten i exempel 2.9 ska vara följande: Det vill säga att lika med tecknet ska bytas mot ett plustecken.

Tentamen i Statistik STG A01 (12 hp) 5 mars 2010, kl

Anmärkning: I några böcker använder man följande beteckning ]a,b[, [a,b[ och ]a,b] för (a,b), [a,b) och (a,b].

Tentamen 19 mars, 8:00 12:00, Q22, Q26

Jag läser kursen på. Halvfart Helfart

TNA001- Matematisk grundkurs Tentamen Lösningsskiss

Tommy Färnqvist, IDA, Linköpings universitet

Operativsystem - Baklås

UPPSKATTNING AV INTEGRALER MED HJÄLP AV TVÅ RIEMANNSUMMOR. Med andra ord: Vi kan approximera integralen från båda sidor

Föreläsning F3 Patrik Eriksson 2000

H1009, Introduktionskurs i matematik Armin Halilovic. använder vi oftast induktionsbevis.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 5 juni 2004, kl

(a) Skissa täthets-/frekvensfunktionen och fördelningsfunktionen för X. Glöm inte att ange värden på axlarna.

MS-A0509 Grundkurs i sannolikhetskalkyl och statistik Exempel etc., del II

Tentamen i Statistik, STA A13 Deltentamen 2, 5p 20 januari 2007, kl

F10 ESTIMATION (NCT )

Övningstentamen i MA2018 Tillämpad Matematik III-Statistik, 7.5hp

TMS136: Dataanalys och statistik Tentamen med lösningar

Föreläsning 2: Punktskattningar

Webprogrammering och databaser. Begrepps-modellering. Exempel: universitetsstudier Kravspec. ER-modellen. Exempel: kravspec forts:

b 1 och har för olika värden på den reella konstanten a.

Sydkraft Nät AB, Tekniskt Meddelande för Jordningsverktyg : Dimensionering, kontroll och besiktning

Föreläsning G04 Surveymetodik 732G19 Utredningskunskap I

NEWTON-RAPHSONS METOD (en metod för numerisk lösning av ekvationer)

Kontrollskrivning 3 i SF1676, Differentialekvationer med tillämpningar. Tisdag kl 8:15-10

MA2018 Tillämpad Matematik III-Statistik, 3.5hp,

Grundläggande matematisk statistik

Universitetet: ER-diagram e-namn

För att skatta väntevärdet för en fördelning är det lämpligt att använda Medelvärdet. E(ξ) =... = µ

1. (a) Eftersom X och Y har samma fördelning så har de även samma väntevärde och standardavvikelse. E(X 2 ) = k

Befolkning per födelseland Reviderad metod vid framskrivningar. Version: 2

LINJÄR ALGEBRA II LEKTION 4

Lösning till tentamen för kursen Log-linjära statistiska modeller 29 maj 2007

Tentamen i Linjär Algebra, SF december, Del I. Kursexaminator: Sandra Di Rocco. Matematiska Institutionen KTH

Databaser - Design och programmering. Programutveckling. Programdesign, databasdesign. Kravspecifikation. ER-modellen. Begrepps-modellering

Transkript:

Iformatiostekologi Tom Smedsaas 10 augusti 016 Geomsittligt sökdjup i biära sökträd Detta papper visar att biära sökträd som byggs upp av slumpmässiga data är bra. Beteckigar och defiitioer Defiitio De itera väglägde beteckad IPL eller I är summa av alla oders väglägder där rote sägs ha väglägde 1, rotes bar väglägdera etc. För att defiiera de extera väglägde kompletterar vi trädet med alla tomma träd som vi kallar extera oder. Det ya trädet iehåller då itera och + 1 extera oder trädet är ju fullt dvs varje od är atige e iter med två bar eller ett löv uta bar. De extera väglägde beteckad EPL eller E defiieras som summa av alla extera oders väglägder. Exempel k k a s a s e v e v Figure visar hur trädets komletteras med extera oder. I trädet är I 11 och E Ett träds väglägd är ett mått på hur välförgreat det är för samma atal oder är ett träd med lite väglägd mer välförgreat ä ett träd med stor väglägd. Det fis ett ekelt sambad mella de itera och de extera väglägde uttryckt i följade formel: Detta ka visas med hjälp av iduktio övig! E I + + 1 1 1

Avädig av väglägder Väglägdera är speciellt avädbara för att uttrycka det geomsittliga arbetet för sökig i ett biärt sökträd. Om ett träd med oder har iter och exter väglägd I respektive E så gäller att det geomsittliga atalet försök s för att söka e befitlig yckel så kallad lyckad sökig är s I Detta följer direkt av defiitioe av iter väglägd: att hitta yckel lagrad i rote kräver ett försök, yckelara i rotes bar två försök etc. Resoemaget förutsätter att alla ycklar är lika saolika att bli sökta. För att hitta motsvarade uttryck för misslyckad sökig dvs att upptäcka att e viss yckel ite fis i trädet kostaterar vi att varje misslyckad sökig slutar i e exter od. För att komma fram till de extera ode gör vi lika måga försök som dess bidrag var till de extera väglägde. Om alla extera oder är lika saolika täk efter vad detta egetlige iebär så blir det geomsittliga atalet försök u för e misslyckad sökig u E + 1 3 det fis ju + 1 extera oder. Det är således i högsta grad itressat att titta på vad vi ka förväta oss för väglägder i ett biärt sökträd. Att de mista och största möjliga väglägde är Θ log respektive Θ lämas som e gaska ekel övig. De svårare me itressatare fråga vad vi ka förväta oss för väglägd i ett slumpmässigt uppbyggt träd ägar vi ästa avsitt åt. Väglägd i träd uppbyggt av slumptal Atag att vi har uika ycklar och att ett biärt sökträd byggs upp geom att dessa ycklar successivt läggs i i trädet. Atag vidare att var och e av de! olika permutatioera av ycklara är lika saolik. Påståede De geomsittliga itera väglägde i de träd som geereras är 1.386 lg + O Bevis Låt E betecka de geomsittliga extera väglägde och I betecka de geomsittliga itera väglägde i de träd som skapas av alla möjliga iläggigssekveser av de ycklara.

Då gäller E I + + 1 4 Eftersom ovaståede relatio gäller för varje eskilt träd måste de också gälla för medelvärdet Atalet odbesök som görs vid sökig av e viss yckel är exakt lika måga som gjordes är de yckel lades i i trädet om ma äve räkar de extera, tomma ode. Vid det i:te ilägget så görs, i geomsitt, Ei 1/i eftersom i 1 reda är lagrade och det fis i extera il -oder. Vid första ilägget görs E0/1 besök i geomsitt, adra ilägget E1/ besök i geomsitt o.s.v. Eftersom det krävs exakt lika måga odbesök för att fia e yckel som det behövdes för att lägga i de så erhåller vi sambadet I E0/1 + E1/ + E/3 +...E 1/ 5 Dea differesekvatio ivolverar både E och I. Dessutom har de full historia dvs det :te värdet beror av alla föregåede värde. Stadardsättet att bli av med de fulla historie är att sätta upp motsvarade ekvatio för I 1: I 1 E0/1 + E1/ + E/3 +... + E / 1 6 och seda subtrahera 6 frå 5: I I 1 E 1 7 Geom att aväda sambadet 4 ka vi bli av med de ea av de två obekata. Det spelar i pricip ige roll vilke vi elimierar me det visar sig att det blir lättare att räka om vi aväder E. Ekvatioe 7 övergår då i E 1 E 1 1 1 + E E 1 + + E 1 E 1 E + + 1 E 1 8 Ekvatio 8 ka kotrolleras för 1, och 3 geom räka på alla möjliga träd av dessa storlekar. Ekvatioe 8 är e icke-lijär differesekvatio som, geerellt sett, ka vara svår att lösa. I just detta fall ka dock lösige erhållas på vårt valiga sätt geom att expadera: 3

E + + 1 + + 1 + + 1 E 1 + E 1 + + 1 E 1 + + 1 + + 1 1 + 1 E 3 + + 1 + + 1 1 + + 1 E 3. + + 1 + + 1 1 + + 1 + + + 1 k + + 1 + + 1 1 + + 1 + + + 1 + + 1 + 1 1 + 1 3 + 1 E1 E k 1 {k } E1 Eftersom E1 4 erhålles E + + 1 + 1 1 + 1 3 + 1 + + 1 + 1 1 + 1 3 + 1 + 1 1 + + 1 H 1 + + 1H + 1 + 1H + 1 9 där H är de harmoiska summa. H 1 + 1 + 1 3 + + 1 Observera att detta är ett exakt uttryck för E vi har ite gjort ågra uppskattigar alls. Formel ka således lätt kotrolleras för t.ex. 1, och 3. Geom att aväda uppskattige så erhålles H l + γ + O 10 4

E + 1 l + γ + O + 1 l + l + + 1 γ + O + 1 l + O l lg + O 1.386 lg + O 11 Om sambadet mella iter och exter väglägd 4 avädes så erhålles I 1.386 lg + O V.S.B Observera att vi som ett delresultat har visat att lösige till differesekvatioe E + 1 E 1 + är O log vilket är ett resultat som ka avädas vid aalys av quicksort. Alterativ resoemag Om ma tycker att resoemaget som ledde fram till ekvatio 5 är svårt att förstå så ka följade alterativa resoemag föras. Atag att de ycklar vi har ycklara k 1 < k < k 3 <... < k. Om vi vid uppbyggade av trädet börja med yckel k i kommer de att bli rot i trädet och vi kommer få i 1 oder i västersubträdet T L och i i högersubträdet T R. Om väglägde för trädet T L och T R beteckas med I L respektive I R så blir väglägde för detta träd I 1 + i 1 + I L + i + I R + I L + I R vi måste addera 1 för varje od i subträde eftersom vägara till dem först måste gå geom rote. Om vi varje yckel k i är lika saolik att bli vald som rot blir de geomsittliga väglägde I 1 + Ii 1 + I i i1 + 1 Ii i0 Dea ekvatio ka lösas med e likade tekik som avädes ova eller så ka ma utyttja sambadet 1 mella iter och exter väglägd och då får ma exakt samma formel som. 5