Föreläsning 10 Innehåll. Diskutera. Hashtabeller. Hashfunktion. hashfunktion. hashkod (ett heltal)

Relevanta dokument
Föreläsning 10 Innehåll

Diskutera. Hashfunktion

Inlämningsuppgift och handledning

Inlämningsuppgift och handledning. Föreläsning 11 Innehåll. Diskutera. Hashtabeller

Interfacen Set och Map, hashtabeller

Föreläsning 11 Innehåll

Föreläsning 14 Innehåll

Föreläsning 9 Innehåll

Hitta k största bland n element. Föreläsning 13 Innehåll. Histogramproblemet

Föreläsning 10 Innehåll. Diskutera. Inordertraversering av binära sökträd. Binära sökträd Definition

Föreläsning 10 Innehåll

Föreläsning 11 Innehåll. Diskutera. Binära sökträd Definition. Inordertraversering av binära sökträd

Tentamen, EDAA01 Programmeringsteknik fördjupningskurs

Föreläsning 8. Mängd, Avbildning, Hashtabell

Avbildningar och hashtabeller. Koffman & Wolfgang kapitel 7, mestadels avsnitt 2 4

Föreläsning 8. Mängd, Avbildning, Hashtabell

Föreläsning 10 Innehåll. Prioritetsköer och heapar. ADT Prioritetskö. Interface för Prioritetskö. Exempel på vad du ska kunna

ADT Prioritetskö. Föreläsning 12 Innehåll. Prioritetskö. Interface för Prioritetskö. Prioritetsköer och heapar

Seminarium 3 Introduktion till Java Collections Framework Innehåll. Generik Bakgrund. Exempel på en generisk klass java.util.arraylist.

Seminarium 2 Introduktion till Java Collections Framework Innehåll. Generik Bakgrund. Exempel på en generisk klass java.util.arraylist.

Innehåll. Föreläsning 10. Specifikation. Mängd. Specifikation. Konstruktion av mängd. Mängd Lexikon Hashtabell

Programmering fortsättningskurs

Samlingar Collection classes

Datastrukturer och algoritmer. Innehåll. Tabell. Tabell - exempel. Gränsyta till Tabell. Tabell. Modell. Hashtabell Relation, lexikon.

ADT Prioritetskö. Föreläsning 13 Innehåll. Prioritetskö vs FIFO-kö. Prioritetskö Exempel på användning. Prioritetsköer och heapar

Datastrukturer. föreläsning 6. Maps 1

Föreläsning 4 Innehåll. Abstrakta datatypen lista. Implementering av listor. Abstrakt datatypen lista. Abstrakt datatyp

Abstrakt datatyp. -Algoritmer och Datastrukturer- För utveckling av verksamhet, produkter och livskvalitet.

Seminarium 13 Innehåll

Föreläsning 4 Innehåll

Objektorienterad Programmering DAT043. Föreläsning 9 12/2-18 Moa Johansson (delvis baserat på Fredrik Lindblads material)

Programmering för språkteknologer II, HT2014. Rum

Sökning. Översikt. Binärt sökträd. Linjär sökning. Binär sökning. Sorterad array. Linjär sökning. Binär sökning Hashtabeller

Algoritmer och datastrukturer

Tentamen, EDAA01 Programmeringsteknik fördjupningskurs

Programmering för språkteknologer II, HT2011. Rum

Föreläsning 2 Innehåll

Samlingar Collection classes

Java Collections Framework. Föreläsning 2 Innehåll. Java Collections Framework interface hierarki. Java Collections Framework interface hierarki

Tentamen, EDAA01 Programmeringsteknik fördjupningskurs

13 Prioritetsköer, heapar

Föreläsning 5 Datastrukturer (DAT037)

Föreläsning 13 Innehåll

TDDC30. Objektorienterad programmering i Java, datastrukturer och algoritmer. Föreläsning 9 Jonas Lindgren, Institutionen för Datavetenskap, LiU

Länkade strukturer. (del 2)

Algoritmer och datastrukturer 2012, fo rela sning 8

Datastrukturer som passar för sökning. Föreläsning 10 Innehåll. Inordertraversering av binära sökträd. Binära sökträd Definition

F5: Debriefing OU2, repetition av listor, träd och hashtabeller. Carl Nettelblad

Föreläsning 9 Datastrukturer (DAT037)

Hashtabeller. TDA416, lp3 2016

Föreläsning 11 Innehåll

Föreläsning 2 Innehåll

Datastrukturer som passar för sökning. Föreläsning 11 Innehåll. Binära sökträd Definition. Inordertraversering av binära sökträd

Föreläsning 11 Innehåll. Sortering. Sortering i Java. Sortering i Java Comparable. Sortering. O(n 2 )-algoritmer: urvalssortering insättningssortering

Tentamen, EDA690 Algoritmer och Datastrukturer, Helsingborg

Innehåll. F7: Tabell, hashtabell, relation & lexikon. Gränsyta till Tabell. Tabell. Tabell Hashtabell Relation Lexikon.

Tommy Färnqvist, IDA, Linköpings universitet. 1 ADT Map/Dictionary Definitioner Implementation... 2

Magnus Nielsen, IDA, Linköpings universitet

Collection classes. Interface, första exempel. Interface (forts) Men först

Java Collections Framework. Föreläsning 2 Innehåll. Java Collections Framework interface hierarki. Java Collections Framework interface hierarki

Binära sökträd. Seminarium 9 Binära sökträd Innehåll. Traversering av binära sökträd. Binära sökträd Definition. Exempel på vad du ska kunna

Objektorienterad Programkonstruktion. Föreläsning 9 30 nov 2016

Föreläsning Datastrukturer (DAT036)

Föreläsning 2 Innehåll. Generiska klasser. Generik i Java. Varför generiska klasser Bakgrund

Datastrukturer i kursen. Föreläsning 8 Innehåll. Träd rekursiv definition. Träd

ADT Kö. Seminarium 4 Köer och Stackar Innehåll. Operationer. ADT Stack. Definition. Definition

Sortering. Föreläsning 12 Innehåll. Sortering i Java. Sortering i Java Exempel. Sortering

Collection Classes. bjectorienterad programmering Sida 1

Föreläsning 12 Innehåll

Tommy Färnqvist, IDA, Linköpings universitet. 1 ADT Map/Dictionary Definitioner Implementation... 2

Lösningsförslag till tentamen i EDAA01 programmeringsteknik fördjupningkurs

Länkade strukturer, parametriserade typer och undantag

Lösningsförslag till tentamen i EDA690 Algoritmer och Datastrukturer, Helsingborg

Tentamen, EDAA01 Programmeringsteknik fördjupningskurs

Föreläsning 7. Träd och binära sökträd

Datastrukturer och algoritmer

Listor. Koffman & Wolfgang kapitel 2, avsnitt , och 2.9

Föreläsning 4 Datastrukturer (DAT037)

Programmering för Språkteknologer II. Innehåll. Associativa datastrukturer. Associativa datastrukturer. Binär sökning.

Föreläsning 10 Datastrukturer (DAT037)

Datastrukturer. Arrayer. Arrayer. Arrayer. Array av arrayer. Array av arrayer

TDDE10 m.fl. Objektorienterad programmering i Java Föreläsning 5 Erik Nilsson, Institutionen för Datavetenskap, LiU

Tentamen Programmeringsteknik II och NV2 (alla varianter) Skriv bara på framsidan av varje papper.

Tentamen, EDAA01 Programmeringsteknik fördjupningskurs

Tentamen i Algoritmer & Datastrukturer i Java

Lösningsförslag till tentamen Datastrukturer, DAT037,

TDDC77 Objektorienterad Programmering

F12 - Collections. ID1004 Objektorienterad programmering Fredrik Kilander

Repetition av OOP- och Javabegrepp

TENTAMEN: Algoritmer och datastrukturer. Läs detta! Uppgifterna är inte avsiktligt ordnade efter svårighetsgrad.

Repetition av OOP- och Javabegrepp

Tentamen Datastrukturer D DAT 035/INN960

Datastrukturer. föreläsning 3. Stacks 1

Innehåll. Föreläsning 12. Binärt sökträd. Binära sökträd. Flervägs sökträd. Balanserade binära sökträd. Sökträd Sökning. Sökning och Sökträd

Föreläsning 5 Innehåll

Algoritmer och effektivitet. Föreläsning 5 Innehåll. Analys av algoritmer. Analys av algoritmer Tidskomplexitet. Algoritmer och effektivitet

Mål Förklaring av termer

Tentamen kl Uppgift 4. Uppgift 5

Lösningsförslag till exempeltenta 1

Collections och datastrukturer. Kursbokens kapitel 13 och

Transkript:

Föreläsning 0 Innehåll Diskutera Hashtabeller implementering, effektivitet Metoden hashcode i Java Abstrakta datatyperna mängd (eng. Set) och lexikon (eng. Map) Interfacen Set och Map ijava Undervisningsmoment: föreläsning 0, övningsuppgifter 0-, lab 5 och 6 Avsnitt i läroboken: 7. 7.5 2:a upplagan: 7. 7.5 Tidigare har vi sett att man kan använda binära sökträd för att lagra data som man snabbt ska kunna söka i. Tidskomplexiteten för att sätta in, söka och ta bort element i ett balanserat binärt sökträd är O(logn). Antag att vi har fått i uppdrag att skriva ett program som hanterar medlemmar i en förening. Antalet medlemmar är max 000 st. Varje medlem har ett unikt medlemsnummer mellan 0 och 999. Detta nummer används som nyckel för att identifiera och söka efter en medlem. Finns det något bättre (snabbare, enklare) sätt än binärt sökträd för att lagra medlemmarna i just detta specialfall? PFK (Föreläsning 0) VT 207 / 56 PFK (Föreläsning 0) VT 207 2 / 56 Hashtabeller Hashfunktion Idé: översätt nycklar till heltal som kan användas som index i en vektor. Antag att de nycklar som ska användas vid sökningen är heltal i intervallet 0..n. En vektor med n + platser kan användas. Elementet med nyckel k placeras på plats k i vektorn. Sökning, insättning och borttagning av k blir en direkt access till plats k. Alla dessa operationer har tidskomplexitet O(). Idéen kan generaliseras till alla slags objekt: Nycklarna översätts till ett heltal i intervallet 0..n. PFK (Föreläsning 0) VT 207 3 / 56 nyckel hashfunktion hashkod (ett heltal) Hashfunktionen avbildar nyckeln på heltal (hashkod). hashkod % table.length kan användas som index i en vektor table. Kollisioner (olika nycklar får samma index) är oundvikliga och måste hanteras. En bra hashfunktion bör påverkas av alla delar av nyckeln. ger litet förväntat antal kollisioner, sprider elementen över hela tabellen. PFK (Föreläsning 0) VT 207 4 / 56

Hashfunktion för heltal Hashfunktion för strängar Om nyckeln är ett heltal k kan hashkoden vara talet självt. Index i vektorn räknas ut så här: int index = k % table.length; if (index < 0 ) { index : index + table.length; Math.abs kan ge ett negativt resultat och används därför inte här. För en sträng s 0 s s 2 s n är en lämplig hashfunktion s[0] 3 n + s[] 3 n 2 + + s[n ] Ger ett stort heltal (som får anpassas till tabellens storlek genom % table.length). Tecken i olika positioner multipliceras med olika potenser av 3. Permutationer av samma tecken ger därför olika hashkod. 3 är ett primtal och det kan visas att man därför får relativt få kollisioner. PFK (Föreläsning 0) VT 207 5 / 56 PFK (Föreläsning 0) VT 207 6 / 56 Metoden hashcode Diskutera I klassen Object finns en metod hashcode som översätter ett objekt till ett heltal. Den är implementerad så att olika objekt om möjligt avbildas på olika heltal. Metoden hashcode är skuggad i Javas klasser (String, Integer ) så att lika objekt avbildas på samma heltal. Heltalet som returneras från hashcode får sedan anpassas till tabellens storlek med % table.length. Man måste skugga hashcode (och equals) i den klass vars objekt ska fungera som nyckel i en hashtabell. Objekt för vilka equals ger true ska få samma hashkod. Försök sätta in element med nycklarna, 8, 27, 64, 6 ska sättas in i en tabell med 7 platser. Elementets index = x % 7. 0 2 3 4 5 6 Hur hanterar man kollisioner (dvs. att olika nycklar får samma index)? PFK (Föreläsning 0) VT 207 7 / 56 PFK (Föreläsning 0) VT 207 8 / 56

Hashtabeller olika alternativ Sluten hashtabell med linjär kollisionsteknik Det finns olika sätt att implementera hashtabeller. Sluten hashtabell (eng: open addressing) en vektor används för att lagra elementen Det finns sedan olika sätt att hantera kollisioner t ex linjär teknik kvadratisk teknik Öppen hashtabell (eng: separate chaining) en vektor av listor Kolliderande objekt placeras i samma lista. Vid linjär teknik sätter man in ett element som kolliderar med ett annat på första lediga plats efter den där det skulle ha hamnat om ingen kollision inträffat. Tabellen betraktas som cirkulär, d.v.s. index 0 anses komma efter tablesize-. 6 8 64 27 0 2 3 4 5 6 Sökning efter visst element börjar på den plats elementets hashkod anger och fortsätter eventuellt framåt. Om det inte påträffas före en ledig plats finns det inte i tabellen. PFK (Föreläsning 0) VT 207 9 / 56 PFK (Föreläsning 0) VT 207 0 / 56 Borttagning i sluten hashtabell med linjär kollisionsteknik Borttagning i sluten hashtabell med linjär kollisionsteknik Forts Om vi vid borttagning bara gör platsen tom, leder det till fel vid sökning. Ex: Tag bort ur tabellen på föregående bild: 6 8 64 27 0 2 3 4 5 6 Om vi nu söker efter 8 vars hashkod % 7 är börjar vi pröva plats. Eftersom denna plats är tom sluter vi oss felaktigt till att det sökta elementet inte finns i tabellen. Om vi i stället markerar platsen icke-aktiv vid borttagning (i fig. nedan markerat med ett d): 6 d 8 64 27 0 2 3 4 5 6 så kan vi utföra sökningen med början på den plats hashkod % 7 anger och framåt över alla upptagna och icke-aktiva platser. Först när vi stöter på en riktigt tom plats är det misslyckad sökning. PFK (Föreläsning 0) VT 207 / 56 PFK (Föreläsning 0) VT 207 2 / 56

Tidskomplexitet, linjär teknik Problem med linjär teknik Sökning (och därmed insättning och borttagning) i en hashtabell innebär beräkning av index sökning bland kolliderande element Värstafallet för operationerna sökning, insättning och borttagning är O(n), där n är antalet element som finns insatta i tabellen. Inträffar om alla element hamnar i en följd och vi t ex vid sökning måste pröva alla platserna i denna följd. Är dock ytterst osannolikt. Under förutsättning att tabellen inte fylls till mer än hälften får man O()-komplexitet i medeltal. Linjär teknik ger upphov till primär klustring i tabellen. Om flera objekt kolliderar (får samma index pos) kommer de att ligga i ett kluster kring platsen pos. Även objekt vars hashkoder är nära pos kommer att drabbas av kollisioner och bygga ut klustret. Stora kluster gör sökning långsam. Ex: Sätt in element med nycklarna 3, 3, 23, 33, 5, 5. 3 3 23 33 0 2 3 4 5 6 5 5 7 8 9 PFK (Föreläsning 0) VT 207 3 / 56 PFK (Föreläsning 0) VT 207 4 / 56 Sluten hashtabell, kvadratisk kollisionsteknik Sluten hashtabell, kvadratisk kollisionsteknik Exempel Alternativ, bättre teknik för hantering av kollisioner. Först prövas nästa plats, sedan platsen 4 steg fram, sedan 9 steg fram, alltså pos, pos +, pos + 2 2, pos + 3 2,,pos + i 2, där pos är elementets hashkod. Tabellen används fortfarande cirkulärt. Sätt in element med nycklarna 89, 8, 49, 58, 9 i en tabell med 0 platser. 89 % 0 = 9 8 % 0 = 8 49 % 0 = 9 58 % 0 = 8 9%0=9 Undviker primär klustring av element. Kan modifieras till andra sekvenser av steg. 49 58 9 0 2 3 4 5 6 7 8 89 8 9 PFK (Föreläsning 0) VT 207 5 / 56 PFK (Föreläsning 0) VT 207 6 / 56

Sluten hashtabell, kvadratisk kollisionsteknik Öppen hashtabell (separate chaining) Problem: Inte alltid säkert att man hittar ledig plats även om det finns. Om t ex tabellens storlek är 6 och man använder hashfunktionen x % 6 och sätter in element med nycklarna 0, 6, 32 och 64 så kan man inte därefter hitta någon ledig plats för element som hashas till plats 0. De enda platser som kommer att prövas i serien pos + i 2 när pos = 0 blir de upptagna platserna 0,, 4 och 9. Om tabellens storlek är ett primtal kan ett nytt element alltid sättas in om tabellens fyllnadsgrad är mindre än 0.5. Tidskomplexitet: Ännu ej fullständigt utredd. Värsta fallet är O(n). I praktiken mindre klustring än den linjära tekniken. Elementen i tabellen är listor. I lista nummer k ligger alla element vars nyckel har hashkod % table.length = k. 0 2 table.length-2 table.length- PFK (Föreläsning 0) VT 207 7 / 56 PFK (Föreläsning 0) VT 207 8 / 56 Öppen hashtabell (separate chaining) Exempel Sätt in element med nycklarna, 8, 27, 64, 6 i en öppen tabell med 7 listor. 0 2 3 4 5 6 64 8 6 27 Nycklar och hashkod Blanda inte ihop begreppen Nycklarna är unika. Hashkoden beräknas med en hashfunktion som avbildar nycklarna på heltal. Som index i vektorn används hashkod % table.length I Java: key.hashcode() % table.length Olika nycklar kan få samma index (kollision). 0 2 3 4 5 6 64 8 6 27 Unika nycklar: 64, 8, samma index: Unika nycklar: 6, 27 samma index: 6 PFK (Föreläsning 0) VT 207 9 / 56 PFK (Föreläsning 0) VT 207 20 / 56

Öppen hashtabell Diskutera Obeservera att borttagning i öppen tabell är enklare än i sluten. Elementet tas helt enkelt bort ur den lista där det befinner sig. Vi får inga problem med luckor som i den slutna tabellen. I Javas klassbibliotek används öppna tabeller i klasserna HashSet och HashMap. Vilka faktorer påverkar antal kollisioner i en hashtabell? Vilka konsekvenser får ett högt antal kollisioner i en (öppen) hashtabell? Hur kan risken för kollisioner minskas? På laboration 5 får du implementera en öppen hashtabell med enkellänkade listor. PFK (Föreläsning 0) VT 207 2 / 56 PFK (Föreläsning 0) VT 207 22 / 56 Tidskomplexitet, öppen tabell Rehashing Om fyllnadsgraden blir för stor måste man bygga om tabellen: Värstafallet för operationerna sökning, insättning och borttagning är O(n), där n är antalet element som finns insatta i tabellen. Inträffar om alla element hamnat i samma lista. Medelfall Tidskomplexiteten är O() i medelfall (och i praktiken med en bra hashfunktionen och med en tillräckligt stor tabell). Fyllnadsgrad (eng. load factor) = antal insatta element/antal platser itabellen. Valet av fyllnadsgrad är en kompromiss mellan minnesåtgång och tidsåtgång. Ett lämpligt val av fyllnadsgrad är 0.75. Skapa en dubbelt så stor tabell. Sätt in alla element i den nya tabellen. 0 2 3 4 5 6 64 8 25 6 27 6 6 0 2 3 4 5 7 8 9 0 2 3 8 25 27 64 PFK (Föreläsning 0) VT 207 23 / 56 PFK (Föreläsning 0) VT 207 24 / 56

ADT Mängd Använda binärt sökträd för att implementera ADT mängd Definition En mängd (eng. Set) är en en samling element där dubbletter är förbjudna. Operationer: sätta in ett element ta bort ett element undersöka om ett element finns i mängden Ett balanserat binärt sökträd passar bra att använda för att representera en mängd: Ett binärt sökträd innehåller inte dubbletter. Det är effektivt att sätta in ett element ta bort ett element undersöka om ett element finns i trädet. Tidskomplexiteten för dessa operationer är O( 2 log n) iettbalanserat binärt sökträd. PFK (Föreläsning 0) VT 207 25 / 56 PFK (Föreläsning 0) VT 207 26 / 56 Använda hashtabell för att implementera ADT mängd ADT Lexikon En hashtabell passar bra att använda för att representera en mängd: Ett hashtabell innehåller inte dubbletter. Det är effektivt att sätta in ett element. ta bort ett element. undersöka om ett element finns i hashtabellen. Tidskomplexiteten för dessa operationer är O() imedelfall(ochi praktiken vid bra val av hashfunktion och tabellstorlek). Definition Ett lexikon (eng. Map) är en en samling element där varje element har en en nyckel och ett värde. Nycklarna är unika. Operationer: sätta in ett nyckel-värde-par ta bort ett nyckel-värde-par söka värdet som hör till en nyckel PFK (Föreläsning 0) VT 207 27 / 56 PFK (Föreläsning 0) VT 207 28 / 56

ADT lexikon (Map) ADT lexikon (Map) Exempel I ett lexikon (Map) betraktas element som tvådelade en nyckel och tillhörande värde. Nyckeln avbildas (eng. maps) på sitt värde. Nycklar är unika, men inte värden. Man använder nyckeln för att söka tillhörande värde. Exempel: nyckel = månad, värde = antal dagar i månaden. nyckel = personnummer, värde = Person-objekt med namn, adress. nycklar (mängd) mars april maj värden (samling, dubbletter ok) 3 30 3 PFK (Föreläsning 0) VT 207 29 / 56 PFK (Föreläsning 0) VT 207 30 / 56 Diskutera Använda binärt sökträd för att implementera ADT lexikon Hur kan vi använda ett binärt sökträd eller en hashtabell för att implementera en Map? I ett binärt sökträd kan vi sätta in element, inte par (nyckel, värde). Men vi kan ändå använda ett binärt sökträd. Vi deklarerar en nästlad klass som representerar par (nyckel,värde) och sätter in objekt av denna typ i trädet. Vid jämförelser (i metoden compareto) är det nycklarnas värden som ska jämföras. data left right key value PFK (Föreläsning 0) VT 207 3 / 56 PFK (Föreläsning 0) VT 207 32 / 56

Använda hashtabell för att implementera ADT lexikon Interfacen Set och Map i java.util Man kan deklarera en nästlad klass som representerar nyckel-värde-par och sätta in sådana objekt i hashtabellen. Hashkoden beräknas på nyckeln. Iterable Collection 0 2 3 4 key value next key value next Queue List Set Map 5 6 key value next SortedSet SortedMap PFK (Föreläsning 0) VT 207 33 / 56 PFK (Föreläsning 0) VT 207 34 / 56 Interfacet Set Interfacet SortedSet En mängd (Set) är en samling element som inte innehåller dubbletter. Metoderna i interfacet Set finns även i interfacet Collection. De har dock olika kontrakt genom att Set inför restriktionen att inga dubbletter får förekomma. Enligt specifikationen i Java får en mängd (Set) innehålla -element. Men bara ett -element, p.g.a. dubblettförbudet. Vissa konkreta implementeringar av interfacet Set i java.util förbjuder dock insättning av. Förutsätter att elementen som sätts in går att jämföra med varandra. Elementen ska antingen implementera interfacet Comparable eller genom att man (via konstruktorn) anger ett Comparator-objekt som kan användas för jämförelser. Vi återkommer till detta. Garanterar att operationen iterator() returnerar en iterator som går igenom mängden i växande ordning. Utvidgar Set-interfacet med några operationer som återspeglar att elementen går att ordna. Exempel: returnera minsta element, returnera största... PFK (Föreläsning 0) VT 207 35 / 56 PFK (Föreläsning 0) VT 207 36 / 56

Klasser som implementerar Set TreeSet implementerar det utvidgade interfacet SortedSet. Använder ett slags balanserat träd, inte AVL-träd utan röd-svarta träd (eng. Red-Black trees), som också garanterar att höjden är O( 2 log n). HashSet Använder hashtabell. Set Interfacet Set Abstrakta klasser AbstractCollection Collection Set betyder ärver från ("extends") betyder implementerar ("implements") SortedSet AbstractSet SortedSet HashSet TreeSet HashSet TreeSet PFK (Föreläsning 0) VT 207 37 / 56 PFK (Föreläsning 0) VT 207 38 / 56 Interfacet Set Abstrakta klasser Kommentarer till hierarkin på föregående bild: Interface fick t.o.m. Java 7 inte innehålla implementeringar. Ibland kan man implementera vissa operationer med hjälp av andra operationer i samma interface. Ex: isempty () size() == 0 För att underlätta för den som ska implementera ett (stort) interface kan man implementera en abstrakt klass som innehåller implementeringar av vissa metoder enligt detta mönster. Ex: klasserna AbstractCollection och AbstractSet Implementatören av en konkret klass kan då ärva den abstrakta klassen och behöver sedan bara implementera återstående operationer iinterfacet. Ex: klasserna TreeSet och HashSet. Fr.o.m Java 8 får man ha default-metoder i interface. Det innebär att man nu hade kunnat lägga de metoder som implementeras i Abstractklasserna direkt i interfacen istället. PFK (Föreläsning 0) VT 207 39 / 56 Klassen TreeSet Implementerar interfacet SortedSet. Det finns flera konstruktorer i klassen, bl.a: public TreeSet(); 2 public TreeSet(Comparator<? super E> c); Används den första konstruktorn, förutsätts elementen implementera Comparable annars genereras ClassCastException. Den andra konstruktorn har en parameter som är ett objekt av en klass som implementerar interfacet Comparator. Används denna kommer jämförelser att utföras med hjälp av komparatorn. PFK (Föreläsning 0) VT 207 40 / 56

Exempel på användning av klassen TreeSet Comparable<E> // Denna mängd kommer att ordnas efter personnummer Set<Person> nbrset = new TreeSet<Person>(); nbrset.add(new Person("Kalle", "340609-234")); nbrset.add(new Person("Kajsa", "37009-222")); // undersök om personen med personnummer 37009-222 // finns i mängden boolean found = nbrset.contains(new Person(, "37009-222")); Klassen Person måste implementera Comparable<Person>. I metoden compareto jämförs personernas personnummer. PFK (Föreläsning 0) VT 207 4 / 56 Exempel på användning av klassen TreeSet Komparator // Denna mängd kommer att ordnas efter namn Set<Person> nameset = new TreeSet<Person>(new NameComparator()); nameset.add(new Person("Kalle", "340609-234")); nameset.add(new Person("Kajsa", "37009-222")); Klassen NameComparator måste implementeras. I metoden compare jämförs personernas namn. public class NameComparator implements Comparator<Person> { public int compare(person p, Person p2) { return p.getname().compareto(p2.getname()); Istället för en comparatorklass kan man använda lambdauttryck: Set<Person> nameset = new TreeSet<Person>((p, p2) -> p.getname().compareto(p2.getname())); PFK (Föreläsning 0) VT 207 42 / 56 Exempel på användning av klassen HashSet Skugga metoderna equals och hashcode Antag vi vill vill sätta in Person-objekt i en mängd av typen HashSet. HashSet<Person> set = new HashSet<Person>(); Person p = new Person("Kajsa", "37009-222"); set.add(p); boolean found = set.contains(new Person(, "37009-222")); Nu måste equals och hashcode skuggas i klassen Person. I equals ska personnumren jämföras. I hashcode ska en hashkod för personnumret beräknas. Inuti klasserna HashSet och HashMap används metoderna hashcode() och equals(object) för att hitta ett element: Först beräknas index för elementet med nyckel key med key.hashcode() % table.length. Sedan söks key i listan på denna plats. I samband med denna sökning används equals. PFK (Föreläsning 0) VT 207 43 / 56 PFK (Föreläsning 0) VT 207 44 / 56

Om man glömmer skugga hashcode Klass som skuggar equals och hashcode Klassen Person Om vi glömmer att skugga hashcode i Person hittar vi troligen inte personen: När personen p sätts in beräknas hashkoden för objektet som p refererar till. När vi söker efter personen baseras sökningen på hashkoden av det objekt som är parameter till contains-metoden. Detta är ett annat objekt (men med samma personnummer). Sökningen utgår från den plats denna senare hashkod anger och med största sannolikhet är det i en helt annan del av tabellen än den där personen sattes in. PFK (Föreläsning 0) VT 207 45 / 56 Interfacet Map i java.util AbstractMap HashMap Map SortedMap TreeMap PFK (Föreläsning 0) VT 207 47 / 56 public class Person { private String name; private String pnbr; // konstruktor och övriga metoder public boolean equals(object other) { if (other instanceof Person) { return pnbr.equals(((person) other).pnbr); else { return false; public int hashcode() { return pnbr.hashcode(); PFK (Föreläsning 0) VT 207 46 / 56 Interfacet Map -ett urval av metoderna public interface Map<K,V> { V get(object key); boolean isempty(); V put(k key, V value); V remove(object key); int size(); Set<K> keyset(); Collection<V> values(); Set<Map.Entry<K,V>> entryset(); public interface Entry<K,V> { K getkey(); V getvalue(); V setvalue(v); Interfacet Map ärver inte interfacet Collection eller Iterable. Det går alltså inte att iterera direkt över mappen. Däremot kan man iterera över nycklarna, värdena och nyckel-värdeparen. PFK (Föreläsning 0) VT 207 48 / 56

Klasser som implementerar Map Exempel på användning av klassen TreeMap TreeMap implementerar interfacet SortedMap. Använder balanserat binärt sökträd (röd-svart träd) keyset().iterator() ger en iterator som går igenom nycklarna i växande ordning. Ytterligare operationer som bygger på ordning mellan nycklarna finns. HashMap Använder öppen hashtabell. Map Map<String, Integer> map = new TreeMap<String, Integer>(); map.put("januari", 3); map.put("februari", 28); map.put("mars", 3); map.put("april", 30); map.put("maj", 3); System.out.println("Antal dagar i mars: " + map.get("mars")); HashMap SortedMap TreeMap I en TreeMap är det nyckelklassen som ska implementera Comparable eller vars attribut ska jämföras i en komparatorklass. I exemplet har nycklarna typen String. Klassen String implementerar Comparable<String>. PFK (Föreläsning 0) VT 207 49 / 56 PFK (Föreläsning 0) VT 207 50 / 56 Exempel på användning av klassen TreeMap, forts Interfacet Map.Entry En Map används normalt för att med nyckeln hitta motsvarande värde. Ibland behöver man göra tvärtom: System.out.println("Månader med 3 dagar:"); for (Map.Entry<String, Integer> e : map.entryset()) { if (e.getvalue() == 3) { System.out.println(e.getKey()); Metoden entryset returnerar en mängd med alla nyckel-värde-par. Genom att traversera denna mängd kan vi ta reda på vilka nyckel-värde-par som har värdet 3 och skriva ut motsvarande nyckel. Map.Entry är ett inre interface som är nästlat i interfacet Map. /* Representerar ett nyckel-värdepar */ public interface Entry<K,V> { K getkey(); V getvalue(); V setvalue(v); // ändrar värdet till V och // returnerar det gamla värdet Operationen entryset returnerar en mängd (Set) av Entry-objekt. d.v.s. objekt av en klass som implementerar interfacet Map.Entry PFK (Föreläsning 0) VT 207 5 / 56 PFK (Föreläsning 0) VT 207 52 / 56

Exempel på användning av klassen HashMap Exempel Exempel på användning av klassen HashMap Exempel 2 Map<String, Integer> map = new HashMap<String, Integer>(); map.put("januari", 3); map.put("februari", 28); map.put("mars", 3); map.put("april", 30); map.put("maj", 3); System.out.println("Antal dagar i mars: " + map.get("mars")); I en HashMap måste nyckelklassen skugga equals och hashcode. I exemplet har nycklarna typen String. Klassen String skuggar equals och hashcode. Antag vi vill vill sätta in Person-objekt i en hashtabell (HashMap). Personens personnummer ska vara nyckel. Map<String, Person> map = new HashMap<String, Person>(); map.put("37009-222", new Person("Kajsa", "37009-222")); Person p = map.get("37009-222"); if (p!= ) { Här har nycklarna typen String, och i denna klass är redan equals och hashcode skuggade. PFK (Föreläsning 0) VT 207 53 / 56 PFK (Föreläsning 0) VT 207 54 / 56 Interfacen Set och Map, hashtabeller Exempel på vad du ska kunna Förklara begreppen hashtabell och hashfunktion. Definiera vad som menas med sluten och öppen hashtabell och hur kollisioner hanteras i sådana tabeller. Förklara vad som menas med fyllnadsgraden (eng: load factor) för en hashtabell. Förklara hur sökning, insättning och borttagning går till i slutna respektive öppna hashtabeller. Implementera öppna hashtabeller (görs på laboration 5). Ange tidskomplexiteten för operationer på hashtabell. Förklara vad de abstrakta datatyperna set och map är och vilka operationer man förväntas kunna utföra på dem. Använda interfacen Set och Map och deras implementerande klasser i Java Collections Framework. PFK (Föreläsning 0) VT 207 55 / 56 Datorlaboration 5 Map, hashtabell Implementera en map med en egen öppen hashtabell. 0 2 3 4 table.length - key value next key value next key value next Tips: Det ska vara en öppen hashtabell. Entry-objekten fungerar även som noder i en enkellänkad lista. Innehåll: abstrakta datatypen map, öppen hashtabell, länkade listor, generisk klass PFK (Föreläsning 0) VT 207 56 / 56