Föreläsning 12 Innehåll Sortering O(n 2 )-algoritmer: urvalssortering insättningssortering O(n log n)-algoritmer: Mergesort Quicksort Datavetenskap (LTH) Föreläsning 12 VT 2018 1 / 40
Sortering Varför sortera? För att göra sökning effektivare. För att förenkla vissa algoritmer. Varför olika sorteringsalgoritmer? Olika sorteringsalgoritmer passar bra i olika sammanhang. Ingen enskild algoritm är bäst i alla möjliga situtioner. Datavetenskap (LTH) Föreläsning 12 VT 2018 2 / 40
Sortering i Java I klassen java.util.arrays finns metoder för att sortera vektorer t ex: public static void sort(int[] items) public static void sort(object[] items) elementen jämförs med compareto public static <T> void sort(t[] items, Comparator<? super T> comp) elementen jämförs med comp.compare Exempel: int[] a = {1, 4, 1, 9, 5, 2, 6}; Arrays.sort(a); I interfacet java.util.list finns en metod sort för att sortera listan (fungerar alltså för t.ex. ArrayList och LinkedList). Datavetenskap (LTH) Föreläsning 12 VT 2018 3 / 40
Sortering i Java Exempel En vektor med Book-objekt ska sorteras. Klassen Book: public class Book implements Comparable<Book> { private String isbn; private String title; private String author; private int nbrpages; // konstruktor och övriga metoder } public int compareto(book o) { return isbn.compareto(o.isbn); } Datavetenskap (LTH) Föreläsning 12 VT 2018 4 / 40
Sortering i Java Comparable Book[] a = new Book[4]; a[0] = new Book("isbn4", "titleb", "authorc", 125); a[1] = new Book("isbn3", "titlea", "authorc", 523); a[2] = new Book("isbn2", "titled", "authora", 199); a[3] = new Book("isbn1", "titlec", "authorb", 278);... // sortera efter isbn-nummer - jämförs i compareto Arrays.sort(a);... Klassen Book måste implementera interfacet Comparable. Inuti metoden sort används compareto för att jämföra elementen. Datavetenskap (LTH) Föreläsning 12 VT 2018 5 / 40
Sortering i Java Comparator Book[] a = new Book[4]; a[0] = new Book("isbn4", "titleb", "authorc", 125); a[1] = new Book("isbn3", "titlea", "authorc", 523); a[2] = new Book("isbn2", "titled", "authora", 199); a[3] = new Book("isbn1", "titlec", "authorb", 278);... // sortera efter titlar Arrays.sort(a, new TitleComparator());... Klass som implementerar interfacet Comparator: public class TitleComparator implements Comparator<Book> { public int compare(book b1, Book b2) { return b1.gettitle().compareto(b2.gettitle()); } } Inuti metoden sort används compare för att jämföra elementen. Datavetenskap (LTH) Föreläsning 12 VT 2018 6 / 40
Sortering i Java Lambdauttryck Sortera efter titlar: Arrays.sort(a, (b1, b2) -> b1.gettitle().compareto(b2.gettitle()) ); Sortera efter antal sidor: Arrays.sort(a, (b1, b2) -> b1.nbrpages() - b2.nbrpages() ); Istället för att skriva en klass som implementerar interfacet Comparator kan vi använda ett lambdauttryck. Inuti metoden sort används compare för att jämföra elementen. Datavetenskap (LTH) Föreläsning 12 VT 2018 7 / 40
Kommentar: om subtraktion i Comparator I föregående bild används subtraktion för att få ett värde < 0, == 0, > 0: b1.nbrpages() - b2.nbrpages() Differensen får fel tecken om termerna är väldigt stora (i storleksordningen Integer.MAX_VALUE eller MIN_VALUE), och har olika tecken. Problemet kallas overflow, och har att göra med att datatypen int har ett begränsat maximalt antal siffror (32 bitar, binära siffror). Overflow kan inte inträffa i vårt exempel med böcker och sidantal. (Varför?) Om man hanterar stora tal kan hjälpmetoden Integer.compare användas: Arrays.sort(a, (b1, b2) -> Integer.compare(b1.nbrPages(), b2.nbrpages()) ); Datavetenskap (LTH) Föreläsning 12 VT 2018 8 / 40
Urvalsortering i vektor Urvalsortering (eng. selection sort) Sök minsta elementet i den osorterade delen av vektorn och byt plats med första osorterade element (first = första elementet i den osorterade delen): first 3.5 1.1 1.1 1.1 1.1 1.1 6.2 first 6.2 2.8 2.8 2.8 2.8 2.8 min 2.8 first 6.2 3.5 3.5 3.5 5.0 5.0 5.0 first 5.0 4.5 4.5 min 1.1 3.5 min 3.5 6.2 first 6.2 5.0 4.5 4.5 4.5 min 4.5 min 5.0 6.2 Tidskomplexitet: n 1 + n 2 +... + 1 = O(n 2 ) Datavetenskap (LTH) Föreläsning 12 VT 2018 9 / 40
Urvalssortering Tidskomplexitet är O(n 2 ). Efter k pass är de k minsta (eller största) elementen sorterade. Kan därför vara lämplig om man bara vill få fram de k minsta (eller största) och k är litet. Tidskomplexitet är då O(k n) Datavetenskap (LTH) Föreläsning 12 VT 2018 10 / 40
Insättningssortering i vektor Insättningssortering (eng. insertion sort) Element på plats k i vektorn sätts in på rätt plats bland de redan sorterade elementen på platserna 0..k 1 Detta görs för k = 1, 2,..., n sort 3.5 3.5 2.8 2.8 1.1 1.1 osort 6.2 sort 6.2 3.5 3.5 2.8 2.8 2.8 osort 2.8 sort 6.2 5.0 3.5 3.5 5.0 5.0 osort 5.0 sort 6.2 5.0 4.5 1.1 1.1 1.1 osort 1.1 sort 6.2 5.0 4.5 4.5 4.5 4.5 osort 4.5 sort 6.2 Tidskomplexitet (värstafall): 1 + 2 + 3 +... + n 1 = n(n 1)/2 = O(n 2 ). Även medelfallet kan visas vara O(n 2 ). Datavetenskap (LTH) Föreläsning 12 VT 2018 11 / 40
Diskutera Blir urvalssortering snabbare eller långsammare om vektorns element råkar vara sorterade i stigande ordning? Blir insättningssortering snabbare eller långsammare om vektorns element råkar vara sorterade i stigande ordning? Datavetenskap (LTH) Föreläsning 12 VT 2018 12 / 40
Insättningssortering Tidskomplexitet är O(n 2 ) i värsta fall och i medelfall. Dock bra metod om vektorn är nästan sorterad från början: Om vektorn är sorterad utförs bara en jämförelse per pass tidskomplexiteten blir då O(n). Om vektorn består av n sorterade element följda av k osorterade behövs endast k pass. Man börjar med att sortera in det (n + 1):a sedan det (n + 2):a o s v. I varje pass görs i värsta fall O(n) jämförelser. Totalt O(k n) d.v.s. O(n) om k är litet i förhållande till n. Datavetenskap (LTH) Föreläsning 12 VT 2018 13 / 40
Insättningssortering public static <T extends Comparable<T>> void sort(t[] a) { for (int i = 1; i < a.length; i++) { T nextval = a[i]; int nextpos = i; while (nextpos > 0 && nextval.compareto(a[nextpos - 1]) < 0) { a[nextpos] = a[nextpos - 1]; nextpos--; } a[nextpos] = nextval; } } Datavetenskap (LTH) Föreläsning 12 VT 2018 14 / 40
Kommentar: begränsad typparameter Metoden sort skulle kunna skrivas så här: public static void sort(object[] a) {...} För att anropet av compareto inuti sort ska fungera måste nextval typkonverteras till Comparable:... ((Comparable) nextval).compareto(...)... Klassen som beskriver elementen i vektorn måste implementera Comparable. Annars genereras ClassCastException vid exekveringen. Man kan istället låta klassen vara generisk och begränsa typparametern T så att det redan vid kompileringen krävs att klassen som ersätter T implementerar Comparable<T>: public static <T extends Comparable<T>> void sort(t[] a) {...} Datavetenskap (LTH) Föreläsning 12 VT 2018 15 / 40
Insättningssortering Variant med komparator public static <T> void sort(t[] a, Comparator<T> comp) { for (int i = 1; i < a.length; i++) { T nextval = a[i]; int nextpos = i; while (nextpos > 0 && comp.compare(nextval, a[nextpos - 1]) < 0) { a[nextpos] = a[nextpos - 1]; nextpos--; } a[nextpos] = nextval; } } Datavetenskap (LTH) Föreläsning 12 VT 2018 16 / 40
? super T Överkurs? super T kan utläsas okänd superklass till T (inklusive T) Deklarationen av typparametern T bör egentligen se ut så här: <T extends Comparable<? super T> istället för bara <T extends Comparable<T>>. Förklaring: Antag att vi har följande klasser: class Person implements Comparable<Person> {... } class Student extends Person {... } Om den andra, enklare varianten används kan vi inte kan vi inte skriva: Student[] v =... sort(v); Klassen Student implementerar inte Comparable<Student> utan istället genom arv Comparable<Person>. Datavetenskap (LTH) Föreläsning 12 VT 2018 17 / 40
Mergesort Sortera med söndra- och härskateknik Sortera vänstra halvan Sortera högra halvan Samsortera de båda sorterade halvorna 7 2 5 9 3 8 10 2 2 5 7 9 2 3 8 10 2 2 3 5 7 8 9 10 Datavetenskap (LTH) Föreläsning 12 VT 2018 18 / 40
Merge samsortering av sorterade följder Algoritm Givet två följder v1 och v2 med element sorterade i växande ordning. Samsortera till en följd res. Algoritm: i = j = k = 0 så länge det finns obehandlade element kvar i både v1 och v2 jämför elementet i v1[i] med elementet i v2[j] om det minsta elementet är från v1 res[k] = v1[i] i = i + 1 annars res[k] = v2[j] j = j + 1 k = k + 1 En av följderna v1 och v2 har obehandlade element kvar. Flytta dessa element till res. Datavetenskap (LTH) Föreläsning 12 VT 2018 19 / 40
Samsortering av sorterade följder exempel v1 1 4 6 6 v1 1 4 6 6 v1 1 4 6 6 v1 1 4 6 6 v2 2 4 7 v2 2 4 7 v2 2 4 7 v2 2 4 7 res res 1 res 1 2 res 1 2 4 v1 1 4 6 6 v1 1 4 6 6 v1 1 4 6 6 v2 2 4 7 v2 2 4 7 v2 2 4 7 res 1 2 4 4 res 1 2 4 4 6 res 1 2 4 4 6 6 v1 1 4 6 6 v2 res 2 4 7 1 2 4 4 6 6 7 Datavetenskap (LTH) Föreläsning 12 VT 2018 20 / 40
Samsorteringen i Mergesort I samsorteringssteget i Mergesort (merge) motsvaras de båda följderna v1 och v2 av de båda sorterade vektorhalvorna. Det går inte att utföra samsorteringen i den ursprungliga vektorn. En hjälpvektor, lika stor som den som ska sorteras, behövs. När man i merge-steget skall slå samman två delvektorer: används motsvarande utrymme i hjälpvektorn (tmparray): Resultatet flyttas sedan tillbaka till ursprungsvektorn. Datavetenskap (LTH) Föreläsning 12 VT 2018 21 / 40
Samsorteringen i Mergesort Exempel Slå samman delvektorerna v1 och v2 i vektorn a (bestående av ett element vardera): a 7 2 5 9 3 8 10 2 tmparray 2 7 Resultatet flyttas sedan tillbaka till den ursprungliga vektorn. a 2 7 5 9 3 8 10 2 Datavetenskap (LTH) Föreläsning 12 VT 2018 22 / 40
merge implementeringsskiss Slå samman de sorterade delvektorerna a[leftpos].. a[rightpos - 1] och a[rightpos].. a[rightend]: private static <T extends Comparable<T>> void merge(t[] a, T[] tmparray, int leftpos, int rightpos, int rightend) { int leftend = rightpos - 1; int tmppos = leftpos;... rightend leftpos rightpos Datavetenskap (LTH) Föreläsning 12 VT 2018 23 / 40
merge implementeringsskiss Forts while (leftpos <= leftend && rightpos <= rightend) { if (a[leftpos].compareto(a[rightpos]) <= 0) { tmparray[tmppos] = a[leftpos]; leftpos++; } else { tmparray[tmppos] = a[rightpos]; rightpos++; } tmppos++; } /* Nu är en av delvektorerna tom. Kopiera över resten av elementen i den icke tomma vektorn till tmparray */ } /* Flytta till sist tillbaks elementen från tmparray till motsvarande platser i a */ Datavetenskap (LTH) Föreläsning 12 VT 2018 24 / 40
Mergesort implementering /** Sorterar elementen i vektora a */ public static <T extends Comparable<T>> void sort(t[] a) { T[] tmparray = (T[]) new Comparable[a.length]; mergesort(a, tmparray, 0, a.length - 1); } private static <T extends Comparable<T>> void mergesort(t[] a, T[] tmparray, int first, int last) { if (first < last) { int mid = first + (last - first) / 2; mergesort(a, tmparray, first, mid); mergesort(a, tmparray, mid + 1, last); merge(a, tmparray, first, mid + 1, last); } } Datavetenskap (LTH) Föreläsning 12 VT 2018 25 / 40
Stabila sorteringsalgoritmer Stabila sorteringsalgoritmer Bibehåller ordningen för element med lika nycklar efter sorteringen. Exempel: Antag att vi har personer ordnade efter förnamn: Ada Andersson, Bo Eriksson, Lars Andersson, Lena Andersson Om vi vill sortera efter efternamn istället, men samtidigt bibehålla den tidigare ordningen mellan förnamnen så måste vi använda en stabil sorteringsalgoritm. Ada Andersson, Lars Andersson, Lena Andersson, Bo Eriksson Är mergesort stabil? Datavetenskap (LTH) Föreläsning 12 VT 2018 26 / 40
Mergesort tidskomplexitet Att samsortera två sorterade delvektorer av sammanlagd storlek n kostar O(n). 1 merge av två delvektorer av storlek n/2, kostnad n 2 merge av två delvektorer av storlek n/4, kostnad 2 n/2 = n 4 merge av två delvektorer av storlek n/8, kostnad 4 n/4 = n Antal nivåer = log n = total kostnad O(n log n) Datavetenskap (LTH) Föreläsning 12 VT 2018 27 / 40
Quicksort Söndra- och härskaalgoritm. Oftast snabb Sämre än Mergesort i värsta fall O(n 2 ). Bra (snabb) i medelfall O(n log n). Värstafallet kan göras statistiskt osannolikt. Inget extra minnesutrymme för temporär vektor krävs. Datavetenskap (LTH) Föreläsning 12 VT 2018 28 / 40
Quicksort algoritm Välj ut ett element (pivotelement). Se till att det hamnar på rätt plats: Flytta om elementen så att element pivot hamnar till vänster och element pivot hamnar till höger. Kallas partitionering av vektorn. x x x Pivot-elementet, på rätt plats Upprepa rekursivt på de båda delvektorerna till vänster respektive till höger om pivotelementet. Datavetenskap (LTH) Föreläsning 12 VT 2018 29 / 40
Quicksort implementering public static <T extends Comparable<T>> void sort(t[] a) { quicksort(a, 0, a.length - 1); } /* Privat hjälpmetod. Sorterar delvektorn a[first]..a[last] */ private static <T extends Comparable<T>> void quicksort(t[] a, int first, int last) { if (first < last) { int pivindex = partition(a, first, last); quicksort(a, first, pivindex - 1); quicksort(a, pivindex + 1, last); } } Datavetenskap (LTH) Föreläsning 12 VT 2018 30 / 40
Quicksort val av pivot I princip kan vilket element som helst väljas. Vi börjar för enkelhets skull med att välja första elementet i vektorn. Inte särskilt bra val. Vi återkommer senare med en diskussion om bättre val. Datavetenskap (LTH) Föreläsning 12 VT 2018 31 / 40
Quicksort partitioneringssteget Sök från vänster upp ett element som är pivot. Sök från höger upp ett element som är pivot. Byt plats på dessa. Fortsätt tills hela vektorn genomletats. Pivotelementet kan sättas in mellan de båda vektordelarna som uppstår. Arbetet blir proportionellt mot vektorns längd. Datavetenskap (LTH) Föreläsning 12 VT 2018 32 / 40
Partitionering exempel pivot = 6 6 1 8 9 4 3 5 2 0 7 Efter byte: 6 1 0 9 4 3 5 2 8 7 6 1 0 9 4 3 5 2 8 7 Efter byte: 6 1 0 2 4 3 5 9 8 7 6 1 0 2 4 3 5 9 8 7 Byt plats på detta och pivot 5 1 0 2 4 3 6 9 8 7 pivot Datavetenskap (LTH) Föreläsning 12 VT 2018 33 / 40
Partitionering sorterad vektor Dåligt val av pivot Om vektorn är sorterad och om pivot väljs som första elementet hamnar Quicksort i sitt värsta fall: pivot = 1 1 2 3 4 5 6 7 8 Byt plats på detta och pivot 1 2 3 4 5 6 7 8 pivot Tom vektordel till vänster Alla element utom ett till höger Detta upprepas i alla rekursiva upplagor. Datavetenskap (LTH) Föreläsning 12 VT 2018 34 / 40
Quicksort tidskomplexitet Man kan visa att det bästa fallet för Quicksort är när vektorn delas mitt itu i varje rekursiv upplaga. Då är tidskomplexiteten = O(n log n) x x pivot x Sämsta fall är när den ena delvektorn blir tom i varje rekursiv upplaga. Då är tidskomplexiteten = O(n 2 ) x pivot x Datavetenskap (LTH) Föreläsning 12 VT 2018 35 / 40
Quicksort bättre val av pivot Välj median av första, mittersta och sista elementet. Eliminerar riskerna i samband med sorterad eller nästan sorterad indata. 6 1 4 9 8 3 5 2 7 0 left mid right Sortera de tre elementen i växande ordning: 0 1 4 9 6 3 5 2 7 8 left mid right pivot Median av de tre är nu mittelementet. Datavetenskap (LTH) Föreläsning 12 VT 2018 36 / 40
Quicksort bättre val av pivot Forts Byt elementet på plats mid med elementet på plats left. Då hamnar pivotelementet längs till vänster precis som förut. 6 1 4 9 0 3 5 2 7 8 pivot Nu kan partitioneringssteget utföras som förut. Datavetenskap (LTH) Föreläsning 12 VT 2018 37 / 40
Varianter av partitioneringssteget Stanna eller ej (och byta) vid likhet med pivot? Om vi inte stannar och byter och alla nycklar är lika hamnar vi i sämsta fallet. 5 5 5 5 5 5 5 5 5 5 pivot Om vi stannar och byter och alla nycklar är lika blir det bästa fallet. 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 5 pivot Man brukar rekommendera att stanna och byta vid likhet. Datavetenskap (LTH) Föreläsning 12 VT 2018 38 / 40
Quicksort efter partitioneringen Efter partitioneringen sorteras delvektorerna a[low]... a[pivindex-1] och a[pivindex+1]... a[high] rekursivt. I praktiken låter man av effektivitetsskäl metoden avstanna när delvektorn i det rekursiva anropet är mindre än 10-20. Den då nästan färdigsorterade vektorn kan sorteras av någon metod som är bra på nästan sorterad indata. T.ex. är insättningssortering lämplig. Datavetenskap (LTH) Föreläsning 12 VT 2018 39 / 40
Sortering Exempel på vad du ska kunna Redogöra för och jämföra olika sorteringsalgoritmer: Insättningssortering i vektor Urvalssortering i vektor Heapsort (behandlas i samband med prioritetsköer). Mergesort Quicksort Genomföra sortering på enkla exempel med ovan nämnda metoder Samsortera två sorterade följder Förklara begreppen pivot-element och partitionering (Quicksort). Använda idéerna från sorteringsalgoritmerna för att lösa andra problem (t.ex. partionering från quicksort eller sammanslagning av sorterade följder från mergesort). Datavetenskap (LTH) Föreläsning 12 VT 2018 40 / 40