Välkommen till DVA234: Databaser Dag Nyström dag.nystrom@mdh.se IDT Akademin för Innovation, Design och Teknik
Personal Kursansvarig & lärare: Dag Nyström, universitetslektor dag.nystrom@mdh.se Forskningsområde: Databaser för tidskritiska system Tidigare: Mimer Information Technology Laborationsassistenter: Mobyen Uddin Ahmed, universitetslektor mobyen.ahmed@mdh.se, Nils Müllner, postdoktor nils.muellner@mdh.se Shaibal Barua, doktorand shaibal.barua@mdh.se, 2
Kursens mål 1. förklara hur en databas används för att lagra och hantera information på ett standardiserat, strukturerat och effektivt sätt 2. konstruera konceptuella datamodeller utifrån givna kravställningar och vidare transformera och implementera dessa i en databashanterare 3. förklara relationsmodellens och relationsalgebrans principer och hur dessa tillämpas i implementationen av relationsdatabaser 4. utarbeta operationer mot en databas med hjälp av datamanipulerings- och datadefinieringsspråk samt utföra komplexa associationer och sammanslagningar på relationer 5. tillämpa normaliseringsprocessen för relationsdatabaser Teori 6. utveckla program, både i klient och i databashanteraren, som programmatiskt nyttjar databaser 7. förklara databashanterarens interna uppbyggnad med avseende på till exempel arkitektur, transaktioner, återhämtning och indexering 8. ge exempel på vetenskapliga frågeställningar och forskning inom databasområdet och 9. relatera till sociala och etiska frågeställningar inom databasområdet, som till exempel dataintrång, registersamkörning och personuppgiftslagen. Praktik Vetenskap/ Etik 3
Kurshemsida http://www.idt.mdh.se/kurser/dva234 På hemsidan finns information om: Föreläsningar, labbar, övningar & seminarier Examinationsformer/regler Fusk/Plagiarism Diskriminering Nyheter Så håll er uppdaterade! 4
Examinationsformer Kursen examineras genom: 1 skriftlig inlämningsuppgift (betygsgrundande akademisk rapport) Kunna förklara och argumentera kring användning av databas. Exemplifiera vetenskapliga frågeställningar och forskning inom omr. Relatera till sociala och etiska frågeställningar inom databasområdet. 5 stycken övningar (papper och penna) görs 2 och 2 Datamodellering Relationsmodellen Normalisering Transaktioner Fysisk databasdesign 4 stycken laborationer (Programmeringsövningar) Görs 2 och 2 SQL Stored procedures API programmering Dataoberoende 1 seminarium (gruppdiskussioner presentationer) Sociala och etiska frågor runt dataintrång, registersamkörning & PUL På kurshemsidan finns mer information om examinationen på kursen 5
Övningarna 5 stycken övningar som knyter an till föregående föreläsning Övningen öppnar efter föreläsningen på måndagen Görs i labgrupperna 2 och 2 Papper och penna övningar Man får ha boken På övningstillfället på fredagen skall hela gruppen redovisa Man får tidsslottar på ca 10-15 minuter per grupp Godkänt på alla 5 övningar krävs för avslutad kurs! 6
Seminariet Obligatorisk aktiv närvaro Man måste alltså delta aktivt i diskussionerna INNAN Seminariet Läsanvisningar ligger på kurshemsidan Var och en skriver en kort reflektion som lämnas in dagen före Seminariedagen 13:15-13:30 Inledning och gruppindelning 6-8 personer/grupp Utdelning av frågor och ståndpunkt för/emot 13:30-14:30 Gruppdiskussioner & förberedelser 14:30-17:00 Redovisning sker i 4 block (2 grupper per block) - 5 min framläggande av argument för - 5 min framläggande av argument emot - 20 min duell mellan grupper 7
Laborationerna Labredovisning Laborationstillfällen varje vecka, labbarna skall primärt redovisas på dessa. Ev extra handledningstider mot slutet av kursen läggs upp vid behov. Efter kursens slut kommer några redovisningstillfällen fördelade under året. Laborationer redovisas för labass Laborationerna tar mycket tid!! Labbtillfällena räcker inte. 8
Lite om laborationerna Databasutveckling mot Microsoft SQL Server MDH har en server ni jobbar emot Ni arbetar främst i Microsoft SQL Server Management Studio SSMS är installerat i labsalen SSMS2016 i labsalar, 2008 fungerar lika bra om ni vill ladda ner från MS SSMS finns för gratis nedladdning. https://docs.microsoft.com/en-us/sql/ssms/download-sql-server-management-studio-ssms Programmering mot databas i C# Ni arbetar i Microsoft Visual Studio VS2008 är installerat i labsalen Labbarna görs i grupper om 2 Nästa föreläsning kommer jag skicka runt en labblista Jag skapar konton på servern för varje labgrupp. 9
Angående SQL Server För närvarande är servern vi använder i kursen låst för access utanför MDHs nätverk. Vi förhandlar med ITA kring en lösning Möjliga lösningar: Uppdatera server och öppna igen Köra från en molnbaserad SQL Server (Azure t.ex.) Fungerar smidigt men kostar massor 10
Lite om laborationerna Alla laborationer och den ena övningen hör ihop Mål: Skapa en applikation för hantering av IDT Studenter, kurser, personal osv Lab 1: Skapa tabeller Grundläggande SQL Lab2: Enkel C# applikation med ADO.NET Övn1: Modellera IDT-databasen Lab3: Implementera IDT Databasen, designa applikationen samt implementera denna Lab4: Avancerad SQL (Extra-lab: Dynamisk SQL) 11
Kurslitteratur Default-boken: Databasteknik av Thomas Padron-McCarthy och Tore Risch Alternativ 1 (Gamla Default-boken) Fundamentals of Database Systems (4:de editionen eller senare) av Elmasri och Navathe Har tyvärr blivit större och större och dyrare och dyrare med åren. Alternativ 2: An Introduction to Database Systems (7:de editionen eller senare) av C J Date För mer info, se kurshemsidan! 12
Resultat från förra årets kursutvärdering Svarsfrekvens: 23 svarande av 54 studenter L Egen arbetsinsats <5-14h/vecka (17,4%) Några betyg (skala 1-5) Övergripande betyg 4.4 Kursinnehåll 4.7 Kursens undervisning 4.6 Tydlighet i examination 4.2 Kurslitteraturen gav stöd 4.0 Studiehandledning 4.7 Annat Information om tidigare kursutvärderingar 15-24h/vecka (34,8%) >24h/vecka (47,8%) 100% ja Jämlikhet/Diskriminering/kränkningar En person har svarat: Ja, någon annan har kränkts eller missgynnats 13
Revideringar denna kurs Den huvudsakliga kritiken förra året gällde att den parallella kursen interaktionsdesign tog mycket tid. Jag har framfört detta på lärarlaget, hoppas vi får en bättre balans I år. Problem: Svårt med Windows Forms om man inte gått den senaste instansen av OOP Lösning: Jag hoppas detta försvinner i år eftersom vi nu gett detta 2 år I OOP 14
Något betydligt mindre roligt FUSK och PLAGIARISM Jag AVSKYR fusk och har nolltolerans Snälla, låt mig slippa detta i år!!!!! I dessa fall: Plagiat från tidigare års rapport Plagiat genom översättning För hand eller google-translate Vilseledande referenshantering Parafrasering Tre upptäckta, tre fällda 15
Så för att vara tydlig Nästa föreläsning: Ni skall ha parat ihop er 2 och 2 och skriva upp er på den lista jag skickar runt. Sedan kommer jag att ge varje grupp inloggningsuppgifter till servern. Det tar mig ett tag att göra dessa så jag behöver alla grupper för att hinna till labben!! 16
Upprop Finns du inte med på listan, eller är osäker på om du har behörighet, eller har du ett tillgodoräknande som ej är beslutat än ta det med studievägledare/studenttorget 17
Sist men inte minst: Välkomna till kursen, nu kör vi! 18
Föreläsning 1: Introduktion till Databaser DVA234 Databaser IDT Akademin för Innovation, Design och Teknik
Innehåll Föreläsningens mål: Att ge en översikt över kursens innehåll. Varför databaser? Vad är en databas? Databasernas historia/relationsmodellen Datamodellering Transaktionshantering 20
Vad är en databas? Ett elektroniskt arkiveringssystem. Definition 1: En samling data som hör ihop, som modellerar en del av världen och är persistent. (Padron-McCarty) Definition 2: En samling statiska data som används av applikationssystem inom en given verksamhet (C. J. Date) Definition 3: En samling relaterat data. (Elmasri & Navathe) Slutsats: Det är alltså samlingen data som är databasen 21
Vad är en databashanterare? En programvara som har till uppgift att lagra och hantera databaser I bland brukar man slarvigt säga Databasserver (Vi kommer till varför det är slarvigt senare..j ) Databashanterare brukar förkortas DBMS (Database Management System) Exempel på några databashanterare: Oracle MS SQL Server MS Access (ingår i MS Office Pro) MySQL Mimer SQL SQLite 22
Vilka krav ställs på en databas? Hantera mycket stora datamängder Kraftfulla dataoperationer Komplexa frågor över stora mängder data Stödja ändringar av strukturen (schemat) i run-time Delning av data (Flera samtidiga användare) Persistens ( Garanterad permanent lagring) Tillförlitlighet (up-time) Datakonsistens/Dataintegritet Datadistribution Säkerhet 23
Varför databaser? Dataoberoende - Separera data från applikationen Applikationscentrisk approach App. App. App. Data Data Data OS API/Skal OS-tjänster OS-kärna Hårdvara Data(bas)centrisk approach App. App. App. OStjänster OS API/Skal Data OS-kärna Hårdvara Applikationerna ansvarar själva för kommunikation Fler appl. à Högre komplexitet Ändras en appl. à Dominoeffekt Dataoberoende Kursens viktigaste ord!!! Separat datalager som en del av systemets basplattform Appl. kommunicerar via databas Databas - egen vy till varje appl. 24
Databassystemet Användare Användare Användare Användare Verktyg: Modellering Optimering Administration Programmerings API Rapportverktyg... Erbjuder möjligheten att skapa anpassade vyer Extern vy A Extern vy B Extern vy C En programvara som hanterar databasfilen Databashanteringssystem (DBMS) Databassystem En stor fil (eller flera), oftast på disk. Databas 25
Databashistoria: Filbaserade databaser (1:a gen) Kalle, Kostigen 4 Datalogi, 2001, Pelle, Vasagatan 3 Datatekn, 2002, Nilla, Vasagatan 2 Datalogi, 2011, Lagra data i filer Flat file database Dataposter i filer Jämför fopen, fwrite,fread Inga samband mellan data Hanterar delning av data Program Program 26
Databashistoria: Hierarkiska databaser (2:a gen) Kursplan Kurs Kurstillfälle Lärare Student Data organiserat i hierarkiskt träd Används i Windows Registry Fortfarande relativt rudimentär modell Leder ofta till duplicerat data Program Program 27
Databashistoria: Nätverksdatabaser (3:e gen) Kursplan Kurs Kurstillfälle Lärare Student Data organiserat i utökat hierarkiskt träd Barn kan ha flera föräldrar Ökar modelleringsbarheten Förkunskaper Program Program 28
Databashistoria: Relationsdatabaser (4:e gen) Frågespråk (SQL) Relationsmodellen Formell modell Data i tabeller Operatorer Standardiserat frågespråk (SQL) De-facto standard idag Den typ vi använder i denna kurs Program Program 29
Exempel på en tabell STUDENT Personnr# Namn Program Startår Poäng 810602-0547 Stina Nilsson DVP 2014 65 800129-0355 Stefan Andersson Nätverk 2013 73 790518-0219 Per Johansson Nätverk 1999 110 761130-1288 Nina Persson Nätverk 2014 72 721210-1256 Rikard Sjöström DVP 2014 70 621021-3459 Tor Hedman DVP 1995 105 680906-1882 Eva Ekman Nätverk 2015 25 30
Databashistoria: Objektorienterade databaser (5:e gen) Databas Persistenta objekt Frågespråk (OQL, ) Hanterar persistenta objekt (data och beteende) Objekt kan instansieras och delas i databasen Ofta hårt integrerat i programspråket Programspråk Ickepersistenta objekt Program Program 31
Databashistoria : Nutida och framtida typer Objektrelationsmodellen Blandning av relations och objektmodellen Fält i en tabell kan vara objekt med beteende NoSQL databaser ( NoRel ) Samlingsnamn för nya grafbaserade databaser, ickerelationella Bygger ofta på grafteori och stödjer mycket stora datamängder. Exempel: Facebooks inbox search ca (50TB) Källa: Wikipedia.org Embedded-databaser Små databaser som sitter i device, typ mobiltelefoner, reglerdon Primärminnesdatabaser Lagrar data i RAM - Snabbhet vs. Persistens Realtidsdatabaser För applikationer med tidskrav. Ger garanterade svarstider. 32
Relationsmodellen Relationsdatabaser är baserade på en formell teori som kallas relationsmodellen (Codd 1970) Bygger på följande abstrakta datamodell: Data representeras som rader i en tabell (eller flera) Varje rad kan utläsas som en ett sant påstående, ex kan utläsas Personen med personnummer 810602-0547 heter Stina Nilsson, läser DVP och har 65 poäng 33
Relationsmodellen Relationsoperationer ( databasfrågor) Operatorer tillhandahålls för att skapa nya sanna påståenden utifrån givna påståenden. Exempel Vad hette de som startade DVP år 2014! "#$" (& '()*(#$+, -./0 (& 12#(2å(+4567 89:;<=9 )) Resultat: Ovanstående kryptiska rad kan utläsas som följer (börja längst in i parenteserna) Ta tabellen STUDENT, och välj alla rader där startår är 2014, av dessa rader välj alla rader där program är DVP, för dessa rader, ta bort alla kolumner utom Namn Men det här är ju krångligt, så vi måste hitta något lättare sätt 34
Structured Query Language (SQL) Ett frågespråk för att arbeta med data i databaser Används för att: Ändra värden på data i databasen Läsa ut data ur databasen Ändra strukturen på hur data lagras Med SQL kan man relativt enkelt skapa väldigt komplexa sökningar i stora datamängder. 35
Så vår fråga i SQL då. Vad hette de som startade DVP år 2014: Relationsoperator: SELECT Namn FROM STUDENT WHERE Program= DVP and Startår=2014; π-operatorn σ-operatorn Resultat: Namn Stina Nilsson Rikard Sjöström 36
Fler exempel på databasoperationer Lägga till data: INSERT INTO STUDENT(Personnr, Namn, Program, Startår, Poäng) VALUES ( 780828-0458, Kalle Svensson, DVP, 2015, 0); Ändra data: UPDATE STUDENT SET Poäng = Poäng + 5 WHERE Personnr = 680906-1882 ; Ta bort data: DELETE FROM STUDENT WHERE Personnr = 790518-0219 ; 37
Access till Databas SQL i terminalfönster Systemunderhåll Admin-gränssnitt 38
Access till Databas Databasverktyg Systemunderhåll Admin-gränssnitt Verktyg har sina begränsningar. Underskatta inte terminalfönstret 39
Access till Databas Programmatisk Access Applikationer Web-applikationer 40
Databasdesign Konceptuell databasdesign Skapa en generell modell av verkligheten Oberoende av databas och datamodell Tekniker: Entity-Relationdiagram, UML, Logisk databasdesign Transformera den konceptuella databasmodellen till en datamodell (relationell, objektorienterad osv ) Oberoende av fysiska hänsyn eller DBMS val Fysisk databasdesign Transformera den logiska databasmodellen till en fysisk design Lagringsmedia, DBMS-val, prestandaoptimeringar (index etc) Detta är givetvis en iterativ process!!! 41
Konceptuell databasdesign: ER-modellering Entity-Relationdiagram: Program namn Personnr Program 1 Läser M Student Namn Startår Akademi Entitet Samband Poäng Attribut (Primärnyckel understruken) 42
Logisk databasdesign: Relationsschema Implementation av den konceptuella databasdesignen Främmande nyckel: Kan sättas på ett attribut som refererar till en primärnyckel. Referensintegritet T ex, om en främmande nyckel är Robotik, MÅSTE motsvarande primärnyckel existera. Foreign key PROGRAM Programnamn# STUDENT Personnr# Namn Programnamn Startår Poäng Akademi 43
Samtidig dataaccess En databashanterare måste klara av många samtidiga användare. Exempel: Banker, biljettbokningssystem, facebook osv Inte ovanligt med tusentals samtidiga användare Samtidiga användare à risk för konflikter, t ex Någon tar ut pengar i en bankomat samtidigt som någon annan för över pengar från samma konto Samma sittplats på Bruce Springsteens konsert bokas samtidigt av flera kunder Hur hanterar en databas detta? 44
Transaktionshantering En transaktion är en logisk arbetsenhet Består av en eller flera operationer som utförs atomärt, tex: BEGIN TRANSACTION; UPDATE Konton SET Saldo=Saldo-300 WHERE KontoNr= 11223344 ; UPDATE Konton SET Saldo=Saldo+300 WHERE KontoNr= 55667788 ; COMMIT; Om transaktionen avbryts (vid systemkrasch eller explicit med ROLLBACK operationen) får inget av delstegen utföras. Transaktionshanteringen är en av de mest komplexa delarna av en databashanterare. 45
Summering av föreläsningen Databaser hanterar stora datamängder Delning av data, persistens, separat datalager Ett databassystem består av Databas, databashanteringssystem, diverse verktyg etc. Relationsdatabaser och relationsmodellen En formell datamodell där data lagras i tabeller Datamodellering Konceptuell, logisk och fysisk datamodellering Transaktionshantering En transaktion samlar ihop en mängd operationer till en atomär logisk arbetsenhet. Adress till kurshemsidan: http://www.idt.mdh.se/kurser/dva234 46