Anvisningar för projektarbete och dokumentation (v3-v10)



Relevanta dokument
Databashantering och Beslutsstöd

Databashantering och beslutsstöd 7,5 hp. Kursbeskrivning

Tentamen för DD1370 Databasteknik och informationssystem

1DV405 - Databasteknik. Kursintroduktion. Så här är kursen planerad.

Uppgraderingsinstruktion för Tekis-FB Avisering version 6.3.1

DVA234 Databaser. Dag Nyström, Introduktion till databaser och MS SQL Server

L0009B. Moment. Introduktion till geografiska databaser: G:\L0009B\Allmänt\IntroGeoDB.pdf (F)

Webservice & ERP-Integration Rapport

Manual för Remote Travel användare Hur Ni använder er av CRM RemoteTravel

Uppgraderingsinstruktion för Tekis-FB Avisering version 6.3.0

Kursnamn XX poäng Rapportmall. Författare: (Skrivs i bokstavsordning om flera) Handledare:

1DV405 - Databasteknik. Kursintroduktion. Så här är kursen planerad.

Vad är en databas? Databaser. Relationsdatabas. Vad är en databashanterare? Vad du ska lära dig: Ordlista

Vad är en databas? Exempel på databaser: Databas = Organiserad samling och lagring av information.

Projektanvisning. Webbsideprojekt. Författare: Johan Leitet Version: 2 Datum:

1DV423 Databas med Administration

GIT L0003B. Databaser, en introduktion. Information inför kursstart

Beskrivningen stödjer funktion ver

KURS PM INDIVIDUELLT PROJEKTARBETE (2IV206)

TENTAMEN. För kursen. Databasteknik. Ansvarig för tentamen: Cecilia Sönströd. Förfrågningar: Anslås inom 3 veckor

SPF/MiRiaM Manual avancerad sökning

1.Lär känna MS SQL Observera. Tips. Förberedelse

Institutionen för Tillämpad fysik och elektronik Stefan Berglund och Per Kvarnbrink. Laboration: Flerskiktade applikationer

Uppstart Inloggning SSMS Skapa Databas Skapa Tabell Skapa Diagram, Fk, RI Hantering av Index, Pk, Fk, Ix Constraints Beräknande fält Några funktioner

GIT L0009B GEOGRAFISK DATABASTEKNIK. Information inför kursstart

Design och konstruktion av grafiska gränssnitt

Funktionsbeskrivning

Frågor att lösa med SQL mot databasen kursdb_sql Sida 1 av 5

Riktlinjer för Verksamhetsförlagd utbildning inom. Förskollärarutbildningen. UVK3: Specialpedagogik VT 15

Människa- datorinteraktion, MDI, vt 2012, Anvisningar för projekt- /grupparbete

Lite om databasdesign och modellering

Att komma igång med FirstClass (FC)!

Tentamen för DD1370 Databasteknik och informationssystem

Applikation för att skapa, underhålla, lagra och publicera litteraturlistor Lärare skapar och underhåller litteraturlistor Ämnesansvariga eller andra

Tentamen för DD1370 Databasteknik och informationssystem

Laboration 1, Datamodellering. Observera. Tips. Förberedelse. Genomförande

Lär känna MS SQL 2008 / Övning. Observera. Tips. Förberedelse

Tentamen 4,5 hp Delkurs: Databaser och databasdesign 7,5hp Tentander: VIP2, MMD2, INF 31-60, ASP

Nu är du inloggad på QlickView-servern och kan starta QlickView som finns som shortcut på skrivbordet, se figur1. Skapa nytt dokument med File->New.

TDDC74 - Projektspecifikation

FLEX Personalsystem. Uppdateringsanvisning

custice. fakta. presentation

För att XCOPY i SQL Server Express ska fungera måste data och logg ligga i samma mapp, vilket naturligtvis inte är så bra.

Lathund publiceringsverktyget

Inlämning i Studentportalen

Installationsanvisning - Kopplingen mellan GK96 och golf.se -

Databaskunskap 7,5 högskolepoäng Provmoment: Ladokkod: Tentamen ges för:

VAD GÖR DU / VEM ÄR DU?

Mål med lektionen! Veta kursmålen. Ha kännedom om några av de grundläggande begreppen.

Hur tycker du kursen har varit? Tycker du att kursens upplägg har underlättat för dig att uppnå lärandemålen?

WEBB13: Bild och Grafisk produktion, 7,5 hp, H13 (31KBG1)

Frontermanual för Rektorsprogrammet

SLUTRAPPORT RUNE TENNESMED WEBBSHOP

Gör så här för att rapportera:

Manual Partnerwebben 2014

Mitthögskolan ITM Telefon Access. Laborationskompendium för grunderna i databasen Microsoft Access. Detta exemplar tillhör:

Om du vill hitta tillbaka till din sektion klicka på fliken i huvudmenyn som heter organisation.

I dokumentet beskrivs hur man i medlemsregistret (MiRiaM) utför en så kallad avancerad sökning.

GODKÄNNANDE AV BASKRAV FÖR BEFINTLIGA LEVERANTÖRER TILL LKAB.

Vid problem med programmet kontakta alltid C/W Cadware AB på telefon

Stored procedure i ASP.NET

TENTAMEN. För kursen. Databasteknik. Ansvarig för tentamen: Cecilia Sönströd. Förfrågningar: Anslås inom 3 veckor

Scio. en liten användarguide. Skriven av: Josefine Siewertz

Inga hjälpmedel är tillåtna

Detta dokument beskriver hur du ansöker om ett ID06 konto hos Areff.

Tentamen för DD1370 Databasteknik och informationssystem

DOTPROJECT Manual. Projektledare och administratör har tillgång till fler funktioner och mer information än andra roller i det webbaserade systemet.

Nyheter i Norstedts Tidbok Mattias Claesson Produktchef

7,5 högskolepoäng. Objektorienterad systemutveckling I Provmoment: Ladokkod: 21OS1B Tentamen ges för: Lycka till! /Peter & Petter

Manual C3 BMS v. 1.1 för Windows Mobile telefoner

Nytt fräscht medlemsregister firar vi med ny fräsch årsrapporteringsguide!

SITHS i Easy. Handledning i hanteringen av Självdeklarationen. SITHS i Easy SITHS Förvaltning Senast ändrad Sid 1/9

Användarhandledning ICA Torget

Så här loggar man in:

Introduktion till MySQL

Minikurs Har du koll på företagets nyckeltal?

Administrationsmanual ImageBank 2

Kursansvarig: Margareta Kesselberg, Rum: B320, Tel: , E-post:

Människa- datorinteraktion, MDI, ht 2012, Anvisningar för projekt- /grupparbete

Logga in på:

För sent inkommen eller ofullständig ansökan riskerar att inte bli behandlad vid denna ansökningsomgång.

DDL Kommandon CREATE/DROP Database CREATE /ALTER/DROP Table ALTER/ADD/DROP Column CREATE /ALTER/DROP Index

Tilldelas efter registrering

Skapa professionella försättsblad i Pappersvyn

Installationsanvisningar VisiMIX. Ansvarig: Visi System AB Version: 2.2 Datum: Mottagare: Visi MIX kund

Användarhandbok StepStones Recruiters Space

HANDBOK PROCAPITA UTFÖRARE

Gymnasiearbetets rapport. En översiktlig genomgång

Kursdokument Regional kurs Kursnamn: Döva barn och barn med hörselnedsättning lära att läsa och skriva under de tidiga åren Termin: Höstterminen 2015

Information till webbstödet för leverantörer Rehabiliterings tjänster (Uppdaterat )

Webprogrammering och databaser. Konceptuell datamodellering med ER-modellen

Skapa kontrolluppgifter

Övningsuppgifter med E-postklienten MS live Inloggning

Thomas Pihl Frontermanual. för studerande vid Forum Ystad

Databaser design och programmering. Design processen ER- modellering

Inställningar frånvaronotifiering

Föra över ett befintligt register via importfil

TENTAMEN För kursen. Databasteknik. Ansvarig för tentamen: Anna Palmquist. Förfrågningar: Anslås inom 3 veckor

Hållbar utveckling A, Ht. 2014

Transkript:

Anvisningar för projektarbete och dokumentation (v3-v10) Anteckna (för egen del) vilka medlemmar som ingår i din grupp. Se till att samma uppgifter är mejlade till kursansvarig jesper.hakerod@hh.se senast kl 17:00 efter kursintroduktionen. Gruppnamn: E-post till kontaktperson: Utsedd kontaktperson: Förnamn Efternamn Personnummer Gärna telefon Projektdelen (3p) bygger på de nyckelkoncept som tagits upp tidigare i kursen och utgörs av ett praktiskt projekt där Ni är tre till fyra studenter i varje grupp. Ni ska utveckla en BI-lösning efter styrd idé, där ett specifikt antal nyckelkoncept måste användas. Projektet inkluderar även en dokumentation där ni redovisar bland annat hur de olika nyckelkoncepten använts i ert projekt. Vidare skall Ni dokumentera utifrån de rubriker som föreslås lite senare i detta pm. I många projekt är processerna under systemutveckling mycket viktiga. Kvaliteten är till stor del beroende av att ha bra processer under systemutvecklingen. För att ha en möjlighet att göra bra ifrån sig under arbetets fortskridande är det bra att ha ett strukturerat tillvägagångssätt. Det är viktigt med en klar och genomgående designidé där tankearbetet kan följas på papper med hjälp av metoder och verktyg t.ex. mappningsschema, databasskisser, pappersprototyper etc. Ni ska kunna visa att Ni analyserat och bearbetat de problem som finns i projektet och lösa dessa på ett strukturerat sätt och undvika att tekniken styr Er design i alltför stor grad. Titta gärna på Microsofts BI-webb: http://msdn.microsoft.com/en-us/library/ms173767(sql.90).aspx På Microsofts teknikwebb finns mycket hjälp om själva verktyget: http://msdn.microsoft.com/en-us/library/ms130214.aspx 2

Inlämning: Färdig BI-lösningen lämnas in och vara körbar i de verktyg Ni har till förfogande till (MS SQL Server 2005) och all källkod (hela mappen) skall inkluderas. Bakgrund: Företaget Bike (i Jeeves) har som många andra företag under året börjat känna av de sämre ekonomiska tiderna och styrelsen vill göra en bättre analys med hjälp av sina nyckeltal för att följa upp verksamheten. De har investerat i senaste versionen av affärssystemet Jeeves Universal men de har också andra typer av system sedan tidigare som de vill ta med i dataunderlaget och de vill kunna se trender i vad som händer i ett större och bredare perspektiv än med bara informationen som finns i Jeeves. De inser också att ju tidigare man har information, desto tidigare kan man sätta in korrigeringsåtgärder t.ex. genom ökad marknadsföring eller justeringar i sortimentet för att bättre anpassa sig mot marknadens krav. Därför har de valt att satsa på ett BI-projekt, de har också valt att ha kompetensen inom företaget, vilket innebär att Ni fått uppdraget att leverera en BI-lösning. Scenario: Det som skall göras är att ifrån Jeeves interna databaser skall man extrahera ut historiska order, nuvarande order och befintliga offerter som ligger ute, dessa skall kombineras med uppgifter på inkomna men ej registrerade orders från säljare som reser runt. Säljarna registrerar dessa i ett Excelark, datakvaliteten är dock är oftast mycket låg, man skriver fel kundnummer, fel datumformat m. fl. då de har inte någon online uppkoppling för sitt system. Samtidigt är datan viktig då detta är de senaste uppgifterna (order från aktuell vecka). Säljarna antecknar även uppgifter som de snappar upp t.ex. missnöje med produkterna eller information om andra konkurrerande leverantörer t.ex. nya kampanjer eller erbjudande. Informationen från dessa datakällor skall sammanställas, ev. aggregeras och rensas och läggas (så kallad ETL extract, transform, load) i en data warehouse databas. Nedanstående skiss ser Du en schematisk skiss över BI-lösningen med datakällor och rapportdelen. 3

Jeeves orders Reporting Services Dataware house Jeeves offerter Excelark Excelark från säljare Övrigt: Ni får en kopia av Jeeves databas av oss, som Ni kan utgå ifrån. Det finns ett företag företagskod 9998 som innehåller en del transaktionsdata som Ni kan använda. Det kommer inte att finnas något gränssnitt (Jeeves klient) för denna databas, utan Ni får logga in på ordinarie Jeeves Universal i så fall för att kunna se hur datan presenteras. Det finns även hjälpfiler som kan vara behjälpliga för er analys. Dokumentation Den bör på ett klart och tydligt sätt redogöra för hur ni har gått tillväga i ert utvecklingsarbete. De viktigaste valen (metodmässigt, systemutvecklingsmässigt, testning, tekniskt etc.) ska argumenteras för och vara kopplade till lämplig litteratur. Det ska klart och tydligt framgå att det finns teori i form av litteraturstudier kopplat till dokumentationen. Dokumentation bör därför behandla följande huvudavsnitt (exempel på upplägg). 4

Detaljer som skall vara med: Jeeves databas, o En databas kommer att finnas tillgänglig för Ert bruk och gör Ni förändringar vid överföring av data skall det finnas en förteckning över vilka fält, datatyper m.m som förändrats, förklara vad dessa förändringar har för syfte. Mappningar Excelark (om vi hinner), ett ark för registrering av orderuppgifter som säljaren har med sig på sina resor. Detta skall innehålla uppgifter som är väsentliga för en order, uppgifter om kan inhämtas från Jeeves hjälp eller genom att studera Jeeves gränssnitt. Det rör sig om 5-10 fält och dessa kan vara enkla strängfält utan formatering. Vid ETL av datawarehouse skall Ni använda funktioner för att rensa dessa fält förslagsvis en lookup och en datumformatering. Jeeves BI-databas med dokumentation o Modell (Star-, Snowflake, flat argumentera för val) o denormaliseringsgrad o varför o förteckningar fält (data dictionary) o aggregeringar, hur är dessa sammansatta? o ETL flödesschema Rapporter generade utifrån denna BI-databas. Metoder för datarensning Metadataförteckning o Ursprungsfält o Tidsstämplar o Aggregering Metoder för felhantering Delredovisning 1 Två grupper kommer att få presentera sina projekt vilket lottas i början av redovisningen. Ni som deltar uppmanas till att ställa frågor och bidra med egna erfarenheter. Vid första redovisningstillfället ska ni muntligen kunna presentera ert projekt och även lämna in en kort sammanfattning av ert arbetes status fram till 5

redovisningsdatumet. Dokumentationen som lämnas in skall, förutom formalia på försättsbladet (se anvisningar för delredovisning 4 för namnuppgifter, etc) innehålla: Namn + pnr på samtliga deltagare på försättsblad en databasmodell över er måldatabas (så den ser ut nu) data dictionary för entiteter, relationer och attribut Delredovisning 2 (Slutredovisning) Färdig BI-lösning visas upp och presenteras i sin helhet. Vidare skall även all dokumentationen överlämnas till kursledare på CD/DVD skiva med projektet. Varje grupp har 20 min på sig att redovisa. Ni bör nu även kunna redogöra för: mappningsdiagram ETL process flow diagram (t ex skärmdumpar av era controlflöden, samt data flow diagram) Rapporter Observera att inlämnat material skall vara märkt med kursnamn, gruppnamn, inlämningsdatum, fullständiga namn, mailadresser och personnummer för samtliga deltagare. Bedömningskriterier och examination För projektet kan ni erhåll betyget U-G. Kravet är att ni fullföljt alla kraven som ställts upp ovan. Lycka till! Jesper & Torben 6

Bilaga: Erfarenheter ifrån labbar i databashantering och beslutsstöd Måldatabasen som ni konstruerat har stor potential att generera fel om den inte konstrueras med stor omsorg. Några aspekter som ni kan kontrollera i designläget för era tabeller när ni är inne i SQL server Management Studio är att: alla attribut i tabellen tillåter nullvärden. Se till att kryssa för allow nulls för alla fälten i er tabell eftersom Jeeves10 innehåller null-värden för en hel del attribut. Det går aldrig att sätta allow nulls för en primärnyckel vilket innebär att ni får lösa detta med en ny primärnyckel en sk surrogatnyckel. Ni skapar alltså en ny primärnyckel (oftast numerisk eftersom den är snabbast, välj tex datatypen int) och tar därefter bort den gamla så att ni kan kryssa allow nulls för den. Nu kan ej nullvärden sätta stopp för överföringen av data till denna tabell. datatyperna för mappning mellan källdatabas och måldatabas måste vara exakt likadana. Håll musmarkören på fälten som ni ser i mappningsschemat. Ni får upp information om datatyp, längd och codepage, etc. Jämför datatyperna för källdatabas och måldatabas så att de är exakt likadana. Är det inte likadana måste måldatabasens datatyp ändras så att den blir exakt likadan. Detta arbete är väldigt tidsödande om det görs i efterhand. Ett bättre sätt är att vid konstruktion av måldatabasen utgå ifrån ett framarbetat data dictionary där källdatabasens datatyper i stort sett styr den datatyp som är lämplig för samma attribut i måldatabasen (givet att det inte är meningen att datan ska konverteras till en annan datatyp under överföringen). Till exempel kan ni för ett ordernummer välja mellan smallint, int, bigint för att växla mellan 2-, 4- och 8-bitars integer jämför alltså med datatypen i Jeeves10 är den 8-bitars integer väljs datatypen bigint för motsvarande attribut i måldatabasen. Kontrollera även att teckenuppsättningen är lika, dvs att t ex codepage är typ 1252 för både källa och mål i mappade attribut. om det verkar strula med duplicate keys eller om poster verkar krocka med befintliga poster, kan ni testa att rensa bort allt gammalt skräp i måldatabasens tabeller som kan vara orsaken till krockarna och felen. Ni kan välja att skapa en New Query och där skriva SQLkommandot DROP FROM [tabellens namn] (glöm ej att slutligen köra frågan) för att slänga alla poster i den tabellen. 7

Några viktiga aspekter som är bra att känna till när ni arbetar i Visual Studio 2008 och arbetar med era flöden är att: när ni skapar dataflow och kör dem så körs alla dataflows oavsett vad ni markerat. Finns det fel i ett helt annat dataflow än det ni för tillfället arbetar i stannar körningen på grund av det andra datafödets fel. Håll med andra ord koll på fel i samtliga dataflow. Om ni vill lägga in en conditional split eller något annat kontrollobjekt i ert dataflow, kan ni markera och ta bort den befintliga gröna pilen ifrån källdatabasobjektet och därefter dra om den nya pilen till ett skapat conditional splitobjekt. Det är således enkelt att bygga om era flöden efter hand utan att era redan utlagda objekt i dataflödet försvinner. Per visade ett sådant exempel där företaget 9998 skulle selekteras ut och där villkoret foretagkod==9998 lades in i en conditional split. Kika i processfliken om fel uppstår för att få vägledning i vad felet kan bero på. Till sist kan det vara bra att nämna lite om hur ni gör felsökningen mycket lättare genom att närma er den färdiga lösningen successivt genom att börja med några få attribut - och om detta fungerar bra - successivt öka på komplexiteten med allt fler attribut. Skapa t ex ett dataflow för överföring av offerter ifrån Jeeves, ett annat dataflow för att överföra ordrarna, ett tredje dataflow för att föra över säljarnas exceldata, ett fjärde för att sammaställa faktatabellen i er data warehouse om ni använder starmodell för er måldatabasdesign. Eftersom ni använder er av star-modellen för er databasdesign kan det vara bra att kika i motsvarande kapitel i kurslitteraturen eller i Connolly & Begg för att få mer kött på benen kring konstruktion av olika dimensionstabeller och faktatabellen, inte minst avseende behov av surrogatnycklar. 8