Data mining. Ett analysverktyg för att upptäcka mönster i stora mängder data. Linköpings universitet Artificiell intelligens II 729G11 HT 2010
|
|
- Ola Bergman
- för 9 år sedan
- Visningar:
Transkript
1 Linköpings universitet Artificiell intelligens II 729G11 HT 2010 Data mining Ett analysverktyg för att upptäcka mönster i stora mängder data karfr294@student.liu.se
2 Innehållsförteckning 1 Inledning Syfte Avgränsning Data mining Data miningens rötter Konkreta exempel på användningsområden för data mining Data mining and Knowledge Discovery in Databases (KDD) KDD processen Data warehouse Två typer av data mining Prediktiv och deskriptiv data mining Tekniker Funktion kontra teknik Funktioner Klassificering Uppskattning Prediktion Associering Visualisering Data mining tekniker Beslutsträd Neurala nätverk Kluster Genetiska algoritmer Minnesbaserat resonemang/ K-nearest neighbour Utmaningar med data mining Diskussion Referenser
3 1 Inledning Vi lever i ett informationssamhälle, men vad skall vi med all information till? Hur kan vi dra nytta av den? Filosofen Theodore Zeldin lär ha sagt "What to do with too much information is the great riddle of our time." Visst ligger det en sanning i denna utsaga. I dagens samhälle kan vi få nästan hur mycket information som helst, om vad som helst, när som helst. Dagens informationsteknologi har dessutom gett företag möjlighet att samla in enorma mängder data om sina kunder. Att ur en databas kunna få fram användbar information kan vara oerhört värdefullt för en organisation. Många företag har på senare år blivit alltmer kundfokuserade och framgångar inom datainsamling och lagringsteknologi har därmed resulterat i tillväxt av stora databaser. Intresset för att kunna göra nytta av dessa data har vuxit sig allt starkare. Det är här data mining kommer in i bilden. Data mining är en metod som används för att hitta meningsfulla mönster och viktig information i stora mängder data som genereras i ett företags verksamhet. 1.1 Syfte Syftet med detta fördjupningsarbete är att ge en grundläggande insikt i vad data mining är, hur det fungerar, samt vilka möjligheter och begränsningar detta analysverktyg erbjuder. 1.1 Avgränsning Området data mining är oerhört stort och komplext. För att göra detta arbete hanterbart inom tidsramen och utrymmet för denna fördjupningsuppgift ämnar jag främst redovisa de vanligast förekommande algoritmerna som står till grund för data mining tekniken, samt ge en något förenklad förklaring av deras funktion. 2 Data mining 2.1 Definition av data mining Data mining är ett begrepp som bygger på teorier och idéer som härstammar från olika fält. Det finns inte någon tillräckligt bra och allmänt accepterad översättning av begreppet i svensk facklitteratur, därmed används det engelska ordet data mining även på svenska. Som tidigare nämnts är data mining en teknik varigenom man extraherar värdefull information i stora databaser. Citatet nedan ger en grundlig insyn i vad data maning innebär. 2
4 Data mining is the search for relationships and global patterns that exist in large databases but are hidden among the vast amount of data, such as a relationship between patient data and their medical diagnosis. These relationships represent valuable knowledge about the database and the objects in the database and, if the database is a faithful mirror, of the real world registered by the database. Marcel Holshemier & Arno Siebes (1994) 2.2 Data miningens rötter Data mining är inte en ensam teknologi utan en samling av verktyg som används för att få fram värdefull information från stora mängder data. Det som är nytt är att sammanslagningen och tillämpningen av tekniken används på ett nytt sätt och på olika områden. Data mining har sitt ursprung i flera olika kunskapsfält. Vid användning av data mining används flera olika tekniker för att lösa olika problem. Dessa tekniker har bland annat sitt ursprung i statistik, artificiell intelligens, maskinlärning, mönsterigenkänning, databasteknologi, och visualisering. De datamängder som undersöks är ofta stora. Om enbart små datamängder varit inblandade skulle man endast behöva klassiska statistiska metoder. Men när det gäller stora kvantiteter av data uppstår nya problem. Därmed har intresset vuxit sig att allt större att utveckla metoder som kan hantera den typen av data och ge värdefull information. Till följd därav utvecklades data mining. (Bertino, E, 2001) 2.3 Konkreta exempel på användningsområden för data mining I litteraturen beskrivs ett antal områden som lämpar sig för data mining. Några av dessa användningsområden är inom finans och bank branschen. Inom finansvärlden används data mining bland annat för att förutspå aktiepriser. Inom bankbranschen kan tekniken bland annat användas som hjälp vid direktmarknadsföring, för att genomföra trendanalyser, förutspå bedrägerier, eller utvärdera risker. (Fayyad, et al., 1996). Sjukvården är ännu ett område där data mining kan tillämpas. Här används bland annat data mining för utveckling av mediciner. Det är främst vinstdrivande grupper med stora databaser som använder sig av data mining. Företag lagrar exempelvis data i sina databaser över sina kunder, produkter och transaktioner. Butikskedjor sparar information om konsumenternas kvitton som visar på inköpta varor, tidpunkt och datum för köpen. Vid kortbetalning sparar de möjligtvis även personinformation såsom ålder och kön. Dessa uppgifter använder sedan företaget för att med hjälp av data 3
5 mining utvinna mönster och trender som de kan använda sig utav för marknadsföringssyften samt utökning av sitt sortiment. För att få en tydligare uppfattning på vilket sätt data mining kan användas i en organisation beskrivs ett kort exempel. Data mining kan exempelvis användas som grund för beslut om vilka leverantörer man vill använda sig av. Metoden är användbar när en organisation skall fatta beslut om gamla leverantörer bör vara kvar eller inte. Kravet är att organisationen har data lagrat om leverantörerna beträffande de faktorer som anses vara viktigast. Exempel på sådana faktorer kan vara tillgänglighet, pris, leveranstider och produktkvalité. Utifrån dessa faktorer är det sedan möjligt för organisationen att göra analyser för att få fram ett beslutsunderlag för huruvida leverantörerna skall få vara kvar eller inte. Man väljer alltså ut relevanta data och sätter sedan sitt data mining verktyg till att arbeta fram mönster. Dessa mönster används sedan för att bygga en modell som sammanfattar de mönster man fått fram. Mer om exakt hur denna teknik fungerar kommer redovisas längre fram i arbetet. 2.4 Data mining and Knowledge Discovery in Databases (KDD) Begreppet data mining ingår i en process vars mål är att omvandla data till kunskap. Processen kallas Knowledge Discovery in Databases. Intresset för data mining och KDD har lett till ett flertal likartade definitioner och begrepp. I litteraturen beskrivs sökandet efter mönster i data med flera termer, däribland data mining, men också knowledge extraction, information discovery, samt pattern processing. Frasen knowledge discovery in databases myntades för att betona att kunskap är slutprodukten av en datadriven upptäckt. Då det saknas en lämplig svensk översättning kommer jag fortsättningsvis använda mig av den engelska termen knowledge discovery in databases, eller dess förkortning KDD. Enligt Fayyad et al. (1996) så är omvandlingen från data till kunskap en process i vilken data mining utgör ett utav flera steg. Data miningens uppgift innebär att verktyget söker efter mönster och samband som i nästa steg skall tolkas. Genom att diskutera data mining i ett KDD perspektiv belyser man att data mining är en del av en större process KDD processen Eftersom KDD är ett viktigt och övergripande område där data mining ingår, tillägnas ett stycke för att beskriva dess process. Figuren nedan ger en beskrivning av knowledge discovery in databases (KDD) processen för att tydliggöra var data mining kommer in i bilden av kunskapsutvinnande. 4
6 Figur 1. En överblick av stegen som utgör processen Knowledge Discovery in Database (KDD) Under varje steg i KDD processen transformeras data till att komma ett steg närmare användbar och inressant kunskap. Processen är iterativ, det vill säga att vissa steg i processen ibland måste upprepas, och alla steg i processen är lika viktiga. Varje stegs resultat fungerar som ingångsdata för nästa steg. Första steget i KDD processen går ut på att förstå verksamhetsområdet och att identifiera ändamålen för projektet, detta för att det är viktigt att kunna identifiera vilka kriterier som är viktiga för att lyckas med projektet. Första steget utgörs också av att man tar tillvara på relevant kunskap som man har sedan tidigare projekt. Det andra steget innebär att man väljer den datamängd som skall bearbetas. Det är viktigt att man här funderar på om data förändras över tid eller om den förblir oföränderlig. Tredje steget innefatts av att data tvättas och förbereds för vidare bearbetning. Här fattas även beslut om hur värden som saknas skall behandlas och presenteras. Genom att filtrera data så minimeras avvikelser och störande värden. Det fjärde steget består av att data reduceras och transformeras. Reduceringen sker i första hand genom att de variabler som inte är betydelsefulla sorteras bort. Beroende på vilket mål som användaren arbetar efter bestäms hur data skall representeras. Efter steg tre och fyra är datamängden i ordning för att analyseras med data mining verktyg. Femte steget innefattas av att matcha de mål man satt upp med en passande data mining funktion. I sjätte steget görs ett val av data mining algoritm samt metod för att hitta mönster i datamaterialet. Valet är ofta kritiskt för slutresultatet. Metoden som väljs måste passa med de generella kriterierna i KDD processen. Sjunde steget är själva data mining steget och kännetecknas av att intressanta mönster sökes. Resultatet av detta steg är mönster som måste tolkas och utvärderas, och som alltså sker i steg åtta. Överflödiga mönster tas här bort och svårtolkade mönster återges på ett sätt som användaren kan tolka och förstå 5
7 utifrån sin kunskap om verksamhetsområdet. Vad som genererar ny kunskap bestäms av det som processen tagit fram och är en komplex uppgift. Det kräver att man förlitar sig på tekniken och på användarens kunskap och möjlighet att avgöra vad som är intressant nog att arbeta vidare med. Ett hjälpmedel för att lättare bedöma om resultatet är värdefull kunskap är visualiseringsverktyg som redogör för resultatet på ett mer överskådligt sätt. Avslutningsvis består sista steget av att använda sig av den kunskap som erhållits, samt integrera kunskapen i verksamheten eller dokumentera och rapportera till berörda parter, liksom jämföra med tidigare uppfattningar eller resultat. (Fayyad et al.,1996) Trots det faktum att ovan relativt utförliga beskrivning av de olika stegen i KDD processen inte berör hur själva data mining fungerar, ansåg jag det vara av vikt att ge en grundlig bakomliggande beskrivning av vilken roll data mining spelar i ett helhetsperspektiv, från det att data i stora mängder analysers för att få fram mönster, tills det att man faktiskt kan ha nytta av den nya kunskap som erhållits ur analysen. Då läsaren nu har utrustats med en klar beskrivning av de steg som krävs för användbar kunskapsutvinning, och där alltså data mining utgör en nyckelkomponent, ämnar jag nu berätta hur data mining fungerar, vilket utgör större delen av fokus för detta arbete. Men först ges en kort beskrivning av data warehouse som utgör en mycket viktig del för en effektiv data mining process. 2.5 Data warehouse För att lyckas analysera data är ett självklart krav att man faktiskt har data att analysera, vilket innebär att data skall samlas in och lagras. För att underlätta analysen krävs att data är välstrukturerad, vilket görs med hjälp av ett data warehouse, på svenska även kallat datalager. Jag kommer dock använda mig av den engelska benämningen då jag talar om data warehouse. Ett data warehouse är en förvaringsplats för data som samlats in från flera olika datakällor. För stora bolagsgrupper där till exempel småföretagen utnyttjar olika datasystem för lagring av information kan det vara väldigt svårt att samla in betydelsefull data från samtliga företag om de använder sig av olika datakällor med varierande struktur. Med hjälp av ett data warehouse kan man analysera data från olika källor och därmed få en bra sammanställning av informationen från de olika systemen inom företagen. Detta effektiviserar processen av data mining. 6
8 3 Två typer av data mining Berry & Linoff (2000) skiljer på två olika typer av data mining. Beroende på vilka avsikter användaren har med sin data kan man antingen arbeta med riktad eller oriktad data mining. Vid riktad data mining sker analysen uppifrån och ner, vilket innebär att arbetet sker utifrån ett resultat varpå analytiker försöker skapa sig förståelse för varför resultatet blev som det blev. Vid användning av riktad data mining är det orrelevant för användaren att veta hur modellen arbetar. Man är enbart ute efter bästa möjliga resultat. Denna metod används när användaren vet vad den söker efter och kallas för prediktiv, eller förutsägande modellering, eftersom användaren vet vad det är som skall förutsägas. Exempelvis används förutsägande modeller då man vill ha svar på frågor av typen vilka kunder som troligtvis kommer att säga upp sitt medlemskap de närmaste sex månaderna. Vid den andra typen av data mining, det vill säga vid oriktad data mining, sker arbetet från motsatt håll. Här använder man sig utav en nerifrån och upp strategi, där data får tala för sig själv. Oriktad data mining används för att upptäcka relationer och samband mellan data varpå det sedan är upp till användaren att avgöra om dessa mönster är relevanta eller inte. Dessa mönster kan ge användaren djupare insikt om sin data, vilket i det långa loppet kan visa sig vara väldigt produktivt för effektivisering av sin verksamhet. Exempelvis kan mönstret visa att kunder som ofta köper chips även köper läsk, och därmed finns det ingen anledning att sänka priset på läsk. Riktad data mining förklara de mönster som hittas i en oriktad data mining modell. 3.1 Prediktiv och deskriptiv data mining Beroende på vilket mål data mining uppgiften har kan data mining antingen ses som prediktiv eller deskriptiv. Det huvudsakliga målet med prediktiv data mining är att göra prognoser baserade på resultat av tidigare data. Vid deskriptiv data mining är målsättningen att beskriva generella egenskaper om existerande data. Även om det är vanligt att man använder sig av båda modellerna vid data mining är det dock något vanligare med deskriptiva modeller. (Tan et al., 2006) 4 Tekniker För att uppnå målet med data mining finns det ett flertal olika tekniker att välja mellan. Ordet teknik används här för att referera till ett konceptuellt tillvägagångssätt för att få fram information ur data. I följande avsnitt kommer jag att presentera de i litteraturen vanligast 7
9 förekommande teknikerna som används för data mining. Teknikerna är generella utgångspunkter för problemlösning där det oftast finns flera lösningar och där varje lösning representeras av olika algoritmer. Algoritmerna kan linkas vid en manual, med stegvisa instruktioner som förklarar vad som skall hända. Vardera teknik kan i sig utgöras av ett flertal olika algoritmer. Det är viktigt att användarna har en uppfattning om algoritmens inre struktur för att veta i vilka sammanhang de bör användas, hur resultatet bör tolkas samt huruvida algoritmen faktiskt fungerar eller inte. Det finns en mängd olika data mining tekniker, med en mängd olika funktioner att använda när det är dags att analysera företagets data. Valet av teknik är ett kritiskt steg för en lyckad data mining. Data mining teknikerna är anpassade för att lösa olika problem, där vissa tekniker lämpar sig bättre än andra. Utvecklingen av nya och innovativa tekniker för att analysera data ökar kraftigt i samband med ett allt större intresse för data mining. (Berry & Linoff, 2000) 4.1 Funktion kontra teknik Inom data mining betraktas funktioner som olika tillvägagångssätt som data mining verktyget använder sig utav vid analys av data. Vilken typ av funktion man väljer, det vill säga vilket tillvägagångssätt man applicerar, beror på vilket resultat användaren är ute efter. Data mining teknikerna är anpassade för att lösa olika problem, där olika tekniker har olika styrker och lämpar sig bäst enbart inom vissa områden. De olika funktionerna kan appliceras på en eller flera av de olika tekniker som finns representerade för data mining verktyget. Teknikerna utgörs av algoritmer vars uppgift är att lösa ett givet problem. En teknik kan lämpa sig för flera funktioner. Då det förekommer funktioner som har likadant namn som en del av teknikerna kan detta skapa förvirring hos läsaren. En del källor blandar dessa båda uttryck och gör inte någon skillnad mellan funktion och teknik, vilket till en början försvårade för mig att skapa mig ett helhetsperspektiv i ämnet. (Berry & Linoff., 2000) Funktioner Enligt Berry och Linoff (2000) kan teknikerna som används för data mining delas in i följande funktioner: Klassificering Uppskattning Prediktion 8
10 Associering Klustrering Visualisering Klassificering, uppskattning samt prediktion är samtliga exempel på riktad data mining, medan associering, klustrering och visualisering utgör exempel på oriktad data mining. Nedan ges en kort beskrivning av samtliga funktioner Klassificering Klassificering är den vanligaste funktionen inom data mining. Klassificering utgörs bland annat av processer som ämnar hitta regler som definierar ifall ett dataobjekt tillhör en specifik klass av data. Klassificeringens mål är att utifrån en redan definierad och klassificerad datamängd bygga en modell som kan tillämpas på oklassificerad data, för att möjliggöra en klassificering. En klassificeringsmodell kan exempelvis byggas för att hitta samband och relationer mellan olika kundegenskaper, så som ålder och kön, eller kundens köpegenskaper i form av kläder och mat. Matchningen mellan de olika egenskaperna kan exempelvis hjälpa beslutsfattare att avgöra vilka kunder som är mest troliga att köpa en viss vara. Inom data mining används klassificering ofta för att avgöra kreditbeviljande eller för att bestämma en kundprofil. Vanliga tekniker som används här är beslutsträd samt neurala nätverk Uppskattning Syftet med denna funktion är att försöka förutspå ett visst värde. Bland annat används uppskattning för att skatta en familjs totala inkomst. Givet en viss indata används uppskattning för att komma fram till ett värde för en okänd kontinuerlig variabel. I praktiken används uppskattning ofta för att genomföra en klassificeringsuppgift, liksom en klassificeringsuppgift kan omvandlas till en uppskattningsuppgift. Neurala nätverk är en teknik som lämpar sig för uppskattning Prediktion Enligt Berry och Linoff (2000) är det knappt någon skillnad mellan prediktion och en klassificerings- eller uppskattningsuppgift. De menar på att det i stort sett är samma sak bortsett från det faktum att data är klassificerade för att stämma överens med förutspådda 9
11 framtida händelser eller uppskattade värden i framtiden. Den enda skillnad mellan dessa tre funktioner är att vid användning av klassificering och uppskattning kan man inte gå tillbaka för att se om resultatet stämde. Med prediktion är data klassificerad efter framtida handlingar och uppskattningar. Det enda sättet att få reda på om resultatet stämmer eller inte är att vänta och se vad som händer. Tekniker som används för prediktion är exempelvis minnesbaserat resonemang och neurala nätverk, samt beslutsträd Associering Associering är en funktion som data mining använder för att exempelvis bestämma en kunds köpbeteende eller för att hitta mönster i transaktionsdata. Att förstå mönster som bygger på beteenden kan vara värdefullt för en verksamhet. Exempelvis kan en affärsinnehavare med hjälp av denna insikt ändra strategi för vilka varor som bör säljas nära varandra. Vid associering hittar man alltså förhållanden mellan saker som förekommer tillsammans Klustrering Klustrering är en funktion som delar databasen i grupper, där medlemmarna i de olika grupperna har liknande egenskaper. Detta ger användaren en bra förståelse för hur en datamängd är uppbyggd, vilket gör det lättare att överskåda en stor databas. Just tack vare detta används klustrering ofta som första stadium vid andra typer av data mining metoder för att underlätta arbetet. Skillnaden mellan klustrering och klassificering är att vid klustring är man inte beroende av fördefinierade klasser. K-means är en av de vanligare klusterteknikerna Visualisering Syftet med visualisering är att beskriva en invecklad databas på ett så förenklat sätt som möjligt genom att skapa en begriplig visualisering av databasen. Detta görs främst för att underlätta för användaren att förstå sig på det som producerade data. Visualisering är främst bra när man vill beskriva sitt data material Data mining tekniker I kommande avsnitt ämnar jag redovisa några av de i litteraturen vanligast förekommande teknikerna inom data mining. I beskrivningarna av samtliga tekniker återkommer de båda uttrycken riktad respektive oriktad data mining. För att underlätta för läsaren klargör jag 10
12 därför återigen skillnaderna mellan dessa båda uttryck. Vid riktad data mining är målet att förklara de relationer och mönster som hittas i en datamängd. Vid oriktad data mining är målsättningen att hitta relationer och mönster i en datamängd. Då man är ute efter att hitta grupperingar och relationer är oriktad data mining väldigt lämplig, dock så är större delen av de arbeten som görs på data mining av riktad natur. Nedan presenters så en del av dessa tekniker- beslutsträd, neurala nätverk, kluster, genetiska algoritmer, samt minnesbaserat resonemang Beslutsträd Ett beslutsträd är en teknik som genererar en modell som både är prediktiv och deskriptiv. Tekniken har fått sitt namn på grund av att modellen genererar en struktur som liknar ett träd. Beslutsträd är ett sätt att presentera en serie regler som leder till en klassificering av ett värde. Tekniken är en riktad data mining metod och används även för förutsägelser. (Berry & Linoff, 1997) Om man exempelvis vill klassificera en lånetagare som antingen en bra eller riskfylld lånetagare kan detta illustreras med hjälp av ett beslutsträd. Nedan illustreras ett exempel på ett enkelt sådant klassificeringsträd. Figur 2. Exempel på ett enkelt klassificeringsträd Ett beslutsträd utgörs av en rot, noder och lövnoder. Roten placeras i toppen och lövnoderna i botten. Roten samt noderna utgörs av frågor för att hitta en lösning till den problemställning man har från början. Varje gren på trädet består av en unik klassificeringsfråga, där varje nod utgörs av en regel. Slutligen mynnar trädet ut i ett antal lövnoder där varje lövnod är en del av datamängden med en tillhörande klass. Trädet delar upp data på varje gren utan att gå miste 11
13 om någon del av datamängden på vägen. Rotnoden tilldelas till alla exempel från datamängden. Om alla exempel tillhör samma grupp, det vill säga samma gren, så behövs inga fler beslut fattas för att dela datamängden, vilket innebär att trädet inte längre förgrenas. Om exemplen från denna nod tillhör två eller flera grenar, görs ett test vid noden som resulterar i en förgrening. Ett beslutsträd är binärt ifall varje nod delas i två delar och ickebinärt (flerfördelat) ifall varje nod förgrenas i tre eller flera delar. Då en nod inte längre kan delas, blir den en lövnod och det slutgiltiga tillståndet nås. Därmed returneras lövnoden, innehållandes specifika värden som är en del av datamängden, med en tillhörande klass. Figue 3. Illustration av binärt, respektive icke-binärt träd Vägen till varje nod eller lövnod är ömsesidigt uteslutande vilket innebär att inte mer än en gren kan väljas. Proceduren upprepas alltså för varje nod tills det att varje möjlig förgrening har gjorts och ett sluttillstånd nås i form av en lövnod. (Berry, 2006) Beslutträdens struktur gör det relativt lätt att förstå hur modellen är uppbyggd och fungerar, vilket underlättar tolkningen av resultatet. Då det dessutom finns tydliga regler för dess struktur gör detta beslutsträd till en av de mest användbara tekniker för att bygga förståeliga modeller för data mining. Eftersom ett beslutsträd representerar regler som är lätta att förstå, föredras denna modell ofta framför andra tekniker, främst då framför neurala nätverk som kommer redovisas i nästa stycke. Hur beslutsträdet växer Vid skapandet av ett beslutsträd är det viktigt att man ställer bästa möjliga fråga vid varje förgrening. Om en fråga är mindre bra eller inte har att göra med till vilken utsträckning frågan kan organisera datamängden. De algoritmer som används vid utvecklingen av ett beslutsträd tittar på en mängd utmärkande frågor som kan dela upp datamängden i led som är likartade med hänsyn till de prediktiva värdena. De olika algoritmerna kan använda diverse tekniker för val av frågor, där vissa algoritmer använder sig utav slumpen, medan andra 12
14 algoritmer använder sig av tekniken att testa alla frågor. När detta gjorts väljs sedan den bästa frågan, varpå datamängden delas i två mer ordnade led. Denna procedur upprepas sedan iterativt på samtliga frågor i de nya leden. När upphör trädets förgrening? Beslutsträd kan snabbt växa och bli oöverskådliga. Därför har algoritmen som används ofta en begränsning på hur många steg neråt trädet kan förgrena sig till. En annan metod som ofta används är att man begränsar antalet löv längst ner i trädet. Exempel på några algoritmer Det finns ett antal olika algoritmer att använda då man skall bygga ett beslutsträd. Tekniken som ligger till grund för beslutsträd härstammar från områden så som statistik och artificiell intelligens, samt en blandning av dessa båda fält. De vanligaste algoritmerna är bland annat CART och CHAID. CART-algoritmen CART som är ett acronym för Classification And Regression Trees är en algoritm som kartlägger och förutsäger data. Några av algoritmens fördelar är att bekräftelse av modellen är inbyggd i algoritmen, samt att den kan hantera saknad data. Om det i ett register saknas ett värde för ett särskilt attribut, kommer det registret inte att användas när fördelningen av trädet skall ske. CHAID-algoritmen CHAID som står för Chi square Automatic Interaction Detector, är en beslutsträdsalgoritm som påminner om CART, men skiljer sig på den punkten att den väljer förgreningarna i trädet genom att förlita sig på det så kallade chi square testet som används för att fastställa om det finns en signifikant skillnad mellan den förväntade mängden och den observerade mängden, i en eller flera kategorier. CHAID används ofta i sammanhang med direkt marknadsföring för att välja ut grupper av konsumenter och förutspå hur deras respons på någon variabel påverkar andra variabler. Trots att beslutsträd och dess algoritmer kan vara väldigt komplicerade, kan resultatet presenteras på ett lättförståeligt och tydligt sätt som är användbart för slutanvändaren. Därför används beslutsträd vid en stor variation av affärsproblem, exempelvis för utforskning och förutsägelser, exempelvis om vilka kunder som är i risk att lämna företaget. 13
15 Neurala nätverk Ett neuralt nätverk är en teknik som letar efter mönster i en del av en datamängd, för att sedan skapa en modell som kan tillämpas på hela datamängden. Neurala nätverk är en riktad data mining teknik och betraktas som den mest avancerade algoritmen inom data mining. Nätverket är enbart prediktiv, vilket gör att de val som algoritmen väljer är svåra att begripa sig på. Det neurala nätverket är en matematisk funktion som genererar ett utdata, baserat på en mängd av indata. Neurala nätverk är bra att använda vid klassifikationer och förutsägelser. För att möjliggöra en förutsägelse måste man dela in värdena i olika grupper och därefter förutspå till vilken grupp ett okänt värde skall grupperas. För att kunna placera in okända värden i grupper måste det neurala nätverket först ha använt sig av en samling historisk data som testdata för att på så vis lära sig känna igen situationer och därefter placera in de nya värdena i grupper. Neurala nätverk som används för att hitta okända mönster, lär sig alltså av tidigare erfarenheter genom att algoritmen söker efter mönster i en del av en datamängd, varpå en modell byggs, som sedan kan användas på hela datamängden. Hur ser ett neuralt nätverk ut? Det neurala nätverket utgörs av noder, samt förbindelser som sammankopplar de olika noderna. Exempelvis kan nätverket ta emot indata från vänster och utföra beräkningar på dessa för att sedan skapa nya värden i noden till höger. Det nya värdet i form av utdata representerar förutsägelsen från modellen. Var och en av förbindelse i nätverket tilldelas ofta ett viktat värde. Det som följaktligen sker är att varje värde för en nods indata multipliceras med respektive förbindelses viktade värde, varpå dessa indatanoder tillsammans bildar värdet på noden för utdata. Då man vill förändra ett neuralt nätverks beteende, det vill säga det resultat man får, ändrar man i första hand hur förbindelserna är organiserade samt värdet på vikten hos förbindelsen. Steget mellan noderna för in- och utdata utgörs ofta av ett så kallat gömt lager med gömda noder, som inte är synliga för användaren, och därmed också försvårar för användaren att förstå hur denna redan komplexa process går till, vilket kan göra det svårt att tolka resultaten och ge en förklaring till varför det blir som det blir, vilket därmed också kan göra det svårt att motivera ett beslut. Det kan exempelvis bli svårt att motivera avslag på ett banklån, genom att endast säga att ens neurala nätverk kom fram till detta. Dock är en styrka med neurala nätverk att det har en förmåga att skapa korrekta förutsägelser på komplexa problem. 14
16 Viktiga punkter att tänka på vid skapandet av ett effektivt neuralt nätverk För att få ett så bra neuralt nätverk som möjligt är det viktigt att tänka på hur noderna i nätverket skall kopplas samman eller när träningen av modellen skall upphöra för att undvika så kallad överanpassning, vilket innebär att nätverket övertränas och därmed ger skeva resultat. För att tackla detta problem kan man periodvis testa resultatet på träningsdata. Första stadiet för ett neuralt nätverk är att skapa en modell för testdata. Målsättningen med neurala nätverk är som tidigare nämnts att dem skall tränas på en liten del av en datamängd, och därmed lära sig känna igen önskvärda mönster, för att sedan applicera denna lärdom på en större datamängd. Det resultat man får av ett neuralt nätverk är en avspegling av den testdata man använde sig av. Därför är det väldigt viktigt att man väljer rätt data. Testdatan utgörs av tidigare kända klassificeringar och observationer. Det är viktigt att den testdata man väljer och som alltså bygger på historisk data, omfattar alla kännetecken som nätverket utgörs av. För att täcka alla relationer mellan posterna krävs fler testomgångar ju större antal kännetecken nätverket utgörs av. Som vid all data mining är ett viktigt steg innan användandet av data att bearbetning av datamängden sker, enligt den princip som tidigare beskrivits i stycket under KDD processen. För att kunna tolka resultatet från det neurala nätverket är det viktigt att man förstår vad data i datamängden står för, samt att man har en tydlig bild av de företagsproblem man vill lösa. Neurala nätverk kan användas vid mycket stora och komplicerade modeller, men till ett pris av att dem inte alltid är så lätta att använda och förstå sig på. Neurala nätverk har en hel del användningsområden, däribland upptäckter av kortbedrägerier. Ett system som är uppbyggt av neurala nätverk skall kunna förutsäga troliga resultat av ett visst händelseförlopp genom att nätverket lär sig utkomsten av tidigare resultat som bygger på samma händelse. Nätverket lär sig alltså känna igen mönster från de tidigare händelserna. Exempelvis kan man med hjälp av ett neuralt nätverk upptäcka när ett kreditkort används som väldigt mycket avviker från tidigare köpbeteenden, samt kanske tid och plats, vilket kan vara ett tecken på kreditkortsbedrägeri. Bilden på nästa sida beskriver neurala nätverk som är uppbyggda på olika sätt. Indata kommer från ena hållet som sedan bearbetas och transformeras, och slutligen presenteras som utdata. 15
17 Figur 4. Exempel på ett förenklat neuralt nätverks olika uppbyggnad Kluster En omfattande databas kan utgöras av ett flertal variabler, vilket kan göra det svårt för en teknik att hitta betydelsefulla samband och relationer bland datamängden. Ett problem som kan uppstå när man minar sin data är att verktyget hittar alldeles för många mönster, vilket till slut inte bidrar med någon relevant information om datamängden. Det är här klustertekniken kommer in i bilden. Genom att tillämpa denna teknik, som är en av få oriktade data mining 16
18 tekniker, kan man undgå detta problem. Målet med klustertekniken är att bygga en modell där tidigare okänd data som liknar varandra klustras ihop, det vill säga grupperas samman i en och samma grupp. Genom att dela in data i olika grupper får man en bättre föreställning om hur datamängden ser ut. Att dela in tvätt i exempelvis ljus- respektive mörk tvätt är ett enkelt exempel på hur klustrering kan gå till. Klustrering används ofta som förberedelse till någon annan typ av data mining modell. Klustrering ger oftats en bra helhetssyn på vad som händer i databasen och försöker alltså hitta mönster i data som förut var okända. Klustrering gör det även lättare att se när ett visst data avviker från resterande datamängd. Användningsområden där man tillämpar klustertekniken är bland annat inom markandssegmentering, där kunder som har liknande köpbeteende placeras i samma kluster. På så vis kan användaren skapa sig en bild över exempelvis vilken sorts reklam som passar bäst till vilket kluster. K-means Det finns ett flertal algoritmer som används vid användning av klusterteknik. K-means är den vanligaste av dessa algoritmer och utgörs av flera steg, vilket slutligen leder till att undergrupperingar skapas av de variabler som liknar varandra. Steg ett i K-means algortitmen går ut på att välja K datavärden som utgångspunkter, vilka gradvis kommer att byggas ut till kluster. En efter en placeras samtliga datavärden in i den grupp vars medelvärde ligger närmast datavärdet. Efter det att alla datavärden delats in i kluster räknas medelvärdespunkten ut för de nya grupperna. När man hittat dessa nya centrumpunkter börjar proceduren om från början med att placera varje datavärde i skilda grupper tills det att de inte längre förändras. (Tan,et al., 2006) Följden av denna typ av teknik är att datavärden som har liknande egenskaper ingår i samma kluster, vilket i sin tur vidare kan underlätta för resterande data mining process Genetiska algoritmer Genetiska algoritmer försöker efterlikna biologiska processer och kan ses som en artificiell variant av evolution. Tekniken är en riktad data mining metod och använder sig utav strängar och datorprogram som förändras över tid, för att finna optimala förutsägelser på ett problem. Ett krav för genetiska algoritmer är att modellen som används måste vara känd sedan tidigare. Genetiska algoritmer utvecklar gradvisa generationsgener som med tiden blir alltmer lämpade. De genetiska algoritmerna använder sig bland annat utav selektion och mutation för att få fram generationer som är mest förutsägbara. Efter hand att nya generationer har vuxit fram, kommer endast den generation som är mest förutsägbar att överleva. Målet med den 17
19 genetiska algoritmen är att maximera nyttan av generna i populationen. Algoritmen består av steg där den först identifierar gener och hur pass lämpliga generna är med hänsyn till överlevnad och reproduktion. Därefter genereras en inledande generation av gener. Efter detta steg är det dags för den första generationen att justeras genom att använda sig av selektion, crossover eller mutation. Den här justeringen av gener skall upprepas så länge lämpligheten av generationen inte längre kan ändras till det bättre. Genetiska algoritmer används till skillnad från de andra teknikerna inte för att hitta mönster, utan är snarare en optimeringsteknik som kan användas inom många områden och komma fram till lösningar på problem, som oftast är överlägsna andra tekniker. Det genetiska materialet utgörs av siffror som avgör hur man ska komma till rätta med ett specifikt problem. I det fall då en viss gen orsakar en sämre lösning till ett specifikt problem, minskar det styrkan av anpassning vilket bidrar till att den gen som bidrog till detta sorteras bort från datamängden Minnesbaserat resonemang/ K-nearest neighbour Vi människor fattar oftast beslut grundade på tidigare erfarenheter då vi står inför en ny situation. Minnesbaserat resonemang fungerar på ett liknande sätt och är en riktad data mining teknik som också baseras på erfarenheter. Det hela går ut på att då man stöter på en ny situation, använder man sig utav information som man identifierar med tidigare liknande fall. Då metoden utgår från en databas med tidigare kända fall, kan minnesbaserat resonemang hitta det tidigare fall som är mest likt det nya fallet och agera efter tidigare erfarenheter. Den gör detta på det vis att den använder sig av så kallade grannar för att klassificera eller förutspå det nya fallet. Om man liknar fallen med punkter i en flerdimensionell datarymd så är idén med grannar att fall som är på kort avstånd från varandra, liknar varandra, och är därmed grannar. Uttrycket k- nearest neighbour kommer lite av att vi gör som grannarna gör. Grundtanken är att enheter, exempelvis kunder, kommer att agera på ett liknande sätt om de är av samma typ, vilket alltså innebär att de är placerade på nära avstånd i datarymden. En fördel med minnesbaserat resonemang är att det inte är beroende av att data måste vara i ett visst format, vilket oftast är kravet för andra data mining tekniker. Det väsentliga för minnesbaserat resonemang är endast den så kallade distans- och kombinationsfunktionen. Det som distansfunktionen gör är att den fördelar en distans mellan fallen medan kombinationsfunktionen kombinerar resultatet av grannarna för att på så vis komma fram till ett förenat resultat. För att göra det möjligt att överhuvudtaget klassificera okända kategorier, är det viktigt att man har en databas som innehåller historiska fall som redan har 18
20 delats in i kategorier. Det minnesbaserade resonemanget söker bland de historiska fallen efter någon händelse som påminner om den nya nuvarande situationen. När så ett historiskt fall som påminner om den nya situationen har hittats, kommer det nya fallet att klassificeras efter samma kategori som det historiska fallet tillhör. För att göra det möjligt att hitta den motsvarande kategorin måste två steg genomföras. Det första steget innebär att tekniken letar efter historiska värden i databasen, och det andra steget beskriver på vilket sätt tekniken skall kunna förstå sig på okända situationer. Vid användning av minnesbaserat resonemang är det tre saker som måste göras. Till en början måste man välja rätt mängd med historiska fall som kommer utgöra själva testdatan. Här bör alla tillgängliga fall tas med i beaktande och modellen bör innehålla lika många fall från varje kategori. En annan viktig detalj är att bestämma på vilket sätt man vill presentera de historiska fallen. Den sista punkten är att avgränsa distans- och kombineringsfunktionen, liksom mängden grannar som ett fall skall ha. Minnesbaserat resonemang fungerar bra vid bland annat förutsägelser för huruvida en kund svarar på en marknadsföringskampanj eller inte. Det är viktigt att man förstår sig på de huvudsakliga karaktärsdragen av de algoritmer som används av data mining verktyget, för att kunna besluta ifall algoritmerna matchar karaktären av det problem man vill lösa. 5 Utmaningar med data mining För att lyckas med en effektiv och givande data mining i sin verksamhet är det viktigt att den data som skall bearbetas har behandlats på rätt sätt. I de fall då det i analysen saknas stora mängder data eller det i databasen finns felaktig data, liksom ifall det uppstår problem vid insamling eller lagring av data, skapas moment som försvårar effektiviteten av data mining. Det är även viktigt att problem är välformulerade. För att organisationen i slutändan ska ha någon verklig nytta av det som kommer fram under analysen är det viktigt att användaren kan tolka och förstå resultatet som utvinns. En svårighet med data mining är att ta fram modeller som är tillräckligt generella. De automatiserade processerna vet inte ifall ett mönster man har fått fram är generellt eller ifall det enbart är giltigt för den givna datamängden. Vad som är desto svårare är att hitta modeller som även kan gälla för data som förändras med tiden. Ytterligare en utmaning med data mining kan vara presentationen och tolkningen av resultatet man har fått fram under data mining processen. 19
21 6 Diskussion Data mining erbjuder bra möjligheter att hjälpa verksamheter hitta okända mönster i sin data, vilket i sin tur kan leda användaren till att förutspå kunders beteenden, liksom hur produkter bör marknadsföras. Detta kan öka effektiviteten inom ett företag. Dock så är det viktigt att data mining verktyg tillhandahålls av användare som inte enbart förstår sig på problemområdet, utan även förstår sig på hur verksamheten fungerar, vilken typ av data man jobbar med samt karaktärsdragen av analysverktygen som används. Realistiska förväntningar kan ge givande resultat över flera områden, alltifrån förbättrade intäkter, till minskade kostnader. Traditionellt sett har majoriteten av företag som har använt sig av data mining varit företag som vill förbättra sin kundrelation, marknadsföring eller för att upptäcka bedrägerier. Att bygga modeller som letar efter okända mönster är endast ett steg i kunskapsutvinnandet. Det är av yttersta vikt att man samlar in ordentlig data och förbereder denna för analys, samt att man stämmer av modellerna mot hur den verkliga världen verkligen ser ut. Den bästa modellen uppkommer oftast efter att man har byggt flera olika typer av modeller, eller genom att man prövar olika tekniker och algoritmer, för att komma fram till vilken modell som bäst passar det problemområde man handskas med. Utveckling av data mining tekniker pågår hela tiden och fler användningsområden upptäcks. Arbetet med det här projektet har varit väldigt givande. Jag gick in med en begränsad kunskap om vad data mining egentligen innebar, men när jag väl började gräva i området, fann jag mer och mer information om ämnet och insåg då att data mining redan är ett större område, som appliceras på fler områden, än vad jag hade trott. En intressant aspekt av data mining som jag dock inte berör i detta fördjupningsarbete är hur den personliga integriteten ska skyddas när alltfler företag använder sig av data mining utan kundernas vetskap. I litteraturen presenteras det inte mycket kring denna fråga trots att den personliga integriteten med hänsyn till ett utvecklat datorsamhälle, allt oftare är ett debatterat ämne. Utifrån den litteratur jag tagit del av i ämnet, skapar jag mig uppfattningen att data mining är bra och enkelt att använda, och visst finns det potential för data mining inom områden som kan ge verksamheter konkurrensfördelar. Dock är det viktigt att man har respekt för och förstår den komplicerade teknik som står till grund för det komplicerade data mining arbetet. Att skaffa data från ett flertal databaser beskrivs enbart med någon enstaka mening i litteraturen, men verkligheten är långt ifrån så enkel. Om data som skall analyseras inte är strukturerad i ett data warehouse, är det en väldigt lång process som först måste avklaras och struktureras upp innan det riktiga data mining arbetet kan börja. 20
22 Referenser Böcker Berry, M.J.A. & Linoff, G. (1997), Data mining Techniques: For Marketing, Sales and Customer Support, New York, John Wiley & Sons, Inc. Berry, M.J.A. & Linoff, G. (2000), Mastering Data mining, New York, John Wiley & Sons, Inc. Berry, M.W. (2006), Lecture Notes in Data Mining, Hackensack, NJ, World Scientific Bertino, E, et al., (2001,) Intelligent database system, Addison-Wesley/Longman Tan, P-N, et al., (2006), Introduction to data mining, Pearson Addison Wesley Artiklar Fayyad, et al., (1996), Data mining and Knowledge Discovery: Making Sense Out of Data, American Association for Artificial Intelligence Elektroniska källor Introduction to Data mining and Knowledge Discovery, third edition, Two Crows Corporation Hämtad den 25 sep 2010 Marcel Holshemier and Arno Siebes (1994) Hämtad den 25 sep
ESSÄ. Min syn på kompetensutveckling i Pu-process. Datum: 2006-04-26. Produktutveckling med formgivning, KN3060
ESSÄ Min syn på kompetensutveckling i Pu-process Datum: 2006-04-26 Produktutveckling med formgivning, KN3060 Utfört av: Kim Hong Tran Handledare: Rolf Lövgren Ragnar Tengstrand INLEDNING INLEDNING ESSÄNS
Det första steget blir att titta i Svensk MeSH för att se om vi kan hitta några bra engelska termer att ha med oss på sökresan.
Sökexempel - Hälsovägledare Hälsovägledning med inriktning mot olika folkhälsoproblem som t ex rökning, tips på hur man går tillväga för att göra en datasökning och hur man även kontrollerar om artiklarna
PREDIKTIVA MODELLER I EN FÖRÄNDERLIG VÄRLD
Går det att göra en framtidsprognos när marknaden förändras i rekordfart? PREDIKTIVA MODELLER I EN FÖRÄNDERLIG VÄRLD Datan du inte visste att du behövde är den som avgör huruvida du överlever på morgondagens
Historia Årskurs 9 Vårterminen 2014
Historia Årskurs 9 Vårterminen 2014 1 Inledning Utgångspunkten för de nationella proven i historia är kursplanen i historia. Denna har det övergripande målet att utveckla elevers historiemedvetande genom
Penningpolitiken och Riksbankens kommunikation
ANFÖRANDE DATUM: 2007-10-08 TALARE: PLATS: Förste vice riksbankschef Irma Rosenberg Swedbank, Stockholm SVERIGES RIKSBANK SE-103 37 Stockholm (Brunkebergstorg 11) Tel +46 8 787 00 00 Fax +46 8 21 05 31
Hur mäts kunskap bäst? examinationen som inlärningsmoment
Miniprojekt, pedagogisk grundkurs I, vt 2001. Klemens Eriksson, Evolutionsbiologiska institutionen Hur mäts kunskap bäst? examinationen som inlärningsmoment Jag hävdar att kunskapskontrollen är en del
En nybörjarkurs i kritiskt tänkande
En nybörjarkurs i kritiskt tänkande Jesper Jerkert Andreas Anundi & CJ Åkerberg: Skeptikerskolan. Handbok i kritiskt tänkande. Stockholm: Forum, 2010, 226 s. ISBN 978-91-37-13588-5. Andreas Anundi och
Så gör du din kund nöjd och lojal - och får högre lönsamhet. Tobias Thalbäck Om mätbara effekter av kundnöjdhet
Så gör du din kund nöjd och lojal - och får högre lönsamhet Tobias Thalbäck Om mätbara effekter av kundnöjdhet Hög kundnöjdhet ger högre avkastning Företag med hög kundnöjdhet genererar högre avkastning
Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU
Statistikens grunder (an, 7,5 hsp) Tatjana Nahtman Statistiska institutionen, SU KURSENS INNEHÅLL Statistiken ger en empirisk grund för ekonomin. I denna kurs betonas statistikens idémässiga bakgrund och
Viktigt att tänka på i en intervju och de vanligaste fallgroparna. som intervjuar. Ett kostnadsfritt whitepaper utgivet av Level Recruitment
Viktigt att tänka på i en intervju och de vanligaste fallgroparna för dig som intervjuar Ett kostnadsfritt whitepaper utgivet av Level Recruitment Level Recruitment AB - 2015 Viktigt att tänka på i en
Svenskt Näringsliv/Privatvården. Patienternas syn på vårdcentraler i privat och offentlig drift
Svenskt Näringsliv/Privatvården Patienternas syn på vårdcentraler i privat och offentlig drift SAMMANFATTNING Denna rapport redovisar resultatet från en undersökning som jämför privat och offentligt drivna
Ämnesprovet i matematik i årskurs 9, 2014 Margareta Enoksson PRIM-gruppen
Ämnesprovet i matematik i årskurs 9, 2014 Margareta Enoksson PRIM-gruppen Inledning Konstruktionen av de nationella ämnesproven utgår från syftet med dessa, d.v.s. att stödja en likvärdig och rättvis bedömning
Barnkonventionens påverkan på Linköpings förskolor
Metoduppgift 4 Metod-PM Barnkonventionens påverkan på Linköpings förskolor en normativ studie Bakgrund Sverige har sedan 1990-talet skrivit under och ratificerat Förenta Nationernas konvention om barns
Grafisk visualisering av en spårbarhetslösning
Datavetenskap Opponenter Johan Kärnell och Linnea Hjalmarsson Respondenter Agni Rizk och Tobias Eriksson Grafisk visualisering av en spårbarhetslösning Oppositionsrapport, C-nivå Report 2011:06 1. Generell
Sammanställning av uppgifter från lärarenkät vid kursprov i svenska 1 och svenska som andraspråk 1, VT 2014
Sammanställning av uppgifter från lärarenkät vid kursprov i svenska 1 och svenska som andraspråk 1, VT 2014 I anslutning till vårterminens kursprov i svenska 1 och svenska som andraspråk 1 har en lärarenkät
Handisam. Beräkningsunderlag för undersökningspanel
Beräkningsunderlag för undersökningspanel Kund Mottagare Ann Dahlberg Författare Johan Bring Granskare Gösta Forsman STATISTICON AB Östra Ågatan 31 753 22 UPPSALA Wallingatan 38 111 24 STOCKHOLM vxl: 08-402
Recept för rörelse. TEXT Johan Pihlblad. Lena Kallings är medicine doktor och landets främsta expert på fysisk aktivitet på recept.
Recept för rörelse Minst hälften av svenska folket rör sig för lite. Forskare varnar för negativa hälsoeffekter och skenande sjukvårdskostnader i en snar framtid. Frågan är vad som går att göra. Fysisk
Utvärdering med fokusgrupper
Hämtat från www.kunskapsabonnemanget.se Utvärdering med fokusgrupper Monica Hane Med metod menar vi hur det empiriska materialet insamlas och bearbetas för att på bästa sätt belysa det som studien skall
SLALOMINGÅNGAR hur svårt kan det vara?
SLALOMINGÅNGAR hur svårt kan det vara? Av Marie Hansson Ju mer man börjar tänka på vad en slalomingång innebär, desto mer komplicerat blir det! Det är inte lite vi begär att hundarna ska lära sig och hålla
SVAR 1 (7) Postadress Besöksadress Telefon Bankgiro Inläsningscentralen, 839 88 Östersund
SVAR 1 (7) Socialdepartementet 103 33 Stockholm Försäkringskassans svar på ISF:s rapport (2012:3) Handläggning av bostadstillägg Inledning Inspektionen för socialförsäkringen (ISF) har granskat Pensionsmyndighetens
Utvecklingen av löneskillnader mellan statsanställda kvinnor och män åren 2000 2014
Utvecklingen av löneskillnader mellan statsanställda kvinnor och män åren 2000 2014 Rapportserie 2015:3 Arbetsgivarverket Utvecklingen av löneskillnader mellan statsanställda kvinnor och män åren 2000
2010-09-13 Resultatnivåns beroende av ålder och kön analys av svensk veteranfriidrott med fokus på löpgrenar
1 2010-09-13 Resultatnivåns beroende av ålder och kön analys av svensk veteranfriidrott med fokus på löpgrenar av Sven Gärderud, Carl-Erik Särndal och Ivar Söderlind Sammanfattning I denna rapport använder
LUFFARSCHACKETS GRUNDER
LUFFARSCHACKETS GRUNDER Många har frågat mig: Kan man träna luffarschack? Jodå, svarar jag. Det går alldeles utmärkt och det ger bevisligen resultat. Men lika väl som man inte blir fotbollsproffs efter
En hjälp på vägen. Uppföljning av projektledarutbildning kring socialt företagande - projekt Dubbelt så bra. Elin Törner. Slutversion 2013-12-20
En hjälp på vägen Uppföljning av projektledarutbildning kring socialt företagande - projekt Dubbelt så bra Slutversion 2013-12-20 Elin Törner 1 1. Inledning I denna PM redovisas en uppföljning av projektledarutbildningen
Karlsängskolan - Filminstitutet
Projektrapport Karlsängskolan - Filminstitutet 1. Om Skolan Karlsängskolan är en högstadieskola i Nora kommun som ligger 3,5 mil norr om Örebro och i Örebro län men tillhör landskapet Västmanland. Skolan
Att välja sin framtid entreprenörskap
Ämne: Teknik Strävansmål - utvecklar kunskaper om rättigheter och skyldigheter i ett demokratiskt samhälle, - utvecklar sin förmåga att argumentera och uttrycka ståndpunkter samt en tilltro till den egna
BARNS SPRÅKUTVECKLING
BARNS SPRÅKUTVECKLING BARNS SPRÅKUTVECKLING Hur lär sig barn sitt språk? Vad skiljer barns språkutveckling från vuxnas språkinlärning? Hur kan vi forska om barns språkutveckling? Vad säger språkutvecklingen
Är sjukvården jämställd och går det åt rätt håll?
Inledning Som titeln antyder är syftet med den här undersökningen att ta reda på om svensk hälso- och sjukvård är jämställd. Det är en fråga som kan analyseras utifrån olika perspektiv, vilka i huvudsak
Statens skolverks författningssamling
Statens skolverks författningssamling ISSN 1102-1950 Förordning om ämnesplaner för de gymnasiegemensamma ämnena; Utkom från trycket den 1 mars 2011 utfärdad den 2 december 2010. Regeringen föreskriver
Följa upp, utvärdera och förbättra
Kapitel 3 Följa upp, utvärdera och förbättra Det tredje steget i tillsynsprocessen är att följa upp och utvärdera tillsynsverksamheten och det fjärde steget är förbättringar. I detta kapitel beskrivs båda
Komma igång med Eventor
Guide Eventor Komma igång med Eventor Version 2.0, 2013-10-07 Starta med startsidan På Eventors startsida finns en kortare guide över hur du skaffar användarkonto och hur du loggar in. Börja med den för
Samverkan kring ämnen på ett högskoleförberedande program ett exempel
Utvecklingspaket 2012-06-14 Samverkan kring ämnen på ett högskoleförberedande program ett exempel Läroplanen för gymnasieskolan lyfter fram vikten av att eleverna ska kunna välja studie- och yrkesinriktning
Välkommen till BESTA-vägen ett metodstöd för analys av löneskillnader mellan kvinnor och män
Välkommen till BESTA-vägen ett metodstöd för analys av löneskillnader mellan kvinnor och män Det här handlar om en metod som kan användas i lönebildningsarbetet på myndigheten. Fokus för metoden BESTA-vägen
Att använda bildhanteringsprogram, del 2
Att använda bildhanteringsprogram, del 2 Gå till Adobe Online (M) Markeringsram - (L) Lasso - (C) Beskärning - (J) Airbrush - (S) Klonstämpel - (E) Suddgummi - (R) Oskärpa - (A) Markering av bankomponenter
1. Hur många timmar per vecka har du i genomsnitt lagt ner på kursen (inklusive schemalagd tid)?
Husdjursavel HV0081, 10057.1516 15 Hp Studietakt = 65% Nivå och djup = Grund Kursledare = Anna Maria Johansson Värderingsresultat Värderingsperiod: 2016-01-14-2016-01-31 Antal svar 20 Studentantal 35 Svarsfrekvens
Inventering av registrerade föreningar. Fritidsförvaltning
Inventering av registrerade föreningar Fritidsförvaltning Upprättad Datum: Version: Ansvarig: Förvaltning: Enhet: 211-4-5 1.3 Thomas Sterner (Gustaf Johansson/David Nilsson) Fritidsförvaltningen Föreningsavdelningen
Elektronisk patientjournal
Elektronisk patientjournal Hippokrates Typer Tidsorienterad, problemorienterad samt källorienterad Varför? Stödja vården, legala skäl, forskning, utbildning. Data måste vara otvetydiga, strukturerade,
Individuellt fördjupningsarbete
Individuellt fördjupningsarbete Ett individuellt fördjupningsarbete kommer pågå under hela andra delen av kursen, v. 14-23. Fördjupningsarbetet kommer genomföras i form av en mindre studie som presenteras
Taltaggning. Rapport av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003
Taltaggning av Daniel Hasselrot 781105-0157, d98-dha@nada.kth.se 13 oktober 2003 Sammanfattning Denna rapport är skriven i kursen Språkteknologi och behandlar taggning av årtal i en text. Metoden som används
På jakt med geocaching
På jakt med geocaching Text: Lena Lithén & Kamilla Aspgren-Kvarnström (Publicerad i Förskoletidningen, 2014) På förskolan Uppfinnaren i Gävle geocachar barnen tillsammans med trollet Trulle. Detta efter
Antagning till högre utbildning höstterminen 2016
Avdelningen för analys, främjande och tillträdesfrågor Föredragande Torbjörn Lindquist Utredare 010-4700390 torbjorn.lindquist@uhr.se RAPPORT Datum 2016-04-22 Diarienummer Dnr 1.1.1-382-16 Postadress Box
Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01
Rapport från Praktik på SVOX AG 2008 05 14 till 2008 09 01 Om SVOX AG Jag gjorde min praktik på företaget SVOX AG, ett företag som bygger och sysslar med TTSmotorer. Företaget bildades våren 2000 och har
Betyg E (med tvekan) : (= Eleven beskriver mest med egna ord hur man upplevt träningen)
Betyg E (med tvekan) : (= Eleven beskriver mest med egna ord hur man upplevt träningen) Utverdering det har gott bra med träningen. jag tycker att det var kul att träna och så var det skönt att träna.
POLICYSAMMANFATTNING FRÅN ENTREPRENÖRSKAPSFORUM VARFÖR SILOTÄNKANDE KAN VARA BRA FÖR INNOVATION
POLICYSAMMANFATTNING FRÅN ENTREPRENÖRSKAPSFORUM VARFÖR SILOTÄNKANDE KAN VARA BRA FÖR INNOVATION PS från Entreprenörskapsforum En viktig uppgift för Entreprenörskapsforum är att finna nya vägar att nå ut
6-stegsguide för hur du tänker positivt och förblir positiv.
6-stegsguide för hur du tänker positivt och förblir positiv Låt oss säga att du vill tänka en positiv tanke, till exempel Jag klarar det här galant. och du vill förbli positiv och fortsätta tänka den här
Så väljer svenska studenter utbildning och så påverkas studenter i hela Norden av den ekonomiska krisen
Så väljer svenska studenter utbildning och så påverkas studenter i hela Norden av den ekonomiska krisen En undersökning av Studentum om val till högskola och Kvalificerad Yrkesutbildning Studentum AB Torstenssonsgatan
Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar
Vetenskaplig teori och metod II Att hitta vetenskapliga artiklar Sjuksköterskeprogrammet T3 Maj 2015 Camilla Persson camilla.persson@umu.se Idag tittar vi på: Repetition av sökprocessen: förberedelser
Nyföretagarcentrum 5, 2, 3, 30, 4, 5, 5, 1, 1, 10, 10, 1, 6, 4, 1, 7, 6 20, 15, 10, 20, 3, 30, 4, 6, 20, 20, 3, 15, 10, 3, 1, 1, 2, 2, 3, 30, 10,
Bilaga 4 Sida 1(11) KL 1900 Inger Åckander, 630222 SAMMANSTÄLLNING AV FRÅGORNA AV TOTALT 37 INTERVJUER FÄRGADE SIFFROR FRÅN STORSTADSLÄN - 24 FRÅN STORSTADSLÄN OCH 13 FRÅN ÖVRIGA LÄN Frågor Ja Nej Hur
SSM tänkte fel: Tio gånger för hög effekt för 90 procent av Sveriges radioamatörer
SSM tänkte fel: Tio gånger för hög effekt för 90 procent av Sveriges radioamatörer Posted by Erik SM7DZV on 6 februari, 2016 in Nyheter Amatörradioantenn TH11DX. Långt till närmaste granne FOTO Erik SM7DZV
Västernorrlands län. Företagsamheten 2016. Maria Eriksson, Stöde Bud & Taxi Vinnare i tävlingen Västernorrlands mest företagsamma människa 2015
MARS 2016 Företagsamheten 2016 Maria Eriksson, Stöde Bud & Taxi Vinnare i tävlingen s mest företagsamma människa 2015 Foto: Anders Lövgren. s län Innehåll Inledning... 2 Så genomförs undersökningen...
Del ur Läroplanen för specialskolan 2011: kursplan i teckenspråk för döva och hörselskadade
Del ur Läroplanen för specialskolan 2011: kursplan i teckenspråk för döva och hörselskadade 3.5 TECKENSPRÅK FÖR DÖVA OCH HÖRSELSKADADE Språk är människans främsta redskap för att tänka, kommunicera och
Stressade studenter och extraarbete
Stressade studenter och extraarbete En kvantitativ studie om sambandet mellan studenters stress och dess orsaker Karolina Halldin Helena Kalén Frida Loos Johanna Månsson Institutionen för beteendevetenskap
Barn- och ungdomspsykiatri
[Skriv text] NATIONELL PATIENTENKÄT Barn- och ungdomspsykiatri UNDERSÖKNING HÖSTEN 2011 [Skriv text] 1 Förord Patienters erfarenheter av och synpunkter på hälso- och sjukvården är en viktig grund i vårdens
Slutrapport för Pacman
Slutrapport för Pacman Datum: 2011-05-30 Författare: cb222bj Christoffer Bengtsson 1 Abstrakt Jag har under våren arbetat med ett projekt i kursen Individuellt Mjukvaruutvecklingsprojekt. Målet med mitt
Historia Årskurs 9 Vårterminen 2015
Historia Årskurs 9 Vårterminen 2015 1 Inledning Utgångspunkten för de nationella proven i historia är kursplanen i historia. Denna har det övergripande målet att utveckla elevers historiemedvetande genom
Styrdokumentkompendium
Styrdokumentkompendium Information och kommunikation 2 Sammanställt av Joni Stam Inledning Jag brukar säga till mina elever, halvt på skämt och halvt på allvar, att jag förhåller mig till kursens centrala
Grupparbete om PBL Problembaserat Lärande
TÄRNA FOLKHÖGSKOLA Grupparbete om PBL Problembaserat Lärande 2009-09-18 - 2 - Innehåll Bakgrund... - 3 - Syfte... - 4 - Metod... - 4 - Fakta... - 5 - Resultat... - 7 - Diskussion... - 9 - Referenser...-
Uppgift 24A - Reflektion över boken "Vem snodde osten?"
Uppgift 24A - Reflektion över boken "Vem snodde osten?" Här har vi plockat ut sex citat som vi tycker är extra viktiga. Om du inte förändras riskerar du att utplånas Att bara stå och stampa på ett och
Företagande mot sporten
Företagande mot sporten Att driva företag och samtidigt fokusera på hoppsporten Fredrik Spetz 2015-01-06 Innehåll Inledning och syfte... 3 Metod... 4 Insamlad data från intervjuer... 5 Analys... 7 Slutsats...
Hitta kunder som frilansare
Hitta kunder som frilansare Hitta kunder som frilansare 4 Att livnära sig som frilansare, genom att ta långa- eller kortsiktiga uppdrag, är en allt vanligare arbetsform. På Billogram träffar vi många frilansare,
Föreläsning 11. Giriga algoritmer
Föreläsning 11 Giriga algoritmer Föreläsning 11 Giriga algoritmer Användning Växelproblemet Kappsäcksproblemet Schemaläggning Färgläggning Handelsresandeproblemet Uppgifter Giriga algoritmer (Greedy algorithms)
Invandrarföretagare i Sverige och Europa. Farbod Rezania, Ahmet Önal Oktober 2009
Invandrarföretagare i Sverige och Europa Farbod Rezania, Ahmet Önal Oktober 2009 Sammanfattning 1 Sammanfattning I denna rapport har möjligheter och hinder för företagandet i Sverige jämförts med motsvarande
0HG HXURSHLVNW GLJLWDOW LQQHKnOO EHKnOOHUYLOHGQLQJHQ
63((&+ (UNNL/LLNDQHQ Ledamot av Europeiska kommissionen med ansvar för näringspolitik och informationssamhället 0HG HXURSHLVNW GLJLWDOW LQQHKnOO EHKnOOHUYLOHGQLQJHQ Norden digitalt konferens +HOVLQJIRUVGHQRNWREHU
1. Bekräftelsebehov eller självacceptans
1. Bekräftelsebehov eller självacceptans Jag behöver kärlek och bekräftelse från människor som känns viktiga för mig och jag måste till varje pris undvika avvisande eller nedvärdering från andra. Jag gillar
Skrivprocessen. Varför skriva för att lära? Min kunskapssyn
Skrivprocessen Skrivprocessens viktigaste grundtanke att sätta eleven och hans/hennes förutsättningar i centrum. Skrivprocessen är inte bara ett sätt att skriva uppsatser utan framförallt skriva för att
ÄMNESPLANENS STRUKTUR. Progressionstabellen
Progressionstabellen Nivåerna för betygsstegen E, C och A i kunskapskraven är formulerade med hjälp av en progressionstabell. Progressionstabellen är utgångspunkt för kunskapskraven i samtliga kurser för
Visionen om att lära eleverna engelska under mattelektionen hur fungerar den i verkligheten?
Visionen om att lära eleverna engelska under mattelektionen hur fungerar den i verkligheten? Liss Kerstin Sylvén, fil.dr i engelska I Sverige talar de flesta av oss svenska. Svenskan är ett litet språk.
Analyser och prognoser om utbildning och arbetsmarknad
Beskrivning av statistiken Analyser och prognoser om utbildning och arbetsmarknad UF0504 0 Administrativa uppgifter om produkten 0.1 Benämning Analyser och prognoser om utbildning och arbetsmarknad 0.2
Häckningsresultat hos stare 2006 2008 i Kvismaren
Häckningsresultat hos stare 2006 2008 i Kvismaren Jan Sondell I förra årsskriften presenterades en sammanfattning av de studier av stare som pågått vid Kvismare fågelstation under drygt fyra decennier.
Grunderna kring helmäskning
Grunderna kring helmäskning I bryggskolans kapitel extraktbryggning och delmäskning så har vi berättat om hur du kan brygga goda öl med hjälp av dessa metoder. Vad vi också nämner är att i extraktbryggning,
Min syn på visuella verktyg i produktutvecklingsprocessen
Mälardalens Högskola Min syn på visuella verktyg i produktutvecklingsprocessen KPP306 Produkt- och processutveckling Joakim Vasilevski 10/4/2012 Innehåll Sammanfattning... 2 Inledning... 3 Skisser... 3
Metod- PM: Påverkan på Sveriges apotek efter privatiseringen
Metod- PM: Påverkan på Sveriges apotek efter privatiseringen Problem Sedan privatiseringen av landets apotek skedde för 3 år sedan är det många som hävdar att apoteken inte har utvecklats till det bättre,
Från sömnlös till utsövd
SAMUEL LINDHOLM & FREDRIK HILLVESSON Från sömnlös till utsövd Ett sexveckorsprogram mot sömnproblem för bättre sömn, mer energi och högre livskvalitet BILAGOR Innehåll Bilaga A: Målsättning 3 Bilaga B:
Mål och normer: Kvalitetskrav på ytvatten
Mål och normer: Kvalitetskrav på ytvatten Syfte Vattenmyndigheterna ska klassificera den ekologiska och kemiska statusen i våra svenska ytvatten för att kunna avgöra var det behövs åtgärder för att klara
Nätverket stöd för vuxna anhöriga till person med psykisk ohälsa, Sammanställning 7
140326 Nätverket stöd för vuxna anhöriga till person med psykisk ohälsa, Sammanställning 7 Sammafattning I den sjunde träffen sammanfattade de lokala lärande nätverken vad det gett dem at delta i det lärande
Slutrapport för projektet Programmeringsundervisning i skolor med webbaserad konstprogrammering Annika Silvervarg, Linköping universitet
Slutrapport för projektet Programmeringsundervisning i skolor med webbaserad konstprogrammering Annika Silvervarg, Linköping universitet Inledning Dagens barn och ungdomar är flitiga användare av datorer,
Concept Selection Chaper 7
Akademin för Innovation, Design och Teknik Concept Selection Chaper 7 KPP306 Produkt och processutveckling Grupp 2 Johannes Carlem Daniel Nordin Tommie Olsson 2012 02 28 Handledare: Rolf Lövgren Inledning
Förord. ra och Ackordspel (Reuter&Reuter), men andra böcker kan naturligtvis också användas (se
Förord Lär av Mästarna har vuxit fram under min tid som lärare i ämnet satslära med arrangering vid Musikhögskolan i Malmö. Materialet har under ett decennium provats både i grupp- och individuell undervisning
Sammanställning av studentutvärderingen för kursen Estetiska lärprocesser 15 hp, ht 2007
Sammanställning av studentutvärderingen för kursen Estetiska lärprocesser 15 hp, ht 2007 135 av 167 studenter (81%) har Lärare, tidigare år, förskola 39% besvarat utvärderingen Lärare, tidigare år, grundskola
Att bedöma. pedagogisk skicklighet
Att bedöma pedagogisk skicklighet Hur bedömer jag pedagogisk skicklighet? Vi blir allt fler som har anledning att ställa oss den frågan. Visad pedagogisk skicklighet är numera ett behörighetskrav vid anställning
E-handeln 2014 SILENTIUM AB COPYRIGHT WWW.SILENTIUM.SE
E-handeln 2014 Presentationsupplägg Fakta om undersökningen Sammanfattning Undersökningsresultat FAKTA OM UNDERSÖKNINGEN Denna undersökning är gjord av Silentium 11/12 17/12 2014. 1038 personer i varierande
Övergången från vård till vuxenliv. Vad vet vi och vad behöver vi veta?
Övergången från vård till vuxenliv. Vad vet vi och vad behöver vi veta? Ingrid Höjer Professor i socialt arbete Institutionen för socialt arbete Presentationens innehåll: Vad vet vi redan? Kort om situationen
Könsfördelning inom utbildning, forskning och personal vid Umeå universitet
Sid 1 (23) Könsfördelning inom utbildning, forskning och personal vid Umeå universitet Könsfördelningen vid Umeå universitet är förhållandevis jämn 1. Trots en jämn könsfördelning råder det en kvinnlig
GRUNDUTBILDNING: ATT HELA SIG SJÄLV ATT ÄLSKA DIG SJÄLV ÄR DET MEST BETYDELSEFULLA DU KAN GÖRA.
GRUNDUTBILDNING: ATT HELA SIG SJÄLV ATT ÄLSKA DIG SJÄLV ÄR DET MEST BETYDELSEFULLA DU KAN GÖRA. Först helar du dig själv sedan kan du hjälpa andra! Grundutbildning i helande; Att hela sig själv, ger dig
Sårbarheter i det moderna betalningsväsendet
ANFÖRANDE DATUM: 2006-10-18 TALARE: PLATS: Förste vice riksbankschef Eva Srejber Sveriges säkerhetsting i Eskilstuna SVERIGES RIKSBANK SE-103 37 Stockholm (Brunkebergstorg 11) Tel +46 8 787 00 00 Fax +46
Västsvenska paketet Skattning av trafikarbete
Västsvenska paketet Skattning av trafikarbete Rapport Dokumenttitel: Skattning av trafikarbete Västsvenska paketet rapport Utförande part: WSP Kontaktperson: Tobias Thorsson Innehåll 1 Introduktion Fel!
Liten introduktion till akademiskt arbete
Högskolan Väst, Inst för ekonomi och IT, Avd för medier och design 2013-09-14 Pierre Gander, pierre.gander@hv.se Liten introduktion till akademiskt arbete Den här texten introducerar tankarna bakom akademiskt
Studie av gränssnittsprototyp i projektet Webbklustring - användarupplevelsen
LINKÖPINGS UNIVERSITET Institutionen för Datavetenskap Studie av gränssnittsprototyp i projektet Webbklustring - användarupplevelsen Namn E-mail Evelina Rennes evere305@student.liu.se INNEHÅLL INNEHÅLL
Kursdokument Regional kurs Kursnamn: Döva barn och barn med hörselnedsättning lära att läsa och skriva under de tidiga åren Termin: Höstterminen 2015
Kursdokument Regional kurs Kursnamn: Döva barn och barn med hörselnedsättning lära att läsa och skriva under de tidiga åren Termin: Höstterminen 2015 Kursledare: Carin Roos, carin.roos@kau.se, tfn 054-700
Planeringsspelets mysterier, del 1
Peter Lindberg Computer Programmer, Oops AB mailto:peter@oops.se http://oops.se/ 28 februari 2002 Planeringsspelets mysterier, del 1 Om jag ska spela ett sällskapsspel för första gången så vill jag att
PROGRAMRÅD INTERAKTIONSDESIGN
PROGRAMRÅD INTERAKTIONSDESIGN Tid: 2010-11-17, Klockan 10.00 Plats: Kalmar Nyckel i sal NY110 samt via Skype Kallade: Morgan Rydbrink, Dennis Larsson, Sara Elebro, Hannes Johansson, Linus Knutsen, Wilaiwan
Ekonomiska drivkrafter eller selektion i sjukfrånvaron?
REDOVISAR 2001:10 Ekonomiska drivkrafter eller selektion i sjukfrånvaron? Utredningsenheten 2001-09-28 Upplysningar: Peter Skogman Thoursie 08-16 30 47 peter.thoursie@ne.su.se Sammanfattning Allt fler
KVALITETSINDIKATORER PÅ 1177.se
KVALITETSINDIKATORER PÅ 1177.se Invånartjänster idag Nationella tjänster från Sveriges landsting och regioner Hälso- och sjukvårdstjänster som kan användas dygnet runt Ger råd om hälsa och relationer,
Bostadsköpet & tryggheten
Bostadsköpet & tryggheten - Budgivningen är det klart stressigaste momentet i ett bostadsköp - Bostadsköpare söker främst råd hos anhöriga och sin bankkontakt, mäklarens råd anses inte trovärdiga - Ränteförhandlingen
Den äldre, digitala resenären
Den äldre, digitala resenären Resebranschen är en av de mest växande branscherna i världen. Digitaliseringen har dock gjort att branschen förändrats mycket under de senaste åren. Många resenärer agerar
Information till registrerade enligt personuppgiftslagen
Information till registrerade enligt personuppgiftslagen Datainspektionens allmänna råd 1 2 Innehåll Inledning 5 Information som skall lämnas självmant (23 25 ) 6 Uppgifter som samlas in direkt från den
Konsekvensutredning - Transportstyrelsens föreskrifter om riskutbildning för behörighet B
Konsekvensutredning 1 (10) Datum Dnr/Beteckning Handläggare Henrik Julin Väg- och järnvägsavdelningen Enhet behörigheter Sektion regler Konsekvensutredning - Transportstyrelsens föreskrifter om riskutbildning
KÄNNA IGEN ADHD-SYMTOM OCH DIAGNOS
KÄNNA IGEN ADHD-SYMTOM OCH DIAGNOS Det här kapitlet innehåller råd till både föräldrar/vårdnadshavare och lärare om symtomen på ADHD och hur man känner igen dem hos ett barn. Här finns avsnitt om ADHD
Struktur och Ledning i små organisationer
Kungl. Tekniska Högskolan ME1010, Organisation och kundskapsintensivt arbete Fredrik Bergenlid, 870510-0157 Christian Rane, 810105-0279 Struktur och Ledning i små organisationer Innehåll 1 Inledning 1
Verktyg för Achievers
Verktyg för Achievers 2.5. Glöm aldrig vem som kör Bengt Elmén Sothönsgränd 5 123 49 Farsta Tel 08-949871 Fax 08-6040723 http://www.bengtelmen.com mailto:mail@bengtelmen.com Ska man kunna tackla sina problem