VILKET REKOMMENDATIONSSYTEM SKA EN INTERAKTIV MEDIETJÄNST VÄLJA?

Relevanta dokument
LINKÖPINGS UNIVERSITET. Rekommendationssystem

Rekommendationer på nätet

Rekommendationssystem. med fördjupning på collaborative filtering

SÅ BLIR DIN NETFLIX- UPPLEVELSE BÄTTRE. En litteraturstudie om Netflixs rekommendationssystem

TiVo ett rekommendationssystem. TiVo ett rekommendationssystem

Personifierad Netflix

Colloborative filtering ett rekommendationssystem

Regression med Genetiska Algoritmer

Kritisk reflektion av använd teori för införande av digitala teknologier, Tidsläckage Teorin.

En praktisk implementation av ett rekommendationssystem

I arbetet hanterar eleven flera procedurer och löser uppgifter av standardkaraktär med säkerhet, både utan och med digitala verktyg.

Övningshäfte 2: Induktion och rekursion

Extramaterial till Matematik X

Brukarundersökning Individ- och familjeomsorgen Introduktionsenheten

Concept Selection Chaper 7

Business research methods, Bryman & Bell 2007

Kursplan för Matematik

Undersök och diskutera sökalgoritmer. Lektionen handlar om vad en algoritm är och algoritmers betydelse för hur söktjänster fungerar.

8F Ma Planering v45-51: Algebra

Ladokkod: TentamensKod: Tentamensdatum: Tid: Hjälpmedel: Inga hjälpmedel

Visualisering av samverkan

729G11 Artificiell Intelligens Marcus Johansson Marjo581. Fuzzy logic. Marcus Johansson Marjo581

1. Inledning, som visar att man inte skall tro på allt man ser. Betrakta denna följd av tal, där varje tal är dubbelt så stort som närmast föregående

Slumpförsök för åk 1-3

Ladokkod: Studenter i lärarprogrammet GF 11GF20 vt17 tillfälle 1 och vt16 tillfälle 4

Undersök och diskutera sökalgoritmer

48 p G: 29 p VG: 38 p

Musik bland dagens ungdomar

MULTIPLATTFORMAR STÄLLER KRAV PÅ DIN STRATEGI OCH LEDNING

Grupp 12 Andreas Antonsson andan850 Ellen Franzén ellfr008 Robin Blomberg robbl105 Lovisa Rönngren lovro519 Pontus Rudolfson ponru118

SF1900 Sannolikhetsteori och statistik, HT 2017 Laboration 1 för CINEK2

PRÖVNINGSANVISNINGAR

Förslag den 25 september Engelska

Effekten av varierande datamängd vid filmbetygsprediktion

TATM79: Föreläsning 1 Notation, ekvationer, polynom och summor

DIGITALISERING FÖR MERVÄRDE EN ILLUSTRERAD GUIDE FÖR SOCIALTJÄNSTEN I SUNDSVALL

Statistisk mönsterigenkänning

Undervisningen i ämnet matematik ska ge eleverna förutsättningar att utveckla följande:

X-jobbs katalog. Medius R&D November 2011

Viktigt! Glöm inte att skriva Tentamenskod på alla blad du lämnar in. Skriv inte på bladens baksidor. Helst en uppgift per blad.

Grundläggande matematik fo r grundlärare med inriktning mot arbete i grundskolans a rskurs 4-6, 15 hp VT ho gskolepoäng

Dryck till maten. - ett nyttobaserat rekommendationssystem. Sarah Albertsson

Studenter i lärarprogrammet GF(11GF20) 46 p G: 28 p VG: 38 p

Centralt innehåll. I årskurs 1.3

Betyg i årskurs 6. Grundskolans läroplan Kursplan i ämnet matematik

Statistik, sannolikhet, algebra och funktioner, 3 hp. Studenter i lärarprogrammet F-3 III, 12F380 ht17 Varberg

Blue Ocean Strategy. Blue Oceans vs Red Oceans. Skapelse av Blue Oceans. Artikelförfattare: W. Chan Kim & Renée Mauborgne

Formativ bedömning i matematikklassrummet

Anvisningar till rapporter i psykologi på B-nivå

Statistiska samband: regression och korrelation

Utvärdering. Övergripande (1) Med/utan användare. Övergripande (2) Fredag 1 oktober F1. Ann Lantz - Anna Swartling -

7E Ma Planering v45-51: Algebra

Kritiskt tänkande HTXF04:3 FTEB05. Induktiv argumentation

LUNDS UNIVERSITET KURSPLAN INFN35 Ekonomihögskolan Institutionen för Informatik INFN35

Institutionen för datavetenskap Department of Computer and Information Science

Förslag den 25 september Matematik

Matematik. Kursprov, vårterminen Bedömningsanvisningar. för samtliga skriftliga provdelar

Musik bland dagens ungdomar

Skolverkets föreskrifter om kursplan för kommunal vuxenutbildning i svenska för invandrare;

1. En oreglerad marknad involverar frihet. 2. Frihet är ett fundamentalt värde. 3. Därav att en fri marknad är moraliskt nödvändigt 1

Lab6: Social Navigering på Amazon.com. Inledning. Vad är Social navigering?

IT Café #7. Bästa Apparna Gröna Gång 17

INTRODUKTION STEG Övning ger färdighet. Träna gärna på intervjusituationen med en vän eller genom att filma dig själv och dina svar.

ämnesområden. Funktioner och räta linjens ekvation. Hur funktioner kan användas för att undersöka förändring, förändringstakt och andra samband.

Här är två korta exempel på situationer då vi tillämpar den distributiva lagen:

Projekt i programmering 1 (ver 2)... 2 Projektidé... 2 Planering... 2 Genomförande... 2 Testning och buggar... 3 Utvärdering... 3 Planering...

Kommunal vuxenutbildning i svenska för invandrare KURSPLANER OCH KOMMENTARER REVIDERAD 2018

Kapitel 4: SAMBANDET MELLAN VARIABLER: REGRESSIONSLINJEN

KURSPLAN FÖR KOMMUNAL VUXENUTBILDNING I SVENSKA FÖR INVANDRARE

Kursplanen i matematik grundskolan

Denna uppdelning är ovanlig i Sverige De hela talen (Både positiva och negativa) Irrationella tal (tal som ej går att skriva som bråk)

CDC en jämförelse mellan superskalära processorer. EDT621 Campus Helsingborg av: Marcus Karlsson IDA

Sociala medier. - vidga rekryteringsmöjligheterna. Sociala medier vidga rekryteringsmöjligheterna

LPP ENGELSKA LAG NORD ÅK 7 MAKING A NEWSPAPER

Lokal pedagogisk planering i matematik för årskurs 9

Framtidens Team AB. Seminarium Framtidens ledarskap. endagsseminarium för att få en inblick i framtidens ledarskap Framtidens Team

Utvidgad aritmetik. AU

Projekt X: Effektkartan

Välj rätt affärssystem för att din. organisation ska blomstra!

Lärarenkät för Kursprov i Engelska 5 (gymnasieskola och gymnasial vuxenutbildning) vårterminen 2016

LUNDS UNIVERSITET. Parallell exekvering av Float32 och INT32 operationer

Alla datorprogram har en sak gemensam; alla processerar indata för att producera något slags resultat, utdata.

ENGELSKA. Ämnets syfte. Kurser i ämnet

MÖNSTER OCH TALFÖLJDER

Formativ bedömning i matematikklassrummet

Bakgrund. Frågeställning

Skrivträning som fördjupar den naturvetenskapliga förståelsen Pelger, Susanne

FÖRSLAG TILL KURSPLAN INOM KOMMUNAL VUXENUTBILDNING GRUNDLÄGGANDE NIVÅ

Kursnamn XX poäng Rapportmall. Författare: (Skrivs i bokstavsordning om flera) Handledare:

KURSPLAN FÖR KOMMUNAL VUXENUTBILDNING I SVENSKA FÖR INVANDRARE

Ämne - Engelska. Ämnets syfte

MATEMATIK 5.5 MATEMATIK

Innehåll. Inledning... 3

Moralfilosofi. Föreläsning 4

Användbarhet och Webbutveckling för mobila enheter. Behovsanalys

Aktiviteter Del 4. h succesivt anta mindre värden, som till exempel π. , och låta programmet summera sekanternas längder från x = a till x = b.

Kapitel 4. Scanlon tar också upp problemet om moralens omfång d.v.s. frågan om vilka varelser som vi har moraliska skyldigheter mot.

Instuderingsfrågor till avsnittet om statistik, kursen Statistik och Metod, Psykologprogrammet på KI, T8

Handledning Det didaktiska kontraktet. 19 september 2012

Tema: Underhållning Teknikspanarna

Transkript:

VILKET REKOMMENDATIONSSYTEM SKA EN INTERAKTIV MEDIETJÄNST VÄLJA? Med Spotify som praktiskt fall.se 12 januari 2017 729G43 Kognitionsvetenskapliga programmet, LiU.

Sammanfattning Rekommendationssystem är ett område som det finns mycket forskning och många metoder kring. Dessa metoder fyller samtliga olika syften men har alla samtliga mål; nämligen att skapa rekommendationer som för användaren är personliga och relevanta. Spotify är ett företag som är ledande inom detta och har applicerat en mängd olika metoder för att uppnå den personlighet bland de funktioner som de idag har. Några av de främsta metoderna som används på marknaden är matrisfaktorisering samt kollaborativa och innehållsbaserade rekommendationssystem. Kollaborativa system syftar i att jämföra användare med varandra och är därför oberoende av vilken typ av objekt som ska rekommenderas. Innehållsbaserade är beroende av egenskaper hos objekt, men behöver å andra sidan inte ta hänsyn till någon annan än användaren rekommendationen avser. Matrisfaktorisering är en metod som bryter upp en matris via matrismultiplikation och därmed kan se data som andra algoritmer troligen missar. Rekommendationssystem är ett avancerat område där det finns mycket att ta hänsyn till. Det finns en mängd metoder som har sina för och nackdelar, vilket skapar ett beroende av deras samarbete. Som utgångspunkt är de kollaborativa och innehållsbaserade rekommendationssystemen en lång bit på vägen. De ledande inom området formar system som tar hänsyn till mer information, identifierar dolda mönster och i slutändan ger bättre rekommendationer till slutanvändarna. 2

Innehållsförteckning Sammanfattning... 2 1. Inledning Digitaliseringens utveckling och användares krav... 4 2. Teori... 4 2.1 Rekommendationssystem... 4 2.2 Kollaborativa rekommendationssystem... 5 2.1.1 Den kollaborativa algoritmen... 5 2.3 Innehållsbaserade rekommendationssystem... 7 2.4 Matrisfaktorisering... 8 3. Spotify Discover Weekly... 8 3.1 Spotify s matrisfaktorisering... 9 4. Analys... 10 5. Diskussion... 12 6. Slutsats... 13 7. Referenser... 15 3

1. Inledning Digitaliseringens utveckling och användares krav Rekommendationssystemens utveckling har ökat kraftigt de senaste tio åren i takt med att även nya teknologier har framställts. Samhället har med tiden blivit alltmer digitaliserat och detta märks tydligt på marknaden för exempelvis musik. Musikindustrin har i snabb takt gått från musikaffärer som sålde musik som fysiska produkter till något som finns tillgängligt på din dator eller mobil. CD-skivan har alltså gått från en fysisk sak till något digitaliserat som numera konsumeras obegränsat och på många ställen även gratis, via interaktiva musiktjänster såsom Spotify (Billing, 2016). Av alla dessa existerande musiktjänster och medier, vad är det egentligen som fått just Spotify att bli så framgångsrikt? Enligt Hooven (u.å) upplever 74 procent kunder, frustration när en hemsida inte är personligt anpassad. Detta indikerar en stark relation med hemsidor och tjänsters personlighetsanpassning och framgång. Och självklart är denna egenskap något som Spotify är ledande med inom musiktjänstindustin. Det finns många hemsidor och tjänster för en konsument att välja mellan i dagens samhälle. Detta har lett till ett ökat krav från konsumenterna på deras upplevelse då de har stora möjligheter att välja bort tjänster som inte fyller de kraven. Den frågeställning som valt att studerats är; Hur kan ett väl fungerande rekommendationssystem för interaktiva medietjänster formas? 2. Teori 2.1 Rekommendationssystem Genom åren har det funnits många definitioner om vad ett rekommendationssystem är. Burke (2002) berättade att det gjordes en tidig definition av Resnick och Varian från 1997. De förklarade att ett rekommendationssystem är något där människor ger rekommendationer genom input, som systemet sedan tar in och skickar ut till den lämpliga mottagaren. Begreppet har utvecklats en hel del sedan dess. Aggarwal (2016) förklarar grundidén av rekommendationssystem som att man använder olika datakällor för att förstå användares intressen. Numera används rekommendationssystem till olika typer av system där individanpassade rekommendationer ofta genereras som en slutprodukt eller i vissa fall, hjälper användare att välja bland olika domänobjekt. Förslagen som ges avser enligt Ricci Rokach och Shapira (2015) olika beslutsprocesser. Exempel på detta skulle kunna vara rekommendationer för musik eller nyheter som användare förväntas vilja lyssna på eller läsa. Kärnan i denna teknik som används för att generera rekommendationer, är anpassade för att ge användbara och effektiva förslag för den specifika typen av objekt. I många fall är rekommendationer personliga, vilket innebär att användare får egna, specifika förslag. Däremot finns det även rekommendationer som inte väljer att ge personliga rekommendationer utan snarare mer generella förslag som kan passa många. 4

2.2 Kollaborativa rekommendationssystem Detta system är den mest populära och bredaste implementationstekniken för rekommendationssystem, vilket utgör att den även har testats och använts mest i forskningssyfte. Systemet sammanställer betygsättning på objekt och därefter observerar dem med de användare som gett liknande betyg. På så sätt går det därav att komma med nya rekommendationer baserade på andra användares betygsättningar. Betygsättningen kan se ut på olika sätt. I vissa fall används en sifferskala från exempelvis 1-10 och i andra fall används en binär skala där användare får välja att gilla eller ogilla objekten (Burke, 2002). Vidare förklarar Burke (2002) att det finns olika typer av kollaborativa system, antingen minnesbaserad eller modellbaserad filtrering. Aggarwal (2016) beskriver att den minnesbaserade filtreringen utgår från att användare som tycker om samma saker har liknande mönster gällande betyg. Därmed jämförs användares korrelation för att en personlig rekommendation ska kunna göras. Han beskriver därefter att den modellbaserade inte har fokus på betygsättning utan istället skapar den modeller genom maskininlärningsalgoritmer på testdata. Dessa datamodeller används för att hitta mönster som sedan kan appliceras i riktig data och därigenom ge rekommendationer. 2.2.1 Den kollaborativa algoritmen Identifiera grannar Algoritmen för detta rekommendationssystem illustrerar Jannach, Zanker, Felfernig och Friedrich (2011) genom en av de tidigare metoderna så kallad användarinriktad minnesbaserad rekommendation. Tankesättet är att utifrån en betygdatabas och en användare, identifiera andra användare (även kallad nära grannar) som har liknande åsikter som huvudanvändaren utifrån val och betygsättningar från tidigare. Betygdatabasen som illustreras i exemplet följer nedan och visar vilket betyg vilken användare (user) gett vilket objekt (item): Item1 Item2 Item3 Item4 Item5 User1 5 3 4 4? User2 3 1 2 3 3 User3 4 3 4 3 5 User4 3 3 1 5 4 User5 1 5 5 2 1 Tabell 1 Översikt för användares betyg av objekt Syftet med exemplet är enligt Jannach, Zanker, Felfernig och Friedrich (2011) att algoritmen ska identifiera vilket betyg user1 troligtvis skulle ge item5. För att förstå formeln måste de symboler som används, förklaras. U = {u1,, un} illustrerar en mängd användare, P = {p1,, pm} visar en mängd objekt, ri, j visar en användare i:s betyg på objekt j. Betygsskalan är numerisk från ett till fem, där det lägre är lågt betyg och det högre är bra betyg. För att sedan jämföra användare med varandra används Pearsons korrelationskoefficient enligt formel nedan där Sim(a, b) jämför användare a och b utifrån tabellen ovan. 5

Formel 1 - Uträkning för användares likhet av betyg Jannach, Zanker, Felfernig och Friedrich (2011) utgår från att a är user1 och att b är user2. Till en början räknas täljaren i formeln ut. Den innebär att man ska summera en produkt enligt formeln för alla objekt som både a och b har betygsatt. Båda användarnas differens av det aktuella objektets betyg och det totala medelbetyg multipliceras sedan, vilket blir värdet som summeras till täljaren (se nedan). ((5-4) * (3 2.4)) + ((3 4) * (1 2.4)) + ((4 4) * (2 2.4)) + ((4 4) * (3 2.4)) = 2 Nämnaren består enligt Jannach, Zanker, Felfernig och Friedrich (2011) av produkten av de två kvadratrötter som var för sig innehåller summan för användare a respektive b:s betygsättning av samtliga betygsatta objekt. Kvadratroten hänvisas fortsättningsvis i skrift som square() och avrundning till viss del sker. Nedan visas uträkningen av nämnaren. Kvadratrot för a: Square(((5-4)^2) + ((3-4)^2) + ((4-4)^2) + ((4-4)^2)) = 1.4142 Kvadratrot för b: Square(((3-2.4)^2) + ((1-2.4)^2) + ((2-2.4)^2) + ((3-2.4)^2)) = 1.685 Multiplicering av a och b:s kvadratrot och framställning av den finala nämnaren: 1.4142 * 1.685 = 2.379545 Genom detta går det att få fram den slutgiltiga faktorn för jämförelsen mellan a och b: 2 / 2.37959 = 0.84 (0.85 utan någon avrundning i tidigare steg) Denna kvot tolkas sedan enligt Jannach, Zanker, Felfernig och Friedrich (2011) som en skala mellan -1 och 1. Ju högre värde desto mer lik är användarnas betygssättning varandra. Genom detta kan man då se att user1 och user2 delar åsikter till en väldigt hög grad. Deras betyg behöver nödvändigtvis inte vara samma. Man måste tänka utifrån varje användares perspektiv. Det som menas är att exempelvis user1 betygsatt item1 som 5 och user2 har betygsatt den som 3, vilket vid första blick indikerar skillnad. Det viktiga här är deras betygsättning utifrån deras eget perspektiv. För user2 är betyg 3 det högsta den någonsin betygsatt ett objekt, vilket då skapar likheten med betyget som user1 gav. Resterande värden som framgår av samma uträkning för user3, user4 och user5 är i samma ordning 0.70, 0.0 samt -0.79. Simulera betyg Utifrån tidigare uträkningar påpekar Jannach, Zanker, Felfernig och Friedrich (2011) att det är user2 och user3 som bäst överensstämmer med user1 och är därmed de användare som 6

involveras i förutsägelsen av den rating som saknas. Utöver detta måste det också identifieras i vilken grad man skall värdesätta deras betyg. Detta görs genom denna formel: Formel 2 - Uträkning för rekommendationsobjektets betyg Det den gör är att addera originalanvändarens medelbetyg med kvoten av uträkningarna i formeln. Åter igen börjar Jannach, Zanker, Felfernig och Friedrich (2011) med att räkna ut täljaren. Täljaren är en summering av värdet för samtliga andra användare som klassas som grannar (i detta fall user2 och user3). Det som summeras är värdet från multiplikation av sim(a,b) och differensen av användarens betyg av objektet och medelbetyget. Nedan följer uträkningen av täljaren för det genomlöpande exemplet: (0.85 * (3 2.4)) + (0.70 * (5 3.8)) = 1.35 Nämnaren är inte lika komplicerad som täljaren. Den är en summering av sim(a, b) för de användare som klassas som grannar: (0.85 + 0.70) = 1.55 För att slutföra algoritmen räknas kvoten ut och summeras med originalanvändarens medelrating enligt formeln: 4 + (1.35 / 1.55) = 4.87 Genom detta har Jannach, Zanker, Felfernig och Friedrich (2011) då förutspått att user1 bör få rating 4.87 utifrån tabellen med betygsdata. De påpekar dock att det är viktigt att komma ihåg att detta betyg endast är en idealisering av verkligheten och med en så pass liten databas som tabellen som användes i exemplet går det inte att lita på värdet helt. I verkligheten skulle tusentals användare jämföras med varandra genom tusentals objekt vilket skulle öka komplexiteten, men även resultatens validitet, väsentligt. 2.3 Innehållsbaserade rekommendationssystem Denna metod tar i beaktning att användare som visat preferenser för en viss typ av objekt tidigare, kommer att gilla liknande onjekt senare också. Metoden är som mest användbar då ett objekt är nytt och det inte finns så många betyg för just det objektet än. Anledningen till detta är då detta system enbart ser på den enskilda användarens betygsättning och inte utifrån andras betyg, som det kollaborativa systemet utgår ifrån (Aggarwal, 2016). Jannach, Zanker, Felfernig och Friedrich (2011) beskriver att innehållsbaserade rekommendationssystem har till sin fördel att implementationen är relativt enkel. Anledningen till detta är då man inte behöver flera användare för att göra en bedömning. 7

Algoritmen behöver endast lägga fokus på den enskilda användaren, vilket är mindre tidskrävande. Trots detta framgår det rekommendationer med samma kvalitéer som för resultatet av mer avancerade algoritmer. Tanken för det innehållsbaserade rekommendationssystemet är att leta efter mönster i egenskaperna bland de objekt som användaren sedan tidigare har brukat. Genom dessa mönster går det då att anta att användaren kommer uppskatta ett nytt objekt som har samma egenskaper som tidigare uppskattade objekt. 2.4 Matrisfaktorisering Yeung (2010) förklarar att namnet matrisfaktorisering innebär att man bryter ut två eller flera matriser utifrån en ursprungsmatris som sedan vid multiplikation kan återskapas. Detta medför att det går att effektivisera genomsökningen av matrisen i jämförelse till andra algoritmer. Metoden är ett matematiskt verktyg som används för matriser och möjliggör att förstå och hitta dolda egenskaper i dess data. Detta tack vare att man kan fokusera på specifika data och enklare se mönster. På så sätt möjliggörs vissa perspektiv av data som tidigare inte har synts tack vare att ursprungsmatrisen går att omformulera. En styrka som matrisfaktorisering har enligt Koren, Bell och Volinsky (2009) är dess förmåga att anpassa sig utifrån den information som den har tillgänglig. De hänvisar främst till användandet av explicit eller implicit information. När en användare inte explicit har försett systemet med betyg kan systemet själv genom implicit information ändå förstå och tolka mönster hos användaren. Vidare förklarar de att denna model gör det möjligt att använda en teknik som kallas, singulärvärdesfaktorisering som används för att identifiera data och mönster som annars inte syns i matriserna. De beskriver att denna faktoriseringsteknik är en styrka som vid andra metoder, såsom kollaborativa rekommendationssystem, blir mer komplex. 3. Spotify Discover Weekly Spotify är en digital musiktjänst som grundades i Sverige 2006 av Daniel Ek och Martin Lorentzon. Spotify (2017a) förklarar att tjänsten ger tillgång till att lyssna till flera miljoner låtar och har cirka 100 miljoner aktiva användare världen över. Detta gör tjänsten till den största på marknaden då den är etablerad i 60 länder med fortfarande ett snabbt växande antal användare. Detta utgör att Spotify är den mest använda streamingtjänsten i åtta av tio länder. Statistik som Spotify (2017b) själva har gjort, visar att den genomsnittliga användaren lyssnar på musik via Spotify i 148 minuter och att tjänsten används dygnet runt. Enligt Spotify (2017c) visar sig tjänsten vara den mest använda streamingtjänsten i åtta av tio länder Göransson (2016) beskriver att Spotify använder olika algoritmer i sin tjänst beroende på vilken funktion man väljer att fördjupa sig i. Fokus i denna rapport kommer ligga på deras nyaste tillskott, nämligen Discover Weekly. Denna funktion förklarar Göransson (2016) som en rekommenderad spellista som är skräddarsydd för varje användare på Spotify. Denna spellista byts ut varje vecka och ger ett personligt intryck med låtar som känns bekant. Detta är något som ger Spotify ett övertag över andra konkurrenter då dem prickar in varje användares musiksmak men med nya, fräscha låtar som är nya för användarens öron. 8

Den största ingrediensen för Discover Weekly, är alla användare, berättar Pasick (2015). Det är alla användares spellistor som används för att göra dessa rekommendationer på låtar veckovis. Spotify tittar alltså på dina vanor gällande vilken musik som du lyssnar på och vilka som har liknande smak. Därmed kan Spotify notera att vissa av dina favoritlåtar även träder fram i någon annan användares spellista som i sin tur har en låt som du inte har lyssnat på förut, som Spotify då kan rekommendera till dig genom Discover Weekly. Förutom detta förklarar Pasick (2015) att Spotify även skapar profiler av alla användares individuella musiksmak, för att kunna göra kluster av artister och generer. Därmed går det att få en överblickande bild av varje användares musiksmak. Skaparen av Discover Weekly, Matthew Ogle, förklarar i Wiggins (2015), att det är viktigt att få användaren att känna en personlig upplevelse. Förutom vilka låtar som ska rekommenderas i spellistan behöver man också tänka på mängden låtar. Matthew förklarar att det finns en gräns, vid för många låtar känns det inte personligt eller humant längre. Med 30 låtar som spellistan varje vecka innehåller, menar han att listan fyller nog med låtar att upptäcka och ger inte ett överväldigande uttryck. Bild 2 - Modell över rekommendationer för Discover Weekly Pasick (2015) förklarar att förbindelsen mellan biljontals spellistor och allas personliga profiler utgörs av en algoritm. Algoritmen som Spotify använder är ett kollaborativt rekommendationssystem men även neutral language processing. På grund av den enorma mängden data som Spotify har lagrad använder dem en djupinlärningsteknik. Med denna teknik och med hjälp av starka datorer som har tränats upp, går det att hitta och känna igen mönster i den stora mängden av data. För igenkänning använder dem även neurala nät, vilket dem även nämner som en viktig egenskap. 3.1 Spotify s matrisfaktorisering Johnson (2014) visar att Spotify använder två typer av Matrisfaktorisering, både explicit och implicit, för sina rekommendationer. Explicit innebär att de använder data som en användare själv aktivt bidragit med, i deras fall en rating. Motsatsen implicit innefattar då den databehandling som samlas utan aktivt bidrag av användaren. Detta kan vara vilka filmer användaren sett, om vissa filmer inte ses färdigt eller liknande. Båda typerna spelar en viktig roll i att kunna ge så bra rekommendationer som möjligt. 9

Explicit matrisfaktorisering illustrerar Johnson (2014) genom exempel med filmer. Dess mål är då att förutspå hur en användare kommer betygsätta en film den inte har sett. Genom detta kan då filmer som förväntas ha hög rating för en användare presenteras för den. Denna typ av matrisfaktorisering är inte den som Spotify har fokus på, utan det är implicit matrisfaktorisering vilket förklaras djupare nedan. Implicit matrisfaktorisering utgår från implicita data om en användare har hört en låt eller inte. Datan är strukturerad som en matris med användare (x) och låtar (y). Värdena i matrisen är antingen 0 eller 1, motsvarande har inte sett eller har sett. Syftet med Figur 1 - Spotifys matrisillustration implicit matrisfaktorisering är att kunna förutspå vilka filmer en användare troligen vill se, utifrån beteendemönster. Detta utförs genom matrismultiplikation, vilket delar upp matrisen i två mindre matriser. I dessa mindre matriser består ena av faktorer om användaren (x) och den andra av faktorer om låtarna (y). Genom dessa faktorer utförs beräkningar enligt formeln nedan. Denna formel kommer inte behandlas i detalj men i stora drag försöker den minimera värdet för x och y i en summering som sker utifrån faktorerna. De låtar som ska rekommenderas framstår genom att minimera summan och därigenom få ut vilka faktorer (x och y) som ändras (Johnson, 2014). Formel 3 - Spotifys matrisfaktorisering 4. Analys Som Aggarwal (2016) förklarar, implementeras olika rekommendationssystem beroende på vilken situation en rekommendations ska genereras. Ricci, Rokach och Shapira (2015) beskriver att rekommendationer är anpassade för att ge lämpliga förlag utifrån ett specifikt objekt. Därmed bör man ta hänsyn till vilket rekommendationssystem som är mest brukbar för syftet. Då rekommendationer består av förslag på exempelvis musik eller filmer, passar både kollaborativt- eller innehållsbaserat rekommendationssystem. Avvägningen med vilket system man då ska välja beror på hur mycket data som finns tillgängligt. Ett exempel som tydligt illustrerar detta är rekommendation av filmer. En gammal film som funnits i tio år har många användare sett och därmed kan man på bäst sätt ge bra rekommendationer genom ett kollaborativt rekommendationssystem, då det redan finns mycket data från andra användare om filmen att tillgås. Jannach, Zanker, Felfernig och Friedrich (2011) klargör att det behövs en omfattande betygdatabas för att kunna använda systemet då det annars blir svårt att hitta tillräckligt med mönster bland användarna. Motsatsen är en alldeles ny film som i princip ingen tidigare har sett. Det blir därmed svårt att applicera ett kollaborativt rekommendationssystem på grund av saknaden av användardata. I dessa lägen går det att använda ett innehållsbaserat rekommendationssystem som, enligt Aggarwal (2016), jämför den aktuella användarens preferenser gällande andra liknande filmer. Mönster identifieras genom filmernas egenskaper istället för användarnas liknelser, vilket innebär att systemet inte är beroende av någon annan användare än den beräkningarna berör. Han påpekar specifikt att 10

detta system är bäst lämpad för nya objekt med avsaknad data. En nackdel med detta system är dock att det kräver information om objekten, i detta fall filmerna. Detta då det som nämnt ovan är filmernas egenskaper som utgör systemets mönsterigenkänning. I de fall det inte finns tillgång till sådan information blir detta system problematiskt. Det kollaborativa rekommendationssystemet har dock inte denna begränsning, utan är helt fri från objektens egenskaper. Detta innebär att systemet i sig enklare kan appliceras i olika situationer. Vidare finns det även en skillnad med lagringen av objektens egenskaper. Ett innehållsbaserat rekommendationssystem kan, tack vare att den skapar mönster av objektens information, ge specifik motivering till varför en viss användare blivit rekommenderad det aktuella objektet. Det kollaborativa rekommendationssystemet kan enbart motivera att andra användare tyckte om objektet. Som det framgår av Göransson (2016) använder Spotify en mängd olika algoritmer och metoder för sina rekommendationer, även för enskilda funktioner såsom Discover Weekly. Detta kan relateras till analysen ovan; att det krävs olika rekommendationssystem för olika situationer. Därav går det att konstatera att en medietjänst inkorporerar flertalet rekommendationssystem för att kunna framställa så breda och förankrade rekommendationer som möjligt, för att täcka in olika typer av situationer. Pasick (2015) nämner mer specifikt för Spotify och deras funktion Discover Weekly, att användare är den största och allra viktigaste ingrediensen. Användarnas spellistor jämförs med varandra och identifierar genom detta mönster och vanor för varje användare. Detta påstående kan starkt relateras till Jannach, Zanker, Felfernig och Friedrich (2011) samt Aggarwals (2016) förklaringar av kollaborativa rekommendationssystem där användarna är fokuspunkten. Detta rekommendationssystem fungerar precis på det sätt som beskrivs om Spotify ovan. Användarnas betygsättningar, eller visningar för implicita system, jämförs med andra användare för att försöka hitta gemensamma faktorer och därigenom kunna ge personliga rekommendationer. Burke (2002) beskriver att själva informationen som analyseras kan variera mellan situationer men att det inte gör någon skillnad enligt det som nämns ovan i stycket. Det han menar är att vissa kollaborativa rekommendationssystem utgår från en betygsskala med varierande tak och golv, medan andra är byggda med en binär skala där användaren antingen gillar eller ogillar ett objekt. Vidare förklarar Pasick (2015) att Spotify skapar användarprofiler av samtliga användares individuella musiksmak för att enklare kunna sortera in artister och genrer i så kallade kluster. Dessa profiler stämmer överens med Aggarwals (2016) beskrivning av innehållsbaserade rekommendationssystem som innebär att användare som prefererar ett visst objekt, troligen kommer tycka detsamma om ett senare liknande objekt. Yeung (2010) menar att matrisfaktorisering kan vara ett mer effektivare alternativ att använda sig av än exempelvis algoritmen för det kollaborativa rekommendationssystemet. Anledningen till det beror på att en matrisfaktorisering tillåter undersökning av dolda egenskaper hos objekt, vilket enligt Koren, Bell, Volinsky (2009) är svårare att undersöka för 11

det kollabortiva systemet. Matrisfaktoriseringen kan nämligen titta på interaktionen mellan användare och objektet för att på så sätt se fler mönster. Den är heller inte låst till en viss typ av information och blir därför ett flexibelt alternativ som i hög grad ger ut relevanta rekommendationer. Algoritmen för det kollaborativa rekommendationssystemet som Jannach, Zanker, Felfernig och Friedrich (2011) illustrerar är relativt avancerad med olika steg men är trots allt uppbyggd på ett konkret sätt. Denna rapport har inte behandlat algoritmen för innehållsbaserade rekommendationssystem, vilket gör det svårt att analysera skillnaden. En skillnad som dock framgår är faktumet att innehållsbaserade system enligt Aggarwal (2011) endast förfogar användaren som rekommendationerna avser. Dock är det mycket annan information som behöver tas hänsyn till för innehållsbaserad, så man kan fortfarande genom analysen inte anta att den ena är enklare att implementera än den kollaborativa rekommendationssystem. Johnson (2014) förklarar den formel och algoritm som Spotify använder för matrisfaktorisering, vilket jämfört med den kollaborativa algoritmen tar komplexiteten till ytterligare ett steg. De båda har samma grundidé, att hitta beteendemönster genom betygsskalor eller binära skalor, men med stor skillnad. Spotify lägger större vikt i hanteringen och uppdelningen av matriser för att identifiera dolda egenskaper, medan den kollaborativa algoritmen endast berör en matris. Som Koren, Bell och Volinsky (2009) påpekar och som även nämns i stycket ovan speglar matrisfaktorisering dessutom en högre grad av flexibilitet än kollaborativa och innehållsbaserade algoritmer. 5. Diskussion Det främsta som framgår i analysen av Aggarwal (2016) är det faktum att framgångsrika tjänster som använder sig av rekommendationssystem har en kombination av dem. Samtliga metoder tjänar ett visst syfte och de kompletterar då varandra på ett bra sätt. Kollaborativa system, som Jannach, Zanker, Felfernig och Friedrich (2011) demonstrerat, kommer självständigt i många fall ge bra rekommendationer på en stor mängd objekt och därmed ofta fylla syftet med ett rekommendationssystem. Dock finns risken att objekt, som inte haft lång livstid, antingen inte rekommenderas alls eller rekommenderas felaktigt. Motsatsen är som Aggarwal (2016) förklarar innehållsbaserade rekommendationssystem. Dessa är bra på att identifiera användarprofiler som kan förutspå betyg för objekt med kort livstid, helt enkelt en rak motsats mot kollaborativa system. Min tanke kring detta fenomen är att kollaborativa och innehållsbaserade rekommendationssystem kompletterar varandra på ett bra sätt i teorin. De har som sagt båda sina styrkor och svagheter, men med rätt kombination fyller båda det tomrum som den andra inte lyckas hantera. Jag kan därför inte heller avgöra om någon metod är bättre än den andra. För det innehållsbaserade systemet är det en bonus att den kan motivera med konkret information varför den rekommenderas för en användare. Dock tack vare ett beroende, att objekten tydligt måste ha egenskaper, som i många lägen inte är önskvärt. Motsatsen är åter igen det kollaborativa systemet som inte är beroende av objektegenskaper, men kan inte heller konkret motivera rekommendationer. Detta tror jag är en viktig avvägning som måste göras när ett rekommendationssystem ska appliceras i en tjänst. 12

Jag upplever att Spotify har en väl genomtänkt plan för sina rekommendationsmetoder som Pasick (2015) beskriver. De använder allt från kollaborativa system, till användarprofiler och matrisfaktorisering, alla skräddarsydda för sina olika funktioner som tjänsten tillhandahåller. Enligt Spotify (2017a) är företaget även en av de ledande inom musikströmning, vilket jag tror är ett resultat av just deras starka rekommendationer och funktioner. Att upptäcka ny bra musik finns nog trots allt i alla deras kunders intresse. Denna inkorporation av rekommendationssystem verkar vara en avancerad struktur som de troligtvis lagt mycket tid och resurser på att implementera och applicera. Det märks även tydligt hur de använt sig av välgrundade teorier kring ämnet då deras tillvägagångssätt i princip är identiskt till de teorier som presenterats genomlöpande i rapporten. Algoritmerna i sig upplever jag samtliga som avancerade och relativt svåra att implementera på ett bra sätt. Samtliga speglar tydligt de tankar och synsätt som dess metoder och teorier berör, vilket är en självklarhet att de gör. Matrisfaktoriseringen som Spotify använder är den som jag har uppfattat som den absolut svåraste att implementera, av de tre som behandlats i rapporten. Dock upplever jag ett samband mellan den ökade komplexiteten och rekommendationernas relevans. Den är mer avancerad av en anledning; den tar hänsyn till mer information, ser på dolda data som andra algoritmer inte ser samt har bättre förutsättning till att göra mer avancerade beräkningar tack vare matrismultiplikationen. Dock bör vi inte försumma kollaborativa och innehållsbaserade rekommendationssystem då de även har sin användning och får i många fall ut mer specifik information och blir enklare att spåra beslut i då de är inriktade på att hitta en viss typ av mönster. 6. Slutsats För att forma ett välfungerande rekommendationssystem så finns det mycket man måste ta hänsyn till. Främst behövs insikten att alla rekommendationssystem är olika och har olika syften. Det idag mest använda systemet är det kollaborativa rekommendationssystemet som jämför olika användare med varandra för att hitta mönster och likheter mellan dem och därmed kunna förutspå rekommendationer mellan dem. Denna är bra och inte allt för svår att implementera, men självständigt är den kanske inte tillräcklig. Vi måste ta hänsyn till att det finns både äldre och nyare objekt. Ett nytt objekt som inte har någon användardata kommer heller inte kunna jämföra och hitta likheter mellan användare, då den kräver att andra användare varit i kontakt med objektet. Det vi då får göra är att inkorporera ett annat vanligt system, nämligen det innehållsbaserade rekommendationssystemet. Den jämför inte användare med varandra utan snarare skapar en profil för varje användare utifrån vad den haft för preferenser tidigare, vilket då blir grunden till att hitta mönster och därmed rekommendationer. De metoder som nämnts i stycket ovan är båda relativt enkla att förstå konceptuellt och till viss del även för implementationen, men det finns även en mer avancerad metod så kallad matrisfaktorisering. Den innebär att det sker en fördelning av den matris som innehåller varje användare och dess betyg till ett visst objekt. Genom denna fördelning möjliggör det att vi 13

kan se vissa data som annars är dold och svår att se genom andra metoder. Dessutom är den flexibel i den mening att den kan blanda in mer än en typ av data i dess beräkningar. I det hela är det viktigaste att vara påläst i vad det finns för olika metoder och hur de kan samarbeta med varandra. Detta då grunden till ett väl fungerande rekommendationssystem är att det består av flera mindre system som arbetar tillsammans i att försöka förutse vad användare kommer tycka om vissa objekt. Detta är inget enkelt och det kräver en hel del expertis för att nå den färdiga produkten. 14

7. Referenser Aggarwal, C. C. (2016). Recommender Systems. Springer International Publishing AG. Billing, M. (2016). Skrivjättarna: Spotify har förändrat maktbalansen I musikbranschen. Digital. http://digital.di.se/artikel/skivjattarna-spotify-har-forandrat-maktbalansen-i-musikbranschen (Hämtad 2017-01-12) Burke, R. (2002). Hybrid Recommender Systems: Survey and Experiments. Survey and User Modeling and UserAdapted Interaction. 12(4), 331 370. Göransson, A (2016) Med Daily Mix ska Spotify konkurrera med Apple Musics For You. M3. http://m3.idg.se/2.1022/1.666328/med-daily-mix-ska-spotify-konkurrera-med-apple-musicsfor-you (Hämtad 2017-01-03) Hooven, J. (u.å). Costomers Frustrated with Brands that Fail to Personalize. Clutch. https://www.clutch.com/customers-frustrated-with-brands-that-fail-topersonalize/#post_content (Hämtad 2016-12-27) Jannach, D., Zanker, M., Felfernig, A. och Friedrich, G. (2011). Recommender Systems: An Introduction. Cambridge University Press. Johnson, C. (2014). Algorithmic Music Recommendations at Spotify. [online] SlideShare. http://www.slideshare.net/mrchrisjohnson/algorithmic-music-recommendations-atspotify/19-implicit_matrix_factorization19replace_stream_counts (Hämtad 2016-12-28) Koren, Y., Bell, R. Och Volinsky, C. (2009). Matrix Factorization Techniques for Recommender Systems. IEEE Computer Society. https://datajobs.com/data-science-repo/recommender-systems-%5bnetflix%5d.pdf (Hämtad 2017-01-08) Pasick, A. (2015). The magic that makes Spotify s Discover Weekly playlists so damn good. Quartz. https://qz.com/571007/the-magic-that-makes-spotifys-discover-weekly-playlists-so-damngood/ (Hämtad 2017-01-03) Ricci, F., Rokach, L. och Shapira, B. (2015). Recommender Systems Handbook. 2 nd Edition. Springer-Verlag New York Inc. Spotify (2017a) About Us. Spotify. https://press.spotify.com/se/about/ (Hämtad 2017-01-02) Spotify. (2017b). Your audience is tuned in. Spotify. 15

https://spotifyforbrands.com/se/ (Hämtad 2017-01-02) Spotify. (2017c). The New Audio: reaching the Spotify listener in Europe. Spotify. https://spotifyforbrands.com/se/insight/the-new-audio-tns-study/ (Hämtad 2017-01-02) Wiggins, T. (2015). The 7 secret of Spotify s Discover Weekly. Stuff. http://www.stuff.tv/features/7-secrets-spotifys-discover-weekly (Hämtad 2017-01-6) Yeung, A.A. (2010). Matrix Factorization: A Simple Tutorial and Implementation in Python. Quuxlabs. [Blogg]. 16 september. http://www.quuxlabs.com/blog/2010/09/matrix-factorization-a-simple-tutorial-andimplementation-in-python/ (Hämtad 2017-01-05) 16