Adaptiva system Metoder och processer Erik Wallin erikw@kth.se erik@adaptlogic.com
Agenda 1. Introduktion 2. Process för informationsanpassning 3. Metoder för återkoppling 4. Metoder för informationsanpassning
Bakgrund 1995 Började med smarta agenter och frågan Vem betalar för användningen? 1997 Forskningsprojekt på KTH med fokus affärsstrategier i mediaföretag. Fungerar personalisering? 2001 Startade Adaptlogic som utvecklar autooptimerande och beteendestyrt personaliseringssystem. Praktisk verifiering av forskning. 2004 Doktorsexamen i Informationsadaptation med inriktning på generella metoder och kategoriseringsstrukturer. 2004 Tillämpad forskning
Multiple Content Multiple Users Stored information 2002 5 exabyte (32 000 x British Library (150 million items)) 90% on magnetic media Information flow 2002 18 exabyte 96,7% telephone 3% internet (2,4% email) 0,3% television 30% increase per year 800 MB per person 3 000 commercial messages/day
Process för informationsanpassning 1. Samla in data Store 2. Raffinera data Cache Tune Store 3. Skapa kunskap Mine Target Cache 4. Agera 5. Återkoppla/optimera Target Tune Mine
Metoder för återkoppling 1. Strategiskt perspektiv Statistiska mätningar => Rapporter Datamining 2. Drifts-perspektiv OLAP-kuber Automatisk styrning mha nyckeltal Automatisk eliminering (A/B, multivariatanalys)
Metoder för informationsanpassning Deterministisk Ex. Rules-based Probabilistisk Ex. Social filtering Content-based Andra AI-met. Explicit Implicit Informationsanpassning
Explicit & Implicit Effort for user Register your profile? Yes >20 No Information loss Explicit Baserat på önskan Implicit Baserat på beteende
3 Huvudmetoder 1. Rules based 2. Social filtering 3. Content based
Rules based
Rules based
Rules based 1. Kvalificeringskriterier 1. Maskinförståbar information om besökaren, artiklar och händelser 2. Statisk artikelstruktur 2. Fördelar 1. Hög grad av automatiserad drift 2. Enkelt att förstå och förutsäga 3. Inga Cold-start problem 3. Nackdelar 1. Svag 1-to-1 2. Mindre lämplig för tillämpningar med stor dynamik i innehållet 3. Underhåll kan bli kostsamt 4. Inget minne
Social filtering
Social filtering 0. Två typer: Artikel- och besökarbaserad 1. Kvalificeringskriterier 1. Multiple content många och olika artiklar 2. Multiple interest många olika besökare med olika beteenden 3. Enkla-köp /commodities 2. Fördelar 1. Hög grad av automatisering, låga drifts- och underhållskostnader 2. Ger möjlighet till riktig 1-to-1 3. Behöver ej vara lärande -> typ Artikel kräver ej identifiering 3. Nackdelar 1. Cold-start problem 2. Svårt att förutsäga och kontrollera rekommendationer
Content based
Content based
Content based 1. Kvalificeringskriterier 1. Möjlighet att identifiera besökare 2. Återkommande besökare 3. Kategoriseringsbara artiklar 4. Muliple content många och olika artiklar 5. Multiple interest många olika besökare med olika beteenden 2. Fördelar 1. Hög grad av automatisering 2. Lärande 3. Enkelt att förstå och förutsäga 4. Ger möjlighet till riktig 1-to-1 5. Inga Cold-start problem 3. Nackdelar 1. Kräver kategoriseringsstruktur och underhåll inte bättre än inmatad data 2. Kräver återkommande besökare
Profiles User profile before User profile after Service Offering Advertisement
Kategorisering Kategorier Värde#1 Värde#2 Värde#3 Intresseområde Bil, Ekonomi, Hotell 2% 64% 1% Katalogområde Tjänster Annonssegmentering (Ex DART) Persona (?) Blekinge Borås Gulasidorna Kalle Köp och Sälj Bil/Motor Lena Eskilstuna 18% 67% 15% Kartor 72% 12% 16% Resor Ekonomi/Finans 23% 42% 35% Nisse 90% 10% 0% Kundprofil Annonsprofil Mosaik livsstilar (?) A B C 3% 5% 92% Innehållsprofil
Real-time Matchning
Metrics and Optimization Distr. 45% 45% 10% Conversion +27% +18% 0% Historical Behavior Session Behavior External input
Sammanfattning 1. Process 1. Samla in data 2. Raffinera data 3. Skapa kunskap 4. Agera 5. Återkoppla/Optimera 2. Återkoppling 1. Strategisk 2. Drift 3. Metoder för informationsanpassning 0. Explicit/Implicit 1. Rules based 2. Social filtering 3. Content based