hjälp av SAS Text Miner



Relevanta dokument
Faktabaserade beslutsunderlag

Automatiserad journalgranskning för ökad patientsäkerhet

SAS Institute Education Center. Kurser hösten 2007

Cancerpreventionskalkylatorn. Manual

Behöriga förskollärare och lärare i skola och vuxenutbildning läsåret 2014/15

Så gör du din kund nöjd och lojal - och får högre lönsamhet. Tobias Thalbäck Om mätbara effekter av kundnöjdhet

Kategorisering och klustring. Kategorisering vid indexering. Kategorisering. Kategorisering föränderligtf. Klustring

PUBLICERINGSNOTISER TRIMBLE ACCESS SOFTWARE. Version Revidering A December 2013

Copyright 2003, SAS Institute Inc. All rights reserved.

Det första steget blir att titta i Svensk MeSH för att se om vi kan hitta några bra engelska termer att ha med oss på sökresan.

Sekretessmeddelande Kelly Services AB Innehåll

19. Skriva ut statistik

Laborationer i kursmomentet Datoranvändning E1. Laboration nr 5: Mer om FrameMaker

Lumbago - Förord. Välkommen till Journalprogrammet Lumbago.

Business Model You Din personliga affärsplan framtagen på åtta timmar.

Max18skolan årskurs 7-9. Hälsa

VERSION 5.1/5.2 SNABBINTRODUKTION FÖR WINDOWS 32-BIT

Inbjudan SAS IT Governance Forum 2005 Stockholm 17 mars på Dramaten

CHESS Chemical Health Environment Safety System

Manual. Användargränssnitt

Administration av landstingsstatistik. Statistiktjänsten

Integrationsmöjligheter till Quality ID

Strukturering av fritext

Medicinsk informatik - Uppgift och problem?

Elektroniskt informationsutbyte mellan arbetsgivare och Försäkringskassan. Information om filöverföring

Ekonomirapport från SKOP om Hushållens ränteförväntningar, 4 april 2016

Studie av gränssnittsprototyp i projektet Webbklustring - användarupplevelsen

SNABBGUIDE TILL NEWSDESK

Alex författarlexikon

KVALITETSINDIKATORER PÅ 1177.se

Vårdens resultat och kvalitet

INSTRUKTION Specifikation E modul.doc

Tentamen Marco Kuhlmann

Framsteg med resultatrapportering

Spårbarhet och daglig partirapportering, vad gäller?

Är du osäker på hur det ser ut i skolan idag? Lugn, det finns ett lätt sätt att få svar. Vi kallar det SIRIS.

0HG HXURSHLVNW GLJLWDOW LQQHKnOO EHKnOOHUYLOHGQLQJHQ

SÄKERHETSLÖSNINGAR TJÄNSTEFIERAD SÄKERHET

Webforum. Nya funktioner i version Senast uppdaterad:

Vid funderingar, frågor eller behov av stöd kontakta gärna Utvecklingsenheten via funktionsbrevlådan

Steg 4. Lika arbeten. 10 Diskrimineringslagen

FAQ. Frågor och svar. Mercell Tender Service

Socialstyrelsens äldreundersökningar, manual till Indikators webbverktyg

INKÖPSSTRATEGI Inköpsbarometern rapport nr 1 februari 2012

Skapa en pdf-fil med hög kvalitet, lämpad för tryckning Skapa pdf-filen i en PC med Windows Skapa pdf-filen i en Mac

Användarkravspecifikation för Fiskutsättningar

Tolv dagar med Microsoft Office Excel 2007

OM JAG INTE ORKAR, HUR SKA ANDRA GÖRA DET?

Artiklar via UB:s sö ktja nst

Användarmeddelande (november 2015) Ny programversion. FLEX Lön. Version 16.1a

Handlingsplan Modell Västerbotten

Manual till Genomförandewebben. Treserva

CheckUp

SurveyXact funktionsöversikt Version 6.3. Allmänt om SurveyXact

Multiprofessionella journalmallar och gemensam termbank

DRAFT Mottagningswebben Kravspecifikation

Anvisningar för Rapporterande kursutvärderingar på LTH

POLICYSAMMANFATTNING FRÅN ENTREPRENÖRSKAPSFORUM VARFÖR SILOTÄNKANDE KAN VARA BRA FÖR INNOVATION

Anvisningar för utformning av sammandrag som mognadsprov

Matriks Doc 3 Importera dokument. Navision / Microsoft Dynamics NAV

SYLF:s remissvar på: Guldgruvan i hälso- och sjukvården - Översyn av de nationella kvalitetsregistren Förslag till gemensam satsning

DEN KOMPLETTA PROGRAMVARAN FÖR DESIGN OCH TILLVERKNING AV TRÄTRAPPOR PROGRAMVARA FÖR DESIGN OCH TILLVERKNING AV TRÄTRAPPOR LÄTT ATT ANVÄNDA

Årsrapport för Svenskt Kvalitetsregister för Karies och Parodontit. Hans Östholm Jörgen Paulander Inger v. Bültzingslöwen

Innehåll. Användarstudier. Användarstudier enligt Microsoft. Varför? Aktivt lyssnande. Intervjuteknik. Intervju Observation Personor Scenarier Krav

Taltaggning. Rapport av Daniel Hasselrot , 13 oktober 2003

Slutrapport projektgenomförande - Aurora Innovation AB

Handbok Artikulate. Andreas Cord-Landwehr Ondrila Gupta Översättare: Stefan Asserhäll

Rapportering till FORA 2016

UTBILDNING: Socialt ansvar

Beskrivning av produktregistret

DRUGLINE. med Drugle. Karolic

Skola24 för vårdnadshavare

Offertunderlag Webbportal NILS

Roligt att du vill göra ditt exjobb hos oss!

Kundcase. Lumesse effektiviserar Statoils rekryteringsprocess

HP StoreEasy 5000 Network Storage Solution Installation and Startup Service

Archiving. SaaS Archiving. Användarhandbok Version D

Senaste version kan hämtas från Internet i PDF 1 format

Balanserade Styrkort. (Balanced Scorecard) En aptitretare från VisVires AB

PREDIKTIVA MODELLER I EN FÖRÄNDERLIG VÄRLD

Samtycke vid direktåtkomst till sammanhållen journalföring

Kom med i en gemensam, nationell satsning för att etablera en enkel och effektiv e-tjänst!

Patientsäkerhetsberättelse för Kungälvs kommun

Survey&Report steg för steg: Skapa rapport

7-8 MAJ. Psykisk ohälsa

SÄKERHETSVISAREN 1. LEDNING OCH PRIORITERINGAR

Könsfördelning inom utbildning, forskning och personal vid Umeå universitet

Stärk konkurrenskraften med effektiv HRM.

Föravisering via e-post

Marie Andersson, IKT-centrum E-post: (Bb Learn 9.1.8) Wikis i Blackboard

Manual Jourläkarschema Närhälsan V7 - Version 1.0

Policy Brief Nummer 2010:2

Anslutning till Mina meddelanden

SELLOUT. Version 2.5. eyescream information ab

Lediga Jobb. Vikarie. Version: Time Care Pool 3.3 Uppdaterat:

Ett Barnhem Selfhelp- fund Stipendieverksamhet En gåvoverksamhet för fattiga En IT- skola

BARNS SPRÅKUTVECKLING

ANSÖKAN OM MEDEL FÖR UTVECKLING AV E- TJÄNSTER

Presentation upplägg

Adobe Acrobat 7.0. Få jobbet gjort med kraftfulla intelligenta dokument

Transkript:

Enterprise Intelligence Customer Intelligence Supplier Intelligence Organizational Intelligence Intelligence Architecture Identifiera stora gömda värden i textbaserad information med hjälp av SAS Text Miner Med 27 års erfarenhet är SAS Institute idag en världsledande leverantör av mjukvaror och konsulttjänster inom affärsanalys och beslutsstöd. SAS hjälper stora verksamheter med kostnadsbesparingar och resultatförbättringar genom att strukturera och analysera stora mängder information som finns samlade i våra kunders databaser. Av världens 100 största företag är 92 kunder till SAS Institute. Till våra uppdragsgivare i Sverige hör hälften av Sveriges 200 mest betydande företag och organisationer. Varje dag hanterar olika organisationer en stor mängd textdokument: webbsidor, e-postmeddelanden, artiklar, promemorior, feedback från kunder, garantikrav, patientinformation, undersökningar, forskningsrapporter, meritförteckningar m m. Att läsa igenom sådana textdokument är ett mycket krävande arbete och det finns helt enkelt inte tid att läsa allt, än mindre sortera och klassificera den viktiga informationen i varje dokument. Stora värden i mängder av textbaserad information som genereras varje dag går därmed förlorad. Text är inte anpassat för analytiska processer på samma sätt som strukturerad data. Text kan ofta vara tvetydig och likartade koncept kan beskrivas på flera olika sätt. Detta gör att underförstådd information gömd i textbaserad data är svår att uppfatta, kvantifiera och utnyttja. Text mining är en teknik för att bearbeta och analysera textbaserad information. SAS Text Miner ger verksamheten helt nya möjligheter att utnyttja affärspotentialen i textbaserad information genom att: Identifiera underliggande teman i stora dokumentsamlingar och automatiskt gruppera dokumenten i ämneskategorier/ämneskluster. Klassificera dokument i fördefinierade kategorier. Integrera ostrukturerad textbaserad data med strukturerad data. SAS Text Miner är en utökning av Enterprise Miner, ett marknadsledande verktyg för data mining. Text mining kan därför kombineras med data mining för att ytterligare fördjupa analysen och ge en bättre förståelse för helhetsbilden samt identifiera stora gömda värden i textbaserad information som tidigare inte var möjligt. Integration av text mining och data mining skapar en komplett lösning för både ostrukturerad och strukturerad data Många organisationer idag är beroende av data mining för att bättre förstå sina kunder och sin affärsverksamhet. Genom att undersöka och modellera stora mängder strukturerad data kan företag hitta kopplingar och mönster i informationen. Beslutsfattares förmåga att göra korrekta prognoser förbättras avsevärt, vilket skapar tydliga konkurrensfördelar. Problemet är att en stor mängd data är ostrukturerad. För att kunna utnyttja värdet i ostrukturerad textbaserad data måste en organisation kunna analysera den automatiskt, precis som med strukturerad data.

SAS Text Miner tillhandahåller en stor rad verktyg för textbearbetning och analys som kan hitta underliggande teman och koncept i en stor dokumentsamling. Textdokument kan automatiskt klustras in i grupper, klassificeras i fördefinierade kategorier och användas tillsammans med strukturerad data för att bygga prediktiva modeller som ger avgörande information om framtiden. Text mining kan skapa stor nytta för företag som använder analytiska program för Customer Relationship Management (CRM). Dessa företag kan använda SAS Text Miner i hanteringen av stora volymer inkommande e-post från kunder, t ex för att kategorisera e-posten för snabbare hantering och uppföljning. Personalavdelningar kan använda SAS Text Miner för att sålla i tusentals meritförteckningar och ansökningar för att på ett bra sätt kunna matcha kompetenta sökanden med lediga jobb. I undersökningar kan fritextsvar kombineras med standardsvar för att identifiera trender och skapa resultat att agera utifrån. Sökningar i stora databaser kan förfinas och fokusera på intressanta artiklar. Läkemedelsföretag kan använda text mining vid utvärdering och analysering av textbaserade anteckningar om patienter. Det ger företagen möjlighet att förbättra processerna för kliniska tester, något som är mycket värdefullt. Alla som har behov av att sålla i stora volymer text för att utvinna information, idéer och trender kan med SAS Text Miner omvandla dessa data till insiktsfull kunskap. Detta är bara några exempel på affärspotentialen med text mining. Med denna nya revolutionerande teknik kan man utnyttja informationen i olika textdokument på ett sätt som tidigare inte varit möjlig. Text mining är en teknik som genom sina möjligheter att analysera textbaserad information kan skapa stor affärsnytta och potential för hög avkastning på investering. SAS Text Miner i praktiken SAS Text Miner har använts i samarbete med olika företag, bland dem Volvo Lastvagnar i Sverige och Hewlett-Packard i USA och inom sjukvården. Förenklad dokumenthantering för Volvo Lastvagnar med SAS Text Miner Volvokoncernen är en av de världsledande leverantörerna av transportlösningar för kommersiellt bruk. Volvo Lastvagnar, som är en del av Volvokoncernen, får varje år in en stor volym s k garantiärendedokument angående sina lastbilar. Dessa dokument produceras på verkstäder där lastbilarna kommer in för reparation. Dokumenten innehåller en viss mängd standardinformation så som chassityp, reparationsdatum, antal körda mil, samt fritext som beskriver problemet med lastbilen och hur problemet åtgärdats. Genom att studera texten i dessa dokument kan Volvo Lastvagnar hitta problemorsaker och eventuella samband mellan olika typer av fel på sina lastvagnar. Men antalet dokument är för stort för att på ett enkelt sätt kunna hanteras och klassificeras och viktig information kan gå till spillo. Att läsa igenom alla dokument och för hand hitta mönster och grupperingar i texten är inte en tillfredsställande lösning. Volvo Lastvagnar exporterar sina produkter till flera olika länder. Förutom svenska dokument ska de även hantera och klassificera dokument skrivna på andra språk. också hantera andra språk, däribland svenska, vilket gör det möjligt att analysera texter på olika språk. SAS Institute AB genomförde i samarbete med Volvo Lastvagnar en studie där det undersöktes om SAS Text Miner kunde hjälpa Volvo att klassificera sina garantiärendedokument och därigenom hitta ny och viktig information i dokumenten. Under text mining-processen delas dokumenten från Volvo Lastvagnar in i ett antal olika grupper, s k kluster, där varje kluster beskrivs av några nyckeltermer ur dokumenten. Med hjälp av denna indelning kan man lättare fokusera på en typ av problem och göra djupare analyser av felorsaker. Standardinformationen i Volvos garantiärendedokument ger en viss mängd information om ärendet. Fritexten i dokumenten ger ytterligare information om ärendet, information som inte går att utvinna enbart från standardinformationen. Text mining med SAS Text Miner kan ge Volvo Lastvagnar en djupare insikt i sina garantiärenden och underlätta hanteringen av och informationsutvinningen ur dokumenten. SAS Text Miner hanterar för närvarande texter skrivna på engelska, franska eller tyska. Kommande versioner ska Forts

Hewlett-Packards CRM förbättras med SAS Text Miner HP är en leverantör av teknik, lösningar, produkter och tjänster till konsumenter och företag över hela världen. Företaget levererar IT-infrastruktur, persondatorer, accessprodukter, globala tjänster och produkter för bildhantering och utskrifter. Varje dag får HP in mängder av textbaserad information från kunder genom e-post, dokumentation från call centers eller genom kommentarer på garantisedlar. HP:s databas med information från call centers innehåller flera hundra tusen dokument. I alla dessa olika typer av dokument finns beskrivet kundernas förväntningar och önskemål gällande HP:s produkter och service. Tidigare hade HP inte haft möjlighet att kombinera data om intäkter och produkter ur sitt data ware house med den textinformation de fick in genom sina call centers. Med hjälp av SAS Text Miner fick företaget möjlighet att kombinera dessa data och därmed förbättra sin business intelligence och data mining. SAS Text Miner har även ett användningsområde i HP:s hantering av garantikrav. Text mining hjälper HP:s ingenjörer att snabbare hitta mönster och kopplingar i kundernas garantikrav. Innan de använde text mining tog det lång tid att läsa igenom dokumenten, alldeles för lång tid för att de skulle hitta användbar information. Nu kan en liten grupp analytiker hitta kluster över specifika problem och ge feedback till produktionsavdelningen. När allt är korrekt kategoriserat vill de kunna skapa prediktiva modeller som kan förutse problem med framtida produkter. Om sjukhusen ska kunna höja sin rankning är det därför viktigt vilken information man rapporterar in och vilken kvalitet informationen har. I en satsning att standardisera rapporteringsförfarandet har sjukhus anslutna till universitetet i Louisville använt SAS Text Miner för att undersöka journaler från över 10 000 öppna hjärtoperationer. Text mining lyfter fram viktiga variabler i journaltexterna och hittar mönster i behandlingen av patienter och hur patientinformation rapporteras in. Man har bl a upptäckt en underrapportering av riskfaktorer hos patienterna som i stor utsträckning påverkar sjukhusens rankning. Sjukhus som underrapporterar riksfaktorer har en lägre beräknad mortalitet bland patienterna. Även om antalet lyckade operationer är samma som för andra sjukhus rankas de lägre, eftersom de har en större differens mellan den beräknade och den faktiska mortaliteten. Genom att undersöka informationen om patienter som genomgått öppen hjärtkirurgi har man funnit att patienterna på sjukhusen varit mer sjuka än man tidigare trott. Med SAS Text Miner har man hittat andra problem och sjukdomar som ofta drabbar patienterna, t ex diabetes och allergier. Genom att på ett mer effektivt sätt identifiera och behålla kunder med hjälp av text mining kommer HP att öka sina vinster. Med SAS kan företaget analysera existerande och ny information bättre än sina konkurrenter. Enterprise Miner med SAS Text Miner ger HP möjligheten att samtidigt kunna utnyttja fördelarna med data mining och text mining. SAS Text Miner har nyckelroll inom sjukvården Sjukhus och andra vårdinrättningar i USA rapporterar in stora mängder sjukvårdsinformation till oberoende och utvärderande organisationer. Baserad på denna information gör organisationerna bedömningar av vårdkvaliteten och de olika sjukhusen rankas. Allmänheten har sedan möjlighet att ta del av organisationernas analyser och bedömningar. Med SAS Text Miner kan man jämföra information från journaler med information som används för rapportering. Därigenom kan man avgöra hur förbättrad diagnostisering och bedömning av riskfaktorer kan höja sjukhusets rankning. Framför allt leder användandet till bättre vård för patienterna.

Funktioner hos SAS Text Miner Dataåtkomst SAS Text Miner stöder flera olika filformat, bl a Adobe Portable Document Format (pdf), ASCII-text, HTML och Microsoft Word. Användare kan därför extrahera, transformera och exportera sitt data som SAS-data för text mining. Stöd för flera språk Avancerad textbearbetning finns för engelska, franska och tyska, eller för en kombination av dessa språk genom automatisk språkidentifiering. I kommande versioner av SAS Text Miner finns även textbearbetning för svenska. Flera olika metoder för textbearbetning SAS Text Miner har en omfattande mängd bearbetningsfunktioner för att hitta och destillera den viktigaste av den underliggande informationen inom dokumentsamlingen. Dessa funktioner innefattar: Anpassningsbara stopplistor innehållande termer med litet eller inget informationsvärde. Stopplistans termer som återfinns i texten kommer inte att analyseras under bearbetningsprocessen. Exempel på ord som kan förekomma på en stopplista är och, eller, men, skall, den och det. Ordstamsidentifikation för att hitta gemensamma ordstammar för t ex böjda verb såsom springa, sprang och sprungit och substantiv i singular och plural såsom apelsin och apelsiner. Ordklassidentifikation baserad på kontexten. Ordet jäst är i meningen Degen innehåller jäst identifierat som substantiv medan det i meningen Degen har jäst är identifierat som verb. Standardstopplista och användaranpassad synonymlista. Ord som lära och instruera kan anges vara synonymer till ordet undervisa. Interaktiv resultathanterare Resultathanteraren i SAS Text Miner tillhandahåller en summering av resultaten och innehåller en dokumenttabell, en tabell över termer och en tabell över kluster De interaktiva funktionerna gör det möjligt för användaren att: Sortera tabellen över termer i bokstavsordning, på antalet dokument termen förekommer i, termens viktning eller roll i texten. Filtrera en term för att visa i vilka dokument termen förekommer och i vilka kluster dessa dokument förekommer. Filtrera dokument för att visa alla termer i dokumentet och i vilket kluster dokumentet förekommer. Filtrera kluster för att visa alla dokument i det filtrerade klustret och alla termer i dessa dokument. Modifiera listan över vilka av sparade och borttagna termer som ska visas. Ange att valda termer ska behandlas som ekvivalenta. Välja hur många av de mest representativa termerna för varje kluster som ska visas. Göra om klustringen genom att använda en delmängd av dokumenten eller termerna. Figur 1: Den interaktiva resultat hanteraren i SAS Text Miner

Användarvänligt självdokumenterande gränssnitt Det grafiska användargränssnittet i Enterprise Miner (Figur 2), tar bort behovet av manuell kodning och reducerar text mining-tiden avsevärt för både affärsanalytiker och statistiker. Processflödet kan modifieras, sparas och delas med andra analytiker. Resultatet från ett processflödesdiagram kan publiceras i en koncis HTML-rapport. Tack vare integreringen av text mining i Enterprise Miner är SAS den första mjukvaruförsäljaren som erbjuder en komplett lösning för data mining där analys för både ostrukturerad och strukturerad data ingår. Figur 2: Processflödesdiagram i Enterprise Miner, där SAS Text Miner är integrerad. SAS Institute AB Stora Frösunda, SE-169 70 Solna, SWEDEN Tel +46 (0)8-52 21 70 00, fax +46 (0)8-52 21 70 70 info@swe.sas.com www.sas.com/sweden SAS Institute AB is a subsidiary of SAS Institute Inc., Cary, NC, USA. SAS and all other SAS Institute Inc. product or service names are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. indicates USA registration. Other brand and product names are trademarks of their respective companies. Copyright 2000, SAS Institute Inc. All rights reserved.