Prduktöversikt Blware SOFTWARE CORPORATION http://www.sftbl.cm
1 Nyttan med Blware Blware är specialiserat på att ge snabb återsökning, analys (textmining) samt beräkning i stra infrmatinsmängder med mmentan uppdatering av index. Blware indexerar exempelvis textdata, numerisk data, RTF dkument, PDF dkument, Markup Language data (HTML, XML ch VML) etc. sm lagrats i recrdfiler eller i en relatinsdatabas (RDBMS) ch används för att på ett effektivt sätt söka fram relevant infrmatin ur hetergena datakällr. Blware, sm är ett verktyg, kan mycket enkelt integreras i befintliga ch nya tillämpningar med hjälp av våra standardiserade gränssnitt vilket medför betydligt krtare utvecklingstider genm att mycket funktinalitet redan finns färdigt. Genm enkla inställningsmöjligheter anpassar man verktyget till tillämpningen, ch inte tvärt m. Verktyget kan med fördel användas av företag i såväl interna sm externa tillämpningar, där man har någt eller några av följande krav i sin tillämpning: krav på blesk sökning (FIND/AND/OR/NOT/XOR) krav på utökad sökfunktinalitet (närrdssökning, fnetisk sökning, synnymsökning, tesaurussökning, mönsterigenkänning/mönstermatchning mm.) krav på direktuppdatering krav på hög prestanda krav på skalbarhet (kstnadseffektiv infrmatinshantering) krav på att kunna klassificera infrmatinen (autmatisk kategrisering baserat på mönster) Fördelar är bland annat: Mycket snabb återsökning med unik indexeringsteknlgi Direktuppdaterande index alltid synkrniserat med datakällan! Relevans ch precisin bl.a. genm utökad sökfunktinalitet ch kmbinatiner av dessa Ord, sträng, numerisk, fritext (med eller utan jker -tecken) Närrdssökning, fnetisk sökning, SET sökning Grundfrmning (Stemming) Synnymer, tesaurus, stpp-rd Samsökning i flera databastabeller Mönsterigenkänning, mönstermatchning Rankning (förekmst, frekvens samt pängsättning - scring ) Viktning (vid sökning ch pängsättning scring ) Srtering Statistik, beräkning ch enklare multidimentinell analys Skalbarhet (mjukvarumässig) API för utvecklare (funktinsbaserat, XML,.NET, JAVA, COM, PHP)
2 Exempel på tillämpningsmråden. Exempel 1 (Elektrnisk handel): Ett exempel där systemet passar mycket bra är i en e- handelslösning där man kan använda systemets förmåga att hitta infrmatin, trts felstavningar ch mkastade bkstäver, med hjälp av specifika inbyggda sökfunktiner sm hanterar synnymer, tesaurus ch undantag vid sökning. Exempel 2 (Katalgsökning): Ett annat lämpligt användningsmråde är att använda systemet för sökning i katalginfrmatin sm exempelvis gula/vita sidrna, prduktinfrmatin etc. där systemets inbyggda funktiner för att ranka ch srtera framsökta resultat på ett snabbt ch effektivt gör helhetsupplevelsen för en slutanvändare mycket psitiv. Exempel 3 (Matchning): Ett ytterligare exempel på lämpligt användningsmråde är att använda systemet, för att på ett snabbt ch effektivt sätt, matcha, tvätta, rganisatins/persnnummersätta data med hjälp av systemets inbyggda ch effektiva funktiner för framsökning, ranking ch pängsättning (scring). Exempel 4 (Finansiell företags- ch adressinfrmatin): Tänk dig att blixtsnabbt kunna söka fram ett företag inm en viss regin, strlek, msättning etc. ch därefter på ett par sekunder kunna analysera (mönstermatcha) framsökt företags blagsrdning/verksamhetsbeskrivning mt hundratusentals- eller miljntals andra företag i systemet ch få ett resultat presenterat i likhetsrdning. Man kan även utföra statistik samt egna beräkningar på numerisk infrmatin i databasen. Exempel 5 (Läkemedelsinfrmatin, biverkningsrapprter etc.): Att från en framsökt biverkningsrapprt inm en viss kategri på ett par sekunder kunna analysera (mönstermatcha) denna biverkningsrapprt mt hundratusentals- eller miljntals andra i databasen ch få resultatet srterat i likhetsrdning. Exempel 6 (Tidningsartiklar/Pressreleaser etc.):ett annat exempel är att man, genm systemets mönsterigenkännings- ch mönstermatchningsmekanismer, hittar liknande artiklar i en tidningsdatabas ch/eller att man använder systemet för att kategrisera nya artiklar sm läggs in i databasen. Exempel 7 (Brttsinfrmatin):Ett ytterligare exempel då systemets mönsterigenkännings- ch mönstermatchningsmekanismer kan utnyttjas är, då man gjrt en persnprfil av ett kriminellt beteende ch vill kunna matcha denna mt en databas med lagrade uppgifter m kriminella persner för att få fram de prfiler sm mest liknar denna.
3 Uppbyggnad Blware Blware kan sägas bestå av tre delar; Blware Manager, Blware Clients, Blware Index Server. Blware Index Server kpplas till den befintliga datakällan med hjälp av ett administrativt prgram, Blware Manager, där samtliga i systemet ingående datakällr (recrdfiler, filsystem ch databaser) kpplas ihp med Blware Index Server för indexering. Psterna i de berörda datakällrna delas in i tabeller ch klumner för att passa sökning ch presentatin. Blware Index Server tillvaratar befintliga datamdeller, ch man har sedan möjlighet att fininställa sökningen på klumnnivå (fält) med hjälp av Blware Manager. För att erhålla en effektiv sökning, skapas Blware Index, vilka innehåller samtliga söktermer ch referenser till alla de i respektive datakälla lagrade psterna. Innehållet i Blware Index återspeglar därmed vid varje ögnblick aktuell infrmatin, lagrad i respektive datakälla. Det nrmala förfarandet är, att datakällan används för att utföra uppdateringar; tillägg, ändringar ch brttag, medan Blware Index Server används för sökningar. Alla uppdateringar sm görs i datakällan kmmer autmatiskt ch mmentant att uppdatera Blware Index. Detta innebär, att uppdaterade pster är medelbart sökbara på den nya infrmatinen. Blware är ett verktyg, vilket levereras i frm av flertal APIer vilka användaren kan använda för att skriva egna applikatiner eller integrera funktinaliteten i en befintlig applikatin. För att testa systemet tillhandahåller Blware en demnstratinsapplikatin, vilken visar Blwares funktinalitet samt ckså kan användas för vissa prestandatester. Nedan visas en schematisk skiss av systemet:
4 Funktinalitetslista 1. Hantering av datakälla via Blware Manager ch Blware Index Server 1.1 Kppling till datakällr (RDBMS, recrdfiler, filsystem) 1.2 Laddning av index samt möjlighet att i Blware lagra klumndata 1.3 Fininställning av sökning per Blware Index 1.4 Optimering av Blware Index (Rerganisatin mm.) 1.5 Validering av Blware Index 1.6 Uppdatering av Blware Index 1.7 Autmatkategrisering (klassificering av data) baserat på mönster i textdata 1.8 Språk/teckenhantering (på klumnnivå) samt stöd för UNICODE 2. Sökning 2.1 Blesk sökning (FIND/AND/OR/NOT/XOR) 2.2 Viktad sökning (söktermer åsätts lika vikter vid sökning) 2.3 Samsökning mellan klumner/tabeller samt RELATE sökning (JOIN via tabellrelatiner) 2.4 Fnetisk sökning (flera lika algritmer finns att välja på klumnnivå) 2.5 Synnymer, stpp-rd, tesaurus samt grundfrmning hanteras vid sökning 2.6 Numerisk sökning 2.7 Intervallsökning 2.8 Strukturerad sökning 2.9 Fritext sökning 2.10 Trunkeringar (höger, vänster samt mitt i (? används för ett tecken, * för flera tecken i rad)) 2.11 Närrdssökning 2.12 Likhetssökning 2.12.1 Analys ch sökning utförs baserat på mönster i textdata 2.12.1 Analys ch sökning utförs baserat på mönster i numeriskt data 2.13 SET sökning 3. Rankning 3.1 Rankning avseende antal förekmmande söktermer samt frekvens av antal förekmmande söktermer 3.2 Srtering avseende innehåll i klumner (stigande/fallande) 3.3 Viktad rankning avseende antal förekmmande viktade söktermer samt 3.4 Viktad rankning avseende frekvens av antal förekmmande viktade söktermer 3.5 Pängsättning (scring) av framsökta pster 4. Statistik & beräkning 4.1 Statistik på numeriskt innehåll (summa, genmsnitt, varians, avvikelse, median, kvartiler etc.) 4.2 Beräkning på ch mellan klumndata med numeriskt innehåll samt multidimentinell analys. 5. Presentatin av resultat 5.1 Angivet antal tecken från specificerade klumner 5.2 Hela raden (psten) 5.3 Översändning av Identifikatinsbegrepp (1 för varje pst)
5 Plattfrmar Aktuella Operativsystem (Blware Index Server): Windws (7/2008 server eller senare) Linux (RHEL 6 eller senare) Datakällr: MS SQL Server 2008 eller senare DB2 UDB 9 eller senare Oracle 10 eller senare Sybase ASE 15 eller senare MySQL 5 eller senare PstgreSQL 9 eller senare Recrdfiler (en fil i CSV-frmat per tabell) Filsystemsfiler (dvs. innehållet i lika filer i, det för systemet synliga, filsystemet. Ex. Wrd, Excel, PDF etc.) Stöd för andra perativsystem/datakällr kan utvecklas på beställning i prjekt.