Problemet Visualisering av stora datamängder 2003-10-09 Erik Wistrand Det finns datamängder som är extremt stora Många olika mätpunkter Många egenskaper hos varje punkt Mätning sker ofta och/eller under lång tid Hur visar man sådan data så att den blir begriplig för människan? Exempel Websidor, gener, astronomisk data, mätdata, loggar,......t ex komplett sekvensiering av jäst ca 12 Mb data http://mips.gsf.de Presentation viktig! Vad betyder det här? microarraychip Presentation - alternativ Bättre? Typiska frågor Detaljsökning hitta det bästa priset på mjölk Vilken gen triggar produktion av visst protein? Anomalier hitta alla avvikande köpmönster Trender Kommer priset på mjölk att gå upp? 1
Angreppssätt Sålla eller filtrera data så att mindre behövs visas T ex traditionell databassökning Hitta metod som använder mänsklig perception för att underlätta förståelse Visuell förmåga Dynamiska skeenden Metaforer Klassikerna Visualisering som forskningsmetod, 1700- Descartes Charles Minard Playfair... Kartor Projektioner fyller olika syften Kartor för olika syften Charles Minard Napoleons fälttåg mot Moskva Hur ser världen egentligen ut? http://www.colorado.edu/geography/gcraft/notes/mapproj/mapproj_f.html Playfair 1759-1823 Anses ha introducerat scatterplots, stapeldiagram etc etc Scatterplots London, kolera, 1854 John Snow, 1855 2
Data-ink ratio Data-Ink ratio enheter data per enheter bläck Hur mycket information kan man få in per pixel? Kan den bli bättre? Lie factor Med vilken faktor överdriven bilden? Typiska exempel Perspektiv Ytor för en-dimensionella värden Lie factor 2 27.5/18 = 1.5 ökning 50%...men uppmätt längd är ca: 5.3/0.6 = 8.8 ökning 780% 780 / 50 lögnfaktor ca 15! Skräckexempel Innehåller bara fem 2D-punkter! Exempel på datatyper Text Stora textmassor, böcker, narrativer, web,... Hierarkisk data Organisationer, web, programkod, filsystem,... Mätvärden Bioinformatik, miljödata,... Kika gärna i Metro för fler exempel ;) 3
Textvisualisering Text - TextArc Visa texten själv Hela texten måste få plats Visa textens interna struktur Visa sökresultat Kan visa bara index Vill kunna söka vidare www.textarc.org Textvisualisering - web TG GoogleBrowser Trädstrukturer vanliga Listor vanligare :) Hierarkiska metoder Många datamängder är av hierakisk natur; web, programkod, filsystem etc Hyperbolic trees Bra på att visa grafer med många noder Cone trees Använder 3D för att visa grafer TreeMaps Använder 2D-yta effektivt TreeMaps TreeMaps filsystem Fyller en yta helt med en trädstruktur www.win.tue.nl/sequoiaview/ 4
Hyperbolic trees browser Graf som ligger på hyperbolisk yta, sedd uppifrån Xerox PARC Demo Sequoiaview Cone Trees Använder 3D för att layouta trädgrafer Fokus + kontext-metoder Behåll sammanhanget, men visa delar i detalj! Magic lenses Xerox PARC Fisheye views Bell labs ImageTrees wistrand Flip zoom Viktoria Magic Lenses http://www2.parc.com/istl/projects/magiclenses/ Demo Magic Lenses 5
Fisheye views Mer trädvisualisering processberoenden Förstorar data i närheten av fokus Förstoring kan t ex vara geometrisk...eller fungera som urvalsmekanism OSGi är ett javaos som låter flera applicationer köra samtidigt, ungefär som vanliga OS-processer Applikationer kan ha beroende mellan varandra. appplikation webserver log Programkod Furmas - 86 Manifest-Version = 1.0 Bundle-ContactAddress = wistrand Export-Service = Bundle-Description = HTTP root servlet Import-Package = javax.servlet.http,org.knopflerfish.service.log,org.osgi.framework,org.osgi.servi ce.http Built-From = E:\work\knopflerfish.org\osgi\bundles\http\httproot > 0 active System Bundle 5 active cm resolved cm_api active cm_cmd 2 18 16 resolved cm_util 6 active console 3 resolved console_api 8 active consoletty 12 active desktop 9 active frameworkcommands 13 active http 14 active httproot 15 resolved jaxp 7 resolved jsdk 4 active log 1 resolved log_api 10 active logcommands 11 active useradmin_api 17 resolved util Scatterplots FilmFinder Ahlberg, Schneiderman Använder viss del av data som 2D-koordinater Andra delar kan användas för färgning, storlek etc för n-dimensionell presentation Exempel FilmFinder Periodic System Spotfire Spotfire dynamic queries Parallella koordinater Inselberg Scatterplots, diagram + frågedon tight coupling mellan visualisering och frågedon http://www.cs.umd.edu/hcil/spotfire/ Platta ut koordinataxlarna z (1,3,2) x y x y z 6
Parallella koordinater Vanliga problem Olika metoder löser olika problem: Sökning? Presentation Browsing?... Olika metoder förvanskar data scatterplot överlapp 3D projektionsproblem... Prestandaproblem Datorer är snabba, men svårt att rita snabbt ändå Informative Art Andra syften än omedelbar förståelse kan vara intressanta! Väderkarta...eller var en tidtabell? Lästips E. Tufte The Visual Display of Quantitative Information Gallery of Data Visualization http://www.math.yorku.ca/scs/gallery/ University of Maryland Human-Computer Interaction Lab, Visualization research http://www.cs.umd.edu/hcil/research/visualization.shtml http://www.viktoria.se/fal/exhibitions/infoart-s2001/index.html 7