Page 1. Innehåll. Datorseendebaserade gränssnitt: Bakgrund. Datorseende - Bildanalys. Datorseendebaserade gränssnitt



Relevanta dokument
Metoder för rörelsemätning, en översikt.

Mekaniska metoder för att mäta objekt och/eller rörelser kan bestå av:

Texturerade 3D-modeller

Kungliga Tekniska Högskolan (KTH) Programutvecklingsprojekt (2D1954) Systembeskrivning för projektgrupp Gestmenyer

Interaktion 2 STYRDON, PEKDON OCH ANNAN INTERAKTION ATT RÄKNA MED

Introduktion till fotogrammetrin

Innehåll. Styrdon (ej i boken) Fitts lag (sidan ) Natural user interfaces. Kap 6.2.9, , Kap

Nya Medier. Gränssnitt, Interaktivitet och Digital kod

Bildskärmar och synergonomi

TBSK 03 Teknik för Advancerade Datorspel

Kort introduktion till POV-Ray, del 1

Grundläggande teori för användargränssnitt,del 2

Från Smart TV till Smartare upplevelse Av: Kim Huber och Connie Huanca

Lektion 1: Möt Robo! Områden: Robotteknik, ingenjörsteknik mekanisk design

När kroppen talar. Hur du kan tolka andra människors kroppsspråk och bli en KÄNSLOLÄSARE. Communication & Performance Development

PC-KAMERA BRUKSANVISNING

För smartare belysning

Signal och bildbehandling SBB

Introduktion till fotogrammetrin

Interaktionsdesign, grundkurs INTERAKTION 1

Dags för ett nytt grepp på skrivbordet.

ett visualiseringskluster i mellannorrland

Testa din förmåga att röra en kroppsdel och hålla andra helt stilla. Sätt score för varje del: 0=Klarar; 1=Klarar inte.

Arbetet började med en ganska rejäl research och uppräkning av situationer, användare och kvaliteter.

Torbjörn Westin, Spacemetric AB Simon Ahlberg, FORAN Remote Sensing AB

Anvisningar för passfoto

Dental digital röntgenteknik Vad ska vi tänka på?

Anvisningar för ansiktsfoton som skickas in elektroniskt

Falcon III. AOI system för 2D och 3D inspektion för komponenter på fixtur eller på palett

Biomekanik. Biomekanik är mekanik, tillämpat på biologiska system.

behövs för enhetlighet, tala samma språk, så att användaren kan lära sig och använda det vidare.

COGAIN. Network of Excellence on Communication by Gaze Interaction. DART, Sweden

TSBK 10 Teknik för avancerade datorspel Fö 9: Nätverk, Peter Johansson, ISY

MIC Series 550 Tålig pan-tilt-zoom-kamera för utomhusbruk

QosmioEngine För avancerad video

När du går runt i utställningarna kommer du att se några personer som jobbar på museet, nämligen våra värdar.

Boken. OBS! Konkret interaktion är inte bokens starka sida. OBS! Jag har skrivit fel kapitel i kursprogrammet Uppdaterad version kommer.

Information till media

Grafiska pipelinen. Edvin Fischer

Spelutveckling - Gameplay. Design och produktion

Din manual ARCHOS 604 WIFI

Innehåll INNEHÅLL. Teckenförklaring Komma igång

Att göra spel med Game Maker. Rum. Grundläggande delar. Gamemaker, dagens föreläsning. Programmeringsmodell

MätKart Kvalitet i mätning med God mätsed

Kardinal Synd Umeå - Inspelningsinstruktioner -

Nya Medier. Gränssnitt, Interaktivitet och Digital kod

Visuell GUI Testning

Spel som interaktiva berättelser

Uppsala Universitet Instutionen för pedagogik, didaktik och utbildningsstudier Matematik 2, Ht 2014 Tilde Henriksson, Hannah Kling, Linn Kristell

Nu lanserar vi AutoDome Easy Den perfekta lösningen för mellanstora miljöer

SV Förenade i mångfalden SV. Ändringsförslag. Beatrix von Storch för EFDD-gruppen

Kristian Pettersson Feb 2016

UltraView IP-systemkameror

XS4 2.0 RE-VOLUTION XS4 MINI. LIMITED EDITION PRINT

Bruksanvisning. Bestic software version Äthjälpmedel. Internet:

Bättre ljus i bilderna. Ytterligare inställningar för en digital systemkamera

Teknisk / Audiologisk Information. FREE VC och FREE VC Open FREE Exclusive och FREE Exclusive Open

Sinnena den mänskliga hårdvaran

Smart Belysning. Hur vi påverkas och hur vi kan använda det

Utveckling av Läsaren

Retuschering inkl Skönhetsretusch. Kalle Prorok Okt 2010

Att orientera i den närliggande natur- och utemiljön med hjälp av kartor, såväl med som utan digitala verktyg. Kartors uppbyggnad och symboler.

Examensarbete i datalogi: Aktivt seende system för gestigenkänning (Active vision system for gesture recognition) -

Optik 2018 Laborationsinstruktioner Våglära och optik FAFF30+40

Dokumenteringar av mätningar med TLC (Thermocrome liquid crystals)

Vad utmärker ett bra användargränssnitt?

Sju riktlinjer vid utveckling av hemsidor för mobil och desktop

Linköping Universitet. Den sociala humanoiden Kismet

Kroppsspråk och röst. Ickeverbal kommunikation introduktion. Fredrik Reinfeldt. Vad är ickeverbal kommunikation? Ickeverbal kommunikation några frågor

Utvärdering av gränssnitt särskilt befintliga. Hur utvecklar man användbara system? Användbarhet handlar om kvalitet

Optik. Läran om ljuset

Inred med. Ett naturligt LED i utvecklingen.

Riktiga experter på värmekamerateknik. Patrik Svensson

SMD084 lp människa/datorinteraktion. Del II Programmeringens matematiska grunder. Del I - Lektionsplanering. Del II Lektionsplanering

Ögonskador. Distriktsveterinärerna tipsar

MyTobii P10. Lathund kring de vanligaste funktionerna i själva styrsystemet i ögonstyrningsutrustningen P10 från MyTobii. Habilitering & Hjälpmedel

Fotorealism, animering, SW resurser

BARNS SPRÅKUTVECKLING

Föreläsning 7, Interak2on

TBSK 03 Teknik för Advancerade Datorspel

CCAW1427-LPI. Huvudfunktionerna omfattar: Högupplöst dag/nattkamera med autofokus och 960H-teknik CCAW1427-LPI

Du ser exakt vilka lönearter som förekommer i ditt företag (dessa kan man utforma helt efter företagets förhållanden)

Menyer, formulär och dialogrutor

Att synliggöra det väsentliga

FaceMouse Artikelnummer:

Målvaktsträning Bas 1 för zon och föreningspaket

Uppgift. Laboration. Sidan 1 av 7

Detaljmonteringsanvisning 371 Sågtorp

Design av användargränssnitt. Vad behöver man veta? Generella designprinciper. Vad är ett användargränssnitt? Några egenskaper hos människan

SÄKERHET FLIR THERMAL FENCE. Detekterar. Verifierar. Reagerar. Omedelbart.

Vågfysik. Geometrisk optik. Knight Kap 23. Ljus. Newton (~1660): ljus är partiklar ( corpuscles ) ljus (skugga) vs. vattenvågor (diffraktion)

Tentamen i Robotteknik MPR160 och MPR210, 14 januari 1998

MIC7000-lampa. Video MIC7000-lampa. Kombinerad infraröd och Vitt ljus-lysdiodbaserad belysning

Pressmeddelande. Hög hastighet, stort intryck Canon ger dig prestanda och stil med den nya IXUS 300 HS

Nationella prov i verkligheten

Matematik inom tekniksektorn Adam Andersson, MY-dagen 2016

Grundläggande teori för användargränssnitt,del 2. Innehåll. Innehåll. Interaktionsmodeller (Interaction types, kap 2.5)

Bildpresentation Kameran i kameraenheten ger en högupplöst bild av besökaren på den flata 3,5 tum stora bildskärmen..

Sakernas internet. (Internet of Things)

Kristian Almgren Artificiell Intelligens Linköpings Universitet Talstyrning

Transkript:

Innehåll Datorseendebaserade människa-datorgränssnitt Exempel på tillämpningar och tekniker Lars Bretzner Centre for User Oriented IT Design (CID) och Computational Vision and Active Perception Lab (CVAP) NADA/KTH Bakgrund, introduktion Datorseendebaserade gränssnitt: Helkroppsposer och rörelser Handgester Datorseendebaserade gränssnitt: Bakgrund Bygger på datoriserad analys av bilder från en eller flera kameror som filmar användaren Har blivit en intressant möjlighet p.g.a. Framsteg inom datoriserad bildanalys Snabbare (och billigare) datorer Billigare (och fler) kameror av bra kvalitet Datorseendebaserade gränssnitt Fördelar: Användaren behöver ingen utrustning för interaktion Billigt ofta standardkameror Flexibilitet samma kamera,olika interaktionssätt Nackdelar: Komplicerad teknik, i de flesta fall är tekniken ej ännu mogen för marknaden Datorseende - Bildanalys Automatisk tolkning av bilder, t.ex igenkänning av föremål, människor eller händelser, för bl.a navigering, övervakning, medicinska tillämpningar, fjärranalys (satellit o flygfoto), MMI, bildsökning, robotar etc. Aktivt forskningsområde sedan 1960-70 Stort uppsving under senare delen av 90-talet och framåt pga allt snabbare datorer Page 1

Varför är det svårt? Datorseende - Bildanalys Bildinnehållet (pixlarna) bestäms av en mängd parametrar: 3D-formen hos föremålen, materialegenskaper, belysning (frekvens, placering), atmosfär, kamerans placering, optik, bildsensor etc etc. Stor datamängd att hantera: >100000 pixlar=bytes per färgkanal (R,G,B) i varje bild, ofta 10-60 bilder/sekund Datorseende - Bildanalys Hur representera/modellera världen för att hantera alla tänkbara situationer...? Tills vidare: Begränsa problemdomänen t.ex Kontrollerade belysningsförhållanden Kända avstånd kamera-scen Enkla scener Fåtal objekt/händelser att känna igen... Helkroppsposer och -rörelser Detektion av stora kroppsdelar och/eller deras rörelser, typiskt armar, ben, torso och huvud. Helkroppsrörelser Enklast: Hitta stora rörelser i hela bilden, kombinera med enkla antaganden om kroppsposition. Exempel på tillämpningar: Övervakning Navigering i VR-miljöer Spel Exempel: Ghost in the Cave, TMH, KTH Helkroppsrörelser Detektion av stora rörelser kan även kombineras med hudfärgsdetektion och borttagning av statisk bakgrund. Exempel: Sony Eye Toy till Playstation 2 Helkroppsposer och -rörelser För att bestämma kroppsposen kan enkel 3Dmodell av kroppen (torso,huvud,armar,ben) matchas mot bilddata. Med två kameror fås djupinformation i scenen. Smart visuell feedback: användaren inuti spelet Ex. MIT AI lab Page 2

Helkroppsposer och -rörelser Kroppsposerna i 3D kan användas för interaktion, t.ex navigering i VR-miljö. Ex. MIT AI lab Fördelar: - Bättre noggrannhet i rörelsedetektion - Kroppsposer möjliggör rikare interaktion Helkroppsposer och -rörelser Endast en kamera: Kroppsposer och rörelser i 3D betydligt svårare. Ingen djupinfo och ofta skymda kroppsdelar gör att gissningar om posen ofta måste göras baserade på statistik från vanliga kroppsrörelser. Nackdelar: - Komplexa beräkningar ty många frihetgrader - Känsligt för belysning, klädsel, bakgrund - Kräver två eller flera kameror Ex. CVAP/NADA/KTH Mätning av huvudposition samt orientering och/eller blickvektor. Exempel på tillämpningar: Uppmärksamhetsmätningar - Intresseområden i bilder, på websidor etc. - Attentive interfaces (uppmärksamhetskänsliga) Trötthetsmätningar Dialogsystem - Ja-nickar/Nej-skakningar - Turtagning Relativt gammalt område, många kommersiella system. En eller flera kameror. Ofta IR-belysning och kamerafilter för att minimera känsligheten för yttre ljusförhållanden. Ex. Smart Eye AB Teknik I: 1. Hitta ansiktet i bilden. 2. Hitta detaljer, särdrag, i ansiktet (ögon, ögonvrå, mungipor..). 3. Anpassa 3D-modell av huvudet till bildpunkterna -> huvudposition och orientering 4. Hitta iris, pupiller, ögonlock -> blickvektor Teknik I, prestanda: Två eller flera kameror med VGA upplösning, Huvudorientering ca 1 grad, Blickvektor ca 3-5 grader ~ 5-8 cm på 1 m. Fördelar: - Både huvudpose och blickvektor. - Stora huvud- och ögonrörelser möjliga. Nackdelar: - Problem med glasögon och vissa ansiktstyper. - Otillräcklig blicknoggrannhet för vissa tillämpningar. Page 3

Teknik II: 1. Hitta ögonen (pupillerna) i bilden med IR-reflexer från ögonbotten. 2. Hitta glintar, dvs reflexer i hornhinnan från IRljuskällor. 3. Beräkna ögonlobens 3D-position från glintarna. 4. Ögonlob+pupillposition -> blickvektor Exempel: Uppmärksamhetsmätning, fixeringar Ex. Tobii AB Exempel: Attentive interfaces forts, svara i telefonen Teknik II, prestanda: Blickvektor ca 1 grad ~ 1.5-2 cm på 1 m. Fördelar: - Tillräcklig noggrannhet för de flesta fall. - Okänslig för olika ansiktstyper. Nackdelar: - Glintberoende: Endast mindre ögonrörelser möjliga i normalfallet. - Mäter ej huvudpose. Exempel: Attentive interfaces, gränssnitt som reagerar då de blir betraktade. Ex. Queen s Univ. : Övrigt Läpprörelser för förbättrad talförståelse, även datortalpedagog Ansiktsigenkänning kommersiella produkter för säkerhetstillämpningar och underhållning (t.ex i Sonys robothundar) Ansiktsuttryck känslogränssnitt, s.k. affective interfaces, enkel variant i Logitechs webcam, snart även i 3G-mobiler Ex. Queen s Univ. Ex. OKI, Japan Page 4

Handgester Medvetna handgester för kontroll av och/eller kommunikation med datoriserad utrustning. Varför handgester? Vi är vana att använda händerna för interaktion Många naturliga gester, t.ex. pekgester Hög rörlighet ger flexibilitet Möjligt att detektera utan behov av datormöss, handskar etc. Exempel på gester: Handgester - Gester som direkt identifierar en intresseregion (t.ex pekgester), eller som specificerar ett kvantitativt värde. - Gester som ges betydelsen av kontrollkommandon. - Kombinationer. Tillämpningsområden: Kontroll och instruktioner av mekaniska system, robotar. Komplettera/ersätt datormöss och mekaniska tangentbord i lämpliga situationer. Interaktion med visualiseringssystem och virtuella miljöer som CAD-miljöer och datorspel. Kontrollera hemelektronik, t.ex som fjärrkontroll för TV och video, ljusdimmer etc.... Handgester Färgsegmentering: Hudfärg relativt väldefinierad i färgrymden Handmodell: Särdragsextraktion Blob- och åsdetektion med automatiskt skalval: Exempel Särdragsextraktion: Hörn, linjer, blobbar, åsar på olika skalor 3D-Geometri: 3D-rörelse från särdragens rörelse över tiden Formmodellering: Kombinera särdragen för att representera form Formigenkänning: Finn den mest sannolika modellen och positionen De 20 starkaste blob- och ås-svaren Handmodell: Särdragshierarki över multipla skalor Handdetektion: Matcha model mot data med partikelfilter Hierarki av stabila, dominerande särdrag (handflata, fingrar, fingertoppar) Modelltillstånd X=(x,y,s,α,l,x,y,α ) (position,skala,orientering,pose,dynamiska parametrar) Hypotesfördelning över tiden Page 5

Kombination av färg och forminformation Exempel DrawBoard: Handposer styr ritprogram Partikelfilter hittar de modellparametrar har högst sannolikhet Ex. CVAP/NADA/KTH Problem/frågeställningar Detektion: Handen generellt svår att modellera, många frihetsgrader, hög deformerbarhet. Vyoberoende? Personberoende variationer i gesters utseende. Komplexa scener; mycket rörelse, mycket bildinformation. Varierande belysningsförhållanden. Realtidskrav. Exempel: Kontroll av hemelektronik TV och belysning styrs med handposer. >>>>Vilka gester går att detektera i vilka situationer? Interaktion: >>>>Vilka gester är bekväma att använda i vilka situationer? >>>>Vilka gester är lätta att komma ihåg? Ex. CID/NADA/KTH Handposer Kombination av gester och menyer för multifunktionskontroll Enbart handposer ger begränsad skalbarhet, en stor mängd handposer skulle med stor sannolikhet innebära: Detektionsproblem Svårigheter att utföra Svårigheter att komma ihåg...etc. Ex. CID/NADA/KTH Page 6

Marking- och Flow-menyer för gestgränsnitt Pekgester för informationsåtkomst -En kombination av rörelser upp/ner/vänster/höger bestämmer menyvalet -Kan memoreras, endast två poser behövs! Enkel formbaserad detektion av fingertoppar mot statisk bakgrund. Traditionell marking menu Pekgester för åtkomst av informationslager över valfritt objekt. Skapar interaktiva ytor utan behov av elektriska installationer. Flow menu -mindre rörelser, återvänder till ursprungspositionen Möjlighet i ömtåliga miljöer och platser utsatta för hårt slitage och vandalism. Ex. CID/NADA/KTH Projektor-kamerasystem för virtuella pekskärmar Projektor-kamerasystem för virtuella pekskärmar Exempel: IBM styrbart projektor-kamerasystem Användaren interagerar med projektionen via t.ex. pekgester. I princip kan vilken plan yta som helst utnyttjas. Intressant alternativ till pekskärmar i känsliga miljöer och platser med hårt slitage och/eller risk för vandalisering. Visuell feedback ökar transparensen, användaren förstår bättre vad som händer och kan korrigera fel. Ex. CID/NADA/KTH Stor flexibilitet. Detektionsproblem när användaren skymmer projektor/kamera, och vid stora vinklar. Projektor-kamerasystem för virtuella pekskärmar Exempel: CLIPS/IMAG/INRIA Datorseendebaserade gränssnitt: Kort sammanfattning Relativt ny teknik med uppsving under senaste åren. Fördelar: Ingen speciell utrustning för interaktion, bara egna kroppen. Billigt. Flexibelt. Stor potential. Nackdelar: Komplicerad, generellt ej mogen teknik. Känslig för belysning, bakgrund, avstånd m.m. Page 7

Datorseendebaserade gränssnitt: Kort sammanfattning Helkropp: 3D svårt, speciellt med bara en kamera. Enklare tekniker baserade på rörelse mot statisk bakgrund. Få kommersiella produkter. : Etablerade tekniker, många kommersiella produkter för uppmärksamhetsmätningar, de flesta med IR. Handgester: 3D svårt ty många frihetsgrader. Ofta vyberoende tekniker med fåtal handposer inkl. pekgester. Ännu inga kommersiella produkter(?), men på gång. Visuell feedback ofta bra sätt att öka transparensen, kan visa relationer användare-objekt, användaren kan lättare lära sig gränssnittet. Page 8