Kontekstbaseret annoncering

5 usædvanlige anvendelser af computervision

Grafik over anvendelser inden for computervision
GumGum-teamet
GumGum-teamet
10 min
Udgivet:
16. august 2020
Del

Som navnet antyder, beskriver computer vision en digital enheds evne til at indsamle visuelle data – fotos, videoer og endda live-optagelser – og derefter faktisk forstå dem. I dag anvendes computer vision i den virkelige verden til alt fra organisering af fotobiblioteker og halvautonome biler til analyse af sponsorlogoer i sportsvideoer og kvalitetskontrol på samlebåndene i fabrikker, der producerer siliciumchips.


Men mulighederne for, hvad computervision kan udrette, er uendelige, og mange mindre kendte innovationer er i øjeblikket under udvikling eller er endda allerede i brug i den virkelige verden. Her er blot et par eksempler:


Se, mor, helt uden kamera: 3D-kortlægning


Den næste generation af smartphones, der er baseret på teknologier som Google Tango, vil i stigende grad være udstyret med 3D-sensorer, der gør det muligt for dem at identificere, måle og oprette 3D-kort over omverdenen. Det er en ny funktion, som startup-virksomheden Fantasmo fra Santa Monica udnytter til at skabe en platform baseret på crowdsourcet 3D-kortlægning af rumlige data. Oplysningerne kan gemmes i skyen og derefter bruges til alt fra at hjælpe nye husejere med at se, hvordan møblerne vil se ud i deres nye hjem, til at give udviklerne af Pokémon Go mulighed for at skabe augmented reality (AR)-indhold, der bygger på en faktisk forståelse i realtid af verden omkring spilleren. Kombinerer man imidlertid Project Tangos teknologi med et live-kamera, vil spillet forvandle hele rummet med miljøspecifikke overlejringer og forskellige Pokémon, der reagerer på det pågældende miljø i realtid.


For Fantasmo ligger værdien ikke i selve 3D-scanningen, men i platformen med crowdsource-kortlagte 3D-rum, der indsamles, og muligheden for at styre denne platform. »Vi vil være den kanal, som disse data løber igennem,« sagde Fantasmos CEO Jameson Detweiler under en demonstration på LDV Vision Summit, hvor Fantasmo vandt start-up-konkurrencen. »Målet her er en model af verden, der konstant opdateres, hvor vi aktivt sporer hver enkelt person og derefter sender disse data tilbage til en spilmotor eller hvad man nu ellers ønsker at bruge. Det er bogstaveligt talt sådan, man forener den digitale verden med den fysiske verden. Det er AR-overfladen.«


Patologernes lille hjælper: Diagnose ved hjælp af øjne, ansigter og røntgenbilleder


I modsætning til, hvad mange tror, er maskinbaserede diagnoser ikke egentlig tænkt som en erstatning for læger eller andet sundhedspersonale, men snarere som et supplement til deres kompetencer. En gennemsnitlig patolog gennemgår for eksempel omkring 500 objektglas, hvor hvert enkelt indeholder titusinder til hundreder af tusinder af individuelle celler. Alle disse celler skal undersøges grundigt, hvilket er praktisk talt umuligt for et enkelt menneske.


Det er her, at AI baseret på computervision – som kan håndtere enorme mængder billeder, forudsat at den leder efter specifikke ting – ændrer spillereglerne. Undersøgelser foretaget af PathAI, der udvikler og træner computervisionsmodeller for at hjælpe patologer med at stille bedre diagnoser, viste, at nøjagtigheden ved biopsier af lymfeknuder i forbindelse med brystkræft steg fra 85 procent til 99,5 procent, når man sammenlignede tilgange, der udelukkende var baseret på menneskelig vurdering, med tilgange, hvor computeren blev inddraget.


PathAI’s maskinlæringssystem fremhæver i det væsentlige de områder, hvor det identificerer kræft på de omkring 500 præparater. »Og nu består en patologs opgave egentlig i at korrigere eller bekræfte den diagnose, som AI-systemet har stillet, og derefter gå videre til det næste tilfælde,« sagde PathAI’s medstifter og administrerende direktør på det nyligt afholdte LDV Vision Summit. »Det er en markant hurtigere procedure.«


Lastbiler, droner og både: Alt andet bliver også autonomt


De fleste af dagens nyheder inden for transportområdet fokuserer på selvkørende biler rettet mod forbrugerne, som bruger en kombination af kameraer, sensorer, LiDAR og radar til at »se«, hvad der befinder sig på vejen foran og omkring dem, men der lægges lige så meget vægt på forskning og udvikling af optimerede computervisionsfunktioner i selvkørende lastbiler, skibe og endda racerbiler.


Nogle eksperter mener, at selvkørende lastbiler vil være klar til bred anvendelse, før det samme gælder for selvkørende personbiler. I fremtiden vil vi se flåder af ulykkesfrie, selvkørende, elektriske lastbiler, der kan køre døgnet rundt uden afbrydelser – måske med ekstra høj hastighed – og levere frugt og grønt eller pakker – eller, hvad der er endnu vigtigere, 2.000 kasser øl – på tværs af landet på et par dage. I mellemtiden testes der allerede selvkørende både i Boston Harbor af startup-virksomheden Sea Machines, som arbejder på selvstyringssystemer til alle former for fartøjer, fra brandbåde til fragtskibe. Kunne dette betyde enden på olieudslip?


Men det handler ikke kun om det praktiske. Også inden for sportsunderholdning går udviklingen i retning af autonomi. Start-up-virksomheden Roborace og Formel E (konkurrencepræget elbilracing) går sammen om at udvikle selvkørende racerbiler, der ikke blot kan køre 199 miles i timen, men også rent faktisk kan lære på banen – jo mere den ligner en forhindringsbane, desto bedre – hvilket mildt sagt gør potentialet for at slå rekorder eksponentielt.


Maskiner med tusind ansigter: Computervision, der gennemskuer dig fuldstændigt


AI mangler måske empati, sociale kompetencer og følelsesmæssig intelligens, men nogle af de opgaver, som ansigtsgenkendelsesnetværk for nylig er blevet trænet til at udføre, giver mulighed for nogle grundlæggende og specifikke forudsigelser af følelser. Disney har for eksempel udviklet et netværk, der kan afgøre, hvordan publikum forholder sig til en film på 10 minutter eller mindre, blot ved at se på billeder af deres ansigter. Ved hjælp af fire infrarøde kameraer, der var rettet mod biografgæsternes ansigter i en biograf med 400 pladser, registrerede Disneys forskere omkring 16 millioner ansigtsudtryk i løbet af 150 filmvisninger.


Ved hjælp af en teknologi kaldet »factorized variational auto-encoders« (FVAE) foretager Disneys program beregninger ud fra, om en person f.eks. griner eller ser bange ud på de rigtige steder, hvilket derefter kan bruges til alt fra testvisninger til anbefalingssystemer på Disneys kommende Netflix-lignende streamingtjeneste.


For ikke at stå tilbage i kapløbet om rudimentær følelsesmæssig intelligens hos maskiner er det andet store, typisk amerikanske brand, Walmart, i gang med at udvikle en ansigtsgenkendelsesteknologi, der analyserer kundernes humør via kameraer ved kassekøerne. Hvis en kunde er irriteret, fordi kasseassistenten er for langsom, vil systemet via ansigtsgenkendelse registrere denne uro og straks underrette andre medarbejdere, så de kan komme og hjælpe.


Men hvorfor nøjes med menneskers læsefærdigheder? Dyr har også ansigter, og derfor har britiske forskere trænet et neuralt netværk på 500 billeder af får, der har ondt, og får, der har det helt fint. Ved at fokusere på afslørende »smerte«-tegn, såsom ører, der er bøjet fremad, og sammenknebne øjne, har »Sheep Pain Facial Expression Scale« lært at forudsige, om et får har ondt, blot ved at se på et billede af dets ansigt.


Det »gode« syn på Terminator: Wearables, der virkelig virker


Selvom Google Glass måske ikke formåede at vinde massernes hjerter, er drømmen om AR-baserede wearables ikke forsvundet. Der går endda rygter om, at Apple arbejder på et par AR-briller. Foreløbig tilbyder virksomheder som Vuzix smarte briller med AR-lignende lag, der hjælper traktorførere med at arbejde mere effektivt og sikkert, mens Orcam tilbyder briller, der kan læse tekst og endda genkende ansigter for synshandicappede ved hjælp af computervision. Begge disse modeller er foreløbig lidt klodsede, men det er kun et spørgsmål om tid, før optikvirksomheder som Warby Parker og lignende tilbyder lignende bærbare enheder, der ligner almindelige briller. Og selvfølgelig kan kontaktlinser meget vel komme til at tilbyde disse augmented reality-lignende oplevelser.


I fremtiden vil muligheden for at have en dynamisk skærm, der reagerer på ens omgivelser, åbne op for virkelig overmenneskelige evner. Her er muligheden for at hente information frem eller analysere det, man ser – hvilken type bil, træ, bygning eller kunstværk der befinder sig foran en – tele- eller mikroskopisk forstørrelse af det, man ser, samt genafspilning af begivenheder fra øjeblikke, dage eller år tilbage. Og lad os ikke glemme, at augmented reality ikke kun handler om seje overlejringer på et live kamerabillede. Det betyder også, at f.eks. realtids-varmekort, der skabes af termiske kameraer – som allerede findes på mange smartphones og bærbare kameraer – snart også kan finde vej ind i wearables.


Illustrationer af Andrew Colin Beck

Indsigt, forskning og praktisk tænkning.