Getting Smarter and Smarter...: La semàntica visual permet un reconeixement de llocs d'alt rendiment

dijous, 28 de juny del 2018

La semàntica visual permet un reconeixement de llocs d'alt rendiment

Els investigadors de la QUT (Queensland University of Technology) han desenvolupat una nova manera perquè els robots vegin el món des d'una perspectiva més humana, que té el potencial de millorar la manera com la tecnologia (per exemple els cotxes sense conductor i els robots industrials i mòbils) operen i interactuen amb la gent.

En el que es creu que és el primer món, l'estudiant de doctorat Sourav Garg; el doctor, Niko Suenderhauf i el professor, Michael Milford de la Facultat de Ciències i Enginyeria de QUT i el centre australià de visió robòtica, han utilitzat la semàntica visual per permetre el reconeixement de llocs d'alt rendiment des de punts de vista oposats.
Els humans tenen una notable capacitat de reconèixer un lloc en tornar-hi des d'un altre accés oposat, això pels robots i vehicles de conducció autònoma és un repte a resoldre. Per exemple, si una persona condueix per una carretera i fa un gir en la direcció contrària, es té la capacitat de saber on es troba, d'acord amb aquesta experiència prèvia, perquè es reconeixen aspectes clau de l'entorn. També poden fer-ho si viatgen per la mateixa carretera a la nit, i de nou durant el dia o durant diferents temporades.
Desafortunadament, no és tan senzill per als robots. Les solucions actuals d'enginyeria, com les que utilitzen els cotxes sense conductor, confien en gran mesura en les càmeres panoràmiques o en la detecció de llum de 360 graus (LIDAR). Si bé això és efectiu, és molt diferent de com els humans naveguen de forma natural.

El professor Michael Milford va dir que el sistema proposat per l'equip d'investigadors de la QUT, va utilitzar una xarxa de segmentació semàntica d'última generació, anomenada RefineNet, capacitada en el conjunt de dades Cityscapes, per formar un descriptor d'imatges local Tensor Semàntic (LoST). Això es va utilitzar per realitzar reconeixement de llocs juntament amb tècniques de visió robòtica addicionals basades en verificacions del disseny espacial i coincidència de punts clau ponderats.

Es volia reproduir el procés que utilitzen els humans. La semàntica visual funciona, no només per detectar, sinó comprendre on hi ha objectes clau en el medi ambient, i això permet una major previsibilitat en les accions que segueixen. L'enfocament d'aquest treball, permet relacionar els llocs des dels punts de vista oposats amb poc solapament visual comú i els cicles de dia nit. s'està ampliant aquest treball per gestionar els punts de vista oposats i el canvi de punts de vista laterals, que es produeixen, per exemple, quan un vehicle canvia de carril, això afegeix un grau de dificultat addicional.

Font: Universitat de Tecnologia de Queensland

Cap comentari:

Publica un comentari a l'entrada

Aquest és un blog amb moderador dels comentaris. Per tant, no apareixen immediatament