répérer-un-objet-dans-un-fouillis
Une nouvelle technique mise au point par le MIT permet aux robots d’identifier rapidement les objets cachés dans un nuage de données tridimensionnelles, rappelant la façon dont certaines personnes peuvent interpréter une image «Magic Eye» à motifs denses si elles l’observent correctement.

Identifier très rapidement un objet dans un nuage de données

Les robots «voient» généralement leur environnement à l’aide de capteurs qui collectent et traduisent une scène visuelle en une matrice de points. Pensez au monde de «La matrice», sauf que les 1 et les 0 vus par le personnage fictif Neo sont remplacés par des points dont les motifs et les densités décrivent les objets d’une scène particulière.
Les techniques classiques qui tentent de sélectionner des objets dans de tels nuages ​​de points ou de nuages ​​de points peuvent le faire avec une rapidité ou très bonne précision, mais pas avec les deux.
Avec leur nouvelle technique, les chercheurs disent qu’un robot peut sélectionner avec précision un objet, tel qu’un petit animal, qui serait autrement obscurci dans un nuage dense de points, en quelques secondes à compter de la réception des données visuelles.
Selon l’équipe, cette technique peut être utilisée pour améliorer de nombreuses situations dans lesquelles la perception de la machine doit être à la fois rapide et précise, notamment des voitures autonomes et des assistants robotiques dans une usine et dans une maison.
«Ce qui est étonnant dans ce travail, c’est que si je vous demande de trouver un lapin dans ce nuage de milliers de points, vous ne pourrez le faire», déclare Luca Carlone, professeur adjoint d’aéronautique et d’astronautique et membre du laboratoire du MIT pour les systèmes d’information et de décision (LIDS). «Mais notre algorithme est capable de voir l’objet à travers tout ce fouillis. Nous atteignons donc un niveau de performance surhumain quant à la localisation d’objets.”
Carlone et l’étudiant diplômé Heng Yang présenteront les détails de cette technique plus tard ce mois-ci à la conférence Robotics: Science and Systems en Allemagne.

Échouer sans le savoir

Les robots tentent actuellement d’identifier des objets dans un nuage de points en le comparant à un modèle – une représentation 3D à points d’un objet, tel qu’un lapin – avec une représentation en nuage de points du monde réel pouvant contenir cet objet. Le modèle contient des «caractéristiques» ou des ensembles de points indiquant les courbures ou les angles caractéristiques de cet objet, tels que l’oreille ou la queue du lapin.
Les algorithmes existants extraient d’abord des caractéristiques similaires du nuage de points de la vie réelle, puis tentent de les faire correspondre aux caractéristiques du modèle, puis les font pivoter et les alignent sur le modèle pour déterminer si le nuage de points contient l’objet en question.
Toutefois, les données du nuage de points qui parviennent au capteur d’un robot incluent souvent des erreurs, sous la forme de points mal positionnés ou mal espacés, ce qui peut perturber le processus d’extraction et de correspondance des caractéristiques. En conséquence, les robots peuvent créer un grand nombre d’associations fausses, ou ce que les chercheurs appellent des « valeurs aberrantes » entre des nuages ​​de points, et finalement mal identifier des objets ou les manquer complètement.
Carlone explique que des algorithmes à la pointe de la technologie permettent de filtrer les mauvaises associations une fois que les fonctionnalités ont été comparées, mais en « temps exponentiel », ce qui signifie que même un groupe d’ordinateurs très puissants, passant au crible des données de nuage de points avec des algorithmes existants, ne serait pas en mesure de résoudre un problème dans un délai raisonnable.
Ces techniques, bien que précises, ne sont pas pratiques pour analyser des jeux de données plus grands et réels, contenant des nuages ​​de points denses. D’autres algorithmes qui sont capables d’identifier rapidement des entités et des associations le font à la hâte, ce qui crée un grand nombre de valeurs aberrantes ou d’erreurs de détection, sans se rendre compte de ces erreurs.
«C’est dangereux si cela est utilisé par une voiture autonome, ou sur toute application critique pour la sécurité», déclare Carlone. « Ne pas savoir que vous échouez est la pire chose qu’un algorithme puisse faire. »

Un «temps polynomial»

Au lieu de cela, Yang et Carlone ont mis au point une technique d’élagage des valeurs aberrantes en «temps polynomial», ce qui signifie qu’elle peut le faire rapidement, même pour des nuages ​​de points de plus en plus denses. Cette technique peut ainsi identifier rapidement et avec précision des objets cachés dans des scènes congestionner de points.
Les chercheurs ont d’abord utilisé des techniques classiques pour extraire les caractéristiques d’un objet d’un nuage de points. Ils ont ensuite développé un processus en trois étapes pour faire correspondre la taille, la position et l’orientation de l’objet dans un nuage de points avec l’objet, tout en identifiant simultanément les associations de fonctionnalités bonnes à mauvaises.
L’équipe a développé un algorithme de «schéma de vote adaptatif» pour élaguer les valeurs éloignées et faire correspondre la taille et la position d’un objet. Pour la taille, l’algorithme établit des associations entre les caractéristiques du modèle et du nuage de points, puis compare la distance relative entre les entités d’un modèle et les entités correspondantes du nuage de points. Si, par exemple, la distance entre deux entités dans le nuage de points est cinq fois supérieure à celle des points correspondants dans le modèle, l’algorithme attribue un «vote» à l’hypothèse selon laquelle l’objet est cinq fois plus grand que l’objet.
L’algorithme le fait pour chaque association de fonctionnalités. Ensuite, l’algorithme sélectionne les associations qui tombent sous l’hypothèse de la taille avec le plus grand nombre de votes et identifie celles-ci comme étant les bonnes associations, tout en éliminant les autres. De cette manière, cette technique révèle simultanément les bonnes associations et la taille relative de l’objet représenté par ces associations. Le même processus est utilisé pour déterminer la position de l’objet.

Un algorithme distinct pour la rotation

Les chercheurs ont développé un algorithme distinct pour la rotation, qui détermine l’orientation du modèle dans un espace tridimensionnel. Faire cela est une tâche de calcul incroyablement délicate. Imaginez que vous teniez une tasse et que vous tentiez de l’incliner de manière à associer une image floue de quelque chose qui pourrait être la même tasse. Vous pouvez incliner cette tasse dans un certain nombre d’angles et chacun de ces angles a une certaine probabilité de correspondre à l’image floue.
Les techniques existantes traitent ce problème en considérant chaque inclinaison ou rotation possible de l’objet comme un «coût» – plus le coût est bas, plus il est probable que cette rotation crée une correspondance précise entre les caractéristiques. Chaque rotation et les coûts associés sont représentés sur une carte topographique composée de plusieurs collines et vallées, avec des altitudes plus basses associées à des coûts plus bas.
Mais Carlone dit que cela peut facilement confondre un algorithme, en particulier s’il existe plusieurs vallées et qu’aucun point le plus bas discernable ne représente la vraie correspondance entre une rotation particulière d’un objet et l’objet dans un nuage de points. Au lieu de cela, l’équipe a développé un algorithme de «relaxation convexe» qui simplifie la carte topographique, avec une seule vallée représentant la bonne rotation. De cette manière, l’algorithme est capable d’identifier rapidement la rotation qui définit l’orientation de l’objet dans le nuage de points.
Grâce à leur approche, l’équipe a pu identifier rapidement et avec précision trois objets différents – un lapin, un dragon et un Bouddha – cachés dans des nuages ​​de points de densité croissante. Ils ont également pu identifier des objets dans des scènes de la vie réelle, y compris un salon, dans lequel l’algorithme a rapidement été en mesure de repérer une boîte de céréales et un chapeau de baseball.

Une approche qui pourrait améliorer la précision des voitures autonomes

Carlone explique que, comme cette approche peut fonctionner en «temps polynomial», elle peut donc facilement être utilisée pour analyser des nuages ​​de points même très denses, ressemblant par exemple à la complexité des données des capteurs pour les voitures autonome.
«Nous espérons avoir un impact sur la navigation, la fabrication en collaboration, les robots domestiques, la recherche et le sauvetage et les voitures autonomes», a déclaré Carlone.
Cette recherche a été financée en partie par le laboratoire de recherche de l’Armée de terre, l’Office of Naval Research et le programme de recherche Google Daydream.
Source : MIT
Crédit photo : Pexel (montage)

Repérer des objets dans un fouillismartinMIT
Une nouvelle technique mise au point par le MIT permet aux robots d'identifier rapidement les objets cachés dans un nuage de données tridimensionnelles, rappelant la façon dont certaines personnes peuvent interpréter une image «Magic Eye» à motifs denses si elles l'observent correctement. Identifier très rapidement un objet dans un nuage...