voir-mur-technologie

La vision aux rayons X a longtemps semblé être un fantasme de science-fiction, mais au cours de la dernière décennie, une équipe dirigée par le professeur Dina Katabi du Laboratoire d’informatique et d’intelligence artificielle (CSAIL) du MIT nous a continuellement rapprochés de cette possibilité. Leur dernier projet, «RF-Pose», utilise l’intelligence artificielle (IA) pour enseigner aux appareils sans fil à détecter les postures et les mouvements des personnes, même de l’autre côté d’un mur.

Un réseau de neurones

Les chercheurs utilisent un réseau de neurones pour analyser les signaux radio qui rebondissent sur le corps des personnes, et peuvent ensuite créer une figure dynamique qui marche, s’arrête, s’assoit et bouge ses membres pendant que la personne effectue ces actions.

L’équipe affirme que ce système pourrait être utilisé pour surveiller des maladies comme la maladie de Parkinson et la sclérose en plaques (SEP), permettant une meilleure compréhension de la progression de la maladie et permettant aux médecins d’ajuster les médicaments en conséquence. Cela pourrait également aider les personnes âgées à vivre de façon plus autonome, tout en offrant une sécurité accrue en matière de surveillance des chutes, des blessures et des changements dans les habitudes d’activité.

Pour les soins de santé

L’équipe travaille actuellement avec des médecins pour explorer de multiples applications dans les soins de santé. «Nous avons constaté que le suivi de la vitesse de la marche des patients et leur capacité à effectuer eux-mêmes des activités de base donnent aux professionnels de la santé, une fenêtre sur leur vie; ce qui pourrait être d’une grande utilité pour toute une gamme de maladies», explique Katabi qui a coécrit un nouveau document sur ce projet. « Un avantage clé de notre approche est que les patients n’ont pas besoin de porter des capteurs ou de recharger leurs appareils. »

Outre les soins de santé, l’équipe affirme que RF-Pose pourrait également être utilisé pour de nouvelles classes de jeux vidéo où les joueurs se déplaceraient dans la maison, ou même dans des missions de recherche et de sauvetage pour aider à localiser les survivants.

«Tout comme les téléphones cellulaires et les routeurs Wi-Fi sont devenus des éléments essentiels des foyers d’aujourd’hui, je crois que les technologies sans fil de ce type aideront à alimenter les foyers de demain», explique Katabi, qui a coécrit ces nouveaux résultats avec plusieurs autres auteurs. Ils présenteront leur découverte un peu plus tard ce mois-ci lors de la conférence sur la vision par ordinateur et la reconnaissance des formes (CVPR) à Salt Lake City, dans l’Utah.

Des défis que les scientifiques ont dû relever

Un défi que les chercheurs ont dû relever est que la plupart des réseaux de neurones sont formés en utilisant des données étiquetées à la main. Un réseau de neurones formé pour identifier les chats, par exemple, exige que les gens regardent un grand ensemble de données d’images et étiquètent chacun comme «chat» ou «pas chat». Les signaux radio, quant à eux, ne peuvent pas être facilement étiquetés par les humains. Pour résoudre ce problème, les chercheurs ont recueilli des exemples en utilisant à la fois leur appareil sans fil et un appareil photo. Ils ont rassemblé des milliers d’images de gens qui faisaient des activités comme marcher, parler, s’asseoir, ouvrir des portes et attendre un ascenseur.

Ils ont ensuite utilisé ces images de la caméra pour extraire les figures en bâton, qu’ils ont montrées au réseau de neurones avec le signal radio correspondant. Cette combinaison d’exemples a permis au système d’apprendre l’association entre le signal radio et les chiffres de bâton des personnes dans la scène. Après la formation, RF-Pose à pu estimer la posture et les mouvements d’une personne sans caméras, en utilisant seulement les réflexions sans fil qui rebondissent sur le corps des gens.

Un système qui a étonné les chercheurs

Comme les caméras ne peuvent pas voir à travers les murs, le réseau n’a jamais été explicitement formé aux données de l’autre côté d’un mur – ce qui a étonné l’équipe du MIT parce que le réseau a pu généraliser ses connaissances pour pouvoir gérer les mouvements à travers du mur. «Si vous considérez ce système de vision par ordinateur comme un enseignant, c’est un exemple vraiment fascinant d’un étudiant qui surclasse l’enseignant», explique Torralba.

Outre la détection du mouvement, les auteurs ont également montré qu’ils pouvaient utiliser les signaux sans fil pour identifier avec précision une personne dans 83% des cas sur une liste de 100 personnes. Cette capacité pourrait être particulièrement utile pour l’application des opérations de recherche et de sauvetage, lorsqu’il faut connaître l’identité de certaines personnes.

En 3D pour plus de précisions

Pour ce document, le modèle produit un chiffre en bâtons à deux dimensions, mais l’équipe travaille également à créer des représentations en trois dimensions qui pourraient refléter des micro-mouvements encore plus petits. Par exemple, il pourrait être en mesure de voir si les mains d’une personne âgée tremblent suffisamment pour demander un examen médical. «En utilisant cette combinaison de données visuelles et d’I.A. pour voir à travers les murs, nous pouvons avoir une meilleure compréhension des scènes et des environnements pour mener une vie plus sûre et plus productive dans plusieurs cas», conclu Zhao.

Source : Massachusetts Institute of Technology, CSAIL.