Cette IA peut lire vos pensées et parler à votre place

, , biothechnologie https://farm8.staticflickr.com/7882/46209044704_b98a8e4022_b.jpg https://farm8.staticflickr.com/7882/46209044704_b98a8e4022_b.jpg Technologie Média 0 https://technologiemedia.net/2019/01/30/cette-ia-peut-lire-vos-pensees-et-parler-a-votre-place/#respond
973

synthèse-vocale-ai-un-appareil

Dans une première scientifique, les neuroingénieurs de Columbia ont créé un système qui traduit la pensée en un discours intelligible et reconnaissable. En surveillant l’activité cérébrale d’une personne, cette technologie peut reconstruire les mots qu’une personne entend avec une clarté sans précédent.

Un système qui traduit les signaux du cerveau en mots

Cette percée, qui exploite le pouvoir des synthétiseurs de parole et de l’intelligence artificielle, pourrait donner aux ordinateurs de nouveaux moyens de communiquer directement avec le cerveau. Il jette également les bases pour aider les personnes incapables de parler, telles que les personnes atteintes de sclérose latérale amyotrophique (SLA) ou en convalescence, de retrouver leur capacité de communiquer avec le monde extérieur.

«Nos voix nous aident à nous connecter à nos amis, à notre famille et au monde qui nous entoure. C’est pourquoi perdre le pouvoir de la parole en raison d’une blessure ou d’une maladie est si dévastateur», a déclaré Nima Mesgarani, PhD, auteure principale de cette recherche et chercheuse principale.

«Avec l’étude d’aujourd’hui, nous avons un moyen potentiel de rétablir ce pouvoir. Nous avons montré qu’avec une technologie appropriée, les idées de ces personnes pouvaient être décodées et comprises par un auditeur. »

Des décennies de recherche ont montré que lorsque les gens parlent – ou imaginent même parler – des schémas d’activité révélateurs apparaissent dans leur cerveau. Des schémas de signaux distincts (mais reconnaissables) apparaissent également lorsque nous écoutons quelqu’un parler ou imaginons qu’il écoute.

Les experts, essayant d’enregistrer et de décoder ces modèles, voient un avenir dans lequel les pensées ne doivent pas rester cachées dans le cerveau – mais pourraient plutôt être traduites en langage verbal à volonté. Mais accomplir cet exploit s’est révélé difficile.

Les premières tentatives ne ressemblaient pas à un discours intelligible

Les premiers efforts de décodage des signaux cérébraux déployés par le Dr Mesgarani et d’autres se sont concentrés sur de simples modèles informatiques analysant les spectrogrammes – qui sont des représentations visuelles des fréquences sonores.

Mais comme cette approche n’a produit aucun résultat qui ressemble à un discours intelligible, le Dr Mesgarani et son équipe, y compris le premier auteur, Hassan Akbari, se sont tournés vers un vocodeur, un algorithme informatique qui peut synthétiser le discours après avoir été formé à l’enregistrement de personnes qui parlent.

« Il s’agit de la même technologie utilisée par Amazon Echo et Apple Siri pour donner des réponses verbales à nos questions », a déclaré le Dr Mesgarani, également professeur agrégé de génie électrique à Columbia Engineering.

Pour enseigner au vocodeur à interpréter l’activité cérébrale, le Dr Mesgarani s’est associé au docteur Ashesh Dinesh Mehta, PhD, neurochirurgien du Neuroscience Institute of Northwell Health Physician Partners et coauteur de l’article. Le Dr Mehta traite des patients atteints d’épilepsie, dont certains doivent subir des interventions chirurgicales régulières.

«En collaboration avec le Dr Mehta, nous avons demandé à des patients atteints d’épilepsie qui subissent déjà une opération du cerveau d’écouter des phrases prononcées par différentes personnes, tout en mesurant les schémas de l’activité cérébrale», a déclaré le Dr Mesgarani. « Ces modèles de neurones ont formé le vocodeur. »

Ensuite, les chercheurs ont demandé à ces mêmes patients d’écouter des orateurs récitants des chiffres compris entre 0 et 9, tout en enregistrant des signaux cérébraux pouvant ensuite être transmis au vocodeur. Le son produit par le vocodeur en réponse à ces signaux a été analysé et nettoyé par des réseaux de neurones – un type d’intelligence artificielle imitant la structure des neurones dans le cerveau biologique.

Les gens pouvaient comprendre 75% du temps

Le résultat final était une voix à la sonorité robotique récitant une séquence de nombres. Pour vérifier l’exactitude de l’enregistrement, le Dr Mesgarani et son équipe ont chargé des personnes d’écouter l’enregistrement et de rendre compte de ce qu’elles avaient entendu.

«Nous avons constaté que les gens pouvaient comprendre et répéter les sons environ 75% du temps, ce qui est bien au-delà des tentatives précédentes», a déclaré le Dr Mesgarani. L’amélioration de l’intelligibilité était particulièrement évidente lorsque l’on comparait les nouveaux enregistrements aux tentatives précédentes, basées sur un spectrogramme.

«Le vocodeur et les puissants réseaux neuronaux représentaient les sons que les patients avaient initialement écoutés avec une précision surprenante.» Le Dr Mesgarani et son équipe prévoient ensuite de tester des mots et des phrases plus complexes, ainsi que les mêmes tests sur les signaux cérébraux émis lorsqu’une personne parle ou imagine de parler.

En faire un implant pour les patients atteints d’épilepsie

En fin de compte, ils espèrent que leur système pourrait faire partie d’un implant, semblable à celui de certains patients atteints d’épilepsie, qui traduirait les pensées du porteur directement en mots. « Dans ce scénario, si le porteur pense » J’ai besoin d’un verre d’eau « , notre système pourrait prendre les signaux cérébraux générés par cette pensée et les transformer en discours verbal synthétisé », a déclaré le Dr Mesgarani.

Se reconnecter au monde qui nous entoure

«Cela changerait la donne. Cela donnerait à toute personne ayant perdu la capacité de parler, que ce soit à la suite d’une blessure ou d’une maladie, la chance de se reconnecter au monde qui l’entoure.  »

Ces résultats ont été publiés dans Scientific Reports.

Source : Columbia University
Crédit photo sur Unsplash :  Janko Ferlič

https://farm8.staticflickr.com/7882/46209044704_b98a8e4022_b.jpg