les-neurones-dopaminergiques-répondent-de-façon-différentes
Les développements de l’intelligence artificielle s’inspirent souvent de la façon dont les humains pensent, mais maintenant l’IA a changé la donne pour nous apprendre comment nos cerveaux apprennent.

Une IA nous indique comment nos cerveaux apprennent

Will Dabney, de la société de technologie DeepMind et ses collègues ont découvert qu’un récent développement de l’apprentissage machine appelé apprentissage par renforcement fournit une nouvelle explication du fonctionnement des voies de récompense dans le cerveau.
Ces voies régissent notre réponse aux événements agréables et sont médiatisées par les neurones qui libèrent de la dopamine, une substance chimique du cerveau. « La dopamine dans le cerveau est une sorte de signal surprise », dit Dabney. « Quand les choses se passent mieux que prévu, plus de dopamine est libérée. »
On pensait auparavant que ces neurones dopaminergiques répondaient tous de la même façon.  » Un peu comme une chorale, mais où tout le monde chante exactement la même note », dit Dabney. Mais l’équipe a découvert que les neurones dopaminergiques individuels semblent en fait varier – chacun est accordé à un niveau différent d’optimisme ou de pessimisme.
« Ils finissent tous par émettre des signaux à différents niveaux de surprise », dit Dabney. « Plutôt comme une chorale qui chante des notes différentes, s’harmonisant ensemble. »

L’apprentissage par renforcement

Cette découverte s’est inspirée d’un processus connu sous le nom d’apprentissage par renforcement, qui est l’une des techniques que l’IA a utilisées pour maîtriser des jeux tels que Go et Starcraft II.
Dans sa forme la plus simple, l’apprentissage par renforcement est l’idée qu’une récompense renforce le comportement qui a mené à son acquisition. Il nécessite une compréhension de la façon dont une action actuelle mène à une future récompense.
Auparavant, les modèles d’apprentissage par renforcement en IA et en neurosciences mettaient l’accent sur l’apprentissage de la prédiction d’une récompense future « moyenne ». « Mais cela ne reflète pas la réalité telle que nous la vivons », dit Dabney. « Par exemple, lorsqu’une personne joue à la loterie elle s’attend à gagner ou à perdre, mais elle ne s’attend pas à ce que ce résultat soit moyen. », dit-il.
Lorsque l’avenir est incertain, les résultats possibles peuvent plutôt être représentés sous forme de distribution de probabilité : certains sont positifs, d’autres négatifs. Les IA qui utilisent les algorithmes d’apprentissage du renforcement sont capables de prédire tout l’éventail des récompenses possibles.

Un test pour vérifier les voies de récompense de la dopamine 

Pour vérifier si les voies de récompense de la dopamine dans le cerveau fonctionnent également par le biais d’une distribution, l’équipe a enregistré les réponses des neurones dopaminergiques individuels chez la souris. Les souris ont été entraînées à effectuer une tâche et ont reçu des récompenses de tailles variables et imprévisibles.
Les chercheurs ont constaté que différentes cellules qui produisent de la dopamine montraient de manière fiable différents niveaux de surprise. « Associer des récompenses à certains stimuli ou actions est d’une importance capitale pour la survie », explique Raul Vicente, de l’Université de Tartu, en Estonie. « Le cerveau ne peut pas se permettre de jeter de précieuses informations sans les récompenses. »
« À grande échelle, cette étude est conforme à l’opinion actuelle selon laquelle pour fonctionner efficacement, le cerveau doit représenter non seulement la valeur moyenne d’une variable, mais aussi la fréquence à laquelle une variable prend des valeurs différentes », explique M. Vicente. « C’est un bel exemple de la façon dont les algorithmes de calcul peuvent nous guider dans ce qu’il faut rechercher dans les réponses neurales. »

Poursuivre les recherches

Toutefois, ajoute M. Vicente, il faut poursuivre les recherches pour démontrer si ces résultats s’appliquent à d’autres espèces ou régions du cerveau.
Cette recherche a été publiée dans Nature.
Source : New Scientist
Crédit photo : Pixabay