Faire avancer la modélisation de la locomotion

Faire avancer la modélisation de la locomotion
Photo EPFL

Des scientifiques de l’EPFL ont développé un système de réseau neuronal pouvant à la fois permettre de mieux comprendre la manière dont les animaux adaptent leurs mouvements aux changements de leur propre corps et créer des systèmes d’intelligence artificielle plus puissants.

L’apprentissage profond a été alimenté par des réseaux neuronaux artificiels, qui empilent des éléments de calcul simples les uns sur les autres, pour créer des systèmes d’apprentissage puissants. S’ils disposent de suffisamment de données, ces systèmes peuvent résoudre des tâches difficiles telles que reconnaître des objets, vaincre des champions au jeu de go et piloter des robots. «Comme vous pouvez l’imaginer, la manière dont vous empilez ces éléments les uns sur les autres peut influencer la quantité de données que vous devez apprendre et les performances maximales que vous pouvez atteindre», déclare Alexander Mathis, professeur assistant au sein de la Faculté des sciences de la vie de l’EPFL.

En collaboration avec les doctorants Alberto Chiappa et Alessandro Marin Vargas, le scientifique a mis au point une nouvelle architecture réseau appelée DMAP (Distributed Morphological Attention Policy). Elle intègre les principes fondamentaux du contrôle sensorimoteur biologique, ce qui en fait un outil intéressant pour étudier la fonction sensorimotrice.

Le problème que la DMAP tente de résoudre est le suivant: les animaux, mais aussi les êtres humains, ont évolué pour s’adapter aux changements à la fois de leur environnement et de leur propre corps. Par exemple, un enfant est capable de s'adapter à l'évolution des différentes parties de son corps au fil du temps afin de continuer à marcher avec adresse, et ce sur différents types de surfaces. Lors du développement de la DMAP, l’équipe s’est penchée sur la façon dont un animal peut apprendre à marcher lorsque son corps est soumis à ces «perturbations morphologiques» – des changements de longueur et d’épaisseur des parties du corps.

«Dans l’apprentissage par renforcement, les réseaux neuronaux dits entièrement connectés sont utilisés pour apprendre des facultés motrices», explique Alexander Mathis. L’apprentissage par renforcement est une méthode de formation par apprentissage machine qui «récompense» les comportements souhaités et/ou «pénalise» les comportements non souhaités.

Il poursuit: «Imaginez que vous ayez des capteurs qui évaluent la configuration de votre corps, par exemple les angles de votre poignet, de votre coude ou de votre épaule. Les signaux de ces capteurs représentent l’entrée du système moteur. La sortie représente les activations musculaires, qui génèrent des couples. Si l’on utilise des réseaux entièrement connectés, alors, par exemple, tous les capteurs du corps sont intégrés dans la première couche. En revanche, en biologie, les informations sensorielles sont combinées de manière hiérarchique.»

«Nous avons repris les principes des neurosciences et les avons appliqués à un réseau neuronal pour concevoir un meilleur système sensorimoteur», explique Alberto Chiappa. Dans leur article, publié lors de la 36e conférence annuelle sur les systèmes de traitement de l’information neuronale (NeurIPS), les chercheurs présentent la DMAP qui «combine un traitement proprioceptif indépendant, une méthode de répartition avec des contrôleurs individuels pour chaque articulation, et un mécanisme d’attention, afin de transmettre de manière dynamique les informations sensorielles de différentes parties du corps à différents contrôleurs».

La DMAP a pu apprendre à «marcher» avec un corps soumis à des perturbations morphologiques, sans recevoir d’informations sur les paramètres morphologiques tels que les longueurs et largeurs spécifiques des membres. Le modèle peut «marcher» aussi bien qu’un système ayant accès à ces paramètres corporels.

«Nous avons donc créé un système d’apprentissage par renforcement grâce à nos connaissances en anatomie», précise Alberto Chiappa. «Après avoir entraîné ce modèle, nous avons remarqué qu’il présentait un déclenchement dynamique rappelant ce qui se passe dans la moelle épinière mais, curieusement, ce comportement est apparu spontanément.»

Globalement, les modèles tels que la DMAP remplissent deux rôles: développer de meilleurs systèmes d’intelligence artificielle basés sur des connaissances biologiques et, inversement, créer de meilleurs modèles pour mieux comprendre le cerveau.

NeurIPS est l’une des principales conférences sur l’apprentissage machine. De nombreux autres laboratoires de l’EPFL y présentent leurs derniers travaux.

Références
Alberto Silvio Chiappa, Alessandro Marin Vargas, Alexander Mathis. DMAP: a Distributed Morphological Attention Policy for Learning to Locomote with a Changing Body. NeurIPS Décembre 2022. DOI: 10.48550/arXiv.2209.14218

Communiqué Nik Papageorgiou, de l'EPFL