Direction scientifique
Transfert de connaissances vers l'industrie

Nos Thèses par thème

Apprentissage par renforcement inverse d'une tâche effectuée par un humain

DPLOIRE (CTReg)

Autre

01-01-2019

SL-DRT-19-0262

laurent.dolle@cea.fr

L'apprentissage par démonstration consiste à permettre à un agent (ex. un robot) d'apprendre une tâche par l'observation d'un autre agent (ex. un humain) réalisant cette même tâche. Les méthodes d'apprentissage par renforcement sont souvent utilisées dans ce cadre afin d'améliorer la capacité du robot à réaliser une tâche dans de nouvelles situations, mais elles nécessitent de définir une fonction de récompense qui renforcera les actions permettant d'atteindre l'objectif. Si cette fonction est délicate à concevoir lorsque la tâche est complexe, il est possible de l'apprendre à partir d'une série d'exemples par des méthodes dites d'apprentissage par renforcement inverse. L'utilisation, conjointe ou non, de ces techniques a montré des premiers résultats encourageants, mais qui sont limités à des exemples jouets et ne peuvent être adaptés tels quels à des tâches plus représentatives du milieu industriel. Au cours de la thèse, l'étudiant analysera et testera des travaux précédents à l'état de l'art. Il proposera alors une méthode, en combinant l'apprentissage par renforcement inverse à d'autres algorithmes (ex. generative adversarial networks, GAN), afin que le robot comprenne la tâche accomplie par l'opérateur (avec un minimum d'information de l'a part de l'opérateur), et généralisera suffisamment pour rendre le robot robuste à un environnement dynamique (obstacles, objets en mouvement ...). Cette méthode devrait être adaptée pour une tâche de « pick and place » dans un environnement industriel et assurer une période d'apprentissage raisonnable (information a priori, retour d'expérience de l'opérateur) pour des tâches de complexité moyenne.

Voir toutes nos offres