Appliquer RL à la robotique du monde réel avec Abhishek Gupta
Aujourd’hui, nous sommes rejoints par Abhishek Gupta, un doctorat. Étudiant à UC Berkeley.
Abhishek, membre du Bair Lab, nous a rejoints pour parler de sa récente recherche et intérêts de recherche et d’intérêts d’apprentissage par renforcement, qui se concentrent sur l’application de RL aux applications de robotique réelle. Nous explorons le concept de supervision des récompenses et comment amener les robots à apprendre ces fonctions de récompense des vidéos, et la raison d’être des experts supervisés dans ces expériences.
Nous discutons également de l’utilisation de la simulation pour les expériences, de la collecte de données et du chemin de l’apprentissage robotique évolutif. Enfin, nous discutons de la chirurgie du gradient par rapport à la traîneau de gradient, et de son article écologique RL, qui se concentre sur les « phénomènes qui existent dans le monde réel » et comment les humains et les systèmes de robotique interfacent dans ces situations.
