Avocation d’apprentissage en renforcement profond avec Nethack avec Tim Rocktäschel

Aujourd’hui, nous sommes rejoints par Tim Rocktäschel, chercheur à Facebook AI Research et professeur agrégé à University College London (UCL). Le travail de Tim se concentre sur la formation des agents RL dans des environnements simulés, dans le but que ces agents puissent se généraliser à de nouvelles situations. En règle générale, cela se fait dans des environnements comme Openai Gym, MuJuco ou même en utilisant des jeux Atari, mais ceux-ci sont tous livrés avec des contraintes. Dans l’approche de Tim, il utilise un jeu appelé Nethack, qui est beaucoup plus riche et complexe que les environnements susmentionnés. Dans notre conversation avec Tim, nous explorons les tenants et aboutissants de l’utilisation de Nethack comme environnement de formation, y compris le contrôle d’un utilisateur lors de la génération de chaque jeu individuel et des défis auxquels il a été confronté lors du déploiement des agents. Nous discutons également de son travail sur MiniHack, un cadre de création d’environnement et une suite de tâches basées sur Nethack et des orientations futures pour cette recherche.