Morel: Apprentissage de renforcement hors ligne basé sur un modèle avec Aravind Rajeswaran

 Morel: Apprentissage de renforcement hors ligne basé sur un modèle avec Aravind Rajeswaran


Aujourd’hui, nous terminons notre série Neirips rejointe par Aravind Rajeswaran, un doctorant en apprentissage automatique et en robotique à l’Université de Washington. Chez Nerips, Aravind a présenté son article « Morel: apprentissage de renforcement hors ligne basé sur un modèle« Dans notre conversation, nous explorons l’apprentissage par renforcement basé sur des modèles et si les modèles sont une » condition préalable « pour réaliser quelque chose d’analogue pour transférer l’apprentissage. Nous fouillons également dans Morel et les progrès récents dans l’apprentissage du renforcement hors ligne, les différences dans le développement de modèles de morel et de modèles RL traditionnels, et les résultats théoriques qu’ils voient à partir de cette recherche.



Source link

Related post