Apprentissage du renforcement pour l’IA industriel avec Pieter Abbeel

Aujourd’hui, nous sommes rejoints par Pieter Abbeel, professeur à l’UC Berkeley, codirecteur du Berkeley AI Research Lab (Bair), ainsi que le co-fondateur et scientifique en chef de Covariant.
Dans notre conversation avec Pieter, nous couvrons une tonne de terrain, en commençant par les objectifs et les tâches spécifiques de son travail chez Covariant, le changement dans les besoins de l’application et des robots de l’IA industrielle, si son expérience de résolution de problèmes du monde réel a changé son opinion à bout en bout, et la portée des trois domaines problématiques des modèles qu’il construit.
Nous explorons également ses travaux récents à l’intersection de l’apprentissage non supervisé et de renforcement, RL dirigé par des objectifs, son récent article « Transformers pré-entraînés comme moteurs de calcul universels« Et où se dirige ce fil de recherche, et bien sûr, son nouveau cerveau de robot de podcast, que vous pouvez trouver sur toutes les plateformes de streaming aujourd’hui!