Tendances de l’IA 2024: apprentissage du renforcement à l’ère des LLM avec Kamyar Azizzadenesheli

Aujourd’hui, nous sommes rejoints par Kamyar Azizzadeshesheli, chercheur d’état-major chez NVIDIA, pour poursuivre nos Trends 2024 Trends 2024. Dans notre conversation, Kamyar nous met à jour sur les derniers développements de l’apprentissage par renforcement (RL), et comment la communauté RL profite des capacités de raisonnement abstrait des modèles de grande langue (LLM). Kamyar partage ses idées sur la façon dont les LLM font avancer les performances de RL dans une variété d’applications, comme Aloha, un robot qui peut apprendre à plier les vêtements, et Voyager, un agent RL qui utilise GPT-4 pour surpasser les systèmes antérieurs à jouer à Minecraft. Nous explorons également les progrès réalisés dans l’évaluation et la lutte contre les risques de prise de décision basée sur la RL dans des domaines tels que la finance, les soins de santé et l’agriculture. Enfin, nous discutons de l’avenir de l’apprentissage en renforcement profond, des principales prédictions de Kamyar pour le domaine et de la façon dont des capacités de calcul plus importantes seront essentielles pour obtenir des renseignements généraux.