AI Rewind 2020: Tendances de l’apprentissage du renforcement avec Pablo Samuel Castro

Aujourd’hui, nous lançons notre série annuelle de Rewind AI rejointe par Friend of the Show Pablo Samuel Castro, développeur de logiciels de recherche du personnel chez Google Brain.
Pablo nous a rejoint plus tôt cette année pour une discussion sur la musique et l’IA, et sa perspective géométrique sur l’apprentissage du renforcement, ainsi que nos heures de bureau RL pendant le premier Twimlfest. Dans la conversation d’aujourd’hui, nous explorons certaines des dernières et des plus grandes avancées de RL qui proviennent des principales conférences cette année, divisées en quelques thèmes majeurs, mesures / représentations, compréhension et évaluation d’apprentissage en renforcement profond et RL dans le monde réel. Ce fut une conversation très amusante, et nous vous encourageons à consulter tous les grands papiers et autres ressources disponibles ci-dessous.
Nous voulons avoir de vos nouvelles! Envoyez vos réflexions sur l’année qui était en 2020 ci-dessous dans les commentaires, ou via Twitter à @samcharrington ou @twimlai.
Pour suivre la série REWIND AI 2020, dirigez-vous vers le page de la série!