# 86 – David Silver: Alphago, Alphazero et Apprentissage en renforcement profond | Mit

 # 86 – David Silver: Alphago, Alphazero et Apprentissage en renforcement profond | Mit


David Silver dirige le groupe de recherche sur le renforcement de l’apprentissage chez DeepMind et a été chercheur principal sur Alphago, Alphazero et co-dirigé sur Alphastar, et Muzero et beaucoup de travaux importants dans l’apprentissage du renforcement.

Soutenez ce podcast en vous inscrivant avec ces sponsors:
– Masterclass: https://masterclass.com/lex
– Cash App – Utilisez le code «lexpodcast» et téléchargez:
– Cash App (App Store): https://apple.co/2spruhe
– application en espèces (Google Play): https://bit.ly/2mlvp5w

Liens d’épisode:
Apprentissage par renforcement (livre): https://amzn.to/2jwp5zg

Cette conversation fait partie du podcast de l’intelligence artificielle. Si vous souhaitez obtenir plus d’informations sur ce podcast, allez à https://lexfridman.com/ai ou connectez-vous avec @lexfridman sur Gazouillement, Liendin, Facebook, Moyenou Youtube où vous pouvez regarder les versions vidéo de ces conversations. Si vous aimez le podcast, veuillez le noter 5 étoiles sur Podcasts Applesuivez Spotifyou le soutenir sur Patreon.

Voici le contour de l’épisode. Sur certains joueurs de podcast, vous devriez pouvoir cliquer sur l’horodatage pour sauter à ce moment.

CONTOUR:
00:00 – Introduction
04:09 – Premier programme
11:11 – Alphago
21:42 – Règle du jeu de GO
25:37 – Apprentissage du renforcement: parcours personnel
30:15 – Qu’est-ce que l’apprentissage du renforcement?
43:51 – Alphago (suite)
53:40 – Apprentissage supervisé et auto-jeu à Alphago
1:06:12 – Lee Sedol Retirement de Go Play
1:08:57 – Garry Kasparov
1:14:10 – Alpha Zero et Self Play
1:31:29 – Créativité en Alphazer
1:35:21 – Applications Alphazero
1:37:59 – Fonctions de récompense
1:40:51 – Signification de la vie

https://www.youtube.com/watch?v=upueq8d73ji





Source link

Related post