# 86 – David Silver: Alphago, Alphazero et Apprentissage en renforcement profond | Mit

Intelligence Artificielle
Noesis News
juillet 31, 2025
0
96
5 minutes de lecture

Podcast: Jouer dans une nouvelle fenêtre | Télécharger

David Silver dirige le groupe de recherche sur le renforcement de l’apprentissage chez DeepMind et a été chercheur principal sur Alphago, Alphazero et co-dirigé sur Alphastar, et Muzero et beaucoup de travaux importants dans l’apprentissage du renforcement.

Soutenez ce podcast en vous inscrivant avec ces sponsors:
– Masterclass: https://masterclass.com/lex
– Cash App – Utilisez le code «lexpodcast» et téléchargez:
– Cash App (App Store): https://apple.co/2spruhe
– application en espèces (Google Play): https://bit.ly/2mlvp5w

Liens d’épisode:
Apprentissage par renforcement (livre): https://amzn.to/2jwp5zg

Cette conversation fait partie du podcast de l’intelligence artificielle. Si vous souhaitez obtenir plus d’informations sur ce podcast, allez à https://lexfridman.com/ai ou connectez-vous avec @lexfridman sur Gazouillement, Liendin, Facebook, Moyenou Youtube où vous pouvez regarder les versions vidéo de ces conversations. Si vous aimez le podcast, veuillez le noter 5 étoiles sur Podcasts Applesuivez Spotifyou le soutenir sur Patreon.

Voici le contour de l’épisode. Sur certains joueurs de podcast, vous devriez pouvoir cliquer sur l’horodatage pour sauter à ce moment.

CONTOUR:
00:00 – Introduction
04:09 – Premier programme
11:11 – Alphago
21:42 – Règle du jeu de GO
25:37 – Apprentissage du renforcement: parcours personnel
30:15 – Qu’est-ce que l’apprentissage du renforcement?
43:51 – Alphago (suite)
53:40 – Apprentissage supervisé et auto-jeu à Alphago
1:06:12 – Lee Sedol Retirement de Go Play
1:08:57 – Garry Kasparov
1:14:10 – Alpha Zero et Self Play
1:31:29 – Créativité en Alphazer
1:35:21 – Applications Alphazero
1:37:59 – Fonctions de récompense
1:40:51 – Signification de la vie

https://www.youtube.com/watch?v=upueq8d73ji

Source link

# 86 – David Silver: Alphago, Alphazero et Apprentissage en renforcement profond | Mit

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Arrêter d’écrire un python désordonné: un cours accidentel...

The best sunglasses for seniors in 2025, according...

40 mèmes hilarants relatables partagés sur le compte...

WELEVEL RAshes 5,7 millions de dollars au développement...

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags