RL OFF-LINE, hors politique pour la prise de décision réelle sur Facebook avec Jason Gauci

Intelligence Artificielle
Noesis News
juin 12, 2025
0
112
1 minute de lecture

Aujourd’hui, nous sommes rejoints par Jason Gauci, directeur de l’ingénierie logicielle chez Facebook AI. Dans notre conversation avec Jason, nous explorons leur plate-forme d’apprentissage de renforcement, Re-Agent (Horizon). Nous discutons du rôle de la prise de décision et de la théorie des jeux dans la plate-forme et des types de décisions qu’ils utilisent à réaliser, du classement et des recommandations à leur marché de commerce électronique. Jason nous guide également à travers les différences entre la formation en ligne / hors ligne et ON / OFF, et où le ré-agent se trouve dans ce spectre. Enfin, nous discutons du concept de causalité contrefactuelle et de la façon dont ils garantissent la sécurité des résultats de leurs modèles.

Source link

RL OFF-LINE, hors politique pour la prise de décision réelle sur Facebook avec Jason Gauci

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Blog des gens •

Économisez 235 $ sur l’outil de diagrammes de...

Rise Robotics collecte des fonds pour les actionneurs...

Comment l’IA changera la conception des puces

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags