V-Jepa, Ai Raisonnement d’une architecture non générative avec Mido Assran

Aujourd’hui, nous sommes rejoints par Mido Assran, chercheur à la recherche fondamentale de l’IA de Meta (FAIR). Dans cette conversation, nous discutons de V-Jepa, un nouveau modèle étant présenté comme «la prochaine étape dans la vision de Yann LeCun» pour le vrai raisonnement artificiel. V-Jepa, la version vidéo de l’architecture prédictive de l’intégration conjointe de Meta, vise à combler l’écart entre l’intelligence humaine et la machine en formant des modèles pour apprendre des concepts abstraits d’une manière prédictive plus efficace que les modèles génératifs. V-Jepa utilise une nouvelle approche de formation auto-supervisée qui lui permet d’apprendre des données vidéo non étiquetées sans être distrait par les détails au niveau des pixels. Mido nous guide à travers le processus de développement de l’architecture et explique pourquoi il a le potentiel de révolutionner l’IA.