Unificatrice de modèles de vision et de langue avec mohit bansal

 Unificatrice de modèles de vision et de langue avec mohit bansal


Aujourd’hui, nous sommes rejoints par Mohit Bansal, professeur Parker et directeur du Murge-Lab à UNC, Chapel Hill. Dans notre conversation avec Mohit, nous explorons le concept d’unification dans les modèles d’IA, mettant en évidence les avantages des connaissances et de l’efficacité partagées. Il relève les défis de l’évaluation dans l’IA générative, y compris les biais et les corrélations parasites. Mohit présente des modèles révolutionnaires tels que UDOP et VL-T5, qui ont obtenu des résultats de pointe dans diverses tâches de vision et de langage tout en utilisant moins de paramètres. Enfin, nous discutons de l’importance de l’efficacité des données, de l’évaluation du biais dans les modèles et de l’avenir des modèles multimodaux et de l’explication.



Source link

Related post