Tendances de l’IA 2024: vision par ordinateur avec Naila Murray

Aujourd’hui, nous lançons notre série AI Trends 2024 avec une conversation avec Naila Murray, directrice de l’IA Research chez Meta. Dans notre conversation avec Naila, nous foulons dans les dernières tendances et développements dans le domaine de la vision par ordinateur. Nous explorons les progrès dans les domaines de la génération contrôlable, de la programmation visuelle, des éclaboussures gaussiennes 3D et des modèles multimodaux, en particulier la vision plus les LLM. Nous discutons des outils et des projets open source, y compris n’importe quoi segment – un outil pour la segmentation d’image zéro polyvalente à l’aide d’invites de texte simples clics et des boîtes de délimitation; ControlNet – qui ajoute un contrôle conditionnel aux modèles de diffusion stables; et le modèle de codage visuel DINOV2 – permettant la reconnaissance, la segmentation et l’estimation de la profondeur d’objets, même dans les scénarios de scarce de données. Enfin, Naila partage son point de vue sur les opportunités les plus excitantes du domaine, ainsi que ses prédictions pour les années à venir.