Augmentation des données et architectures optimisées pour la vision par ordinateur avec Fatih Porikli
Aujourd’hui, nous lançons notre couverture de la conférence CVPR 2023 rejointe par Fatih Porikli, un directeur de technologie principal chez Qualcomm. Dans notre conversation avec Fatih, nous avons couvert pas mal de terrain, abordant un total de 12 articles / démos, en nous concentrant sur des sujets tels que l’augmentation des données et les architectures optimisées pour la vision par ordinateur. Nous explorons les progrès des réseaux d’estimation de l’écoulement optique, de la distillation de connaissances inter-modèles et de la scène pour une détection d’objets 3D efficace, et un apprentissage zéro via des modèles de langue pour un étiquetage à grain fin. Nous discutons également des progrès génératifs de l’IA et de l’optimisation de la vision par ordinateur pour l’exécution de grands modèles sur les appareils Edge. Enfin, nous discutons des fonctions objectives, des choix de conception d’architecture pour les réseaux de neurones et des améliorations de l’efficacité et de la précision dans les modèles d’IA via les techniques introduites dans les articles.
