Défis d’écosystème de l’IA génératif visuel avec Richard Zhang

Aujourd’hui, nous sommes rejoints par Richard Zhang, chercheur principal chez Adobe Research. Dans notre conversation avec Richard, nous explorons les défis de recherche qui surviennent en ce qui concerne l’IA générative visuelle du point de vue de l’écosystème, compte tenu des besoins disparates des créateurs, des consommateurs et des contributeurs. Nous commençons par son travail sur les mesures perceptuelles et le document LPIPS, qui nous permettent de mieux aligner la perception humaine et la vision par ordinateur et qui restent utilisés dans les applications d’IA génératives contemporaines telles que la diffusion stable, les Gans et la diffusion latente. Nous examinons son travail en créant des outils de détection pour un faux contenu visuel, soulignant l’importance de la généralisation de ces méthodes de détection à de nouveaux modèles invisibles. Enfin, nous fouillons son travail sur l’attribution des données et l’ablation du concept, qui visent à résoudre le problème ouvert difficile de permettre aux artistes et à d’autres de gérer leurs contributions aux ensembles de données de formation d’IA génératifs.