Identification des images générées par l’AI avec synthétique

 Identification des images générées par l’AI avec synthétique


Technologies

Publié
Auteurs

Sven Gowal, Pushmeet Kohli

Un nouvel outil aide à faire un filigrane et à identifier les images synthétiques créées par Imagen

Les images générées par l’AI sont de plus en plus populaires chaque jour. Mais comment pouvons-nous mieux les identifier, surtout quand ils ont l’air si réalistes?

Aujourd’hui, en partenariat avec Google Cloudnous lançons une version bêta de Synthétiqueun outil pour le filigrane et l’identification des images générées par l’AI. Cette technologie intègre un filigrane numérique directement dans les pixels d’une image, ce qui le rend imperceptible à l’œil humain, mais détectable pour l’identification.

Synthid est publié à un nombre limité de Vertex Ai les clients utilisant Imagel’un de nos derniers modèles de texte à l’image qui utilise du texte d’entrée pour créer des images photoréalistes.

Les technologies génératrices de l’IA évoluent rapidement, et l’imagerie générée par ordinateur, également connu sous le nom d’imagerie synthétique, devient plus difficile à distinguer de celles qui n’ont pas été créées par un système d’IA.

Bien que l’IA générative puisse débloquer un énorme potentiel créatif, il présente également de nouveaux risques, comme permettant aux créateurs de diffuser de fausses informations – à la fois intentionnellement ou non. Être capable d’identifier le contenu généré par l’IA est essentiel pour permettre aux gens de savoir lorsqu’ils interagissent avec les médias générés et pour aider à prévenir la propagation de la désinformation.

Nous nous engageons à connecter les gens à des informations de haute qualité et à maintenir la confiance entre les créateurs et les utilisateurs de la société. Une partie de cette responsabilité consiste à donner aux utilisateurs des outils plus avancés pour identifier les images générées par l’IA afin que leurs images – et même certaines versions éditées – puissent être identifiées à une date ultérieure.

Synthid génère un filigrane numérique imperceptible pour les images générées par l’IA.

Google Cloud est le premier fournisseur de cloud à offrir un outil pour créer des images générées par AI de manière responsable et en les identifiant avec confiance. Cette technologie est fondée sur notre approche pour développer et déployer une IA responsable, et a été développée par Google Deepmind et raffinée en partenariat avec Google Research.

Synthid n’est pas infaillible contre les manipulations d’images extrêmes, mais elle fournit une approche technique prometteuse pour permettre aux personnes et aux organisations de travailler avec le contenu généré par l’IA de manière responsable. Cet outil pourrait également évoluer aux côtés d’autres modèles et modalités d’IA au-delà des images telles que l’audio, la vidéo et le texte.

Nouveau type de filigrane pour les images d’IA

Les filigranes sont des conceptions qui peuvent être superposées sur des images pour les identifier. Des empreintes physiques sur papier au texte translucide et aux symboles vus sur les photos numériques aujourd’hui, ils ont évolué à travers l’histoire.

Les filigranes traditionnels ne sont pas suffisants pour identifier les images générées par l’IA car elles sont souvent appliquées comme un tampon sur une image et peuvent facilement être modifiées. Par exemple, les filigranes discrets trouvés dans le coin d’une image peuvent être raccourcis avec des techniques d’édition de base.

Il est difficile de trouver le bon équilibre entre l’imperceptibilité et la robustesse aux manipulations d’images. Des filigranes très visibles, souvent ajoutés comme couche avec un nom ou un logo en haut d’une image, présentent également des défis esthétiques à des fins créatives ou commerciales. De même, certains filigranes imperceptibles précédemment développés peuvent être perdus grâce à de simples techniques d’édition comme le redimensionnement.

Le filigrane est détectable même après des modifications comme l’ajout de filtres, le changement de couleurs et la luminosité.

Nous avons conçu Synthed afin qu’il ne compromet pas la qualité de l’image et permet au filigrane de rester détectable, même après des modifications telles que l’ajout de filtres, le changement de couleurs et la sauvegarde avec divers schémas de compression avec perte – le plus souvent utilisé pour les JPEG.

Synthid utilise deux modèles d’apprentissage en profondeur – pour le filigrane et l’identification – qui ont été formés ensemble sur un ensemble diversifié d’images. Le modèle combiné est optimisé sur une gamme d’objectifs, notamment en identifiant correctement le contenu filigrané et en améliorant l’imperceptibilité en alignant visuellement le filigrane sur le contenu d’origine.

Approche robuste et évolutive

SythID permet aux clients Vertex AI de créer des images générées par AI de manière responsable et de les identifier avec confiance. Bien que cette technologie ne soit pas parfaite, nos tests internes montrent qu’il est exact contre de nombreuses manipulations d’images courantes.

Approche combinée de Synthed:

  • Filigrane: Le synthèse peut ajouter un filigrane imperceptible aux images synthétiques produites par Imagen.
  • Identification: En scannant une image pour son filigrane numérique, Synthed peut évaluer la probabilité qu’une image soit créée par Imagen.

Synthid peut aider à évaluer la probabilité qu’une image ait été créée par Imagen.

Cet outil fournit trois niveaux de confiance pour interpréter les résultats de l’identification du filigrane. Si un filigrane numérique est détecté, une partie de l’image est probablement générée par Imagen.

Synthid contribue à la large suite d’approches pour identifier le contenu numérique. L’une des méthodes les plus utilisées pour identifier le contenu est par le biais de métadonnées, qui fournit des informations telles que qui les a créées et quand. Ces informations sont stockées avec le fichier image. Les signatures numériques ajoutées aux métadonnées peuvent alors montrer si une image a été modifiée.

Lorsque les informations de métadonnées sont intactes, les utilisateurs peuvent facilement identifier une image. Cependant, les métadonnées peuvent être supprimées manuellement ou même perdues lorsque les fichiers sont modifiés. Étant donné que le filigrane de Synthed est intégré dans les pixels d’une image, il est compatible avec d’autres approches d’identification d’image basées sur des métadonnées et reste détectable même lorsque les métadonnées sont perdues.

Quelle est la prochaine étape?

Pour construire un contenu généré par AIE de manière responsable, Nous nous engageons à développer des approches sûres, sécurisées et dignes de confiance À chaque étape du processus – de la génération d’images et de l’identification à la littératie des médias et à la sécurité de l’information.

Ces approches doivent être robustes et adaptables à mesure que les modèles génératifs progressent et s’étendent à d’autres supports. Nous espérons que notre technologie synthétique pourra fonctionner avec un large éventail de solutions pour les créateurs et les utilisateurs de la société, et nous continuons à évoluer synthétique en rassemblant les commentaires des utilisateurs, en améliorant ses capacités et en explorant de nouvelles fonctionnalités.

Synthid pourrait être élargi pour une utilisation sur d’autres modèles d’IA et nous sommes ravis du potentiel de l’intégrer dans plus de produits Google et de la rendre à la disposition de tiers dans un avenir proche – permettant aux personnes et aux organisations de travailler de manière responsable avec un contenu généré par l’IA.

Remarque: Le modèle utilisé pour produire des images synthétiques dans ce blog peut être différent du modèle utilisé sur Imagen et Vertex AI.

Remerciements

Ce projet a été dirigé par Sven Gowal et Pushmeet Kohli, avec des recherches clés et des contributions d’ingénierie de (répertorié par ordre alphabétique): Rudy Bunel, Jamie Hayes, Sylvestre-Alvise Rebuffi, Florian Stimberg, David Stutz et Meghana Thotakuri.

Merci à Nidhi Vyas et Zahra Ahmed pour avoir conduit la livraison des produits; Chris Gamble pour avoir aidé à initier le projet; Ian Goodfellow, Chris Bregler et Oriol Vinyals pour leurs conseils. Les autres contributeurs incluent Paul Bernard, Miklos Horvath, Simon Rosen, Olivia Wiles et Jessica Yung. Merci également à de nombreuses autres personnes qui ont contribué à Google Deepmind et Google, y compris nos partenaires de Google Research et Google Cloud.

Image filigranée d’un papillon métallique avec des motifs prismatiques sur ses ailes



Source link

Related post