Images 3D cachées

Connaissez-vous ces autostéréogrammes avec les photos 3D cachées? Des images comme les images des yeux magiques des années 1990 qui ressemblent à des motifs répétitifs bruyants jusqu’à ce que vous défociez vos yeux juste?
Chatgpt peut les générer!
Au moins selon Chatgpt.
J’ai vu des gens essayer de fabriquer des images de style œil magique avec d’autres modèles générant d’images, mais je n’avais pas pensé l’essayer avec Chatgpt jusqu’à ce que le lecteur Pippin m’ait envoyé la suggestion et j’ai généré l’image hilarante du dauphin ci-dessus. Ce qui m’a en particulier, c’est la légende.
Comment vous retrouvez-vous avec un résultat qui semble si confiant et pourtant si complètement faux?
Chatgpt a rencontré des informations sur les stéréogrammes Magic Eye dans sa formation sur Internet. Lorsque je demande « Veuillez générer une image stéréo Magic Eye 3D d’une licorne », les descriptions que Chatgpt passe à Dall-E3 (le générateur d’images qui fait réellement les images) sont extrêmement particuliers:
Un stéréogramme 3D Magic Eye qui révèle une image cachée d’une licorne lorsqu’elle est vue correctement. Le stéréogramme doit être complexe et rempli d’une variété de couleurs pour s’assurer que l’effet 3D est proéminent, permettant à la licorne d’apparaître comme si elle se tenait dans une forêt magique une fois que les yeux du spectateur s’ajustent. Le contexte devrait être constitué de modèles complexes et d’éléments mystiques pour améliorer l’illusion de la profondeur et de l’atmosphère magique, encourageant les téléspectateurs à trouver la licorne cachée. La licorne elle-même doit être conçue pour être une délicieuse surprise pour ceux qui ont apte à voir les images des yeux magiques, avec sa corne et sa crinière clairement discernables au milieu du motif.
Mais c’est l’image que Dall-E3 fournit à Chatgpt en réponse:

Chatgpt n’applique aucune reconnaissance d’image au résultat qu’il revient – tout ce que Dall-E3 a fait est un gros blanc. Donc, Chatgpt continue alors avec sa description comme si l’image était clairement exactement ce qu’elle a demandé. Il fait un geste vers l’écran vert, où il y a vraisemblablement une fabuleuse image d’illusion 3D apparaissant, puis continue sans aucune information sur ses lacunes réelles.
Les Gémeaux de Google (auparavant Bard) ont également un modèle dédié (Imagen 2) pour faire sa génération d’images. Ses images cachées sont même … moins subtiles.

Gemini a une image décrivant le modèle sur lequel il peut appeler, donc si je lui demande de décrire les images qu’il vient de générer, il devrait remarquer qu’ils ne sont rien de tel que des images Magic Eye. Droite?

Au moins, cela n’a pas donné la solution au puzzle.
Mais si je commence une nouvelle conversation et que je lui donne l’une des colombes « cachées » d’en haut, il n’y a pas de soupçon qu’il s’agit d’une illusion magique des yeux, juste une image ordinaire d’une colombe.

Ma théorie est que Gemini n’appelle que son modèle de reconnaissance d’image lorsque l’utilisateur télécharge une image. Sinon, c’est juste un générateur de texte.
Les gens qui vendent « AI » aiment le présenter comme un programme informatique polyvalent, mais des modèles comme Gemini et Chatgpt ressemblent plus à un téléphone plein d’applications. L’application de génération de texte peut lancer l’application de génération d’images dans des circonstances particulières, mais ce n’est pas le même programme de manière significative.
Je dois noter que même lorsque Chatgpt ne fait que la génération de texte et pourrait en théorie vérifier son propre travail, il suppose toujours qu’il fait un excellent travail. Ici, il génère de l’art textuel ASCII, puis en lit ses propres messages:

Si je commence un nouveau chat et envoie son propre mot ASCII, il dit que le mot se lit « Erreur ». C’est tout aussi terrible pour reconnaître et évaluer son propre art ASCII.
La génération d’art ASCII et d’images 3D n’est pas une grande application potentielle pour des modèles comme Chatgpt, mais c’est un bon rappel que ces modèles ne comprennent pas ce que nous demandons ou les étapes de base pour le faire correctement. Lorsque ChatGpt ajoute une reconnaissance ou une description d’image ou d’autres fonctionnalités, ce n’est pas que le modèle de texte d’origine est devenu plus intelligent. Il peut simplement appeler une autre application.
Un dernier défi 3D Illusion! J’ai demandé un vraiment délicat, alors soyez prêt à ne pas avoir l’image cachée au début! Lorsque vous le verrez, vous le saurez car il ressemblera à une tortue de mer.
