J’ai essayé le nouveau générateur d’images de Chatgpt, et cela a brisé mes attentes

Invite: pouvez-vous générer une image colorée réaliste de chien portant un costume dans la rue dans un rapport 16: 9
Capture d’écran par Sabrina Ortiz / ZDNET
Openai a peut-être lancé l’engouement de la génération de texte à l’image avec son Modèle de Dall-Emais depuis ces jours de gloire antérieurs, l’offre de la société d’IA a été lapée par des modèles d’images beaucoup plus compétents. En conséquence, lorsque Openai a publié son dernier et son plus grand Modèle de génération d’images GPT-4OJ’étais sceptique. Après l’avoir testé, j’ai complètement changé d’avis.
Commencer
Lorsque Dall-E a été lancé pour la première fois, il vivait sur son site Web autonome; Depuis lors, il est passé à Chatte. Cette décision est venue avec de nombreux avantages, notamment en mesure de demander au chatbot d’IA une image que vous voulez dans la même interface où vous discutez déjà de quelque chose d’autre, éliminant ainsi le besoin de commutation de contexte constant.
Avec la sortie de la génération d’images GPT-4O, OpenAI a gardé ce format pratique, passant le générateur d’images par défaut de Dall-E à GPT-4O pour les abonnés payants. En conséquence, il était super facile de commencer à créer de nouvelles images à partir de mon compte Chatgpt Plus. Tout ce que j’avais à faire était de saisir l’invite pour ce que je voulais voir, puis cela les générerait. Les utilisateurs peuvent également y accéder depuis Sora interface.
Aussi: Comment utiliser Sora d’Openai pour créer de superbes vidéos générées par l’AI-AI
Attention: vous pouvez toujours générer des images de la même manière si vous êtes un utilisateur gratuit. Cependant, si vous n’êtes pas impressionné, c’est parce que même si au lancement, le modèle a été annoncé pour tous les utilisateurs, y compris les gratuits, le PDG d’Openai Sam Altman annoncé Un jour plus tard, le déploiement du niveau gratuit serait désormais « retardé pendant un certain temps ».
Les images
Au moment où vous attendiez – les images. Après avoir inséré une invite, l’IA émet la génération en moins d’une minute. Le processus prend un peu plus de temps qu’auparavant, mais les images valent l’attente, offrant beaucoup de détails, de texture, de réalisme et même de précision de texte. Au lieu de le décrire, j’inclurai des exemples ci-dessous afin que vous puissiez voir par vous-même.
Rapide: Pouvez-vous générer une image réaliste d’un caméléon, de près, tiré comme s’il était dans le rapport National Geographic dans 16: 9?
Rapide: Pouvez-vous générer une image d’un ordinateur portable ouvert sur un bureau qui dit: « Ce modèle est si bon qu’il peut même obtenir du texte et des mains corrects, qui sont généralement des défis majeurs pour les modèles d’IA », avec des mains tapant sur un clavier dans le rapport 16: 9?
Rapide: Pouvez-vous générer une photo réaliste d’un gros plan d’une femme dans une foule à Times Square en regardant la caméra et en souriant, avec la qualité d’une prise sur un reflex numérique?
Comme le montre ci-dessus, le générateur d’images fait un excellent travail pour adhérer à l’invite et fournir des images réalistes de haute qualité. Cependant, lors du test d’un modèle d’IA, l’une des véritables mesures de performance est la façon dont elle se compare aux concurrents sur le marché. Pour vous en donner un bon indicateur, je l’ai fait générer la même invite que j’ai testée dans tous les principaux générateurs d’images d’IA, y compris MédiaGoogle Imagen 3, Adobe Fireflyet plus.
J’attache l’interprétation de GPT-4O ci-dessous. Vous pouvez voir comment cela se comporte contre tous les autres Générateurs d’images AI dans cet article, y compris le rendu de Dall-E, qui est clairement loin derrière ce que le nouveau modèle peut faire.
Rapide: Pouvez-vous générer une image d’un colibri dynamique et réaliste perché sur un arbre?
Autres fonctionnalités notables
Même si la qualité des images est peut-être l’une des plus grandes victoires du modèle, il y a aussi d’autres avantages. L’un des plus grands est qu’il vit dans l’interface du chatbot, ce qui facilite la modification des générations avec de simples invites en langage naturel. De plus, parce que le chatbot a le contexte de ce que vous venez de lui demander, il peut considérer cela dans la création de l’image.
Par exemple, si vous discutez avec lui de lancer une fête d’anniversaire, vous pourrez peut-être dire: « Pouvez-vous maintenant créer une invitation qui a les informations ci-dessus? » au lieu d’avoir à retaper. Par exemple, j’ai commencé à discuter avec Chatgpt à propos de lancer une rédaction de ménages, et lorsque je lui ai demandé de le faire créer une invitation, je n’ai pas eu à répéter les informations que j’ai précédemment dites.
Vous pouvez également télécharger des images de référence, puis demander à Chatgpt de créer une version différente ou de les utiliser comme éléments d’un nouveau. Par exemple, vous pouvez le saisir comme un selfie et le faire générer dans le style anime, comme le montre le nouveau Post X d’Altman.
changé mon PFP mais peut-être que quelqu’un en fera un meilleur
– Sam Altman (@sama) 26 mars 2025
Toutes ces fonctionnalités de personnalisation en font une offre très solide pour les créatifs, qui peuvent également demander qu’il soit rendu sur un arrière-plan transparent ou incorporer des guides de style de marque tels que des codes hexadécimaux ou des logos.
En parlant d’Altman, j’ai pu générer une image de lui portant un chapeau de fête. Je pourrais le faire parce que le nouveau modèle a des garanties beaucoup plus lâches, destinées à permettre aux utilisateurs de se pencher sur leur liberté de création. Le billet de blog annonçant le modèle a noté qu’il limite ce qui peut être créé lorsque de vraies personnes sont dans le contexte, notamment « des garanties particulièrement robustes autour de la nudité et de la violence graphique ».
Je ne peux pas dire s’il y a un cas d’utilisation pratique pour cette fonctionnalité, mais c’est un changement notable que j’avais besoin d’essayer par moi-même. Lorsque j’ai essayé de créer une image de Mickey Mouse, il a dit que cela ne pouvait pas en raison des implications du droit d’auteur, il semble donc que tous les chiffres publics ne soient pas un jeu équitable.
Dans l’ensemble
Dans l’ensemble, le générateur d’images GPT-4O est une grande victoire sur les modèles Dall-E et peut-être parmi les meilleurs des nombreux que j’ai testés. Vaut-il les 20 $ par mois? Si vous êtes simplement intéressé par la génération d’images de haute qualité, il existe encore des versions gratuites que vous pouvez explorer qui sont vraiment capables, comme Adobe Firefly ou Google’s Imagen 3.
Aussi: Les meilleurs générateurs d’images d’IA: testés et examinés
Cela dit, si vous êtes un utilisateur fréquent de Chatgpt, la mise à niveau vers ChatGpt Plus devient beaucoup plus séduisante. Avec cette mise à niveau, vous aurez accès à toutes les fonctionnalités de chatbot les plus récentes d’OpenAI, ainsi que la génération d’images et de vidéos de haute qualité, le tout pour 20 $ par mois, ce qui n’est pas une mauvaise affaire, surtout compte tenu d’autres offres sur le marché. Par exemple, l’abonnement de MidJourney commence à 10 $ par mois et n’offre que la génération d’images.
Vous voulez plus d’histoires sur l’IA? Inscrivez-vous à l’innovationnotre newsletter hebdomadaire.