Le nouveau générateur d’images de Chatgpt crée de superbes images – pour certains utilisateurs

 Le nouveau générateur d’images de Chatgpt crée de superbes images – pour certains utilisateurs


Invite: pouvez-vous générer une image dans un rapport 16: 9 d’un lapin moelleux réaliste, pris du style National Geographic dans la nature

Sabrina Ortiz / Zdnet via Chatgpt

Openai a continuellement élargi ses offres de chatppt, ajoutant un Assistant vocal AIcompréhension des fichiers et de l’image, Capabilites de recherche avancés, Agents d’IAet plus. Cependant, il y avait une omission flagrante – un générateur d’images vraiment capable.

Mardi, OpenAI a lancé 4O d’images. Ce modèle d’image est nettement meilleur – bien que plus lent – que les modèles Dall-E précédemment proposés par OpenAI. Il aborde des invites très difficiles telles que des images réalistes et, le plus impressionnant, un texte précis.

Aussi: J’ai essayé la nouvelle mise à jour avancée du mode vocal avancé de Chatgpt – voici ce qui a changé

Par exemple, dans la démo en direct, le PDG d’Openai, Sam Altman, rejoint par les chercheurs Gabriel Goh et Prafulla Dhariwal, a incité 4O à créer une photo à partir d’un POV spécifique avec un dépliant qui comprenait beaucoup de texte. Après avoir chargé pendant quelques secondes, il a obtenu la direction cinématographique à droite et a imprimé avec précision tout le texte.

Génération d'images 4o

Capture d’écran par Sabrina Ortiz / ZDNET

Il possède également de nombreuses autres capacités Le générateur d’images précédent d’Openai n’avait pas, comme le référencement d’images, qui peut être utilisé pour rendre une nouvelle version de l’image (comme une version animée ou un selfie), ou comme inspiration pour créer une œuvre complètement nouvelle.

Étant donné que cet outil est destiné à s’intégrer dans les flux de travail des créatifs, il peut générer des images sur des arrière-plans transparents, utiliser des couleurs spécifiques à partir de codes hexadéciques ou implémenter les capacités conversationnelles avancées du chatbot dans les générations. Par exemple, lorsqu’il est invité à inclure « l’humour » sur la photo pendant la démo, il comprenait du texte qui répondait à ces critères.

Étant donné que le générateur d’images est accessible dans Chatgpt, les utilisateurs peuvent également affiner des images via une conversation multi-tour. Cela facilite les ajustements et permet au modèle d’utiliser le contexte des générations précédentes pour en créer de nouvelles. Étant donné que GPT-4O a accès au Web, ce contexte est également ajouté à la création des images.

Selon l’entreprise, la génération d’images de GPT-4O a également une solide adhésion à l’instruction. Il peut gérer 10 à 20 objets différents, ce qui signifie que vous pouvez l’inviter à générer un volume élevé d’éléments en une seule fois.

Garanties plus lourdes

Un autre nouvel aspect du générateur d’images est qu’il peut désormais créer un contenu plus risqué, quelque chose d’Elon Musk Modèle Grok est connu pour. Pendant le flux en direct, Altman a partagé que vous pourrez utiliser la génération d’images de GPT-4O pour créer du contenu offensant « dans des limites raisonnables ». Dans un X post Après le livestream, Altman a ajouté:

« Ce que nous aimerions viser, c’est que l’outil ne crée pas de choses offensives à moins que vous ne le vouliez, auquel cas dans la mesure où il le fait. Comme nous en parlons dans nos spécifications de modèle, nous pensons que mettre cette liberté et ce contrôle intellectuels entre les mains des utilisateurs est la bonne chose à faire, mais nous observerons comment il se passe et écouter la société. »

Aussi: Grok 3 AI est maintenant gratuit pour tous les x utilisateurs – voici comment cela fonctionne

Le billet de blog annonçant le modèle a noté qu’il bloquerait les demandes qui violent les politiques de contenu, y compris les matériaux d’abus sexuels et les profondeurs sexuelles. Une autre sauvegarde en place est de limiter ce qui peut être créé lorsque de vraies personnes sont dans le contexte, y compris « des garanties particulièrement robustes autour de la nudité et de la violence graphique ».

Les utilisateurs peuvent visiter la carte système pour toutes les informations de sécurité dans le modèle de génération d’images 4O.

Comment accéder

Les fonctionnalités de génération d’images mises à jour se déroulent maintenant dans Chatgpt et Sora. Au lancement, le modèle a été annoncé pour tous les utilisateurs (y compris gratuitement), la génération d’images GPT-4O devenant le nouveau défaut. Cependant, en raison d’une forte demande, Altman annoncé Un jour après cela, le déploiement du niveau libre serait désormais « retardé pendant un certain temps ».

Cela signifie que pour accéder à la génération d’images, vous devez maintenant être abonné. Pour les utilisateurs individuels, la meilleure option est Chatgpt Plus, qui coûte 20 $ par utilisateur et par mois et est livré avec de nombreux autres avantages, y compris le générateur vidéo Sora d’Openai. Au moment de la rédaction de cet article, j’ai pu accéder au générateur d’images à partir de mon compte Plus. Les utilisateurs de l’entreprise et de l’éducation auront bientôt accès, avec accès aux développeurs via l’API prévu pour les semaines à venir.

Aussi: Les meilleurs générateurs d’images d’IA: testés et examinés

Lorsque Dall-E a été lancé pour la première fois, il vivait sur son site Web autonome; À l’époque, c’était le plus grand et le plus récent. Depuis lors, il a été déplacé de ne résider que dans le chatgpt; là, le modèle pâlit par rapport à plus Modèles de génération d’images avancés Des concurrents tels que MidJourney, Google et Adobe. Cette mise à jour aide désormais à niveler le terrain de jeu, lui permettant de mieux rivaliser avec d’autres modèles. Cependant, si les utilisateurs souhaitent toujours accéder à Dall-E, ils peuvent le faire via un GPT DALL-E dédié.

Vous voulez plus d’histoires sur l’IA? Inscrivez-vous à l’innovationnotre newsletter hebdomadaire.





Source link

Related post