Pourquoi les nouveaux outils d’agent d’IA d’Openai pourraient changer la façon dont vous codez

 Pourquoi les nouveaux outils d’agent d’IA d’Openai pourraient changer la façon dont vous codez


images monsitj / getty

Si vous êtes développeur de production depuis à tout moment, vous savez que les interfaces de programmation d’applications (API) sont susceptibles de changer chez le caprice du fournisseur.

Vous pourriez vous coucher un soir en sachant que votre application est solide et a un brillant avenir. Ensuite, vous vous réveillez le matin pour découvrir qu’un de vos fournisseurs d’API a annoncé un changement qui vous oblige à passer les six prochains mois à recoder votre application pour travailler avec l’API révisée. Demandez-moi comment je sais.

Aussi: La meilleure IA pour le codage en 2025 (et quoi ne pas utiliser)

Les applications basées sur l’IA ne sont pas à l’abri de cette loi immuable de la vie API. OpenAI a annoncé l’introduction de l’API des réponses, qui déclenchera le coucher du soleil de son API assistante en 2026.

Comme pour la plupart des changements d’API, la nouvelle API fait plus, fonctionne mieux et a moins de calories. Cependant, malgré ces capacités, la nouvelle API ajoute toujours de gros éléments à faire aux premiers adoptants des API précédentes.

OpenAI a annoncé une série de nouvelles fonctionnalités de programme du programmeur Pour la construction d’agents d’IA, y compris l’API. Avant de creuser ce qui est nouveau, mettons ce changement en contexte.

Vous avez probablement remarqué que depuis AI génératif (Gen AI) a fait irruption sur la scène il y a quelques années, presque tous les produits et services semblent avoir soudainement ajouté une fonctionnalité de vense à la hausse de l’IA à leur offre de base. C’est une excellente extension de ligne à de nombreux produits et services, mais ce n’est pas comme si chaque fournisseur avait des équipes de recherche sur l’IA construisant de grands modèles de langue.

Au lieu de cela, ces sociétés ont des API agréées qui fournissent des services d’IA à des frais assez prévisibles par transaction. Différents modèles coûtent différents montants, mais à une estimation approximative, un développeur pourrait en faire 67 GPT-4.5 Requêtes de chat typiques, 1 176 GPT-4O requêtes, ou 20 000 Gpt-4o mini requêtes pour un seul dollar.

Aussi: Comment utiliser Chatgpt pour écrire du code – et mon astuce préférée pour déboguer ce qu’elle génère

Avec les API d’OpenAI (et les autres API des sociétés d’IA), les fonctionnalités d’IA peuvent être ajoutées au code avec des appels de fonction simples et une carte de crédit, réduisant de courtes années de développement et des millions de dollars d’infrastructure et de frais de recherche.

L’API des nouvelles réponses

Jusqu’à présent, OpenAI a offert une API, l’API de complétion de chat, pour avoir envoyé des requêtes d’invite de chat à Chatte et obtenir une réponse. OpenAI a également offert une API, l’API Assistants, qui permet aux agents d’effectuer des fichiers de raisonnement et d’accès en plusieurs étapes.

L’API des nouvelles réponses combine les caractéristiques des deux API précédentes. Bien que l’API de complétion de chat devrait rester, la société a annoncé son intention de coucher de l’API des assistants dès l’année prochaine en faveur de l’API des réponses plus compétentes.

Aussi: Comment transformer le chatppt dans votre outil d’alimentation de codage AI – et doubler votre sortie

Les tarifs pour l’utilisation des réponses API sont situés sur Page de tarification d’Openai et varient en fonction du modèle et de l’utilisation.

L’API API a trois outils intégrés que les programmeurs peuvent appeler: la recherche Web, la recherche de fichiers et l’utilisation de l’ordinateur.

L’outil de recherche Web

Si vous avez déjà utilisé Chatgpt pour rechercher le Web et agréger une réponse, vous savez ce que fait l’outil de recherche Web. Dans le cas de l’API des réponses, il permet aux programmeurs d’initier de telles requêtes à partir de leurs programmes.

Lorsqu’elle est utilisée, l’API fournit du texte en réponse, et relie les sources et les citations en ligne. Beaucoup de ces réponses devraient être correctes. La société cite un graphique montrant que les tests de recherches sur le Web avec GPT-4O n’étaient que 38% (gardez cela à l’esprit la prochaine fois que vous utiliserez le chatppt pour rechercher), mais les recherches à l’aide de l’aperçu de la recherche GPT-4O et de l’aperçu de la mini-recherche GPT-4O étaient corrects neuf sur dix.

La plupart du temps, c’est plutôt bien, non?

L’outil de recherche de fichiers

Ensuite, l’outil de recherche de fichiers, qui recherchera une bibliothèque de vos documents d’entreprise. Et oui, je sais ce que tu penses. Openai dit qu’il ne forme pas ses IA sur les données commerciales. Ainsi, vous devez être assez confiant que le téléchargement de toutes vos données sera sécurisé et n’apparaîtra pas dans la réponse de quelqu’un d’autre à une invite.

Aussi: Comment je teste la capacité de codage d’un chatbot AI – et vous pouvez aussi

Il y a cependant des problèmes. D’une part, à 0,10 $ par concert, par mois, le stockage de fichiers n’est pas bon marché. La base de données des documents d’entreprise de ma petite entreprise est de 57 To. Si cette base de données était téléchargée sur OpenAI pour une recherche d’IA spécifique au contexte, le stockage coûterait près de 6 000 $ par mois – et mon entreprise n’a que deux employés.

Les avantages d’avoir un outil de recherche d’IA sont la possibilité de briser les silos. Mais si les silos sont ce qui rend le stockage des données plus abordable en téléchargeant uniquement des données, ce prix pourrait limiter l’utilité de cette fonctionnalité.

Outil d’utilisation de l’ordinateur

Enfin, OpenAI comprend son outil d’utilisation de l’ordinateur, l’outil de visualisation et de clic sur l’écran au cœur de son offre d’agent opérateur.

Cette chose est censée être en mesure de lire des écrans et, en fonction du contenu de l’écran, soit d’effectuer un traitement ou de cliquer pour provoquer des actions. Des démos, en particulier dans L’aperçu de l’annonce actuelleil semble que l’outil ait un long chemin à parcourir avant qu’il ne soit universellement utile.

Restez à l’écoute sur cette fonctionnalité.

SDK des agents

Une API est un ensemble de points de terminaison ou d’appels de fonction pour interagir avec un système externe. Un SDK (kit de développement de logiciels) est une collection plus large, y compris souvent des outils logiciels, des API, des bibliothèques et des services publics, qui fonctionnent tous ensemble.

OpenAI a annoncé que SDK des agents, un ensemble d’outils pour la construction, le débogage et la surveillance des agents en action. Le kit comprend l’API des réponses et ajoute une orchestration de flux de travail, permettant aux codeurs d’effectuer un raisonnement en plusieurs étapes et une exécution des tâches.

Aussi: Cette nouvelle IA Benchmark mesure combien de modèles se trouvent

Le kit permet également aux codeurs de créer des équipes d’agents, chacune chargée de responsabilités spécifiques. Une fonctionnalité « transfert » permet à un agent de faire un peu de travail, puis de transférer le traitement à un autre agent, etc.

De plus, et je pense que c’est l’une des caractéristiques les plus importantes, un tableau de bord de surveillance permet aux développeurs de voir chaque interaction avec l’IA, d’identifier quels agents ont été utilisés pour quoi et comment ils ont été chargés. Avec La prévalence des hallucinations d’IAil est important de pouvoir suivre ce que font toutes ces tâches indépendantes.

Que pensez-vous des dernières mises à jour d’Openai?

Envisagez-vous d’intégrer l’API des réponses dans vos projets, ou êtes-vous préoccupé par l’Openai Sunting of the Assistants API?

Que pensez-vous des outils intégrés, tels que la recherche Web, la recherche de fichiers et l’utilisation de l’ordinateur? Résolvent-ils de vrais problèmes ou introduisent-ils de nouveaux défis?

Et qu’en est-il du SDK des agents? Le voyez-vous comme un changement de jeu pour le développement des agents d’IA, ou certaines fonctionnalités manquent-elles encore? Faites-nous savoir dans les commentaires ci-dessous.


Vous pouvez suivre mes mises à jour quotidiennes de projet sur les réseaux sociaux. Assurez-vous de vous abonner à ma newsletter hebdomadaire de mise à jouret suivez-moi sur Twitter / X à @Davidgewirtzsur Facebook à Facebook.com/davidgewirtzsur Instagram à Instagram.com/davidgewirtzsur bluesky à @ Davidgewirtz.comet sur youtube à Youtube.com/davidgewirtztv.





Source link

Related post