Le nouvel agent d’IA d’Openai prend une heure pour commander de la nourriture et recommande de visiter un stade de baseball au milieu de l’océan

 Le nouvel agent d’IA d’Openai prend une heure pour commander de la nourriture et recommande de visiter un stade de baseball au milieu de l’océan


Openai publie un nouvel agent d’IA, surnommé de créativité, un agent de Chatgpt – qui ne doit pas être confondu avec les deux autres agents d’IA qu’il est déjà publiés (avons-nous mentionné qu’Openai a un un problème de marque?)

Dans un annoncela société dirigée par Sam-Altman dit que l’outil utilise son propre « ordinateur virtuel » pour effectuer des tâches en votre nom, comme utiliser votre calendrier pour vous informer sur les réunions à venir, acheter les ingrédients pour préparer le petit déjeuner et créer une analyse de glissière de concurrents d’entreprise.

Le nouvel agent synthétise les capacités de son Opérateur agent, qui pourrait effectuer des tâches basées sur le navigateur Web, et son Agent de recherche en profondeurqui a été conçu pour effectuer des tâches de recherche en plusieurs étapes comme la génération d’un rapport personnalisé, et les plonge dans le chatgpt, vous permettant d’accéder à l’outil à partir du confort de l’interface utilisateur du chatbot tout en étant capable d’adapter ses performances grâce à des échanges conversationnels.

Mais il y a une énorme mise en garde. Selon l’annonce d’Openai, « Chatgpt demande l’autorisation avant de prendre des mesures de conséquence » – ce qui signifie que pour toute tâche réellement importante, vous ne pouvez pas simplement vous éloigner après avoir mis les choses en mouvement. Un humain – vous – devez être présent avant que le bot n’approche la gâchette de certaines de ces tâches qu’elle est censée automatiser.

D’un point de vue de sécurité, c’est sans équivoque une bonne chose, étant donné que les IA sont extrêmement enclins à faire des erreurs. Et s’il est sur le point de réserver le mauvais vol? Ou si cela a été victime d’un injection rapide Attaquez, trébuchant sur un site Web conçu par des pirates pour inciter un modèle d’IA à faire quelque chose de dangereux, ou à donner votre argent?

Pourtant, cette intervention souligne à quel point cette technologie reste non digne de confiance, qui par extension Incapacite son utilité, suspendue dans ce limbes maladroit dans lequel il est à la fois trop stupide et trop puissant pour se déchaîner.

C’était le même raccrochage qui retenait l’opérateur, qui nécessitait également l’approbation humaine avant de « finaliser toute action significative ». Comme l’opérateur, l’agent ChatGPT met également les utilisateurs dans un « mode de prise de contrôle » pour taper des informations sensibles, comme les informations d’identification de connexion et les informations de paiement.

À l’époque, les utilisateurs se sont plaints de l’opérateur lenteuravec elle prenant une atroce pour naviguer sur un bureau, et parfois harceler pour l’aide humaine avec les tâches qu’il aurait dû accomplir seuls.

Cela ne semble pas avoir disparu avec l’agent Chatgpt. Comme l’admet la recherche du projet Isa Fulford, l’IA battant le monde a eu du mal à commander un tas de cupcakes dans un délai encore raisonnable à distance.

« Celui-là a pris presque une heure, » Fulford dit Câblé« Mais c’était plus facile que moi le faisant moi-même, parce que je ne voulais pas le faire. »

La démonstration d’Openai des prétendu capacités de son bot dans la vidéo d’annonce ne fait pas non plus de cas convaincant.

Instruit de planifier un voyage pour visiter chaque stade de baseball des ligues majeures aux États-Unis, l’agent Chatgpt produit une carte (représentée dans ce reddit capture d’écran) montrant un coup de pointe dans le Golfe du Mexique. La dernière fois que nous avons vérifié, il n’y a pas de stades de balle assis en plein air. Les heures de jeu semblent également erronées. Un grand chelem, ce n’est pas le cas.

« Carte cool, je suppose », explique le produit, le produit Yash Kumar dans la vidéo. (Alternativement, vous pouvez littéralement taper « visiter tous les stades MLB » dans Google, et trouverez des dizaines de sites Web avec des conseils sur la façon de faire exactement cela, y compris un outil appelé « Baseball-Roadtrip.com. « )

Des erreurs comme celles-ci ne sont généralement pas commentées par Les présentateurs OpenAI dans la vidéo. Ils semblent réticents à revérifier le travail de l’IA tout au long, et probablement pour une bonne raison.

L’agent est d’abord libéré aux utilisateurs professionnels, qui seront plafonnés à 400 invites par mois, et seront bientôt déployés aux abonnés de plus et d’équipe, qui sera limité à seulement un dixième de cela. Aucun calendrier n’a été fourni pour les utilisateurs gratuits.

Plus sur Openai: L’ingénieur Openai quitte, dit que l’entreprise est un pur chaos à l’intérieur



Source link

Related post