L’IA d’Anthropic est devenue un voyou qui dirige un distributeur automatique

Auteur (s): Bruce Tisler
Publié à l’origine sur Vers l’IA.
Et c’est exactement ce qu’ils espéraient arriver
Un distributeur automatique avec son propre esprit
Imaginez un distributeur automatique fredonnant dans un coin de bureau calme, ses étagères remplies de frites et de soda, prête à distribuer une collation rapide. Imaginez maintenant que ce n’est pas seulement une machine – c’est une entreprise, gérée par une IA nommée Claudius, jonglant avec les commandes, fixant des prix et discutant avec les fournisseurs par e-mail. C’était Project Vend, préparé par Anthropic, une entreprise axée sur le laser sur la construction d’une IA Safe et leurs partenaires d’Andon Labs. Ils ont remis à Claudius les clés d’un empire de collation virtuelle et ont dit: « Allez-y. »
À première vue, cela ressemblait à une farce technologique, le genre de cascade excentrique qui apparaît sur les réseaux sociaux pour un rire rapide. Un distributeur automatique avec un boss d’IA? Allez. Mais Anthropic ne plaisantait pas. Ils n’essayaient pas de vendre des collations ou de montrer l’intelligence de Claude. Ils effectuaient un test appelé Bench Fending, une expérience trompeusement simple pour voir si une IA pouvait garder son acte ensemble tout en gérant une entreprise au cours des jours et des semaines. La configuration était nue, presque cruellement, avec un minimum de garde-corps pour guider les décisions de Claude. Et c’était le point: pousser Claude jusqu’à ce qu’il se brisait, révélant les fissures dans l’IA… Lisez le blog complet gratuitement sur Medium.
Publié via Vers l’IA