La montée et la chute de l’inflexion Ai Chatbot, Pi

Au cours des dernières années, l’IA a établi Silicon Valley en feu. Le nouveau livre Ai Valley: Microsoft, Google et la course de milliards de dollars pour profiter de l’intelligence artificielle raconte ces temps hauts flamboyants, racontant les histoires du startups, capital-risque Les entreprises et les entreprises technologiques héritées qui brûlent brillantes et celles qui se sont déjà enflammées.
Dans l’extrait ci-dessous, auteur Gary Rivlin raconte l’histoire intérieure du démarrer Inflexionqui a été établi en 2022 par Liendin fondateur Reid Hoffman et Profondeur fondateur Mustafa Suleyman. L’inflexion espérait se différencier en construisant un chatbot avec une intelligence émotionnelle élevée, et la société était à un moment donné à 4 milliards de dollars américains. Mais son chatbot, Pin’a pas réussi à gagner des parts de marché et en mars 2024 Microsoft a acquis la majeure partie de la main-d’œuvre de l’entreprise, laissant ce qui restait de l’IP à être licencié pour une base comme base pour les robots de service client.
Pi n’était pas humain et ne pouvait donc jamais avoir de personnalité. Pourtant, cela incomberait à «l’équipe de personnalité» de l’inflexion pour imprégner PI avec un ensemble de caractéristiques et de traits qui pourraient donner l’impression que c’était le cas. Les rangs de l’équipe comprenaient plusieurs ingénieurs, deux linguistes et également Rachel Taylorqui avait été le directeur créatif d’une agence de publicité basée à Londres avant d’aller travailler pour l’inflexion.
« Mustafa m’a donné un peu d’ensemble sur ce sur quoi ils travaillaient, et je ne pouvais pas m’arrêter d’y penser », a déclaré Taylor. «Je pensais que ce serait peut-être la chose la plus percutante sur laquelle j’ai jamais travaillé.»
Les humains développent une personnalité à travers une interaction complexe de génétique et les influences environnementales, y compris l’éducation, la culture et les expériences de vie. La personnalité de Pi a commencé avec l’équipe qui énumère les traits. Certains étaient positifs. Soyez gentil, soutient. D’autres étaient des traits négatifs à éviter, comme l’irritabilité, l’arrogance et le combat.
« Vous montrez le modèle de nombreuses comparaisons qui le montrent la différence entre les bonnes et les mauvaises cas de ce comportement », a déclaré Mustafa Suleyman – « apprentissage du renforcement avec les commentaires humains », dans le langage de l’industrie, ou RLHF. Parfois, les équipes travaillant sur RLHF étiquettent simplement le comportement qu’ils veulent qu’un modèle évite (sexuel, violent, homophobe). Mais l’inflexion avait des gens qui attribuaient un score numérique aux réponses d’une machine.« De cette façon, le modèle apprend essentiellement Anusha Balakrishnanun ingénieur à l’inflexion s’est concentré sur le réglage fin. Les scores ont été introduits dans un algorithme qui a ajusté la pondération du modèle en conséquence, et le processus a été répété.
Développer les traits de personnalité de Pi
Contrairement à de nombreuses autres sociétés d’IA, qui ont externalisé apprentissage du renforcement À des tiers, l’inflexion a embauché et formé son propre peuple. Les candidats ont été passés à travers une batterie de tests, en commençant par un exercice de compréhension en lecture que Suleyman a décrit comme «très nuancé et assez difficile». Puis vint un autre ensemble d’examens et plusieurs séries de formation avant d’être mis au travail. Le «professeur» moyen a gagné entre 16 $ et 25 $ de l’heure, a déclaré Suleyman, mais jusqu’à 50 $ si quelqu’un était un expert dans le bon domaine. « Nous essayons de nous assurer qu’ils proviennent d’un large éventail d’horizons et représentent un large éventail d’âges », a déclaré Suleyman.
L’inflexion a fait former plusieurs centaines d’enseignants au printemps 2023. «Dans certains cas, nous avons payé plusieurs centaines de dollars de l’heure pour des personnes très, très spécialisées comme les thérapeutes comportementaux, les psychologues, les dramaturges et les romanciers», a déclaré Suleyman. Ils ont même embauché plusieurs comédiens à un moment donné, pour aider à donner à Pi un sentiment de humour. « Notre objectif est une expérience conversationnelle beaucoup plus informelle, détendue et détendue », a déclaré Suleyman.
La société a respecté une date limite auto-imposée du 12 mars 2023 pour une version bêta de PI qu’ils ont partagée avec des milliers de testeurs. Avec sa libération bêta, la société a émergé du mode furtif. Une annonce de presse a décrit PI comme «une IA de soutien et de compassion qui est impatiente de parler de quoi que ce soit à tout moment». L’entreprise a décrit PI un «nouveau type d’IA» différent des autres chatbots Sur le marché, d’ici mai, l’application était gratuite et disponible pour toute personne désireuse de s’inscrire et de se connecter pour utiliser le service.
Le New York TimesExécute rarement même un court élément sur la sortie d’un nouveau produit, en particulier un à une petite startup inconnue. Pourtant, peu d’entreprises pourraient se vanter des fondateurs avec les connexions et la puissance des étoiles de l’inflexion: Reid Hoffmanle co-fondateur de LinkedIn, et Suleyman, qui était la royauté de l’IA en tant que cofondateur de DeepMind. Cet influence s’est traduit par un bien immobilier de premier ordre sur la première page du Fois Section des affaires, y compris une grande illustration accrocheuse et un titre qui s’étendait sur plusieurs colonnes: «Mon nouveau meilleur ami: Pi, un chatbot de soutien émotionnel. » La journaliste Erin Griffith a été sceptique quant aux exercices de respiration que PI a suggérés pour l’aider à soulager le stress dans sa vie.
Suleyman a publié un manifeste sur le site Web de l’inflexion le jour de la publication de PI. Réseaux sociaux Fondamentalement, avait empoisonné le monde, a-t-il commencé. L’indignation et la colère ont entraîné un engagement, et l’attrait des bénéfices s’est avéré trop fort. « Imaginez une IA qui vous aide à sympathiser ou même à pardonner » l’autre côté « , plutôt que d’être indigné et craintif », a écrit Suleyman. « Imaginez une IA qui optimise pour vos objectifs à long terme et ne profite pas de votre besoin de distraction lorsque vous êtes fatigué à la fin d’une longue journée. » Il a décrit l’IA qu’ils construisaient comme un «compagnon d’IA personnel avec la mission unique de vous rendre plus heureux, plus sain et plus productif».
En juin 2023, Inflection a annoncé sa série A Series A. Suleyman et Hoffman étaient sortis en pensant qu’ils collecteraient entre 600 millions de dollars et 675 millions de dollars, mais après le lancement de PI, l’inflexion a été considérée comme l’une des nouvelles startups. Une longue liste d’investisseurs voulait une pièce. « Nous avons été submergés par des offres », a déclaré Suleyman. En fin de compte, ils ont levé 1,3 milliard de dollars lors d’une entreprise qui valorisait l’inflexion à 4 milliards de dollars.
Éditeurs de HarperCollins
Les défis techniques et commerciaux de l’inflexion
La volonté de Pi de s’attaquer à pratiquement n’importe quel sujet était un point de fierté dans l’inflexion. Lorsque d’autres robots ont arrêté les utilisateurs s’ils ont approché un sujet sensible, PI a invité une conversation. « Il essaiera de reconnaître qu’un sujet est sensible ou controversé, puis sera prudent pour donner des jugements solides et être dirigé par l’utilisateur », a déclaré Suleyman. Pi a corrigé des déclarations de fait qui étaient erronées afin de ne pas perpétuer désinformation Mais plutôt que de rejeter carrément une vue, il a offert une contre-évidence.
Suleyman était particulièrement fier de Pi dans les semaines qui ont suivi l’attaque du Hamas Israël et la campagne de bombardement subséquente dans laquelle Israël a mené Gaza. « C’était bien en temps réel alors que les choses se déroulaient, c’est bien maintenant », a-t-il déclaré deux mois dans les hostilités. «C’est très équilibré et même et voire respectueux.» S’il avait un biais, il était délibéré en faveur de «la paix et le respect de la vie humaine», a déclaré Suleyman. Un bot qui croyait à la base de la sainteté de la vie humaine ne semblait pas une mauvaise chose.
Taylor a jugé la première version de Pi «acceptable». «C’était très, très poli et très formel», a-t-elle déclaré. « Mais il n’y avait pas la conversation que nous voulions. » Agréable. Positif. Respectueux. Ce sont tous des traits admirables mais n’ont pas exactement ajouté l’expérience «amusante» qu’ils vendaient. Pourtant, trouver ce bon équilibre s’est avéré difficile. L’équipe de personnalité tournait le cadran sur un trait ou un autre, mais c’était comme s’il jouait whac-a-mole. Ils jouaient avec les poids et amadaliseraient le modèle pour utiliser plus d’argot et de familles, mais Pi était «un peu trop amical et informel d’une manière que les gens pourraient trouver grossiers», a déclaré Taylor.
Le large éventail de préférences parmi les utilisateurs était un sujet de conversation cohérent au sein de l’entreprise. Le mode par défaut de PI était «amical», mais une courte liste d’alternatives a été ajoutée pour que les gens choisissent: décontractés, pleins d’esprit, compatissants, dévoués. PI déplacerait des modes si un utilisateur le disait qu’il cherchait une oreille sympathique et non l’ami qui essaie de résoudre un problème. Mais le futur Pi, comme imaginé par Suleyman, était un modèle qui lisait ton émotionnel Et s’est rapidement adapté à lui-même, tout comme quelqu’un pourrait le faire si vous saluez un ami avec un copieux bonjour, mais passant immédiatement lors de l’apprentissage, il appelle avec de mauvaises nouvelles. Mais les robots n’étaient pas au point où ils pouvaient lire les préférences d’une personne sans instructions claires. Il a fallu au moins dix tours de la conversation, a déclaré Suleyman, et jusqu’à trente pour discerner l’humeur d’un utilisateur.
« À l’avenir, une IA va être beaucoup, beaucoup de choses à la fois », a déclaré Suleyman. «Les gens me demandent:« Est-ce un thérapeute? Eh bien, il a des saveurs de thérapeute. Il a des saveurs d’un ami. Il a des saveurs d’experts Supernerdy. Il a des saveurs d’entraîneur et de confident. » Parmi leurs hauts objectifs, il y avait un Pi qui avait plusieurs personnalités, comme un cyborg Sybil avec un trouble d’identité dissociatif. Comme ils l’ont vu, Pi pourrait finalement assumer un nombre presque sans limite de modes capables de correspondre au moment.
En décembre 2023, Pi était disponible pour Androïde et ses utilisateurs dans le monde environ 3 milliards. Mais Suleyman et d’autres à l’inflexion étaient vagues sur le nombre d’utilisateurs – il en est de résoudre. Ils étaient une déception. Cet automne, les sondeurs ont demandé aux personnes qui utilisaient des chatbots sur lesquels ils se tournaient le plus souvent. Cinquante-deux pour cent ont dit Chatte et 20% supplémentaires nommés Claude. La perplexité était troisième avec une part de 10%, suivie par le barde de Google (9%) et Bing (7%). Pi a été regroupé avec les 2% des utilisateurs qui ont sélectionné «autre».
L’entreprise avait sa liste de choses à faire habituelle. Pourtant, leur principal défi a été d’apprendre à s’améliorer dans un plus large éventail de tâches. Les gens considéraient Pi comme un causeur, ce qui était une bonne chose, mais un aide qui est bon à parler est limité. « Pi ne peut pas coder », a déclaré Balakrishnan cet hiver. «Cela doit s’améliorer pour raisonner. Cela ne peut pas prendre de mesures. Ce n’est vraiment utile que si vous voulez parler de vos sentiments.»
Du livre: Ai Valley: Microsoft, Google et la course de milliards de dollars pour profiter de l’intelligence artificielle par Gary Rivlin. Droit d’auteur © 2025 par Gary Rivlin. Réimprimé avec l’aimable autorisation de Harper Business, une empreinte des éditeurs de HarperCollins.
À partir des articles de votre site
Articles connexes sur le Web