GPT-5 est là. Maintenant quoi?

 GPT-5 est là. Maintenant quoi?


Alors que l’O1 était un progrès technologique majeur, le GPT-5 est, avant tout, un produit raffiné. Lors d’un point de presse, Sam Altman a comparé GPT-5 aux écrans de la rétine d’Apple, et c’est une analogie appropriée, mais peut-être pas de la manière dont il voulait. Tout comme un écran sans précédent net, GPT-5 offrira une expérience utilisateur plus agréable et plus transparente. Ce n’est pas rien, mais cela ne fait pas loin de l’avenir transformateur de l’IA qu’Altman a passé une grande partie de l’année écoulée. Dans le briefing, Altman a qualifié le GPT-5 «un pas significatif le long du chemin vers AGI», ou l’intelligence générale artificielle, et peut-être qu’il a raison – mais si c’est le cas, c’est un très petit pas.

Prenez la démo des capacités du modèle que Openai a montré Revue de la technologie du MIT avant sa libération. Yann Dubois, une avance de post-formation à Openai, a demandé à GPT-5 de concevoir une application Web qui aiderait son partenaire à apprendre le français afin qu’elle puisse communiquer plus facilement avec sa famille. Le modèle a fait un travail admirable pour suivre ses instructions et a créé une application attrayante et conviviale. Mais quand j’ai donné à GPT-4O une invite presque identique, elle a produit une application avec exactement la même fonctionnalité. La seule différence est que ce n’était pas aussi esthétique.

Certaines des autres améliorations de l’expérience utilisateur sont plus substantielles. Le fait que le modèle plutôt que l’utilisateur choisisse s’il faut appliquer le raisonnement à chaque requête supprime un point de douleur majeur, en particulier pour les utilisateurs qui ne suivent pas les progrès de LLM de près.

Et, selon Altman, GPT-5 raisonne beaucoup plus rapidement que les modèles de la série O. Le fait qu’Openai le publie aux utilisateurs non payants suggère qu’il est également moins cher pour l’entreprise. C’est un gros problème: courir des modèles puissants à bon marché et rapidement est un problème difficile, et le résoudre est la clé pour réduire Impact environnemental de l’IA.

Openai a également pris des mesures pour atténuer hallucinationsqui ont été un mal de tête persistant. Les évaluations d’OpenAI suggèrent que les modèles GPT-5 sont sensiblement moins susceptibles de faire des allégations incorrectes que leurs modèles prédécesseurs, O3 et GPT-4O. Si cette avancement résiste à un examen minutieux, cela pourrait aider à ouvrir la voie à des agents plus fiables et dignes de confiance. «L’hallucination peut provoquer de véritables problèmes de sécurité et de sécurité», explique Dawn Song, professeur d’informatique à l’UC Berkeley. Par exemple, un agent qui hallucine les packages logiciels pourrait télécharger du code malveillant sur l’appareil d’un utilisateur.

Le GPT-5 a atteint l’état de l’art sur plusieurs repères, y compris un test de capacités agentiques et des évaluations de codage SWE-Bench et Aider Polyglot. Mais selon Clémentine Fourrier, un chercheur de l’IA chez l’entreprise HuggingFace, ces évaluations sont en provenance de saturation, ce qui signifie que les modèles actuels ont atteint des performances presque maximales.

«C’est essentiellement comme regarder les performances d’un lycée sur des problèmes de niveau intermédiaire», dit-elle. « Si le lycée échoue, il vous dit quelque chose, mais s’il réussit, cela ne vous en dit pas beaucoup. » Fourrier a déclaré qu’elle serait impressionnée si le système obtenait un score de 80% ou 85% sur Swe-Bench, mais il n’a géré que 74,9%.

En fin de compte, le message des titre d’OpenAI est que GPT-5 se sent mieux à utiliser. « Les vibrations de ce modèle sont vraiment bonnes, et je pense que les gens vont vraiment ressentir cela, en particulier les gens moyens qui n’ont pas passé leur temps à réfléchir aux modèles », a déclaré Nick Turley, chef de Chatgpt.

Les vibrations seules ne provoqueront cependant pas l’avenir automatisé qu’Altman a promis. Le raisonnement ressemblait à un pas en avant majeur sur le chemin d’Agi. Nous attendons toujours le prochain.



Source link

Related post