Elon Musk a déclaré que Grok 4 était « l’IA la plus intelligente du monde », mais ses scores de classement sont sortis et ils racontent une histoire différente

 Elon Musk a déclaré que Grok 4 était « l’IA la plus intelligente du monde », mais ses scores de classement sont sortis et ils racontent une histoire différente


Elon Musk s’est vanté Ce qu’il dit sont les capacités incroyables du nouveau chatbot Grok 4 de Xai.

« Grok 4 est plus intelligent que presque tous les étudiants diplômés dans toutes les disciplines, simultanément », se vantait Musk, ajoutant que Grok 4 était « l’IA la plus intelligente du monde ».

Est-ce vraiment? L’intelligence était une chose difficile à mesurer avant même le retour avant que l’IA ne frappe la scène, mais certains tests peuvent fournir quelque chose d’indice.

Une plate-forme proéminente pour le faire est la UC Berkeley développée Classement Lmarenaquels crowdsources classent sur les modèles d’IA en faisant en sorte que les utilisateurs marquent leurs réponses dans des catégories allant de l’écriture créative et du codage aux mathématiques et à la vision.

Dans ses derniers scores, Grok 4 s’est classé troisième place au total et sur la génération de texte. Ne vous y trompez pas, c’est impressionnant – mais il traîne toujours derrière des modèles avancés de Google et Openai. (Plus précisément, les Gemini 2.5 de Google se sont classés en premier et les modèles de raisonnement O3 et 4O d’OpenAI à égalité pour la deuxième place, avec GPT-4.5 à égalité avec Grok 4 pour la troisième.)

Alors que Grok est clairement un concurrent redoutable dans le arènes du racisme et de l’antisémitismeen d’autres termes, même sa dernière version est clairement en deçà d’être «l’IA la plus intelligente du monde». (Ce n’est pas entièrement surprenant; Musk a une longue histoire de fibing dans son vie professionnelle, activités politiqueset Même ses hobbies.)

La seule grâce salvatrice pour Grok est peut-être la suggestion, par critique d’experts, que l’arène du chatbot de Berkeley pourrait être plus basée sur des vibrations que strictement scientifique.

Selon un étude récentedirigée par un consortium de chercheurs de l’IA et dirigée par la société d’apprentissage automatique Cohere, le classement aurait un tas de « problèmes systématiques qui ont abouti à un terrain de jeu déformé ». Parmi les graves allégations soulevées par les chercheurs figurent l’affirmation selon laquelle l’arène effectue des « tests privés non divulgués » avant de publier des scores publiquement – et que les classements peuvent être rétractés à volonté.

Peu de temps après la sortie du journal, il a été révélé Le fait que la version de Meta’s Llama 4 qui avait été utilisée par le classement n’était pas la même qui avait été publiée publiquement – un stratagème d’appâts et de commutation de la part de Meta pour charger les électeurs humains derrière l’arène.

Bien qu’un Des excuses ont été présentées Et Meta a été jetée sous le bus pour ses tentatives sommaires pour truquer le jeu, c’était toujours un très mauvais look qui a gâché la crédibilité de la Chatbot Arena. Mais qu’est-ce que cela signifie pour Grok? Nous devrons demander à l’IA la plus intelligente du monde.

Plus sur Grok: Le Pentagone pompe 200 millions de dollars dans l’IA d’Elon Musk qui vient d’avoir une fusion nazie



Source link

Related post