(D) Nous avons créé un modèle d’IA qui fait du raisonnement en plusieurs étapes | Il a surclassé de nombreux modèles de haut niveau en mathématiques et raisonnement logique

 (D) Nous avons créé un modèle d’IA qui fait du raisonnement en plusieurs étapes | Il a surclassé de nombreux modèles de haut niveau en mathématiques et raisonnement logique


https://preview.redd.it/vhtav828xz8f1.jpg?width=1479&format=pjpg&auto=webp&s=f98923e43089601e61e02fdf0ff46e900961177cc

Nous en avons marre des LLM de raisonnement en utilisant autant de jetons pour effectuer des tâches relativement simples. Bien que des modèles comme Deepseek prennent parfois plus d’une minute de raisonnement (et utilisent d’innombrables jetons), nous voulions quelque chose de plus efficace.

Donc, nous avons affiné Qwen-14b pour raisonner en plusieurs étapes, pas seulement en une seule passe.

Notre modèle a obtenu des résultats impressionnants sur des repères standardisés:
• marqué 95,68 sur MATH-500 (assis juste en dessous de 2,5 Pro)
• a marqué 82 sur AIME (bien supérieur à la moyenne pour les systèmes d’IA)

https://preview.redd.it/n8ptashqzz8f1.jpg?width=817&format=pjpg&auto=webp&s=5fbc26d612c6f7c3ed0d2bb4f9424bfcb5e70831

Vous pouvez l’essayer ici: helpai.co

soumis par / u / silement-moment-338
(lien) (Commentaires)



Source link

Related post