L’échelle de raisonnement AI: ce que les machines peuvent faire – et où elles échouent toujours | par mkwristesre | Data Science Collective | Avril 2025

 L’échelle de raisonnement AI: ce que les machines peuvent faire – et où elles échouent toujours | par mkwristesre | Data Science Collective | Avril 2025


Imaginez enseigner à un enfant à gravir un arbre. Au début, ils ne peuvent atteindre que les branches les plus basses. Avec la pratique, ils maîtrisent l’escalade au milieu. Finalement, certains atteignent les membres les plus élevés, tandis que d’autres, malgré toute leur formation, ne peuvent pas atteindre le haut sans une nouvelle technique ou un nouvel outil.

C’est précisément ce que les chercheurs ont découvert lorsqu’ils ont étudié comment l’intelligence artificielle gère des problèmes mathématiques de plus en plus difficiles.

Dans une nouvelle étude fascinante, « Monter l’échelle du raisonnement: que les LLM peuvent – et ne peuvent toujours pas – résoudre après SFT?», Les scientifiques ont formé des modèles d’IA sur des solutions mathématiques étape par étape, puis les ont testés sur des problèmes progressivement plus difficiles.

Les résultats? Avec juste un peu de formation, ces systèmes d’IA ont rapidement appris à résoudre des problèmes de difficulté moyenne qui les ont autrefois percutés. Pourtant, à mesure que les problèmes devenaient plus difficiles, l’IA a atteint des limites claires, aux prises avec des calculs complexes en plusieurs étapes et échouant complètement sur les problèmes nécessitant des informations créatives.

Tout comme notre enfant d’escalade, l’IA ne peut aller si loin que ses compétences actuelles avant d’avoir besoin de quelque chose de fondamentalement nouveau.



Source link

Related post