La puissance de moins: comment la chaîne de brouillon rend le raisonnement de l’IA plus rapide et moins cher

Auteur (s): Mkwrishere
Publié à l’origine sur Vers l’IA.
Dans le paysage de l’IA d’aujourd’hui, Modèles de grande langue (LLMS) Comme GPT-4 et Claude peuvent résoudre des problèmes complexes avec une précision impressionnante.
Mais cette capacité a un coût, à la fois en temps de traitement et en ressources de calcul.
Et si ces systèmes d’IA pouvaient le penser tout aussi efficacement tout en écrivant beaucoup moins?
C’est la prémisse derrière une approche innovante appelée «Chain of Draft» (COD), développée par Zoom Communications Researchers.
Explorons comment cette technique aide les modèles d’IA à raisonner plus efficacement en écrivant moins, un peu comme la façon dont les humains notent les notes rapides plutôt que les paragraphes complets lors de la résolution de problèmes.
Lors de la résolution des problèmes complexes, les systèmes d’IA modernes utilisent souvent une technique appelée chaîne de pensée (COT). Cette approche encourage l’IA à briser les problèmes étape par étape, montrant son travail dans des explications détaillées.
Bien que efficace, cette méthode conduit à des réponses extrêmement verbeuses.
Par exemple, lors de la résolution d’un simple problème mathématique comme «Jason a eu 20 sucettes et a donné quelques-unes à Denny, en laissant 12. Combien a-t-il donné?», Une IA utilisant une chaîne de pensée pourrait écrire:
Publié via Vers l’IA