(R) Oubliez le raisonnement de la chaîne de pensées! Présentation de la chaîne de rôti: penser plus rapidement (et moins cher) en écrivant moins.

 (R) Oubliez le raisonnement de la chaîne de pensées! Présentation de la chaîne de rôti: penser plus rapidement (et moins cher) en écrivant moins.


Je suis récemment tombé sur un papier de Zoom Communications (oui, le zoom que nous avons tous utilisé en 2020 …)

Ils proposent un moyen très simple de faire une raison modèle, mais cette fois, ils le rendent beaucoup moins cher et plus rapide que ce que le COT nous permet actuellement.

Voici un exemple de ce qu’ils ont changé dans l’invite qu’ils donnent au modèle:

https://preview.redd.it/p4m5adbqgipe1.png?width=509&format=png&auto=webp&s=32da487a2d054c829609410bd82c4c566dedc405

Voici comment un modèle de COT ordinaire répondrait:

Raisonnement de COT

Voici comment le nouveau modèle de chaîne de rabat répond:

Raisonnement de la chaîne de rôti

Nous pouvons voir que la réponse est beaucoup plus courte, ayant ainsi moins de jetons et nécessitant moins d’informatique pour générer.
Je l’ai vérifié moi-même avec GPT4O, et COD est en fait beaucoup mieux et plus rapide que COT

Voici un lien vers le document: https://arxiv.org/abs/2502.18600

soumis par / u / Danield2724
(lien) (Commentaires)



Source link

Related post