(R) Oubliez le raisonnement de la chaîne de pensées! Présentation de la chaîne de rôti: penser plus rapidement (et moins cher) en écrivant moins.

Je suis récemment tombé sur un papier de Zoom Communications (oui, le zoom que nous avons tous utilisé en 2020 …) Ils proposent un moyen très simple de faire une raison modèle, mais cette fois, ils le rendent beaucoup moins cher et plus rapide que ce que le COT nous permet actuellement. Voici un exemple de ce qu’ils ont changé dans l’invite qu’ils donnent au modèle: Voici comment un modèle de COT ordinaire répondrait: Voici comment le nouveau modèle de chaîne de rabat répond: Raisonnement de la chaîne de rôti Nous pouvons voir que la réponse est beaucoup plus courte, ayant ainsi moins de jetons et nécessitant moins d’informatique pour générer. Voici un lien vers le document: https://arxiv.org/abs/2502.18600 soumis par / u / Danield2724 |