(R) Rapport d’expérience: Openai GPT 4.1-Mini est un modèle vraiment rentable
|
Openai Nouveaux modèles: comment les modèles GPT 4.1 se comparent-ils aux modèles 4O? GPT4.1-Mini semble être le meilleur modèle rentable! Pour faciliter notre curiosité, nous effectuons un ensemble d’expériences de chiffon. L’ensemble de données public est une collection de messages (donc il pourrait être particulièrement intéressant pour les fabricants de téléphones portables et / ou de PC). Soi-disant, il devrait également s’agir d’un bon ensemble de données pour tester les algorithmes de chiffon graphique de connaissances (ou de chiffon graphique). Comme le montre le tableau, les résultats de RAG sur cet ensemble de données semblent soutenir l’affirmation selon laquelle GPT4.1-MINI est le meilleur modèle rentable dans son ensemble. La plate-forme RAG hébergée par VECML permet aux utilisateurs de choisir le nombre de jetons récupérés par RAG. Étant donné que OpenAI facture aux utilisateurs par le nombre de jetons, il est toujours bon d’utiliser moins de jetons si la précision n’est pas affectée. Par exemple, l’utilisation de 500 jetons réduit le coût de seulement 1/10 du coût avec 5000 jetons. Cet ensemble de données est vraiment difficile pour le chiffon et l’utilisation de plus de jetons aide à améliorer la précision. Sur d’autres ensembles de données, nous avons expérimenté, souvent des tokens de chiffon avec 1600 fonctionnalités ainsi que des jetons de chiffon avec 10000 jetons. D’après notre expérience, l’utilisation de 1 600 jetons pourrait convenir aux téléphones Android phares (8GEN4). L’utilisation de 500 jetons peut être toujours adaptée aux téléphones plus anciens et atteint souvent une précision raisonnable. Nous tenons à tester sur plus de ensembles de données RAG, avec une collection de documents claires, un ensemble de requête et des réponses dorées (ou référence). Veuillez nous envoyer les informations si vous connaissez certains ensembles de données pertinents. Merci beaucoup. soumis par / u / dûkitchen3102 |
