(D) La distillation est sous-estimée. J’ai reproduit la capacité de GPT-4O dans un modèle 14x moins cher

Intelligence Artificielle
Noesis News
avril 14, 2025
0
18
2 minutes de lecture

Je viens d’essayer quelque chose de cool avec la distillation. A réussi à reproduire les performances de niveau GPT-4o (précision à 92%) en utilisant un modèle beaucoup plus petit et affiné et il fonctionne 14x moins cher. Pour ceux qui ne sont pas familiers, la distillation est essentiellement: prenez un modèle énorme et coûteux et utilisez-le pour entraîner un plus petit, moins cher et plus rapide sur un domaine spécifique. Si cela est bien fait, le petit modèle pourrait fonctionner presque De plus, à une fraction du coût. Honnêtement, super prometteur. Curieux si quelqu’un d’autre ici a joué avec la distillation. Dites-moi plus de cas d’utilisation.

Ajout de mon code dans les commentaires.

soumis par / u / ambitieux_anybody855
(lien) (Commentaires)

Source link

(D) La distillation est sous-estimée. J’ai reproduit la capacité de GPT-4O dans un modèle 14x moins cher

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Évolution et intelligence avec du Machado de la...

Maxon libère des contrôleurs de servo d’EsCon2

🕊 Dieu à l’ère numérique: une révélation de...

# 217 – Rodney Brooks: Robotique

Évolution et intelligence avec du Machado de la...

Maxon libère des contrôleurs de servo d’EsCon2

🕊 Dieu à l’ère numérique: une révélation de...

# 217 – Rodney Brooks: Robotique

Les escroqueries de Bitcoin ciblant les personnes âgées...

Mise à jour de la cryptographie | Le...

(R) Apprentissage du renforcement pour le raisonnement dans...

«Aita d’avoir suggéré que mon petit-fils pourrait venir...

L’IA d’Elon Musk propose des

Last Week in AI #297

Trump signe de créer une

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags