(P) Les gars ont-ils absolument soufflé mon modèle?

Intelligence Artificielle
Noesis News
mars 10, 2025
0
52
2 minutes de lecture

Transformateur (Standard): Lot = 64, Block_Size = 256, Rate d’apprentissage = 0,0003, Embedding_dimension = 384, couche = 6, têtes = 6, ensemble de données = Tiny Shakespeare, Max_iters = 5000, Tokenisation au niveau des caractères

Mon modèle (standard): Identique au transformateur, sauf pour le taux d’apprentissage = 0,0032 avec le planificateur LR, Embedding_dimension = 64, les têtes ne s’appliquent pas au moins à partir de maintenant

Pourquoi Nan s’est produit à la fin de la formation, expérimentera demain mais aura quelques indices.

Téléchargera le code source après avoir résolu le problème NAN et l’avoir optimisé davantage.

soumis par / u / twosunnysideup
(lien) (Commentaires)

Source link

(P) Les gars ont-ils absolument soufflé mon modèle?

Noesis News

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Pourquoi Jamie a-t-il tué Katie à l’adolescence? Qu’est-ce...

Bitcoin prêt à récupérer 90 000 $, selon...

Les innovations SS atteignent 4 000 chirurgies robotiques...

Apprenez vos animaux de ferme avec l’IA!

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Noesis News

Related post

Posts Récents

Commentaires Récents

Archives

Catégories

Tags