Comment Deepseek a détruit Openai, et comment vous pouvez le faire aussi!

Intelligence Artificielle
Noesis News
mars 9, 2025
0
63
4 minutes de lecture

Auteur (s): Mohit Varikuti

Publié à l’origine sur Vers l’IA.

Qu’est-ce que PTX / ASM?

Cette histoire réservée aux membres est sur nous. Mettre à niveau pour accéder à tout le milieu.

Dans le monde en évolution rapide de GPU L’informatique, les performances peuvent souvent être le facteur de marque ou de rupture dans le succès d’une application. L’une des armes secrètes derrière des cadres hautes performances comme Deepseek est l’utilisation intelligente de CUDA PTX et d’assemblage en ligne (ASM). L’efficacité et la vitesse remarquables de Deepseek ne sont pas venues uniquement de la conception d’algorithmes de haut niveau; C’était aussi la façon dont Deepseek est devenu si bon en exploitant les optimisations CUDA PTX / ASM CUDA de bas niveau pour presser chaque once de performance des GPU modernes.

Dans cet article, nous plongerons dans le langage PTX (exécution parallèle parallèle) de Cuda et explorerons comment l’assemblage en ligne peut être utilisé dans les noyaux Cuda. Nous examinerons ce qu’est le PTX, comment il s’intègre dans le pipeline de compilation CUDA et examiner quelques exemples de code pratiques.

CUDA PTX est un langage de type assemblage intermédiaire utilisé par les GPU NVIDIA. Considérez PTX comme le «langage d’assemblage» pour CUDA, bien qu’il soit de niveau supérieur que le code machine réel exécuté sur le GPU. Lorsque vous compilez le code CUDA à l’aide de NVCC, votre code C / C ++ de haut niveau est transformé en code PTX, qui est ensuite optimisé et compilé davantage vers le code binaire spécifique à la machine (SASS) pour le GPU cible, plus spécifiquement:

Portabilité: PTX résume de nombreux détails matériels,… Lisez le blog complet gratuitement sur Medium.

Publié via Vers l’IA

Source link

Comment Deepseek a détruit Openai, et comment vous pouvez le faire aussi!

Auteur (s): Mohit Varikuti

Noesis News

Leave a Reply Cancel reply

Posts Récents

Commentaires Récents

Archives

Catégories

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Elon Musk prévient que l’IA « va évidemment faire...

(R) Observer les modèles inattendus dans la demande...

Comment construire un pipeline de données léger avec...

Le navigateur COMET AI de Perplexity pourrait exposer...

Bitcoin Open Interest plonge de 43% à 24,5...

Pourquoi le droit et l’ordre: Huang de SVU...

Jim Gates: supersymétrie, théorie des cordes et prouvant...

Points de contrôle pour la formation du modèle...

L’IA d’Elon Musk propose des

Last Week in AI #297

Voici quelle est la tendance

Auteur (s): Mohit Varikuti

Noesis News

Related post

Leave a Reply Cancel reply

Posts Récents

Commentaires Récents

Archives

Catégories

Tags