Comment Deepseek a détruit Openai, et comment vous pouvez le faire aussi!

 Comment Deepseek a détruit Openai, et comment vous pouvez le faire aussi!


Auteur (s): Mohit Varikuti

Publié à l’origine sur Vers l’IA.

Qu’est-ce que PTX / ASM?

Cette histoire réservée aux membres est sur nous. Mettre à niveau pour accéder à tout le milieu.

Dans le monde en évolution rapide de GPU L’informatique, les performances peuvent souvent être le facteur de marque ou de rupture dans le succès d’une application. L’une des armes secrètes derrière des cadres hautes performances comme Deepseek est l’utilisation intelligente de CUDA PTX et d’assemblage en ligne (ASM). L’efficacité et la vitesse remarquables de Deepseek ne sont pas venues uniquement de la conception d’algorithmes de haut niveau; C’était aussi la façon dont Deepseek est devenu si bon en exploitant les optimisations CUDA PTX / ASM CUDA de bas niveau pour presser chaque once de performance des GPU modernes.

Dans cet article, nous plongerons dans le langage PTX (exécution parallèle parallèle) de Cuda et explorerons comment l’assemblage en ligne peut être utilisé dans les noyaux Cuda. Nous examinerons ce qu’est le PTX, comment il s’intègre dans le pipeline de compilation CUDA et examiner quelques exemples de code pratiques.

CUDA PTX est un langage de type assemblage intermédiaire utilisé par les GPU NVIDIA. Considérez PTX comme le «langage d’assemblage» pour CUDA, bien qu’il soit de niveau supérieur que le code machine réel exécuté sur le GPU. Lorsque vous compilez le code CUDA à l’aide de NVCC, votre code C / C ++ de haut niveau est transformé en code PTX, qui est ensuite optimisé et compilé davantage vers le code binaire spécifique à la machine (SASS) pour le GPU cible, plus spécifiquement:

Portabilité: PTX résume de nombreux détails matériels,… Lisez le blog complet gratuitement sur Medium.

Publié via Vers l’IA



Source link

Related post

Leave a Reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *