La vision de Nvidia pour les usines d’IA – «Tendance majeure dans le monde du centre de données»

 La vision de Nvidia pour les usines d’IA – «Tendance majeure dans le monde du centre de données»


Image: nvidia

Nvidia a lancé l’événement du World 2025 du Data Center cette semaine à Washington, DC, avec une vision audacieuse de l’avenir de l’infrastructure d’IA.

Dans son discours, Wade Vinson, ingénieur en chef du centre de données de Nvidia, a présenté le concept de centres de données à l’échelle de l’IA; Ces installations massives et économes en énergie répondraient à la demande de calcul de l’informatique accélérée. Nvidia envisage de vastes «usines d’IA» propulsées par les GPU Blackwell et les superpods DGX, soutenus par des systèmes de refroidissement et d’alimentation avancés par Vertiv et Schneider Electric.

« Il ne fait aucun doute que les usines d’IA sont une tendance majeure dans le monde du centre de données », a déclaré Vinson.

Terminer la première phase d’une usine d’IA au Texas

Vinson a souligné le campus Lancium Clean que Crusoe Energy Systems construit près d’Abilene, au Texas. Comme il l’a expliqué:

  • La première phase de cette usine d’IA est largement terminée: 200 MW dans deux bâtiments.
  • La deuxième phase l’élargira à 1,2 GW. Il devrait être achevé au milieu de 2026.
  • La conception comprend le refroidissement liquide direct à puce, les échangeurs de chaleur à porte arrière et le refroidissement à l’air.
  • Il comprendra six bâtiments supplémentaires, portant l’installation à quatre millions de pieds carrés.
  • 10 turbines à gaz seront déployées sur place pour fournir puissance sur place.

De plus, chaque bâtiment exploitera jusqu’à 50 000 GPU NVIDIA GB200 NVL72S sur un seul tissu réseau intégré, faisant progresser la frontière de la conception et de l’échelle du centre de données pour la formation et les charges de travail de l’inférence en IA.

Vinson a déclaré que certaines usines d’IA tireront parti de l’énergie sur place, tandis que d’autres profiteront des sites où l’électricité est déjà disponible. Il a souligné les vieilles usines, les sites de fabrication et les installations de vente au détail qui sont déjà branchées sur la grille.

Par exemple, un vieux centre commercial à San Francisco peut être converti en usine d’IA en mois, plutôt que les nombreuses années nécessaires pour terminer la construction de nouvelles constructions et obtenir des interconnexions et permis d’utilité. Ces sites ont souvent de grands toits qui peuvent être utilisés pour les réseaux d’énergie solaire.

Reconfigurer les centres de données existants dans les usines d’IA

Et les centres de données existants? Les structures vieillissantes peuvent avoir du mal à s’adapter aux équipements NVIDIA et aux applications de l’IA. Vinson pense que de nombreuses installations de colocation (colos) sont en bonne position pour être transférées dans des usines d’IA.

« Tout colo construit au cours des 10 dernières années a suffisamment de puissance et de refroidissement pour devenir une usine d’IA », a-t-il déclaré. «Les usines de l’IA devraient être considérées comme une opportunité de revenus plutôt que comme des dépenses.»

Il estime que L’IA pourrait stimuler la productivité des affaires et personnelles de 10% ou plus, ajoutant 100 billions de dollars à l’économie mondiale.

« Il représente un changement de productivité plus important que ce qui s’est produit en raison de la vague d’électrification dans le monde qui a commencé il y a environ 100 ans », a déclaré Vinson.

La planification est la clé du succès de l’usine d’IA

Vinson a averti les personnes intéressées à construire ou à gérer leurs propres usines d’IA sur l’importance de la planification. Il est important de considérer les différents facteurs impliqués et la modélisation est vitale.

Il a vanté l’outil de simulation omniverse de Nvidia comme un moyen de planifier correctement une usine d’IA. Il utilise la technologie Twin numérique pour permettre une modélisation complète de l’infrastructure du centre de données et une optimisation de conception. Le fait de ne pas modéliser à l’avance et de simuler de nombreux scénarios possibles peut entraîner des inefficacités dans des domaines tels que la consommation d’énergie et peut étendre les délais de construction.

«Les simulations permettent aux centres de données d’améliorer l’efficacité opérationnelle grâce à la gestion holistique de l’énergie», a déclaré Vinson.

VOIR: Les centres de données peuvent réduire la consommation d’énergie jusqu’à 30% avec environ 30 lignes de code

Par exemple, de nombreux anciens combattants du centre de données peuvent trouver difficile de passer des concepts traditionnels de racks, d’allées et de serveurs aux équipements GPU entourés d’un refroidissement liquide et avec un équipement de distribution d’énergie et d’énergie adéquat.

Les conceptions d’usine AI auront beaucoup plus de puissance et d’équipement de refroidissement à l’intérieur que les racks de serveur; Par conséquent, les dispositions seront radicalement différentes. Après tout, la quantité de chaleur générée par les superpods alimentées par GPU est plus que celle générée par les centres de données typiques.

« Attendez-vous à une consolidation importante des racks », a déclaré Vinson. «Huit vieux racks pourraient bien devenir un futur rack avec des GPU à l’intérieur. Il est essentiel de développer une puissance simplifiée et une configuration de refroidissement pour les racks à l’intérieur des usines d’IA, car celles-ci seront très différentes de ce à quoi la plupart des centres de données sont habitués.»



Source link

Related post