Vous pensez que Deepseek a réduit les dépenses de l’IA? Repérer

L’effondrement des marchés boursiers en janvier, provoqué par la ferveur soudaine pour les Chinois intelligence artificielle (Ai) percée Deepseek Aiet c’est apparemment Approche informatique beaucoup moins chèrepourrait vous faire penser que les entreprises réduisent considérablement leurs dépenses sur des puces et des systèmes pour l’IA.
UN Conférence générative de l’IA mercredi à New York, hébergé par l’unité de renseignement Bloomberg de Bloombergm’a laissé avec l’impression opposée: la faim pour étendre l’utilisation de AI génératif est si grand que les dépenses devraient continuer à générer d’énormes investissements.
Aussi: Qu’est-ce que Deepseek AI? Est-ce sûr? Voici tout ce que vous devez savoir
Intitulé «Generative AI: Scaling Laws Post Deepseek», l’événement du jour a présenté des références constantes à la façon dont la demande entraînera des dépenses plus importantes.
« Nous avions dix panneaux aujourd’hui, et aucune personne sur ces panels, nous avons dit que nous avions plus de capacité que nous avons besoin », a déclaré Mandeep Singh, analyste de technologie senior chez Bloomberg Intelligence, et organisateur de l’événement.
« Et personne ne parlait d’une bulle » dans les infrastructures, a ajouté Singh.
« La question la plus importante en ce moment devant tout le monde est la construction de l’infrastructure d’IA. Ouais. Où sommes-nous dans ce cycle? » Anurag Rana, collègue de Singh à Bloomberg Intelligence et analyste senior des services informatiques et logiciels, m’ont dit.
« Personne ne sait » avec certitude, a déclaré Rana. Cependant, l’espoir soulevé par Deepseek IA est que beaucoup de travail peut être fait avec moins de dépenses.
« Deepseek a secoué beaucoup de gens », a-t-il déclaré. « Si vous n’avez pas besoin de beaucoup de GPU pour exécuter des modèles, alors pourquoi avons-nous besoin de 500 milliards de dollars pour le projet Stargate », a-t-il observé, se référant à un projet d’IA américain prévu géré par le groupe SoftBank japonais, Openai et Giant de base de données Oracle.
Tout le monde dans l’industrie, a déclaré Rana, espère que Les coûts d’IA baisseront rapidement Tout comme le coût du cloud computing a chuté.
Aussi: Le nouveau modèle d’image de Deepseek est-il une autre victoire pour une IA moins chère?
« Cette baisse de la courbe des coûts, qui a probablement pris six, sept, huit ans pour stocker un téraoctet de données en Amazon AWS, quand il a commencé contre aujourd’hui, l’économie était bonne », a-t-il déclaré. « Et c’est ce que tout le monde espère, que du côté de l’inférence » de l’IA, « si la courbe tombe à ce niveau, oh mon Dieu, le taux d’adoption sur l’IA du côté final de celui-ci, ou, le côté d’entreprise, va être spectaculaire. »
Singh a convenu que le moment de Deepseek de l’IA a « changé l’état d’esprit de chacun sur la réalisation de l’efficacité ».
C’était certainement mon impression des procédures de la journée. De nombreux panneaux se sont concentrés sur Projets d’IA d’entreprisede l’étape conceptuelle pour enfin les mettre en production. Cependant, les panélistes ont également parlé de la nécessité de réduire considérablement les coûts de service de l’IA afin d’élargir l’accès.
« Je ne pense pas que Deepseek a été une surprise », a déclaré Shawn Edwards, technologue en chef de Bloomberg, dans une interview avec David Dwyer, le chef de Bloomberg Intelligence. « Ce que cela m’a fait penser, c’est que ce serait formidable si vous pouviez agiter une baguette et que ces modèles fonctionnent incroyablement efficacement », a-t-il dit, ce qui signifie, tous Modèles d’IA.
L’une des raisons pour lesquelles de nombreux panélistes s’attendent à plus d’investissement en infrastructure d’IA La prolifération des modèles d’IA. Un thème tout au long de la journée était qu’il n’y aura pas un Modèle AI pour toutes les tâches.
« Nous utilisons une famille de modèles », a déclaré Edwards. « Il n’y a pas de meilleur modèle. »
Les panélistes ont convenu que, bien que les modèles de grande langue «fondation» ou «frontière» continueront à être développés, les entreprises individuelles peuvent utiliser des centaines, voire des milliers de modèles d’IA.
Aussi: La montée des PC IA: comment les entreprises remodèlent leur technologie pour continuer
Ces modèles pourraient être formés sur les données propriétaires d’une entreprise via le réglage fin, l’acte de recycler un réseau de neurones après sa « pré-formation » initiale sur les données génériques.
« Les agents de l’entreprise nécessitent une optionnalité parmi les modèles », a déclaré Jed Dougherty, responsable de la stratégie de la plate-forme pour la société de science des données soutenue par des entreprises Dataiku. « Ils ont besoin de la capacité de contrôler et de créer, et d’avoir une auditabilité » des modèles d’IA.
« Nous voulons mettre les outils pour construire ces choses entre les mains des gens », a-t-il déclaré. « Nous ne voulons pas que dix doctorants construisent tous les agents. »
Dans un esprit similaire, Outils de conception Maker Adobe Je parie que les modèles personnalisés seront un cas d’utilisation clé dans la nouvelle ère des créatifs. « Nous pouvons former des extensions de modèle personnalisées pour votre marque qui peuvent être d’une aide pour une nouvelle campagne publicitaire », a déclaré Hannah Elsakr, responsable d’Adobe, Hannah Elsakr, dans une conversation avec Bloomberg TV Anchor Romaine Bostick.
Comme avec les modèles d’IA, la prolifération de Agents d’IA Les entreprises intérieures augmentent la demande de traitement, ont suggéré de nombreux orateurs.
« Vous ne saisissez pas un processus entier en un seul agent, vous le diviserez en parties », a déclaré Ray Smith, responsable des agents de Copilot Studio et de l’automatisation.
À travers une seule interface, a prédit Smith, comme Copilote« Nous interagirons avec des centaines d’agents – ce ne sont que des applications dans le nouveau monde » de la programmation.
« Nous donnerons à l’agent le processus métier, lui dire ce que nous voulons accomplir », et l’agent effectuera des tâches. « Les applications agentiques ne sont qu’une nouvelle façon de workflow », a-t-il déclaré.
Aussi: Nvidia domine dans les références Gen AI, les jetons de 2 copeaux AI rivaux
De tels scénarios quotidiens sont « tous technologiquement possibles », a déclaré Smith, « c’est juste le rythme auquel nous le construisons ».
La tendance à obtenir des « agents » de l’IA à plus de personnes dans une organisation exige encore une réduction des coûts, a déclaré James McNiven, responsable de la gestion des produits pour Microprocesseur Maker Arm Holdings, dans une conversation avec Hyde de Bloomberg.
« Comment fournir un accès sur de plus en plus d’appareils », a-t-il posé. « Nous voyons des modèles à un niveau de doctorat » de capacité de tâche, a-t-il déclaré.
Ces agents doivent être assistants de l’homme, a-t-il suggéré, faisant la comparaison avec le moment où les systèmes de paiement ont été amenés dans les pays en développement il y a une décennie via des téléphones portables: « Comment pouvons-nous obtenir cela aux personnes qui peuvent utiliser cette capacité? »
Même les modèles de fondation génériques prolifèrent à un rythme incroyable.
Amazon AWS possède 1 800 modèles d’IA différents disponibles, Dave Brown, chef de l’AWS Computing and Networking, a déclaré à Bloomberg TV Anchor Caroline Hyde. L’entreprise « fait beaucoup pour réduire le coût » de la gestion des modèles, a-t-il déclaré, notamment en développant des puces AI personnalisées, telles que Trainium.
AWS « utilise plus de nos propres processeurs que les processeurs d’autres sociétés », a déclaré Brown, faisant allusion à Nvidia, AMD, Intel et à d’autres fournisseurs de puces à usage général.
Aussi: Le nouveau générateur d’images de Chatgpt a brisé mes attentes – et maintenant c’est gratuit
« Les clients feraient plus si le coût était plus bas », a déclaré Brown.
AWS fonctionne quotidiennement avec anthropic, fabricants du Claude Language Model Family, noté marron. Michael Gerstenhaber, responsable de la programmation d’application, Michael Gerstenhaber, dans la même conversation avec Hyde, a noté que « les modèles de réflexion provoquent une grande capacité à être utilisé », se référant à la tendance des modèles de raisonnement dits, tels que Deepseek R1 et GPT-O1, pour publier des déclarations verbales sur les arguments pour leurs réponses finales.
Anthropic travaille en étroite collaboration avec AWS sur les moyens de réduire le budget de calcul, tels que «la mise en cache rapide», stockant les calculs à partir de réponses antérieures.
Malgré cette tendance, a-t-il dit, « Anthropic a besoin de centaines de milliers d’accélérateurs », ce qui signifie, ce qui signifie, des puces en silicium axées sur l’IA « , dans de nombreux centres de données » pour gérer ses modèles.
De plus, le coût énergétique en spirale de l’alimentation de l’IA ne montre aucun signe de ralentissement, a déclaré Brown. Les centres de données actuels consomment des centaines de mégawatts, a-t-il noté, et nécessitera éventuellement des gigawatts. « Le pouvoir qu’il consomme », ce qui signifie AI « , est grand, et l’empreinte est importante dans de nombreux centres de données. »
Malgré les scénarios ambitieux, une condition pourrait bouleverser tous les cas d’utilisation et les plans d’investissement: l’économie.
Alors que la conférence s’appuyait sur une clôture mercredi soir, les panélistes et les invités vérifiaient la plongeon après les heures d’ouverture en bourse. Le président américain Donald Trump, lors d’une cérémonie de roseraie, venait de dévoiler un paquet mondial de tarifs qui étaient plus grands et beaucoup plus balayés que la plupart de Wall Street ne l’avait prévu.
Les zones traditionnelles de l’investissement technologique, telles que les serveurs et le stockage, et non l’IA, pourraient être les premières victimes de toute contraction économique, a déclaré Rana de Bloomberg.
« L’autre grande chose sur laquelle nous nous concentrons est les dépenses technologiques non en AI », a-t-il déclaré à propos des tarifs. « Quand nous regardons les goûts d’IBM, Accenture, Microsoft et tous les autres, lorsque nous mettons de côté l’IA pendant une seconde, c’est quelque chose qui va être difficile pour cette saison de résultats. »
Les directeurs financiers des grandes entreprises pourraient hiérarchiser l’IA et déplacer les fonds, même si elles doivent réduire leurs budgets au milieu de l’incertitude économique et de la récession, si cela s’est réalisé, m’a-t-il dit.
Cette vision rose n’est cependant en aucun cas garantie.
« Ce que je suis le plus intéressé à découvrir, c’est que, si toutes ces grandes entreprises vont garder leurs objectifs CAP-EX (dépenses en capital) intacts », a déclaré Rana, y compris les centres de données d’IA « , ou disent-ils, vous savez quoi? C’est trop incertain. »