Le nouveau MU de Microsoft est-il pour vous?

 Le nouveau MU de Microsoft est-il pour vous?

Microsoft a annoncé cette semaine un Nouveau système générateur d’IA (Genai) appelé MUet c’est un véritable aperçu de l’avenir de la façon dont nous utiliserons tout, des PC aux grille-pain.

Mu permet aux gens de contrôler leurs ordinateurs en utilisant un langage clair. Par exemple, vous pouvez taper ou dire «Activer le mode sombre» ou «agrandir mon pointeur de souris» et l’ordinateur le fera. La première place MU apparaît se trouve dans l’application de paramètres Windows 11. Vous dites ou tapez comment vous voulez un paramètre spécifique pour changer, et l’outil Genai détermine ce que vous voulez et apporte le changement pour vous.

Surtout, ce n’est pas un modèle de grande langue (LLM) fonctionnant dans le cloud. MU est un modèle de petite langue (SLM) avec des paramètres relativement dérisants de 330 millions, construits pour fonctionner sur une puce d’IA spécialisée appelée un unité de traitement neuronalou npu. (Cette puce se trouve dans les derniers PC Copilot + de Microsoft, Dell, HP, Lenovo, Samsung et Acer. Ces nouveaux PC ont commencé à expédier en juin 2024 et sont les seuls ordinateurs qui peuvent utiliser MU et d’autres fonctionnalités AI avancées dans Windows 11.)

Ce n’est pas un chatbot basé sur LLM qui vit dans le cloud. C’est un SLM qui s’exécute entièrement sur le PC, même lorsqu’il est déconnecté d’Internet.

Microsoft Copilot + PCS Peut fonctionner MU car ils ont une NPU qui peut gérer au moins 40 billions d’opérations par seconde. Microsoft a collaboré avec Qualcomm, AMD et Intel pour s’assurer que MU fonctionne bien sur leurs NPU, qui sont désormais standard dans tous les PC Copilot +.

MU utilise une conception d’encodeur de transformateur, ce qui signifie qu’il divise le travail en deux parties. L’encodeur prend vos mots et les transforme en une forme compressée. Le décodeur prend ce formulaire et produit la commande ou la réponse correcte.

Cette conception est plus efficace que les modèles plus anciens, en particulier pour les tâches telles que la modification des paramètres. MU possède 32 couches d’encodeur et 12 couches de décodeur, une configuration choisie pour s’adapter à la mémoire et aux limites de vitesse du NPU. Le modèle utilise des incorporations de position rotatives pour maintenir l’ordre des mots, une normalisation à double couche pour maintenir la stabilité et l’attention groupée pour utiliser la mémoire plus efficacement. Ces choix techniques permettent à MU de traiter plus de 100 jetons par seconde et de répondre en moins de 500 millisecondes.

Par rapport aux chatbots basés sur LLM comme le chatppt d’Openai, MU est super rapide.

Microsoft a formé MU sur 3,6 millions d’exemples axés sur les paramètres Windows et les tâches connexes. La formation s’est produite sur Azure à l’aide de GPU NVIDIA A100. Après l’entraînement, Microsoft a affiné le MU et a utilisé la quantification pour réduire ses besoins en mémoire, il fonctionnerait donc bien sur les NPU des trois fabricants de puces. En conséquence, MU a environ un dixième de la taille du modèle PHI-3,5-moins de Microsoft, mais fonctionne presque aussi bien pour les tâches pour lesquelles il a été construit.

MU est vraiment révolutionnaire car il s’agit du premier SLM conçu pour permettre aux utilisateurs de contrôler les paramètres du système en utilisant le langage naturel, entièrement fonctionnant sur un dispositif d’expédition grand public. Les iPhones, les iPads et les Mac d’Apple ont tous un NPU en moteur neuron Apple Intelligence. Mais Apple n’a pas de petit modèle de langue aussi profondément intégré aux paramètres du système que MU. Siri et Apple Intelligence peuvent modifier certains paramètres, mais pas avec la même plage ou la même flexibilité.

Le Galaxy S25 de Samsung et d’autres téléphones phares récents disposent d’un NPU et d’un Galaxy AI personnalisés, qui peuvent effectuer diverses tâches de contrôle des appareils et d’assistants personnels. Cependant, ils n’ont pas non plus de SLM pour le contrôle complet des paramètres du système.

Les appareils ChromeBook Plus de Google ont un NPU et prennent en charge l’IA sur l’appareil, mais il n’utilise pas de SLM pour les paramètres du système comme MU le fait.

En traitant les données directement sur l’appareil, MU garde les informations personnelles privées et répond instantanément. Ce changement facilite également le respect des lois sur la confidentialité dans des endroits comme l’Europe et les États-Unis, car aucune donnée ne quitte votre ordinateur.

L’industrie évolue dans cette direction pour des raisons évidentes. Les SLM sont désormais suffisamment puissants pour gérer les tâches focalisées à égalité avec des modèles plus grands basés sur le cloud. Ils sont moins chers à exécuter, utiliser moins d’énergie et peuvent être adaptés à des travaux ou des langues spécifiques.

Notez que les NPU ne sont pas rares. Ils sont actuellement disponibles dans de nouveaux téléphones, des tablettes et même des appareils domestiques. Ces puces sont conçues pour exécuter efficacement les réseaux de neurones et avec une faible puissance, ce qui permet d’offrir des fonctionnalités intelligentes qui fonctionnent n’importe où, même sans une connexion Internet fiable.

Plus important encore, les SLM fonctionnant sur les NPU sont un BFD – pas seulement pour les PC, les téléphones et les tablettes, mais pour tout. Au fur et à mesure que la puissance et les capacités augmentent et que les coûts baissent, nous pouvons nous attendre à des tableaux de bord de voitures, des thermostats, des machines à laver, des tracteurs et tout le reste (y compris les grille-pain) pour éviter les menus imbriqués pour le contrôle des utilisateurs en faveur des paramètres contrôlés par voix.

Vous entrerez dans la cuisine et direz au grille-pain pour griller légèrement votre bagel en environ 20 minutes avant de dire à la cafetière de vous faire un blanc plat. Après le petit déjeuner, vous allez dans votre bureau à domicile et contrôlez à distance toutes sortes de dispositifs IoT et d’autres objets en parlant à un SLM dédié à chaque appareil.

Notez que ces SLM pour le contrôle des périphériques fonctionneront également directement avec les LLM pour des informations et d’autres actions, comme écrire du code, créer des sites Web et des applications, et faciliter toutes vos communications commerciales. Ce SLM à qui vous parlera vivra principalement et exécutera localement sur vos lunettes intelligentes.

Vous ne pouvez jamais posséder ou utiliser un copilote + PC. Mais vous utiliserez certainement quelque chose comme MU tous les jours pendant la majeure partie de votre vie professionnelle et personnelle sur de nombreux appareils. C’est un véritable aperçu de l’avenir de la façon dont nous interagissons avec les machines.



Source link

Related post