LAI # 82: MCP, LLMS au niveau des octets, Vision Transformers et la semaine Dackprop a finalement cliqué

 LAI # 82: MCP, LLMS au niveau des octets, Vision Transformers et la semaine Dackprop a finalement cliqué

Auteur (s): Vers l’équipe éditoriale de l’IA

Publié à l’origine sur Vers l’IA.

Bonjour, les passionnés de l’IA,

Le problème de cette semaine zoome sur ce qui se passe lorsque vous allez plus profondément, qu’il s’agisse de comprendre MCP pour les intégrations d’outils plus intelligentes ou de codage à main pour finalement comprendre ce que votre modèle fait sous le capot.

Dans ce qui est l’IA, nous décomposons le protocole de contexte du modèle (MCP), une nouvelle norme qui pourrait vous faire économiser des heures de travail d’intégration répétitive entre les outils et les organisations. Ensuite, nous allons faire de la pratique: construire des transformateurs de vision à Pytorch, testant le niveau des octets LLMS Sans tokenisation, comparer les optimisateurs neuronaux et évaluer lorsque les alternatives open-source sont en fait assez bonnes à utiliser.

Également dans le mélange: outils d’enrichissement des métadonnées pour la rouille, les nouvelles collaborations de discorde et un mème qui peut atteindre un peu trop près pour quiconque a lutté descente de dégradé cette semaine.

Allons-y.

Qu’est-ce que l’AI chaque semaine

Cette semaine Qu’est-ce que l’AIJe vais plonger dans le protocole de contexte du modèle d’Anthropic. Combien de fois avez-vous commencé un nouveau projet d’IA et vous êtes-vous retrouvé à réécrire la même intégration GitHub, Slack ou SQL? Le fait que la répétition de copie-coche ennuyeuse et le manque de normes entre les organisations et les individus soient exactement la raison pour laquelle le protocole de contexte modèle, ou MCP, existe. Rendez-vous sur ce que c’est et pourquoi c’est important dans votre quotidien la vie, ou Regardez la vidéo sur YouTube.

– Louis-François Bouchard, vers le co-fondateur de l’IA et chef de la communauté

Apprenez la section communautaire AI ensemble!

Article communautaire en vedette de The Discord

SuperUser666_30897 a développé un système pour rassembler, enrichir et analyser les métadonnées pour les caisses de rouille, en utilisant des idées alimentées par l’IA, un grattage Web et une analyse de dépendance. Il combine le grattage Web, l’analyse alimentée par l’IA et les tests de fret pour fournir des informations complètes sur les packages d’écosystème de rouille. Vérifiez-le sur github et soutenir un autre membre de la communauté. Si vous avez des questions ou des suggestions, tendre la main vers lui dans le fil!

Sondage de l’IA de la semaine!

Plus de la moitié de cette communauté est entrée dans l’IA après Chatgpt, et ce n’est pas une mauvaise chose. Il marque un changement générationnel clair: de la recherche d’abord au produit d’abord, des articles académiques aux appels d’API. Si vous avez rejoint avant Chatgpt, quel état d’esprit pensez-vous que la nouvelle foule manque? Et si vous avez rejoint après, quelle est une chose que vous pensez que la foule précédente sous-estime? Dites-nous dans le fil!

Opportunités de collaboration

La communauté de Discord Learn AI est inondé de possibilités de collaboration. Si vous êtes ravi de plonger dans une IA appliquée, voulez un partenaire d’étude ou même souhaitez trouver un partenaire pour votre projet de passion, Rejoignez le canal de collaboration! Gardez un œil sur cette section, nous partageons des opportunités intéressantes chaque semaine!

1 et 1 Skaggsllc Construit Vera AI, un système axé sur l’IA pour l’entretien prédictif des véhicules et les diagnostics de la flotte, et recherche des développeurs qui pourraient être intéressés à contribuer au développement de cette plate-forme. Si cela ressemble à votre créneau, Connectez-vous dans le fil!

2 Vergil727 est à la recherche de quelqu’un pour aider à intégrer un système avancé de planification et de planification (APS) dans son environnement ERP / MES. Vous gérez la cartographie des données, la configuration de planification et l’intégration du système (SQL, ERP, MES). Si cela relève de vos compétences, s’il vous plaît tendre la main dans le fil!

MEME de la semaine!

MEME partagé par bigbuxchungus

Section Tai organisée

Article de la semaine

Des pixels aux prédictions: construire un transformateur pour les images Par Vicki y mu

Comme AI génératif continue de progresser, la compréhension de modèles fondamentaux comme le transformateur de vision est essentiel. Cette procédure pas à pas détaille le processus de construction d’un transformateur de vision (VIT) à partir de zéro dans Pytorch, expliquant la théorie derrière la conversion d’images en séquences de patch et les traitant avec une auto-agence multi-tête. L’auteur implémente le modèle, le forme sur le CIFAR-10 ensemble de donnéeset analyse les résultats, atteignant une précision de 60%. Il couvre également les limitations de la VIT et mentionne des architectures plus avancées.

Nos articles à lire à lire

1 et 1 La semaine où j’ai passé des réseaux de neurones qui codaient à la main pour enfin comprendre la rétro-propagation Par Abduldattijo

L’auteur détaille leur expérience de la construction d’un réseau de neurones à partir de zéro en utilisant uniquement Numpy, malgré des années d’expérience avec des cadres comme Pytorch. Présenté par une lacune dans la compréhension de la rétro-propagation, le processus a couvert les défis du calcul manuel du gradient, la mise en œuvre du passage arrière et la construction d’un optimiseur. Cet exercice a donné une compréhension plus profonde et pratique du fonctionnement des réseaux de neurones, ce qui a entraîné une amélioration des compétences de débogage et une capacité améliorée à comprendre des architectures complexes.

2 Des octets aux idées: LLMS sans tokenisation Par Mkwrishere

L’auteur examine U-Net autorégressif de META (AU-NET), une architecture conçue pour surmonter les limites de la tokenisation traditionnelle dans les modèles de langues. Au lieu d’utiliser des jetons prédéfinis, Au-Net traite le texte brut au niveau de l’octet, apprenant à construire la compréhension des lettres aux concepts. Cette méthode améliore la gestion des fautes de frappe et de nouvelles langues. Les références de performance montrent que l’AU-NET est compétitif avec des modèles standard, démontrant une force particulière dans la traduction multilingue et les tâches au niveau des caractéristiques. Cependant, la version actuelle est principalement optimisée pour les langages latin-script.

3 et 3 Comprendre le protocole de contexte du modèle (MCP): l’avenir de l’intégration des outils d’IA Par Mahendramedapati

Ce blog explique le protocole de contexte du modèle (MCP), une méthode standardisée pour connecter des modèles d’IA à des systèmes externes, tels que des bases de données, des API et des fichiers. Il fonctionne comme un traducteur universel, éliminant le besoin d’intégrations complexes et personnalisées pour chaque outil. En utilisant une analogie du concierge d’hôtel, l’auteur illustre comment MCP récupére et formate en toute sécurité les données pour l’IA. Le texte décrit les avantages tels que les coûts réduits et l’amélioration de la sécurité, et fournit des guides avec des exemples de code pour la mise en œuvre.

4 Le meilleur algorithme d’optimisation pour votre réseau de neurones Par Riccardo Andreoni

L’auteur a présenté un guide des algorithmes d’optimisation des réseaux neuronaux conçus pour réduire le temps de formation. Il passe en revue les méthodes fondamentales, telles que le lot et Descente de dégradé mini-lotsavant d’expliquer des techniques plus avancées. Il a couvert l’élan, qui utilise des gradients passés pour une convergence plus rapide, et RMSProp, qui adapte les taux d’apprentissage pour chaque paramètre. La discussion a ensuite progressé vers Adam, un algorithme combinant les deux approches, dont la performance supérieure a été démontrée dans une comparaison pratique sur la mode de la mode ensemble de données. Le résumé a également noté la désintégration du taux d’apprentissage comme une technique complémentaire pour affiner le processus de formation.

Si vous êtes intéressé à publier avec Vers IA, Vérifiez nos directives et inscrivez-vous. Nous publierons votre travail sur notre réseau s’il répond à nos politiques et normes éditoriales.

Publié via Vers l’IA



Source link

Related post