Lai # 74: invites plus intelligentes, agents compatibles, et les mathématiques derrière Kans

 Lai # 74: invites plus intelligentes, agents compatibles, et les mathématiques derrière Kans

Auteur (s): Vers l’équipe éditoriale de l’IA

Publié à l’origine sur Vers l’IA.

Bonjour, les passionnés de l’IA!

Vous voulez commencer le numéro de cette semaine avec une annonce rapide: l’inscription pour la prochaine «du débutant à avancé LLM La cohorte du développeur est ouverte en ce moment – et lancera 1er juin Avec un appel avec notre PDG, Louie Peters!

Réservez votre siège – à une remise de 75%!

Maintenant, revenons au problème de cette semaine, nous commençons par une ventilation des techniques d’incitation dynamiques et personnalisées, allant au-delà des instructions statiques à des flux de conversation plus adaptatifs. Ensuite, nous plongeons dans des polynômes orthogonaux dans les réseaux de Kolmogorov-Arnold – oui, c’est technique, mais en vaut la peine si vous vous souciez de ce qui est sous le capot d’interprétabilité et d’efficacité.

Il y a plus: nous couvrons le protocole de contexte modèle et Crewai pour la mise à l’échelle des agents d’entreprise, une méthode d’attention hybride pour prévoir les séquences binaires et l’évolution des réseaux bayésiens pour un raisonnement probabiliste en temps réel.

Profitez de la lecture!

– Louis-François Bouchard, vers le co-fondateur de l’IA et chef de la communauté

Apprenez la section communautaire AI ensemble!

Sondage de l’IA de la semaine!

Si la plupart des recherches ne collent pas, quel type de percée change réellement la façon dont vous construisez ou pensez? De temps en temps, quelque chose déplace notre point de vue. Était-ce une technique, un papier ou un outil qui a recâblé votre approche de l’IA? Dites-nous dans le fil!

Opportunités de collaboration

La communauté de Discord Learn AI est inondé de possibilités de collaboration. Si vous êtes ravi de plonger dans une IA appliquée, voulez un partenaire d’étude ou même souhaitez trouver un partenaire pour votre projet de passion, Rejoignez le canal de collaboration! Gardez également un œil sur cette section – nous partageons des opportunités intéressantes chaque semaine!

1 et 1 Benjaminlee9472_18198 est à la recherche d’un partenaire pour travailler sur des projets d’IA, comme la formation d’un modèle. Si c’est aussi votre objectif, tendre la main dans le fil!

2 Lokomatique cherche à collaborer avec des partenaires en se concentrant sur l’alphabétisation / formation de l’IA, l’alphabétisation DS, le Genai Upskilling et d’autres domaines d’apprentissage. Si cela vous semble pertinent, Connectez-vous dans le fil!

MEME de la semaine!

MEME partagé par fantôme_in_the_machine

Section Tai organisée

Article de la semaine

Concevoir des invites personnalisées et dynamiques pour de grands modèles de langue Par Shenggang Li

L’auteur a examiné les techniques pour créer des invites personnalisées et dynamiques Modèles de grande langue. Les invites personnalisées fournissent des instructions fixes et spécifiques à la tâche, tandis que les invites dynamiques ajustent en fonction du contexte conversationnel pour des réponses plus adaptatives. La discussion couvrait la mise en œuvre pratique par le biais de la construction manuelle, DSPY pour les workflows structurés, la bibliothèque de comptage dynamique pour les ajustements en temps réel, Jinja2 pour la composition basée sur des modèles et Langchain pour la construction d’applications LLM complètes.

Nos articles à lire à lire

1 et 1 Polynômes orthogonaux dans les réseaux de Kolmogorov-Arnold: cas d’utilisation et scénarios Par Fabio Yáñez Romero

Ce blog a examiné Kolmogorov-Arnold Networks (KANS), notant des défis avec les implémentations B-Spline, en particulier en ce qui concerne la parallélisation et la mémoire. Il a ensuite exploré les polynômes orthogonaux (OPS) comme alternative, mettant en évidence leurs avantages en matière d’efficacité de calcul, les exigences de mémoire réduites et la capture efficace des modèles globaux en raison de propriétés telles que l’indépendance linéaire et les relations de récidive. Bien que les OP offrent ces avantages, ils nécessitent une normalisation des entrées et peuvent être moins aptes aux variations locales. Il a également discuté des implémentations telles que Chebyshev-Kan et Legendre-Kan.

2 Protocole de contexte de modèle et Crewai: Échelle d’entreprise AI avec contexte standardisé Par Samvardhan Singh

Cet article a exploré le protocole de contexte du modèle (MCP) et Crewai, Technologies conçues pour améliorer l’entreprise AI. MCP standardise un accès sécurisé aux données de l’entreprise pour les agents d’IA, agissant comme un traducteur universel. Crewai orchestre ces agents de l’IA dans des équipes collaboratives pour lutter contre les tâches complexes. Ensemble, ils permettent des systèmes d’IA à l’évolution et au contexte en fournissant une approche structurée de l’accès aux données et de la coordination des agents, détaillant le flux de travail technique de la requête à l’achèvement.

3 et 3 Attention hybride pour les prévisions de séquences binaires Par Shenggang Li

Cet article présente une méthode de prévision de séquence binaire, BinaryTrendFormer. Il intègre les intérêts N-grammes, le comptage de l’auto-atténuer et la récence pondérée statistiques. Ce modèle prédit le résultat binaire suivant et la distribution du nombre de K-Step en transformant les données brutes en signaux fusionnés via l’attention. Il utilise une optimisation multi-tâches et une validation croisée des séries chronologiques. Une expérience de code démontre son application et ses performances, y compris les comparaisons d’intervalle d’incertitude, tout en notant les zones d’amélioration. Il a également discuté des utilisations du monde réel dans la finance, le commerce de détail, la génomique et l’IoT industriel.

4 De statique à dynamique: évolution du réseau bayésien pensant pour les applications du monde réel Par Shenggang Li

Cet article a exploré les réseaux bayésiens, distinguant entre les modèles statiques et dynamiques. Les BN statiques utilisent les données actuelles et les probabilités conditionnelles pour une évaluation immédiate des risques, comme le montre un diagnostic de pneumonie médicale. Les BN dynamiques étendent cela en ajoutant une dimension temporelle pour prévoir les tendances évolutives, démontrée avec les prévisions boursières. Les deux approches tirent parti des données historiques et des connaissances du domaine. Le code Python fourni illustré une implémentation pratique pour chaque type de réseau.

5 Comprendre les agents LLM: concepts, modèles et cadres Par Allohvk

Cet article a exploré les agents LLM, les définissant comme des entités qui utilisent des LLM pour résoudre des tâches complexes en interagissant avec les environnements et les outils, en les distinguant des flux de travail statiques. Il a couvert leur évolution des principes React (Raison + ACT), l’intégration de la mémoire, l’utilisation des outils et le chiffon agentique. La discussion s’est étendue aux systèmes uniques et multi-agents, aux modèles collaboratifs clés et à des cadres comme Langgraph. Des développements significatifs tels que le protocole de contexte du modèle (MCP) pour la connectivité des données et le protocole d’agent-agent (A2A) pour la communication inter-agents ont été mis en évidence, ainsi que les complexités de l’évaluation des agents.

Si vous êtes intéressé à publier avec Vers IA, Vérifiez nos directives et inscrivez-vous. Nous publierons votre travail sur notre réseau s’il répond à nos politiques et normes éditoriales.

Publié via Vers l’IA



Source link

Related post