Lai # 83: Rag correctif, PPO en temps réel, récupération adaptative et chemins de mise à l’échelle LLM

 Lai # 83: Rag correctif, PPO en temps réel, récupération adaptative et chemins de mise à l’échelle LLM

Auteur (s): Vers l’équipe éditoriale de l’IA

Publié à l’origine sur Vers l’IA.

Lai # 83: Rag correctif, PPO en temps réel, récupération adaptative et chemins de mise à l'échelle LLM

Bonjour, les passionnés de l’IA,

Le problème de cette semaine consiste à construire des systèmes d’IA qui peuvent récupérer. Qu’il s’agisse d’une requête qui doit être réinstallée, d’une étape de récupération qui a raté la marque ou un modèle de politique qui se réalise de manière excessive pour changer, ce problème est rempli de techniques qui gardent les choses stables et intelligentes.

Dans ce qui est l’IA, nous partageons la deuxième leçon gratuite de notre 10 heures LLM Primer: une procédure pas à pas de 2 heures sur la façon dont les entreprises peuvent surmonter LLM Limites à travers des techniques comme le chiffon, le réglage fin et, dans le monde, une meilleure ingénierie contextuelle. Nous passons en revue le pipeline typique qu’une entreprise prend d’une simple invite vers le système le plus avancé en place, vous aidant à savoir quoi tester et dans quel ordre. Nous plongeons également dans:

  • Comment le chiffon correctif réécrit les mauvaises requêtes et les re-recherche pour de meilleurs documents
  • Comment PPO adapte les modèles de tarification en temps réel dans des environnements volatils
  • Comment les voies de chiffon adaptatives sont basées sur la complexité et construites avec des boucles de rétroaction
  • Et comment construire une récupération de doc financier alimentée par LLM à l’aide de Gemini + Llamaindex

Ajoutez un assistant AI légal de la communauté, de nouveaux threads collaborateurs et du sondage de cette semaine sur ce qui vient ensuite pour MCP – et vous avez un problème bien équilibré et axé sur l’ingénierie.

Allons-y.

Qu’est-ce que l’AI chaque semaine

Cette semaine, dans Qu’est-ce que l’AIJ’ai partagé la deuxième leçon gratuite de notre Apprêt vidéo LLM 10 heures cours. En 2 heures, je vais discuter de la façon de surmonter les limites des LLM et d’exploiter leur pouvoir grâce à des techniques telles que le chiffon, le réglage fin, les résultats structurés, etc., en suivant le chemin typique qu’une entreprise devrait prendre pour y parvenir. Si vous n’avez pas 2 heures à perdre… Lisez les 10 principaux plats à retenir de cette session ici ou Regardez la session complète sur YouTube.

– Louis-François Bouchard, vers le co-fondateur de l’IA et chef de la communauté

Apprenez la section communautaire AI ensemble!

Article communautaire en vedette de The Discord

Phantom_80757 a construit un assistant de document AI. Cela sera particulièrement utile pour les cabinets d’avocats et comprend des fonctionnalités telles qu’un référentiel de documents juridiques centralisé, une revue juridique contextuelle, une génération de documents alimentée par l’IA, une complétion des modèles intelligents et un raisonnement basé sur les cas. Vérifiez-le ici et soutenir un autre membre de la communauté. Si vous avez des questions ou des commentaires, partagez-les dans le fil!

Sondage de l’IA de la semaine!

81% disent que MCP est là pour rester, et honnêtement, cela a du sens. Si l’IA veut passer d’une démo au déploiement, des chatbots aux agents, quelque chose comme MCP est presque inévitable.

Si vous pariez sur MCP (ou quelque chose comme ça), que voulez-vous voir le support ensuite: outils, flux de travail ou couches de sécurité? Et si vous êtes sceptique, qu’est-ce qui manque? Partager dans le fil!

Opportunités de collaboration

La communauté de Discord Learn AI est inondé de possibilités de collaboration. Si vous êtes ravi de plonger dans une IA appliquée, voulez un partenaire d’étude ou même souhaitez trouver un partenaire pour votre projet de passion, Rejoignez le canal de collaboration! Gardez également un œil sur cette section – nous partageons des opportunités intéressantes chaque semaine!

1 et 1 gabrielayo est à la recherche d’un collaborateur avec une expérience aberrante. Tendre la main dans le fil Pour en savoir plus sur le projet.

2 Quixy8330 Lance une petite équipe pour développer et vendre des systèmes d’automatisation d’IA (tels que N8N, GPT et Chatbots) aux entreprises locales. Si vous voulez apprendre et construire dans cet espace, Connectez-vous avec lui dans le fil!

3 et 3 Franciszz Construit une communauté de développeurs d’automatisation N8N et recherche des ingénieurs d’automatisation qui ont construit des workflows utiles pour faire partie de notre groupe d’accès anticipé. Trouvez plus de détails dans le fil!

MEME de la semaine!

MEME partagé par fumoanalyzer

Section Tai organisée

Article de la semaine

Optimisation de la politique proximale en action: prix en temps réel avec l’apprentissage de la région de la confiance Par Shenggang Li

Cet article examine l’application de l’optimisation de la politique proximale (PPO) pour les prix dynamiques en temps réel. Il explique comment PPO utilise un objectif de substitution coupé pour maintenir la stabilité de l’apprentissage, empêchant les changements de politique volatils courants dans les méthodes standard acteurs-critiques. Il présente une étude de cas pratique dans laquelle PPO est utilisée pour définir des suppléments de livraison en fonction des données historiques, de l’affacturage de la demande, de l’offre et des conditions météorologiques. Les résultats démontrent que PPO produit une stratégie de tarification équilibrée et adaptative, contrairement à un modèle acteur-critique standard, qui a adopté une approche rigide et à haut risque.

Nos articles à lire à lire

1 et 1 Rag correctif: comment construire une génération d’auto-récupération de la récupération Par Sai bhargav rallapalli

Ce blog présente Corrective Rag (Crag), une méthode pour améliorer la génération traditionnelle de la récupération auprès. Crag intègre un mécanisme d’auto-correction qui évalue la pertinence des documents récupérés. Si les documents sont inadéquats, le système peut réécrire la requête et effectuer une recherche Web pour un meilleur contexte avant de générer une réponse. Il fournit une procédure pas à pas technique pour construire un pipeline de roches à l’aide de Langchain et Langgraph, avec du code pour chaque étape du processus.

2 Construire un système de récupération de rapport financier avec Llamaindex et Gemini 2.0 Par ADI Insights and Innovations

Un guide étape par étape a été présenté pour construire un système de génération (RAG) (RAG) de récupération pour les documents financiers. L’auteur utilise Llamaindex pour traiter et indexer un rapport financier d’entreprise, stockant les données dans une base de données vectorielle ChromADB. Le système exploite ensuite les LLM, y compris Gemini 2.0, pour alimenter un moteur de requête qui répond avec précision aux questions des utilisateurs. Il introduit également une méthode de routage qui sélectionne dynamiquement entre un outil de recherche de vecteur pour des requêtes spécifiques et un outil de résumé pour des requêtes plus larges.

3 et 3 Rag adaptatif: le cadre intelligent et auto-corrigé pour les requêtes d’IA complexes Par Sai bhargav rallapalli

Pour améliorer la façon dont les systèmes d’IA répondent aux questions, cet article décrit un cadre de génération (RAG) de récupération adaptative. Cette approche utilise un système de routage intelligent pour analyser la complexité des requêtes et sélectionner la source de données la plus appropriée. Il améliore la fiabilité avec une boucle de rétroaction que les notes ont récupéré des documents, vérifie les hallucinations et réécrit les requêtes si les résultats initiaux sont insuffisants. Il fournit une procédure pas à pas complète, démontrant comment construire ce système en utilisant du code avec Langchain et Langgraph.

Si vous êtes intéressé à publier avec Vers IA, Vérifiez nos directives et inscrivez-vous. Nous publierons votre travail sur notre réseau s’il répond à nos politiques et normes éditoriales.

Publié via Vers l’IA



Source link

Related post