(P) Développer un cadre open source (récupération de la génération augmentée) écrite en C ++ avec des liaisons Python pour des performances élevées

A exploré des moyens d’optimiser Génération de la récupération (RAG) ces derniers temps, et il est clair qu’il y a toujours plus de terrain à couvrir lorsqu’il s’agit d’équilibrer les performances, la vitesse et l’efficacité des ressources dans des environnements dynamiques. Nous avons donc décidé de construire un cadre open source conçu pour repousser ces limites, en gérant les tâches de récupération plus rapidement, à l’échelle efficace et à l’intégration avec des outils clés de l’écosystème. Nous sommes encore en début de développement, mais les repères initiaux montrent déjà des résultats prometteurs. Dans certains cas, il correspond ou même dépasse des solutions bien connues comme Langchain et Llamaindex en performance. Comparrisson pour l’utilisation du processeur au fil du temps Comparrisson pour l’extration et le groupe PDF Il s’intègre en douceur avec des outils comme Tensorrt, Fais, vllm et d’autres. Et notre feuille de route regorge d’optimisations, d’intégations ou d’outils et de mises à jour que nous sommes ravis de déployer. Si cela ressemble à quelque chose que vous aimeriez explorer, consultez le dépôt GitHub: https://github.com/pureai-ecosystem/purecpp. soumis par / u / gbalke |