(P) Nous venons d’ouvrir la première recherche profonde à la file complète: agent + modèle + données + formation – Gaia 82.4 reproductible

 (P) Nous venons d’ouvrir la première recherche profonde à la file complète: agent + modèle + données + formation – Gaia 82.4 reproductible


https://i.redd.it/b9goy7brywhf1.gif

Nous libérons Miromind Open Deep Research (ODR) v0.1ce que nous croyons être le d’abord fileProjet de recherche profonde entièrement open-source– pas juste un agent, mais aussi le modèle, ensemble de données et formation / RL infra sont ouverts et reproductibles. Le cadre de l’agent (Miroflow) reproduit 82.4 sur Validation Gaia; la série de modèles (Mirothinker) atteint 60,2% sur Gaia-text-103. À la recherche de contributeurs + journaux de repro.

Pourquoi cela compte

  • Ouverture complète: La plupart des versions de recherche en profondeur s’arrêtent à l’agent; ODR ouvre les quatre couches: Agent (miroflow), Modèle (mirothinker), Données (Miroverse), Formation / RL (Mirotrain / Mirorl).
  • Nombres reproductibles: • Miroflow: Validation Gaia Maj voter 82.4passer @ 1 avg @ 3 72.2 (avec les détails de configuration et les scripts). • Mirothinker v0.1: 60,2% sur Gaia-text-103 (avec les variantes SFT et DPO à travers 8b / 14b / 32b).
  • Données ouvertes à grande échelle: Miroverse v0.1147k + trajectoires de déploiement complètes (~ 1,9b jetons, 602k + appels d’outils), construit pour les agents d’utilisation des outils / de navigation Web.

Ce qui est inclus

  • Miroflow (Framework d’agent) – Orchestration multi-outils, sous-agent, intégration MCP, analyse comparative d’interface utilisateur; Gaia Runs et scripts détaillés.
  • Mirothinker (série de modèles) – LLMS agents optimisé pour une recherche approfondie; SFT / DPO à 8b / 14b / 32b avec des guides d’évaluation.
  • Miroverse (ensemble de données) – 147k + trajectoires vérifiées sur l’AQ multi-HOP, navigation, raisonnement scientifique; Licence hybride notée sur la carte.
  • Mirotrain / Mirorl (formation et RL) – RL post-formation de bout en bout + MCP-First pour les agents d’utilisation des outils.

Démarrage rapide (Agent EVAL)

  1. Miroflow: Clone, Set Keys (OpenRouter / Anthropic / Openai / Gemini, Serper, Jina, E2B), Sandbox Docker E2B facultatif pour un repro stable; Exécutez des scripts Gaia.
  2. Mirothinker: Pull Modèle de HF ou d’auto-hébergement via SGLANG; Exécutez Gaia-Validation / Gaia-Text-103 / HLE / WebWalkerqa Scripts.

Links

soumis par / u / flyforlight
(lien) (Commentaires)



Source link

Related post