Enrichir les données d’inventaire avec le conducteur d’Arcee | par Julien Simon | Mai 2025

Ce message a été initialement publié sur l’Arcee AI bloguer.
Dans le monde de la gestion des stocks, la précision et la richesse des données sont primordiales pour aider les utilisateurs et les clients à localiser rapidement et facilement le bon élément à chaque fois. Dans des domaines critiques comme les soins de santé, ces éléments ne sont pas des produits; Ce sont des outils critiques qui peuvent faire la différence entre la vie et la mort. S’assurer que chaque élément de l’inventaire est décrit avec précision, classé et à jour n’est pas seulement une meilleure pratique – c’est une nécessité.
Malheureusement, de nombreux systèmes de gestion des stocks, en particulier les systèmes hérités, souffrent de données incomplètes et incohérentes. Ils utilisent souvent des descriptions fortement abrégées en raison des contraintes d’application et de base de données. En conséquence, les descriptions sont difficiles à comprendre pour les utilisateurs. Voici un exemple que vous pourriez trouver dans un système de gestion des stocks hospitaliers
"Item": "IV START KIT W/CHG SKIN PREP CENTRAL LINE"
Si vous êtes un médecin ou une infirmière expérimentée, vous pouvez le comprendre. Cependant, le personnel junior et le personnel non médical seraient certainement confus. Les descriptions abrégées n’ont souvent pas les détails nécessaires pour distinguer les éléments similaires. Cette ambiguïté peut entraîner des erreurs, en particulier dans des environnements critiques comme les hôpitaux, où le mauvais outil peut avoir de graves conséquences.
L’absence de détails rend également difficile la mise en œuvre de fonctionnalités conviviales dans les applications informatiques et limite gravement les fonctionnalités de recherche. Les utilisateurs peuvent devoir passer à travers plusieurs résultats pour trouver l’élément exact dont ils ont besoin, ce qui est utile de temps précieux et augmente le risque d’erreurs. Les recommandations personnalisées sont également difficiles à mettre en œuvre sans données supplémentaires.
Grâce à l’enrichissement des données, nous pouvons ajouter des descriptions détaillées et des champs supplémentaires qui améliorent considérablement l’expérience utilisateur des systèmes d’inventaire. Voici comment l’exemple ci-dessus peut être amélioré, avec une description et des informations lisibles par l’homme sur les applications et les risques.
"Item": "IV START KIT W/CHG SKIN PREP CENTRAL LINE"
"Description": "An IV start kit that includes a chlorhexidine skin prep solution, designed for easy insertion and secure maintenance of central lines."
"Applications": "Insertion of central venous catheters", "Preparing the insertion site for IV access", "Infection control during line placement"
"Risks": "Potential for skin irritation from chlorhexidine", "Risk of infection if aseptic technique is not followed", "Allergic reactions to components of the kit"
Comme nous le savons maintenant, les modèles de langue excellent dans la compréhension des données complexes. Avec la bonne invite, ils peuvent facilement générer les données riches dont nous avons besoin pour créer de meilleures expériences utilisateur dans les systèmes d’inventaire.
Une façon de commencer avec un projet de système d’inventaire serait de choisir le «meilleur» modèle de grande langue (LLM) disponible aujourd’hui, et il pourrait certainement faire un excellent travail. Cependant, les LLM sont notoirement lents et coûteux, ce qui rend difficile l’échelle et la personnalisation du processus d’enrichissement des données. Les hôpitaux gèrent régulièrement des milliers, parfois des dizaines de milliers, d’articles d’inventaire uniques. Si vous jetez un œil à d’autres industries comme la construction, la production alimentaire et bien sûr le commerce électronique, avec un hôpital, vous pourriez regarder 10 fois ce nombre et encore plus.
C’est là que Chef d’orchestre peut aider.
Chef d’orchestre est une puissante plate-forme d’inférence basée sur une collection de modèles de petite et grande langue de haute qualité (LLM). La beauté et l’efficacité du conducteur d’Arcee se trouvent dans sa capacité à sélectionner en temps réel le modèle le plus approprié pour chaque requête, garantissant que la sortie est à la fois de haute qualité et rentable.
Des requêtes simples iront automatiquement à des modèles de petits langues (SLMS), offrant une inférence plus rapide et plus rentable qu’avec un LLM. Seules les requêtes les plus complexes iront aux LLM, et vous ne rencontrerez que leur génération plus lente et le coût plus élevé lorsqu’il sera vraiment nécessaire.
Voyons le chef d’orchestre en action.
Nous avons construit une petite démonstration pour montrer comment enrichir les données d’inventaire de l’hôpital avec Chef d’orchestre. Le carnet de jupyter étape par étape est disponible sur Gitlab.
Tout d’abord, nous générons 100 descriptions d’articles similaires à ce que vous trouveriez dans un système d’inventaire hospitalier. Le fichier contenant ces descriptions est également disponible sur Gitlab. Voici quelques exemples.
« Mask Surg 3ply Elastic Ear Loop plissé Disp BFE98% ASTM2 »
« Examen de gant nitr pwd sans sml non sml txtrd Fingrtip »
«Syringe 3 ml LUER-LOK TIP STERILE LATEX-FREE DIST»
Ensuite, nous envoyons chaque description de l’élément au Chef d’orchestre API configurée en mode Auto, en lui permettant de sélectionner le meilleur SLM ou LLM pour chaque requête. Comme l’API est compatible avec l’API OpenAI, nous pouvons envoyer nos requêtes avec le client OpenAI populaire.
Sur la base de la description de l’article abrégé, nous demandons au modèle d’écrire:
- Une description lisible par l’homme, en 1 à 2 phrases,
- Une liste des applications,
- Une liste de risques,
Une fois le processus terminé, nous avons réussi à enrichir les données! Le fichier enrichi est disponible sur Gitlabet les exemples ci-dessus ressemblent maintenant à ceci.
"Item": "MASK SURG 3PLY ELASTIC EAR LOOP PLEATED DISP BFE98% ASTM2"
"Description": "A surgical mask made of three layers of material, featuring elastic ear loops and pleated design, with a bacterial filtration efficiency of 98% as tested by ASTM2 standards."
"Applications": ("Protection against airborne particles during surgical procedures", "Prevention of cross-contamination in healthcare settings", "Use in environments requiring high-level respiratory protection")
"Risks": ("Potential skin irritation from prolonged wear", "Risk of decreased breathability if wet or soiled", "Inadequate protection if not worn correctly or if damaged")
"Item": "GLOVE EXAM NITR PWD-FREE SML NONSTER TXTRD FINGRTIP"
"Description": "A powder-free, textured, nitrile exam glove designed for sensitive skin, providing protection during medical examinations."
"Applications": ("Use in clinical settings for patient examinations", "Procedures requiring tactile sensitivity")
"Risks": ("Risk of allergic reactions to nitrile", "Potential for tears if not handled carefully")}
"Item": "SYRINGE 3ML LUER-LOK TIP STERILE LATEX-FREE DISP"
"Description": "A sterile, latex-free syringe with a 3ml capacity and a Luer-Lok tip, designed for precise and secure liquid delivery."
"Applications": ("Injection of medications", "Aspiration of fluids", "Administration of vaccines")
"Risks": ("Risk of contamination if not properly sterilized", "Potential for air embolism if not used correctly", "Risk of needle stick injury if not handled properly")}
Vous pouvez voir qu’il est beaucoup plus simple de comprendre ce que sont les éléments. Les données supplémentaires de haute qualité facilitent également la création de fonctionnalités de recherche ou de recommandation efficaces.
Voyons maintenant à quel point ce processus est rentable.
Pour nos 100 exemples, voici la ventilation des modèles sélectionnés par Chef d’orchestre:
- ARCEE Virtuoso-grand, notre modèle à usage général de 32 milliards de paramètres: 86 fois
- GPT-4.1: 7 fois
- Claude Sonnet 3.7: 6 fois
- Arcee Virtuoso-Medium, notre modèle à usage général de 14 milliards de paramètres: une fois
Le chef d’orchestre a pu faire le travail avec ARCEE SLMS 87% du temps. Non seulement cela réduit le temps de traitement d’environ 50%, mais cela se traduit également par des économies de coûts importantes. Avec un coût total de 0,0507 $, Chef d’orchestre est respectivement 75% et 56% plus rentable que l’utilisation de Sonnet 3,7 (0,201 $) ou GPT-4.1 (0,1157 $).
Vous vous demandez peut-être, comment les SLM ARCEE ont-ils fonctionné? Ont-ils produit des données de haute qualité similaires à ce que les LLM auraient généré? Bien sûr, nous vous recommandons d’exécuter votre propre évaluation, mais voici une comparaison côte à côte qui est représentative des performances de nos SLM pour cette démo. Nous avons utilisé la même invite pour les deux modèles sur cet article Description: «Mask Surg 3ply Elastic Ear Loop plieted Disf BFE98% ASTM2»
- Description
– virtuose-grand: Un masque chirurgical jetable avec des boucles d’oreille élastiques, une conception plissée et une efficacité de filtration bactérienne de 98%, répondant aux normes ASTM niveau 2.
– Sonnet 3.7: Un masque chirurgical à trois plis avec boucles d’oreille élastique, une conception plissée et une efficacité de filtration bactérienne à 98% qui répond aux normes ASTM de niveau 2. - Cas d’utilisation
– virtuose-grand:
«Protéger les agents de santé pendant les procédures médicales»
«Empêcher la propagation des infections respiratoires en milieu clinique»
« Fournir une barrière contre les grandes gouttelettes et les éclaboussures »
– Sonnet 3.7:
«Procédures médicales générales»
«Centre de santé»
«Zones de soins aux patients»
«Protection contre les gouttelettes respiratoires»
«Environnements chirurgicaux» - Risques
– virtuose-grand:
«Potentiel d’une efficacité réduite si elle n’est pas correctement ajustée ou usée»
« Risque de contamination s’il est réutilisé ou non éliminé correctement »
«Peut provoquer une irritation cutanée ou des réactions allergiques chez certains utilisateurs.»
– Sonnet 3.7:
« Pas suffisant pour les procédures de génération d’aérosols »
«Peut ne pas fournir une protection adéquate contre les agents pathogènes en suspension dans l’air»
« Unique unique »
«L’ajustement inapproprié peut réduire l’efficacité»
« Ne crée pas de sceau complet autour du visage » - Coût
– Virtuoso-grand: 0,00026685 $
– Sonnet 3,7: 0,002595 $ - Temps
– virtuose-grand: 1,87 seconde
– Sonnet 3.7: 3,2 secondes
Comme vous pouvez voir, les résultats sont extrêmement proches et il est difficile de justifier le coût 10x plus élevé du sonnet et son temps de génération plus lent à 70%.
En utilisant Chef d’orchestre Pour l’enrichissement des données peut transformer vos systèmes de gestion des stocks, et généralement, tout système qui pourrait bénéficier de données et de métadonnées plus riches et plus riches. La sélection automatique du modèle garantit que vous utilisez toujours le modèle le plus approprié et que les économies de coûts sont très importantes. Nous vous encourageons à l’essayer!
Nous serions ravis de vous entendre et de voir comment nous pouvons vous aider. N’hésitez pas à contacter sales@arcee.ai ou soumettre une demande pour répondre à notre réserver une démo formulaire.
Saisissez le cahier et les exemples de fichiers sur Gitlab.