Quand dois-je utiliser un LLM?





Image de l’auteur | Chatte
# Introduction
Au cours des deux dernières années, Modèles de grande langue (LLMS) sont devenus des protagonistes presque ubiles dans le paysage de l’IA et à travers les canaux médiatiques – étant parfois présentés comme la solution tout-en-un à chaque problème. Cela pourrait être une légère exagération de ma part. Pourtant, il est vrai que les LLM sont de plus en plus perçues par beaucoup comme des outils indispensables dans la grande majorité des applications du monde réel qui appellent à l’IA ou aux systèmes basés sur les données.
Cet article vise à ramener la conversation sur les LLMS sur terre. Nous explorerons non seulement le large éventail de cas d’utilisation où les LLM peuvent ajouter une valeur réelle, mais aussi les limites auxquelles ils sont confrontés. Comprendre ces limites est crucial car tous les défis ne sont pas mieux relevés avec un LLM, et dans certains scénarios, les utiliser peut même introduire des risques ou des complexités inutiles.
# Les meilleurs cas d’utilisation où les LLM ajoutent une valeur authentique
Les LLM sont des chefs-d’œuvre de traitement du langage naturel (NLP) conçus pour exceller dans la compréhension du langage et les tâches de génération du langage. Le diagramme ci-dessous répertorie certaines des tâches de compréhension et de génération les plus courantes, plaçant chaque tâche sous le type primaire (mais pas nécessairement le seul) «compétence linguistique» nécessaire pour l’entreprendre. Par exemple, le résumé ou la traduction du texte implique généralement beaucoup de compréhension du langage, mais en fin de compte, il nécessite également des capacités de génération de langage pour générer la sortie: une version résumée ou traduite du texte d’entrée d’origine.


Image par auteur
Bien que ces tâches couvrent les cas d’utilisation les plus courants pour les LLM, la discussion a été abstraite jusqu’à présent. Explorons certaines situations du monde réel où les LLM sont le bon outil pour le travail, en mettant en évidence les tâches spécifiques de compréhension et / ou de génération de la langue impliqués dans chacun:
Les LLM sont des chefs-d’œuvre de traitement du langage naturel (NLP) conçus pour exceller dans la compréhension du langage et les tâches de génération du langage.
// Support client automatisé
Il s’agit d’un cas d’utilisation à haute demande dans des secteurs comme le commerce de détail et le commerce électronique, où les LLM peuvent avoir un impact majeur. Des textes tels que les avis des clients ou les demandes envoyés via un formulaire Web peuvent être analysés par un LLM pour comprendre et classer l’intention de l’utilisateur (louange, plainte, demande, etc.), générer des réponses appropriées et répondre aux questions des clients. Ces tâches spécifiques, en particulier la dernière concernant les questions, sont mieux traitées en construisant un assistant virtuel basé sur LLM capable de comprendre et de répondre à une grande variété de requêtes client exprimées en langage naturel.
// Résumé des documents
Dans des domaines comme le droit, la recherche scientifique et, dans une certaine mesure, le journalisme, il peut être utile de condenser des documents texte longs et complexes tels que des articles et des rapports sur des résumés concis et lisibles qui couvrent les idées et les faits clés. Bien que cette utilisation de LLMS puisse améliorer considérablement l’efficacité des cas d’utilisation ardue comme une revue de la littérature scientifique, il est important de ne pas compter entièrement sur les résumés générés par la LLM et également de vérifier manuellement les sources jugées les plus pertinentes pour plonger plus loin dans des aspects ou des détails spécifiques.
// Communication multilingue
Lorsqu’elles sont utilisées pour la traduction, les LLM sont un excellent outil pour permettre une compréhension croisée. Ils sont utiles pour gérer les commentaires des clients dans une entreprise de commerce électronique qui opère dans plusieurs pays, en fournissant un support personnalisé et en gérant le contenu dans plusieurs langues en général. S’ils sont correctement formés sur des données suffisantes et diverses, les LLM peuvent également aider à interpréter l’argot local ou les phrases locales qui peuvent ne pas être comprises à première vue.
// Recherche sémantique et réponses aux questions
Lorsque les LLM sont intégrées dans des systèmes de génération auprès de la récupération qui peuvent atteindre une compréhension contextuelle plus profonde de la requête utilisateur, ils peuvent être utilisés avec une grande efficacité pour répondre à des questions complexes et ouvertes sur des bases de données ou des documents, fournissant des réponses directes et contextuelles.
// Génération de texte créative
Enfin et surtout, les LLM ont des capacités créatives étonnantes pour générer du texte avec un style, une structure et une intention divers. Des descriptions de produits précises et attrayantes et du contenu narratif avec une maîtrise et un ton solides aux poèmes captivants dans de nombreux styles différents, les LLM peuvent créer une large gamme de texte créatif.
# Quand utiliser autre chose? Limites des LLM
Malgré leur grande capacité à gérer une variété de tâches de compréhension des langues et de génération de langues qui pourraient souvent être très difficiles, il n’est pas réaliste de les considérer comme la solution tout-en-un pour chaque type de problème. De nombreux cas d’utilisation qui ont historiquement été traités en utilisant des solutions traditionnelles d’apprentissage automatique – comme la construction d’un système prédictif pour la classification, la régression et les prévisions – sont encore mieux traités en créant des modèles d’apprentissage automatique spécifiques qui apprennent des données spécifiques au domaine pour effectuer la tâche prédictive cible.
D’autres tâches spécifiques traditionnellement résolues par les systèmes d’IA de génération antérieure, comme les systèmes basés sur des règles ou les modèles de raisonnement logique, sont encore mieux traités par de telles approches traditionnelles dans certains cas: la prise de décision à faible latence et les tâches de raisonnement à limite de faits en sont un bon exemple.
Vous trouverez ci-dessous une liste concise des cas d’utilisation où les capacités de LLMS sont limitées, mettant en évidence la bonne approche alternative à utiliser:


Image par auteur
# Résumé et enveloppement
Les LLMS excellent dans des scénarios nécessitant une génération créative de texte, l’extraction d’informations complexes clés à partir de séquences de texte non structurées et tirant parti des applications d’assistant conversationnelles. Cependant, leur efficacité est limitée pour les scénarios prédictifs exigeant une haute précision, des performances en temps réel, un raisonnement logique spécifique au domaine ou un accès à des données propriétaires spécifiques.
Iván Palomares Carrascosa est un leader, écrivain, conférencier et conseiller dans l’IA, l’apprentissage automatique, le Deep Learning & LLMS. Il entraîne et guide les autres à exploiter l’IA dans le monde réel.
Source link