5 conseils pour construire des modèles de fondation pour l’IA

De nombreuses entreprises commencent à peine à se débattre avec L’impact de l’intelligence artificiellemais certains utilisent l’apprentissage automatique (ML) et d’autres technologies émergentes depuis plus d’une décennie.
Pour Manish Jethwa, CTO à Ordnance Survey (OS), le service national de cartographie du Royaume-Uni, la priorité est de combiner les expériences de l’IA et de la ML de son organisation avec Avancées récentes dans l’IA générative Pour affiner, distribuer et appliquer ses trésors de données.
Jethwa a expliqué à ZDNET comment les modèles linguistiques (LLMS) aident les utilisateurs du système d’exploitation et interrogent les données géospatiales. L’un des éléments clés ici est le Modèles de fondation pour l’IAqui servent de base pour construire des applications plus spécialisées.
Aussi: 4 questions à vous poser avant de parier sur l’IA dans votre entreprise – et pourquoi
Alors que les analystes technologiques comme Gartner suggèrent qu’il y a beaucoup conjecture sur la question de savoir si les chefs d’entreprise doivent acheter ou construire des modèles d’IAJethwa et son équipe au système d’exploitation combinent des modèles de fondation avec des outils disponibles dans le commerce pour exploiter et distribuer des données géospatiales.
Voici cinq leçons clés que les chefs d’entreprise peuvent apprendre du déploiement par Jethwa des modèles de fondation pour l’IA.
1. Développer un cas d’utilisation solide
Jethwa a déclaré que le système d’exploitation développe des modèles de fondation pour extraire les caractéristiques environnementales pour l’analyse de manière sensible au droit d’auteur.
« De nombreux modèles existants formés par les grandes organisations technologiques seront basés sur des données disponibles dans le commerce », a-t-il déclaré.
Le système d’exploitation bénéficie d’une longue histoire de collecte de données de haute précision qui alimente les développements de l’IA de l’organisation.
« Lorsque nous essayons d’extraire des fonctionnalités, nous construisons des modèles de fondation à partir de zéro », a-t-il déclaré. « Ce sera un modèle où nous définissons l’ensemble de formation complet avec les données étiquetées que nous avons en interne. »
Aussi: 4 façons de transformer l’IA en avantage commercial
Les modèles de fondation sont également utilisés comme base d’analyse des données dans d’autres domaines. Jethwa a dit que le message ici est simple: vous pouvez utiliser ce que vous avez déjà construit encore et encore.
« Les modèles de fondation sont là pour nous aider à construire des résultats ultérieurs. Donc, si nous voulions alors en savoir plus sur les matériaux de toit ou les espaces verts ou la biodiversité, nous pourrions faire tout cela à partir du même modèle de fondation », a-t-il déclaré. « Plutôt que d’avoir à former plusieurs modèles de fondation, vous faites simplement le réglage fin à la fin. Ce processus nous permet de nous connecter au problème que nous essayons de résoudre avec les données source. »
2. Établir des méthodes utiles
Jethwa a déclaré que la formation ciblée aide à limiter les coûts lors de la construction de modèles de fondation.
« Nous devons être conscients que, lorsqu’il s’agit de former ces modèles, nous le faisons délibérément, car vous pouvez perdre beaucoup de cycles sur l’exercice de l’apprentissage », a-t-il déclaré. « L’exécution de ces modèles prend beaucoup moins d’énergie et de ressources que la formation réelle. »
Le système d’exploitation alimente généralement les données de formation à ses modèles en morceaux.
« La construction des données sur l’étiquette prend beaucoup de temps », a-t-il déclaré. « Vous devez organiser des données à travers le pays avec une grande variété de classes dont vous essayez d’apprendre, donc un mélange différent entre urbain et rural, et plus encore. »
Aussi: 5 façons d’être un grand gestionnaire d’agent d’IA, selon les chefs d’entreprise
L’organisation construit d’abord un petit modèle qui utilise plusieurs centaines d’exemples. Cette approche aide à limiter les coûts et garantit que le système d’exploitation est dirigé dans la bonne direction.
« Ensuite, nous construisons lentement cet ensemble étiqueté », a déclaré Jethwa. « Je pense que nous sommes maintenant dans les centaines de milliers d’exemples étiquetés. En règle générale, ces modèles sont formés avec des millions d’ensembles de données étiquetés. »
Bien que les modèles de l’organisation soient plus petits, les résultats sont impressionnants.
« Nous surpassons déjà les modèles existants qui sont disponibles des grands fournisseurs parce que ces modèles sont formés sur une plus grande variété d’images », a-t-il déclaré. « Les modèles pourraient résoudre une plus grande variété de problèmes, mais, pour notre domaine spécifique, nous surpassons ces modèles, même à plus petite échelle. »
3. Utilisez d’autres LLM pour un réglage fin
Ce n’est pas parce que le système d’exploitation utilise ses propres modèles de fondation, l’organisation ignore les modèles de grande langue bien connus, a déclaré Jethwa: « Nous construisons les modèles existants et faisons le réglage fin en fonction de notre documentation. »
Le système d’exploitation utilise l’étendue complète des LLM disponibles dans le commerce. En tant que Microsoft Shop, l’organisation utilise des modèles d’apprentissage automatique Azure, des outils basés sur Python et d’autres capacités spécialisées.
Aussi: Chatgpt n’est plus juste pour discuter – maintenant il fera votre travail pour vous
Jethwa a déclaré que le système d’exploitation explore également des partenariats avec des organisations externes, telles que IBM et d’autres fournisseurs de technologies, pour générer des solutions collaboratives aux défis axés sur les données.
Encore une fois, tout comme avec les modèles de fondation, l’objectif est de maintenir les coûts limités.
« C’est un effort pour rationaliser », a déclaré Jethwa. « En interne, la principale façon de adopter cette approche est de se développer lentement et de garantir la destination vers laquelle vous essayez de vous diriger est réalisable, et vous ne gaspillez pas les ressources avec une activité infructueuse. »
4. Pensez à la commercialisation
Maintenant que le système d’exploitation a commencé à construire et à affiner ses modèles de fondation, ces technologies pourraient-elles être utilisées ou vendues à d’autres organisations? La réponse, a déclaré Jethwa, est peut-être.
L’un des principaux problèmes est la Crown Copyright, une forme de droit d’auteur qui s’applique aux actifs créés par les employés du secteur public britannique.
« Je pense qu’il y aura des opportunités pour nous de partager ces modèles de fondation à un moment donné, mais le fait qu’ils soient construits sur les droits d’auteur de la Couronne signifie que nous essayons toujours de comprendre l’impact potentiel de ce travail à l’extérieur », a-t-il déclaré. « Il y a des défis là-bas pour donner les joyaux de la couronne – ces actifs sont, littéralement, des bijoux du droit d’auteur de la Couronne, nous devons donc être prudents. »
Aussi: Microsoft économise des millions avec l’IA et licencie des milliers – où allons-nous d’ici?
Lorsque le système d’exploitation fournit un accès libre, Jethwa a déclaré que les actifs de l’organisation ne devaient pas être collectés et monétisés sans produire d’avantages pour les contribuables britanniques.
« Nous essayons de protéger nos données autant que possible, mais en même temps, offrons autant de valeur pour le Royaume-Uni. Donc, il essaie d’obtenir cet équilibre, ce qui est un défi. »
5. Gardez un œil sur l’avenir
Jethwa a déclaré que les travaux de son organisation sur les modèles de fondation ont prouvé les avantages de l’IA générative pour l’ouverture de l’accès à des informations approfondies.
« Il est à condition que Key se déverrouille, alors qu’auparavant, vous avez toujours eu l’impression que cet accès était légèrement hors de portée en termes de façon de réaliser l’interaction, d’accéder aux données et d’affiner la demande. »
Il a peint un tableau de la façon dont l’approche du système d’exploitation pourrait se développer au cours de la prochaine décennie.
« Je peux imaginer une interface où il y a une carte et vous pouvez dire:« Je suis intéressé par ce domaine », et vous pouvez zoomer et l’IA vous demandera:« Quelles choses spécifiques recherchez-vous? Lorsque vous dites «écoles», l’IA demandera quels types d’écoles, et vous aurez cette boîte de dialogue dans les deux sens via l’interface. «
Aussi: 5 emplois technologiques d’entrée de gamme AI est déjà en augmentation, selon Amazon
Jethwa a déclaré que la clé du succès à long terme est d’utiliser des API et des données pour créer des réponses définitives aux invites à l’aide de sources de confiance, y compris des informations sur le système d’exploitation combinées avec des sources externes.
« Les modèles d’IA sont excellents en termes d’agrégation et d’une vision probabiliste, mais, dans notre exemple, vous ne voulez pas savoir de manière probabiliste où se trouvent les écoles », a-t-il déclaré. « Vous voulez savoir où se trouvent les écoles réelles. L’IA doit traduire une véritable demande, revenir à une source faisant autorité, quel système d’exploitation est, et nous pouvons extraire les données et livrer la sortie. »
Obtenez les meilleures histoires du matin dans votre boîte de réception chaque jour avec notre Newsletter Tech Today.