OpenAI a finalement publié des modèles de langue ouverte

« La grande majorité de nos clients (Enterprise and Startup) utilisent déjà de nombreux modèles ouverts », a déclaré Casey Dvorak, responsable du programme de recherche à OpenAI, dans une conférence de presse sur la version du modèle. «Parce qu’il n’y a pas de modèle ouvert (compétitif) d’OpenAI, nous voulions combler cet écart et leur permettre d’utiliser notre technologie à tous les niveaux.»
Les nouveaux modèles sont disponibles en deux tailles différentes, dont la plus petite peut théoriquement fonctionner sur 16 Go de RAM – la quantité minimale qu’Apple offre actuellement sur ses ordinateurs. Le modèle plus grand nécessite un ordinateur portable haut de gamme ou un matériel spécialisé.
Les modèles ouverts ont quelques cas d’utilisation clés. Certaines organisations peuvent vouloir personnaliser des modèles à leurs propres fins ou économiser de l’argent en exécutant des modèles sur leur propre équipement, bien que cet équipement ait un coût initial substantiel. D’autres – en tant qu’hôpitaux, des cabinets d’avocats et des gouvernements – peuvent avoir besoin de modèles qu’ils peuvent exécuter localement pour des raisons de sécurité des données.
OpenAI a facilité une telle activité en libérant ses modèles ouverts sous une licence Apache 2.0 permissive, qui permet aux modèles d’être utilisés à des fins commerciales. Nathan Lambert, responsable post-formation à l’Institut Allen pour l’IA, dit que ce choix est louable: de telles licences sont typiques des sorties chinoises à modèle ouvert, mais Meta a publié ses modèles LLAMA sous une licence sur mesure et plus restrictive. «C’est une très bonne chose pour la communauté ouverte», dit-il.
Les chercheurs qui étudient le fonctionnement des LLMS ont également besoin de modèles ouverts, afin qu’ils puissent examiner et manipuler ces modèles en détail. «En partie, il s’agit de réaffirmer la domination d’Openai dans l’écosystème de recherche», explique Peter Henderson, professeur adjoint à l’Université de Princeton qui a beaucoup travaillé avec des modèles ouverts. Si les chercheurs adoptent le GPT-ASS comme de nouvelles chevaux de travail, OpenAI pourrait voir des avantages concrètes, dit Henderson – il pourrait adopter des innovations découvertes par d’autres chercheurs dans son propre écosystème modèle.
Plus largement, Lambert dit, publier un modèle ouvert pourrait maintenant aider OpenAai à rétablir son statut dans un environnement d’IA de plus en plus encombré. «Cela remonte à il y a des années, où ils étaient considérés comme le Compagnie AI », dit-il. Les utilisateurs qui souhaitent utiliser des modèles ouverts auront désormais la possibilité de répondre à tous leurs besoins avec les produits OpenAI, plutôt que de se tourner vers le lama de Meta ou d’Alibaba Qwen lorsqu’ils ont besoin d’exécuter quelque chose localement.
La montée des modèles ouverts chinois comme Qwen au cours de la dernière année a peut-être été un facteur particulièrement saillant dans le calcul d’Openai. Un employé d’Openai a souligné lors de la conférence des médias que l’entreprise ne voit pas ces modèles ouverts comme une réponse aux actions prises par toute autre société d’IA, mais OpenAI est clairement adapté aux implications géopolitiques de la domination du modèle ouvert de la Chine. « Un large accès à ces modèles de poids ouverts capables créés aux États-Unis aide à étendre les rails d’IA démocratiques », a écrit la société dans un article de blog annonçant la version des modèles.