(R) Vers la sémantique universelle avec de grands modèles de langue

 (R) Vers la sémantique universelle avec de grands modèles de langue


Salut les gars. Le mois dernier, mon groupe a publié un article où nous essayons de faire parler les LLMS comme des hommes des cavernes:

Configuration des tâches pour générer des explications NSM

La raison en est basée sur le Metalanguage sémantique naturel (NSM) (Geeksforgeeks), qui est basé sur des preuves d’un petit ensemble de Primes sémantiquesqui sont des moyens de mots simples et primitifs qui existent dans de nombreuses langues, sinon toutes les langues du monde. Fondamentalement, ils sont un ensemble d’unités sémantiques fondamentales dont les moyens de mots plus complexes sont construits.

https://preview.redd.it/5f4dt4fujp7f1.png?width=865&format=png&auto=webp&s=4fe0d543a1892bed4650493745eb6472a680fb74

Sur la base de cette théorie, nous pouvons paraphraser n’importe quel mot / phrase / ou texte dans les nombres premiers sémantiques (appelé un explication), et obtenir une représentation facilement traduisible (comme les nombres premiers existent dans toute la langue) de sa signification. Et cela donne une réponse à une question utile: Quelles propriétés sémantiques mon système peut-il supposer tous les mots, langues et textes en commun?

Le NSM a été appliqué dans le passé pour la communication interculturelle (c.-à-d. La traduction), la linguistique (étudiant la dérive sémantique), l’analyse culturelle, la revivalistique, etc. Mais, il a été limité par le fait que la production de ces paraphrases est lente et assez contre-intuitive. Notre article est le premier travail à explorer à l’aide de LLMS pour automatiser ce processus. Notre article présente un tas de mesures, un ensemble de données et des modèles spécialement conçus pour cette tâche, et, espérons-le, servir de base à des recherches futures dans ce sujet.

Dans l’ensemble, cela a été un projet passionnant et assez unique, et je suis intéressé à entendre ce que les gens pensent de ce travail et de toutes les questions que vous avez. De plus, notre groupe est à la recherche de collaborateurs supplémentaires intéressés par ce sujet, afin que vous puissiez m’envoyer la main ou m’envoyer un e-mail si vous souhaitez en discuter davantage.

Lien vers le papier: https://arxiv.org/abs/2505.11764
X fils: https://x.com/baartmns/status/1924631071519543750

soumis par / u / middle_training8312
(lien) (Commentaires)



Source link

Related post