Google Deepmind à ICML 2024

 Google Deepmind à ICML 2024


Recherche

Publié

Explorer AGI, les défis de l’échelle et l’avenir de l’IA génératrice multimodale

La semaine prochaine, la communauté de l’intelligence artificielle (IA) se réunira pour le 2024 Conférence internationale sur l’apprentissage automatique (ICML). Du 21 au 27 juillet à Vienne, en Autriche, la conférence est une plate-forme internationale pour présenter les dernières avancées, échanger des idées et façonner l’avenir de la recherche sur l’IA.

Cette année, des équipes de Google Deepmind présenteront plus de 80 articles de recherche. Sur notre stand, nous présenterons également notre modèle multimodal sur les appareils, Gémeaux Nanonotre nouvelle famille de modèles d’IA pour l’éducation appelée Learnlm Et nous démo Tactiqueun assistant d’IA qui peut aider avec les tactiques de football.

Ici, nous présentons certaines de nos présentations orales, projetées et affiches:

Définir le chemin vers AGI

Qu’est-ce que l’intelligence générale artificielle (AGI)? La phrase décrit un système d’IA qui est au moins aussi capable qu’un humain au plus des tâches. Comme les modèles d’IA continuent d’avancer, définir à quoi AGI pourrait ressembler dans la pratique deviendra de plus en plus importante.

Nous présenterons un cadre pour Classifier les capacités et les comportements des modèles AGI. Selon leurs performances, leur généralité et leur autonomie, notre article classe les systèmes allant des calculatrices non AI aux modèles d’IA émergents et à d’autres nouvelles technologies.

Nous montrerons également cela ouverte est essentielle à la construction de l’IA généralisée Cela va au-delà des capacités humaines. Alors que de nombreuses avancées d’IA récentes ont été motivées par les données existantes à l’échelle Internet, les systèmes ouverts peuvent générer de nouvelles découvertes qui étendent les connaissances humaines.

Chez ICML, nous ferons démontrer Genie, un modèle qui peut générer une gamme d’environnements jouables basés sur des invites de texte, des images, des photos ou des croquis.

Mise à l’échelle des systèmes d’IA efficace et responsable

Le développement de modèles d’IA plus importants et plus compétents nécessite des méthodes de formation plus efficaces, un alignement plus étroit avec les préférences humaines et de meilleures garanties de confidentialité.

Nous montrerons comment utiliser Classification au lieu des techniques de régression Rend la mise à l’échelle des systèmes d’apprentissage en renforcement profond et réalise les performances de pointe dans différents domaines. De plus, nous proposons une nouvelle approche qui prédit la distribution des conséquences des actions d’un agent d’apprentissage du renforcementaider à évaluer rapidement de nouveaux scénarios.

Nos chercheurs présentent un approche de maintenance à l’alignement qui réduit le besoin de surveillance humaine et un Nouvelle approche pour régler les modèles de grande langue (LLMS)sur la base de la théorie des jeux, aligne mieux la sortie d’un LLM avec les préférences humaines.

Nous Critiquez l’approche de la formation des modèles sur les données publiques et ne réglage que la formation « différentiellement privée »et affirmez que cette approche peut ne pas offrir la vie privée ou l’utilité qui est souvent revendiquée.

Videopoet est un modèle de langue large pour la génération de vidéos à tirs zéro.

Nouvelles approches dans l’IA générative et la multimodalité

Les technologies d’IA génératives et les capacités multimodales élargissent les possibilités créatives des médias numériques.

Nous présenterons Videopoetqui utilise un LLM pour générer une vidéo et un audio de pointe à partir d’entrées multimodales, y compris des images, du texte, de l’audio et d’autres vidéos.

Et partager Génie (environnements interactifs génératifs), qui peuvent générer une gamme d’environnements jouables pour la formation d’agents d’IA, en fonction des invites de texte, des images, des photos ou des croquis.

Enfin, nous présentons Magiclersun nouveau système de récupération d’image qui utilise des instructions de texte pour récupérer des images avec des relations plus riches au-delà de la similitude visuelle.

Soutenir la communauté de l’IA

Nous sommes fiers de parrainer ICML et de favoriser une communauté diversifiée dans l’IA et l’apprentissage automatique en soutenant les initiatives dirigés par Handicap dans l’IA,Queer dans l’IA,Latinx en ai etFemmes en apprentissage automatique.

Si vous êtes à la conférence, visitez les stands de recherche Google Deepmind et Google pour rencontrer nos équipes, voir des démos en direct et en savoir plus sur nos recherches.

Apprendre encore plus



Source link

Related post