Nos dernières avancées dans la dextérité des robots

Recherche
Deux nouveaux systèmes d’IA, Aloha Unleashed et DeMostart, aident les robots à apprendre à effectuer des tâches complexes qui nécessitent un mouvement digne
Les gens effectuent quotidiennement de nombreuses tâches, comme attacher des lacets ou serrer une vis. Mais pour les robots, l’apprentissage de ces tâches très terres est incroyablement difficile à bien faire. Pour rendre les robots plus utiles dans la vie des gens, ils doivent s’améliorer pour prendre contact avec des objets physiques dans des environnements dynamiques.
Aujourd’hui, nous introduisons deux nouveaux articles mettant en vedette nos dernières avancées de l’intelligence artificielle (IA) dans la recherche sur la dextérité des robots: Aloha s’est déchaîné qui aide les robots à apprendre à effectuer des tâches de manipulation à deux bras complexes et nouvelles; et Démostart qui utilise des simulations pour améliorer les performances du monde réel sur une main robotique à quais.
En aidant les robots à apprendre des démonstrations humaines et à traduire les images en action, ces systèmes ouvrent la voie aux robots qui peuvent effectuer une grande variété de tâches utiles.
Améliorer l’apprentissage de l’imitation avec deux bras robotiques
Jusqu’à présent, la plupart des robots AI avancés n’ont pu ramasser et placer des objets en utilisant un seul bras. Dans Notre nouveau papiernous présentons Aloha Unleashed, qui atteint un niveau élevé de dextérité dans la manipulation des bi-bras. Avec cette nouvelle méthode, notre robot a appris à attacher un lacet, à accrocher une chemise, à réparer un autre robot, à insérer un équipement et même à nettoyer une cuisine.
Exemple d’un robot bi-bras redressant les lacets de chaussures et les liant dans un arc.
Exemple d’un robot bi-bras disposant d’un polo sur une table, le mettant sur un cintre de vêtements puis le suspendre sur un rack.
Exemple d’un robot bi-bras réparant un autre robot.
La méthode Aloha Unleashed s’appuie sur notre Aloha 2 plate-forme basée sur l’original Aloha (un système matériel open-source à faible coût pour la téléopération bimanuelle) à partir de Université de Stanford.
Aloha 2 est beaucoup plus dextéreurs que les systèmes antérieurs car il a deux mains qui peuvent être facilement téléopérées à des fins de formation et de collecte de données, et il permet aux robots d’apprendre à effectuer de nouvelles tâches avec moins de démonstrations.
Nous avons également amélioré l’ergonomie du matériel robotique et amélioré le processus d’apprentissage dans notre dernier système. Tout d’abord, nous avons collecté des données de démonstration en exploitant à distance le comportement du robot, en effectuant des tâches difficiles comme attacher des lacets et suspendre des t-shirts. Ensuite, nous avons appliqué une méthode de diffusion, prédisant les actions du robot à partir de bruit aléatoire, similaire à la façon dont notre Image Le modèle génère des images. Cela aide le robot à apprendre des données, afin qu’il puisse effectuer les mêmes tâches en soi.
Apprendre des comportements robotiques à partir de quelques démonstrations simulées
Le contrôle d’une main robotique dextéreuse est une tâche complexe, qui devient encore plus complexe à chaque doigt, articulation et capteur supplémentaires. Dans un autre nouveau papiernous présentons Demostart, qui utilise un algorithme d’apprentissage de renforcement pour aider les robots à acquérir des comportements dextères dans la simulation. Ces comportements apprises sont particulièrement utiles pour des modes de réalisation complexes, comme les mains à plusieurs doigts.
DeMostart apprend d’abord des États faciles et, au fil du temps, commence à apprendre des états plus difficiles jusqu’à ce qu’il maîtrise une tâche au mieux de ses capacités. Il nécessite 100 fois des démonstrations simulées de moins pour apprendre à résoudre une tâche de simulation que ce qui est généralement nécessaire lors de l’apprentissage des exemples du monde réel dans le même but.
Le robot a atteint un taux de réussite de plus de 98% sur un certain nombre de tâches différentes dans la simulation, y compris des cubes de réorientation avec une certaine couleur montrant, resserrant un écrou et un boulon et ranger les outils. Dans la configuration du monde réel, il a atteint un taux de réussite de 97% sur la réorientation et le levage du cube, et 64% à une tâche d’insertion à soute de plug qui nécessitait une coordination et une précision élevées.
Exemple d’un bras robotique apprenant à insérer avec succès un connecteur jaune dans la simulation (à gauche) et dans une configuration du monde réel (à droite).
Exemple d’un bras robotique apprenant à resserrer un boulon sur une vis de simulation.
Nous avons développé DeMostart avec Mujoconotre simulateur de physique open source. Après avoir maîtrisé une gamme de tâches dans la simulation et l’utilisation de techniques standard pour réduire l’écart SIM-REAL, comme la randomisation du domaine, notre approche a pu transférer presque zéro-shot vers le monde physique.
L’apprentissage robotique dans la simulation peut réduire le coût et le temps nécessaires pour exécuter des expériences physiques réelles. Mais il est difficile de concevoir ces simulations, et en outre, ils ne se traduisent pas toujours avec succès dans des performances réelles. En combinant l’apprentissage du renforcement avec l’apprentissage de quelques démonstrations, l’apprentissage progressif de DeMostart génère automatiquement un programme d’études qui comble l’écart Sim à réel, ce qui facilite le transfert de connaissances d’une simulation dans un robot physique et la réduction du coût et du temps nécessaire pour exécuter des expériences physiques.
Pour permettre l’apprentissage plus avancé des robots grâce à une expérimentation intensive, nous avons testé cette nouvelle approche sur une main robotique à trois doigts, appelée Dex-eequi a été développé en collaboration avec Robot de l’ombre.
Image de la main robotique Dex-Ee Dexterous, développée par Shadow Robot, en collaboration avec l’équipe de robotique Google Deepmind (Credit: Shadow Robot).
L’avenir de la dextérité des robots
La robotique est un domaine unique de la recherche sur l’IA qui montre comment nos approches fonctionnent dans le monde réel. Par exemple, un grand modèle de langue pourrait vous dire comment resserrer un boulon ou attacher vos chaussures, mais même s’il était incarné dans un robot, il ne pourrait pas effectuer ces tâches elle-même.
Un jour, les robots d’IA aideront les gens avec toutes sortes de tâches à la maison, sur le lieu de travail et plus encore. La recherche de dextérité, y compris les approches d’apprentissage efficaces et générales que nous avons décrites aujourd’hui, contribuera à rendre cet avenir possible.
Nous avons encore un long chemin à parcourir avant que les robots puissent saisir et gérer des objets avec la facilité et la précision des gens, mais nous faisons des progrès significatifs, et chaque innovation révolutionnaire est un autre pas dans la bonne direction.
Remerciements
Les auteurs de DeMostart: Maria Bauza, Jose Enrique Chen, Valentin Dalibard, Nimrod Gileadi, Roland Hafner, Antoine Laurens, Murilo F. Martins, Joss Moore, Runile Pevcevicite Francesco Nori, Nicolas Heess.
Les auteurs d’Aloha se sont lancés: Tony Z. Zhao, Jonathan Tompson, Danny Driess, Pete Florence, Kamyar Ghasemipour, Chelsea Finn, Ayzaan Wahid.