Diffusedrive aborde la rareté des données pour la formation des robots et de l’IA

 Diffusedrive aborde la rareté des données pour la formation des robots et de l’IA

Diffusedrive construit des images photoréalistes comme celle-ci à partir d'ensembles de données du monde réel.

Diffusedrive construit des images photoréalistes comme celle-ci à partir d’ensembles de données du monde réel. Source: diffusedrive

Les robots et l’intelligence artificielle ont besoin de grandes quantités de données sur lesquelles se former et si ces données sont synthétiques, elles doivent être aussi réalistes que possible. La capture des données du monde réel peut être coûteuse et longue, tandis que les données basées sur la simulation proviennent généralement des moteurs de jeu et ont conduit à des lacunes sim-à-réel. DiffusedRive Inc. a affirmé que sa plate-forme d’IA générative évalue les données existantes, identifie ce qui manque et utilise des modèles de diffusion propriétaires pour créer des données photoréalistes.

Balint Pasztorun ingénieur, et Roland Pinter, un physicien, a fondé Diffusedrive en 2023 après avoir rencontré Bosch. Ils ont ensuite déplacé le entreprise De la Hongrie à San Francisco.

« Nous avons auparavant travaillé sur la conduite autonome de niveau 4 pour Porsche », a déclaré Pasztor Le rapport robot. «La rareté des données est la pièce manquante pour résoudre le puzzle de l’IA physique, qui couvre la fabrication, la surveillance, l’agriculture et l’aérospatiale.»

Fondateurs Diffusedrive Roland Pinter (à gauche) et Balint Pasztor (à droite).

DIFFUSEDRIVE CO-FONDURE: CTO Roland Pinter (à gauche) et PDG Balint Pasztor (à droite).

L’IA a besoin de données spécifiques au domaine

« L’industrie utilise les mêmes modèles depuis le début des années 2010, et les constructeurs automobiles et les développeurs de robotique n’ont pas suffisamment de données réalistes couvrant leurs domaines de conception opérationnelle », a déclaré Pasztor, qui est maintenant PDG de Diffusedrive.

« Les données synthétiques des simulations n’étaient pas assez réalistes pour la sécurité ou les fonctions critiques », a-t-il ajouté. «Nous avions besoin de données générées par l’IA qui ne se distinguent pas de la vie réelle.»

Même lors de la conférence IEEE / CVF de cette année sur la vision par ordinateur et la reconnaissance des modèles (CVPR), les gens de l’espace ne marquaient que 50%, se souvient-il. « Ils ne faisaient que deviner », a déclaré Pasztor.

Les applications de robotique commerciale nécessitent des quantités élevées de données pertinentes. Les véhicules autonomes et la reconnaissance des articles pour la sélection du commerce électronique ont connu et en croissance des ensembles de données, mais l’automatisation peut servir de manière flexible de nombreuses autres applications – si elle est correctement formée.

Diffusedrive identifie, comprend les lacunes à combler

Diffusedrive peut combler l’écart de simulation à la réalité en générant des suggestions basées sur la logique métier, a expliqué Pasztor. Cela lui permet de créer des ensembles de données pertinents en quelques jours plutôt que des mois ou des années, a-t-il affirmé.

« Des moteurs comme GPT ou DALI peuvent générer des modèles, mais vous avez besoin d’une couche d’assurance qualité (QA) comme Diffusedrive », a-t-il déclaré. «La couche QA est construite sur l’application ou le cas d’utilisation à partir de l’aérospatiale, etc., et le modèle de raisonnement comprend ce qui a déjà été présenté.»

DiffusedRive utilise à la fois des méthodes classiques et nouvelles d’analyse statistique pour comprendre contextuellement les données existantes et créer des points de données, similaires à un cloud de points, a déclaré Pasztor.

« Nous utilisons un système séparé pour comprendre ce que les clients ont déjà, en construisant essentiellement un arbre de décision », a-t-il déclaré. «Par exemple, pour la conduite autonome de niveau 2, nous avons construit une carte thermique des scénarios de stationnement et la distribution de l’emplacement des objets. Diffusedrive a ensuite identifié qu’il manquait de grands et fermes les éléments à certains moments. En atteignant une distribution plus large des données, nous avons amélioré les performances de 40%.»

https://www.youtube.com/watch?v=ab5q_t2yjne

Les clients contrôlent les données étranges

Dans le même temps, Diffusedrive ne développe pas l’expertise du domaine. Au lieu de cela, l’entreprise digère la documentation de ses clients et les données du domaine de conception opérationnelle (ODD) du monde réel.

«Ce sont les experts du domaine et contrôlent en termes de génération de leurs exigences», a déclaré Pasztor. «Ils ne veulent pas que quiconque reprenne son travail mais veut que nous les augmentions.»

Une fois qu’il a les données de base, Diffusedrive utilise la segmentation sémantique, l’étiquetage contextuel et visuel, ainsi que les boîtes de délimitation 2D et 3D. « Chaque fois qu’ils génèrent des images, la carte du point de données se remplit, pas seulement pour combler les lacunes, mais aussi l’élargissement des connaissances étranges », a déclaré Pasztor.

Graphic expliquant que les clients contrôlent leurs données pour un délai plus rapide pour commercialiser, explique Diffusedrive.

Les clients contrôlent leurs données de domaine, qui sont ensuite rapidement analysées pour les lacunes. Source: diffusedrive.

Diffusedrive voit les opportunités de marché

Le marché mondial de l’IA en robotique pourrait connaître un taux de croissance annuel composé de 38,5%, passant de 12,77 milliards de dollars en 2023 à 124,77 milliards de dollars d’ici 2030, selon Recherche de Grand View.

« Notre vision est de faire en sorte que chaque système autonome utilise des données Diffusedrive – il pourrait s’agir d’une entreprise ou d’un projet d’un individu », a déclaré Pasztor. «Nous avons décidé de nous appuyer sur notre expérience avec les voitures et les drones, car les véhicules autonomes ont encore besoin de beaucoup de données, et la plupart des entreprises n’ont pas l’échelle de Tesla.»

DiffusedRive est à intégrer sa troisième vague de clients, à suivre des pilotes de drones, puis une surveillance autonome de conduite et de sécurité. Ils comprennent Aisin, Continental et Denso. La société a déclaré qu’elle voyait également le potentiel de la défense, de l’entreposage, de la construction et de l’agriculture.

« Chez CVPR, nous avons parlé avec 50 clients potentiels du Fortune 500, dont plusieurs produisent non seulement des systèmes autonomes, mais aussi des systèmes stationnaires comme les robots industriels », a déclaré Pasztor. «Les personnes de santé étaient également intéressées à fermer la boucle de données.»

En mai, diffusedrive soulevé 3,5 millions de dollars de financement des semences, ajoutant à 1 million de dollars qu’il avait auparavant reçus E2VC. Il a également nommé Jordan Kretchmer, un partenaire principal à Outlander VC et co-fondateur de Rapid Robotics Inc.à son conseil d’administration.

« La Jordanie a de l’expérience dans l’investissement en robotique, et notre thèse est d’être agnostique de l’industrie, des applications de fabrication comme QA jusqu’à des robots de cueillette de ménage », a déclaré Pasztor. «L’imagerie réaliste doit se propager rapidement entre différents verticales, car nous apprenons de tout le monde. Le différenciateur n’est plus les données synthétiques; sa création du moteur de données.»

Comme le dit mon co-fondateur, «le logiciel est développé de manière itérative, alors pourquoi ne pas les données», a-t-il conclu.





Source link

Related post