Sur le chemin de la vision du robot avec Aljosa OSEP

Aujourd’hui, nous terminons notre couverture de la conférence CVPR 2022 rejointe par Aljosa OSEP, un post-doctorant à l’Université technique de Munich & Carnegie Mellon University. Dans notre conversation avec Aljosa, nous explorons ses intérêts de recherche plus larges dans la réalisation de la vision du robot et sa vision de ce à quoi elle ressemblera lorsque cet objectif sera atteint. Le premier article dans lequel nous fouillons est Text2POS: Localisation cross-modal de texte à pointqui propose un module de localisation croisé-modal qui apprend à aligner les descriptions textuelles avec les indices de localisation d’une manière grossière à fin. Ensuite, nous explorons le papier Prévision de LIDAR via la détection d’objets futursqui propose une approche de bout en bout pour la détection et la prévision de mouvement basée sur la mesure du capteur brut par opposition aux pistes de vérité au sol. Enfin, nous discutons du troisième et dernier article d’Aljosa Ouverture du suivi du monde ouvertqui propose une nouvelle référence pour analyser les efforts existants dans le suivi multi-objets et construit une base de référence pour ces tâches.