Synthèse neurale du discours binaural de l’audio mono avec Alexander Richard

Aujourd’hui, nous sommes rejoints par Alexander Richard, chercheur à Facebook Reality Labs, et récipiendaire du prix du meilleur article de l’ICLR pour son article « Neural Synthesis of Binaural Discours de Mono Audio ». Nous commençons notre conversation avec un aperçu de la charte des laboratoires de réalité Facebook, et du projet de Codec Avatar d’Alex, où ils développent AR / VR pour la téléprésence sociale (Des applications comme celle-ci me viennent à l’esprit). Bien sûr, nous foulons dans l’article susmentionné, discutant de la difficulté d’améliorer la qualité de l’audio et le rôle de la déformation du temps dynamique, ainsi que les défis de la création de ce modèle. Enfin, Alex partage ses réflexions sur le rendu 3D pour l’audio et d’autres orientations de recherche futures. Si vous êtes un fan de cet épisode, vous pourriez également profiter de notre conversation avec Jesse Engel.