Résoudre le problème du cocktail avec l’apprentissage automatique avec Jonathan Le Roux

Aujourd’hui, nous sommes rejoints par Jonathan Le Roux, un chercheur principal principal chez Mitsubishi Electric Research Laboratories (MERL). Chez Merl, Jonathan et son équipe se concentrent sur l’utilisation de l’apprentissage automatique pour résoudre le «problème de cocktail», en se concentrant non seulement sur la séparation de la parole du bruit, mais aussi sur la séparation de la parole de la parole. Dans notre conversation avec Jonathan, nous nous concentrons sur son papier Le problème de la fourche à cocktail: séparation audio à trois tiges pour les bandes sonores du monde réelqui cherche à séparer et à améliorer une scène acoustique complexe en trois catégories distinctes, la parole, la musique et les effets sonores. Nous explorons les défis de travailler avec des données aussi bruyantes, l’architecture du modèle utilisé pour résoudre ce problème, comment ML / DL s’inscrit dans la résolution du problème plus grand des cocktails, les orientations futures pour cette ligne de recherche, et bien plus encore!