Dette de données en apprentissage automatique avec D. Sculley

Aujourd’hui, nous lançons les choses avec une conversation avec D. Sculley, directeur de l’équipe Google Brain. De nombreux auditeurs de l’émission d’aujourd’hui connaîtront D. de son travail sur le journal, La dette technique cachée dans les systèmes d’apprentissage automatiqueet bien sûr, le tristement célèbre diagramme (lié ci-dessous). D. a récemment traduit l’idée de la dette technique en dette de données, ce que nous passons un peu de temps dans l’entretien. Nous discutons de sa vision du concept de DCAI, où la dette s’inscrit dans la conversation de la qualité des données, et à quoi ressemble un passage vers le centrisme de données dans un monde de modèles de plus en plus grands, c’est-à-dire GPT-3 et les modèles de palme récents. Nous explorons également les sources communes de dette de données, quelles sont les choses que la communauté peut et a faite pour atténuer ces problèmes, l’utilité des graphiques d’inférence causale dans ce travail, et bien plus encore! Si vous avez apprécié cette interview ou si vous souhaitez en savoir plus sur ce sujet, revenez sur la page de la série DCAI à https://twimlai.com/podcast/twimlai/series/data-centric-ai.