Échelle de formation du modèle avec Kubernetes à Stripe avec Kelley Rivoire
Aujourd’hui, nous sommes rejoints par Kelley Rivoire, directeur de l’ingénierie travaillant sur l’infrastructure d’apprentissage automatique chez Stripe.
Kelley et moi avons rattrapé une récente conférence sur les données de strates où elle a présenté la conférence « Formation du modèle d’échelle: des API de formation flexible à la gestion des ressources avec Kubernetes ». Dans notre conversation, nous discutons du parcours de l’infrastructure de l’apprentissage automatique de Stripe, y compris leur départ de la production plutôt que de se concentrer sur la réponse aux questions commerciales internes. Kelley détaille également quelques-uns de leurs outils internes, notamment Railyard, une API construite pour gérer la formation des modèles à grande échelle. Enfin, nous discutons de la façon dont les utilisateurs finaux ont géré le passage aux modèles de streaming basés sur des événements.
