Comment j’utilise les agents d’IA comme scientifique des données en 2025

 Comment j’utilise les agents d’IA comme scientifique des données en 2025


Comment j'utilise les agents d'IA comme scientifique des données en 2025
Image par auteur

# Introduction

En tant que scientifiques des données, nous portons tellement de chapeaux au travail que cela ressemble souvent à plusieurs carrières en une seule. En une seule journée de travail, je dois:

  • Créer des pipelines de données avec SQL et Python
  • Utiliser des statistiques pour analyser les données
  • Communiquer des recommandations aux parties prenantes
  • Surveillez systématiquement les performances du produit et générez des rapports
  • Exécuter des expériences pour aider l’entreprise à décider de lancer un produit

Et ce n’est que la moitié.

Être un scientifique des données est passionnant car c’est l’un des domaines les plus polyvalents de la technologie: vous obtenez une exposition à tant d’aspects différents de l’entreprise et pouvez visualiser l’impact des produits sur les utilisateurs quotidiens.

Mais l’inconvénient? J’ai l’impression que vous jouez toujours au rattrapage.

Si un lancement de produit fonctionne mal, vous devez comprendre pourquoi – et vous devez le faire instantanément. En attendant, si une partie prenante veut comprendre l’impact du lancement de la fonctionnalité A au lieu de la fonctionnable B, vous devez concevoir rapidement une expérience et leur expliquer les résultats d’une manière facile à comprendre.

Vous ne pouvez pas être trop technique dans votre explication, mais vous ne pouvez pas non plus être trop vague. Vous devez trouver un terrain d’entente qui équilibre l’interprétabilité avec une rigueur analytique.

À la fin d’une journée de travail, J’ai parfois l’impression de courir un marathon. Seulement pour se réveiller et tout recommencer le lendemain. Donc, quand j’ai l’occasion d’automatiser certaines parties de mon travail avec l’IA, je le prends.

Récemment, j’ai commencé à intégrer des agents d’IA dans mes flux de travail de science des données.

Cela m’a rendu plus efficace à mon travail, et je peux répondre aux questions commerciales avec des données beaucoup plus rapidement qu’auparavant.

Dans cet article, je vais expliquer exactement comment j’utilise des agents d’IA pour automatiser certaines parties de mon flux de travail de science des données. Plus précisément, nous explorerons:

  • Comment j’effectue généralement un flux de travail en science des données sans IA
  • Les mesures prises pour automatiser le flux de travail avec l’IA
  • Les outils exacts que j’utilise et combien de temps cela m’a sauvé

Mais avant d’y entrer, révisons ce qu’est exactement un agent d’IA et pourquoi il y a tellement de battage médiatique autour d’eux.

# Que sont les agents de l’IA?

Les agents AI sont des systèmes alimentaires de grande langue (LLM) qui peuvent effectuer des tâches automatiquement en planifiant et en raisonnant à travers un problème. Ils peuvent être utilisés pour automatiser les workflows avancés sans direction explicite de l’utilisateur.

Cela peut ressembler à l’exécution d’une seule commande et au fait qu’un LLM exécute un flux de travail de bout en bout tout en prenant des décisions et en adaptant son approche tout au long du processus. Vous pouvez utiliser ce temps pour vous concentrer sur d’autres tâches sans avoir à intervenir ou à surveiller chaque étape.

# Comment j’utilise des agents d’IA pour automatiser l’expérimentation en science des données

L’expérimentation est une grande partie d’un travail de science des données.

Des entreprises comme Spotify, Google et Meta expérimentent toujours avant de publier un nouveau produit pour comprendre:

  • Si le nouveau produit fournira un retour sur investissement élevé et vaut les ressources allouées à la construction
  • Si le produit aura un impact positif à long terme sur la plate-forme
  • Sentiment des utilisateurs autour de ce lancement de produit

Les scientifiques des données effectuent généralement des tests A / B pour déterminer l’efficacité d’une nouvelle fonctionnalité ou d’un nouveau lancement de produit. Pour en savoir plus sur les tests A / B en science des données, vous pouvez lire Ce guide sur les tests A / B.

Les entreprises peuvent exécuter jusqu’à 100 expériences par semaine. La conception et l’analyse des expériences peuvent être un processus hautement répétitif, c’est pourquoi j’ai décidé d’essayer de l’automatiser à l’aide d’agents d’IA.

Voici comment j’analyse généralement les résultats d’une expérience, un processus qui prend environ trois jours à une semaine:

  1. Créez des pipelines SQL pour extraire les données de test A / B qui circulent depuis le système
  2. Interrogez ces pipelines et effectuez une analyse des données exploratoires (EDA) pour déterminer le type de test statistique à utiliser
  3. Écrivez du code Python pour exécuter des tests statistiques et visualiser ces données
  4. Générez une recommandation (par exemple, déploiez cette fonctionnalité à 100% de nos utilisateurs)
  5. Présentez ces données sous la forme d’une feuille Excel, d’un document ou d’un jeu de diapositives et expliquez les résultats aux parties prenantes

Les étapes 2 et 3 sont les plus longues car les résultats de l’expérience ne sont pas toujours simples.

Par exemple, lorsque vous décidez de déployer une annonce vidéo ou une annonce d’image, nous pouvons obtenir des résultats contradictoires. Une annonce d’image peut générer des achats plus immédiats, ce qui entraîne des revenus à court terme plus élevés. Cependant, les annonces vidéo peuvent conduire à une meilleure rétention et à la fidélité des utilisateurs, ce qui signifie que les clients effectuent plus d’achats répétés. Cela conduit à des revenus à long terme plus élevés.

Dans ce cas, nous devons rassembler plus de points de données à l’appui pour prendre une décision sur le lancement d’annonces d’image ou de vidéo. Nous devrons peut-être utiliser différentes techniques statistiques et effectuer certaines simulations pour voir quelle approche s’aligne le mieux avec nos objectifs commerciaux.

Lorsque ce processus est automatisé avec un agent d’IA, il supprime beaucoup d’intervention manuelle. Nous pouvons demander à l’IA de collecter des données et d’effectuer cette analyse de plongée profonde pour nous, ce qui supprime le levage de lourds analytique que nous faisons généralement.

Voici à quoi ressemble l’analyse automatisée de test A / B avec un agent d’IA:

  1. J’utilise Curseurun éditeur d’IA qui peut accéder à votre base de code et écrire et modifier automatiquement votre code.
  2. En utilisant le protocole de contexte du modèle (MCP), le curseur a accès au lac Data où les données de l’expérience brute se déroulent dans
  3. Cursor construit ensuite automatiquement un pipeline pour traiter les données de l’expérience et accède à nouveau au lac Data pour rejoindre cela avec d’autres tables de données pertinentes
  4. Après avoir créé tous les pipelines nécessaires, il effectue EDA sur ces tableaux et détermine automatiquement la meilleure technique statistique à utiliser pour analyser les résultats du test A / B
  5. Il exécute le test statistique choisi et analyse la sortie, créant automatiquement un rapport HTML complet de la production dans un format présentable aux parties prenantes de l’entreprise

Ce qui précède est un cadre d’automatisation de l’expérience de bout en bout avec un agent d’IA.

Bien sûr, une fois ce processus terminé, je passe en revue les résultats de l’analyse et passe par les mesures prises par l’agent d’IA. Je dois admettre que ce flux de travail n’est pas toujours transparent. L’IA hallucine et a besoin d’une tonne d’incitation et d’exemples d’analyses antérieures avant de pouvoir trouver son propre flux de travail. Le principe « Garbage In, Garbage Out » s’applique certainement ici, et j’ai passé presque une semaine à conserver des exemples et à créer des fichiers rapides pour garantir que le curseur avait toutes les informations pertinentes nécessaires pour exécuter cette analyse.

Il y avait beaucoup de va-et-vient et de multiples itérations avant que le cadre automatisé ne soit effectué comme prévu.

Maintenant que cet agent d’IA fonctionne, cependant, je suis en mesure de réduire considérablement le temps consacré à l’analyse des résultats des tests A / B. Bien que l’agent AI effectue ce flux de travail, je peux me concentrer sur d’autres tâches.

Cela enlève les tâches de mon assiette, ce qui fait de moi un scientifique des données un peu moins occupé. Je peux également présenter les résultats aux parties prenantes rapidement, et le délai d’exécution plus court aide toute l’équipe du produit à prendre des décisions plus rapides.

# Pourquoi vous devez apprendre les agents d’IA pour la science des données

Chaque professionnel de données que je connais a incorporé l’IA dans leur flux de travail d’une manière ou d’une autre. Il y a une poussée descendante pour cela dans les organisations pour prendre des décisions commerciales plus rapides, lancer des produits plus rapidement et rester en avance sur la concurrence. Je crois que l’adoption de l’IA est cruciale pour que les scientifiques des données restent pertinents et restent compétitifs sur ce marché du travail.

Et d’après mon expérience, la création de flux de travail agentiques pour automatiser des parties de nos travaux nous oblige à augmenter. J’ai dû apprendre de nouveaux outils et techniques comme la configuration MCP, l’invitation de l’agent AI (qui est différent de la saisie d’une invite dans Chatte) et orchestration de flux de travail. La courbe d’apprentissage initiale en vaut la peine car elle permet d’économiser des heures une fois que vous pouvez automatiser des parties de votre travail.

Si vous êtes un scientifique des données ou en herbe, je vous recommande d’apprendre à créer des workflows assistés par l’IA au début de votre carrière. Cela devient rapidement une attente de l’industrie plutôt que juste une bonne à avoir, et vous devriez commencer à vous positionner pour un avenir proche des rôles de données.

Pour commencer, vous pouvez Regardez cette vidéo pour un guide étape par étape sur la façon d’apprendre gratuitement l’IA agentique.

Natassha selvaraj est un scientifique des données autodidacte avec une passion pour l’écriture. Natassha écrit sur tout ce qui concerne les données liées à la science, un véritable maître de tous les sujets de données. Vous pouvez vous connecter avec elle Liendin ou regarde-la Chaîne YouTube.



Source link

Related post