Construire votre application AI comme Legos avec Azure MCP | Par Ali Amine Ghazali | Août 2025

Dans l’écosystème technologique en constante évolution d’aujourd’hui, la construction d’applications d’intelligence artificielle robustes, évolutives et maintenables est un défi majeur. Les développeurs sont souvent confrontés à la tâche d’intégrer plusieurs services hétérogènes (analyse de documents, modèles de langue, stockage, etc.), ce qui peut rapidement conduire à des architectures monolithiques difficiles à évoluer et coûteuses à maintenir.
C’est là que le Protocole de contexte modèle (MCP)une spécification open source, entre en jeu. Il est conçu pour normaliser la communication entre les composants de l’IA. Loin d’être juste un protocole, MCP représente un changement de paradigme vers des architectures modulaires et interopérables.
Pour illustrer la puissance de cette approche, nous avons développé le «PDF Intelligence Assistant», « Une application de démonstration qui orchestre plusieurs services Azure de manière fluide et extensible. Cet article détaille comment MCP fonctionne grâce à notre application et démontre sa valeur en termes de flexibilité, d’évolutivité et de vitesse de développement.
Le MCP est une spécification open source qui vise à créer une norme pour interagir avec les modèles d’IA et les systèmes connexes. Il a été conçu pour découpler les clients (applications) à partir de services (modèles d’IA, outils), permettant une flexibilité et une réutilisabilité sans précédent.
Les principes fondamentaux de MCP, que notre application met en évidence, sont:
- Chaque service (un modèle de langue, une API de vision par ordinateur, une base de données) est encapsulé dans son propre serveur MCP indépendant.
- Tous les serveurs communiquent via une interface standardisée, quel que soit le fournisseur (Azure, Openai, AWS, etc.) ou le langage de programmation.
- Des services peuvent être ajoutés, supprimés ou remplacés à la volée sans avoir à modifier le code de l’application principale.
- Les services fonctionnent isolément, ce qui simplifie le débogage et augmente la résilience globale du système.
Séquence de connexion MCP
Chaque connexion MCP doit commencer par une poignée de main à trois messages spécifique:
- Initialiser la demande – Le client envoie ce premier
- Initialiser le résultat – le serveur répond avec les capacités
- Notification initialisée – Client confirme (aucune réponse attendue)
Ce n’est qu’après cette poignée de main que vous pouvez envoyer d’autres demandes comme des appels d’outils ou des listes d’invites.
Le «PDF Intelligence Assistant»
Notre application est conçue pour extraire les informations d’un document PDF, l’analyser à l’aide d’un modèle de langue et stocker le résultat. Il illustre parfaitement comment MCP transforme une tâche complexe en un workflow simple et modulaire.
Architecture
L’architecture de notre assistant repose sur un orchestrateur central qui communique avec plusieurs serveurs MCP spécialisés. Chaque serveur résume un service Azure spécifique.
┌─────────────────────────────────────────────────┐
│ Frontend Web │
│ (User Interface) │
└─────────────────────┬───────────────────────────┘
│
┌─────────────────────▼───────────────────────────┐
│ MCP Orchestrator │
│ (Main MCP Client) │
└─────────┬───────────┬───────────┬───────────────┘
│ │ │
┌────▼────┐ ┌───▼────┐ ┌───▼────┐
│Document │ │ OpenAI │ │Storage │
│ Intel │ │ MCP │ │ MCP │
│ MCP │ │ Server │ │ Server │
└─────────┘ └────────┘ └────────┘
│ │ │
┌────▼────┐ ┌───▼────┐ ┌───▼────┐
│ Azure │ │ Azure │ │ Azure │
│Document │ │ OpenAI │ │ Blob │
│ Intel │ │Service │ │Storage │
└─────────┘ └────────┘ └────────┘
Cette architecture démontre l’isolement des services. Le Document Intelligence MCP Server ne sait rien des serveurs OpenAI MCP ou MCP de stockage. L’orchestrateur définit le flux de travail en appelant les services nécessaires en séquence.
Structure du code d’application
Le flux de traitement PDF
Voici comment MCP orchestre le traitement de bout en bout d’un document PDF:
- Téléchargement PDF: L’utilisateur télécharge un fichier via l’interface Web.
- Stockage initial: L’orchestrateur envoie une demande au serveur MCP de stockage pour stocker le fichier RAW dans un conteneur de stockage Azure Blob.
- Extraction de contenu: Une fois le fichier stocké, l’orchestrateur invoque le serveur MCP de document Intelligence, qui utilise le Azure AI Document Intelligence API pour extraire le texte et la structure du document.
- Analyse et résumé: Le texte extrait est ensuite envoyé au serveur MCP OpenAI. Ce serveur interroge le Azure Openai Service (avec un modèle comme GPT-4.1) pour résumer le contenu, répondre à une question ou extraire des entités spécifiques.
- Affichage du résultat: La réponse enrichie est renvoyée à l’interface utilisateur.