\ Quelque chose de très intéressant se produit lorsque vous combinez les Agents d'IA, le Protocole de Contexte de Modèle (MCP), et le Cloud computing sans serveur. Nous ne parlons pas simplement de chatbots plus intelligents capables d'utiliser quelques API ; nous construisons des systèmes d'IA qui peuvent réellement comprendre qui vous êtes, ce que vous êtes autorisé à faire, et qui peuvent fonctionner à travers différents systèmes d'entreprise sans enfreindre les règles de sécurité ni empiéter sur les autres utilisateurs.
Les applications d'IA traditionnelles font face à un problème fondamental : comment maintenir le contexte et les permissions de l'utilisateur lorsqu'un Agent d'IA doit accéder à plusieurs services au nom de différents utilisateurs ? La plupart des implémentations sacrifient soit la sécurité (en utilisant des identifiants partagés) soit l'expérience utilisateur (en exigeant une ré-authentification constante).
La solution réside dans un modèle sophistiqué de propagation JWT qui maintient l'identité de l'utilisateur tout au long de la chaîne de requêtes :
\ Cela crée une chaîne de confiance sécurisée où l'identité de l'utilisateur n'est jamais déduite des réponses de l'IA mais toujours vérifiée cryptographiquement.
Considérez le MCP comme libérant l'IA de sa cage. Au lieu de construire une application d'IA massive qui essaie de tout faire, vous pouvez maintenant créer des services d'IA plus petits et spécialisés qui communiquent entre eux. Plutôt que de coder en dur tous les outils possibles dont une IA pourrait avoir besoin, le MCP permet à votre IA de découvrir et d'utiliser de nouveaux outils à la volée, même si ces outils se trouvent sur des serveurs complètement différents.
L'idée clé est de traiter les outils comme des microservices plutôt que des fonctions intégrées. Chaque serveur MCP devient un hub d'intelligence spécifique à un domaine qui peut servir plusieurs agents tout en maintenant sa propre sécurité et logique métier.
\
// Les outils MCP deviennent automatiquement conscients des utilisateurs export async function getTravelPolicies(userId, userRole) { // L'application des politiques se fait au niveau de l'outil return policies.filter(p => p.appliesToRole(userRole)); }
\
Le Cloud computing sans serveur résout trois défis critiques pour les Agents d'IA :
1. Sans état par conception : Chaque invocation démarre à neuf, éliminant la pollution d'état entre les utilisateurs et les requêtes.
2. Mise à l'échelle automatique : Gérer les utilisateurs simultanés sans planification de capacité—essentiel lorsque les Agents d'IA peuvent déclencher des chaînes d'outils complexes.
3. Efficacité des coûts : Payez uniquement pour le temps réel d'inférence et d'exécution des outils, pas pour la capacité inactive.
L'architecture devient élégamment simple :
Les applications web traditionnelles maintiennent l'état de Session en mémoire ou dans des bases de données. Les Agents d'IA nécessitent une approche différente car leur "état" comprend l'historique des conversations, les résultats des outils et le contexte appris—potentiellement des gigaoctets de données.
L'externalisation de ceci vers S3 avec le SDK Strands crée des possibilités fascinantes :
# L'état de l'agent devient portable et analysable session_manager = S3SessionManager( bucket="agent-sessions", key_prefix=f"user/{user_id}/conversations/" ) # L'état peut être partagé, analysé ou migré agent = StrandsAgent.from_session(session_manager)
Cela permet des fonctionnalités comme les transferts de conversation entre agents, les pistes d'audit, et même des modèles de collaboration IA-à-IA.
La construction de l'exemple d'agent de voyage a révélé plusieurs modèles non évidents :
Composition d'outils : Les serveurs MCP peuvent appeler d'autres serveurs MCP, créant des hiérarchies d'outils. Un outil de réservation peut appeler des outils de politique, des outils de tarification et des outils de disponibilité en séquence.
Isolation des défaillances : Lorsqu'un serveur MCP échoue, les autres continuent de fonctionner. L'agent dégrade gracieusement les fonctionnalités plutôt que d'échouer complètement.
Autorisation dynamique : Les permissions des utilisateurs peuvent changer en cours de conversation. Le modèle de rafraîchissement JWT garantit que les outils fonctionnent toujours avec les permissions actuelles.
Ce modèle d'architecture s'étend bien au-delà de la réservation de voyages. Considérez :
La combinaison du MCP et du serverless permet une nouvelle classe d'applications d'IA qui sont :
Nous passons de "l'IA qui peut utiliser des outils" à "l'IA qui peut orchestrer des processus métier distribués tout en maintenant une sécurité parfaite et un contexte utilisateur."
L'avenir n'est pas seulement fait de chatbots plus intelligents ; ce sont des systèmes intelligents qui peuvent fonctionner en toute sécurité à travers tout le spectre des applications d'entreprise, chaque utilisateur bénéficiant de son propre assistant IA personnalisé, sécurisé et conscient du contexte.
\


Copier le lienX (Twitter)LinkedInFacebookEmail
Le Sénat américain s'achemine vers le dernier vote de confirmation