L’écosystème OpenAI s’est enrichi d’une suite complète d’outils, nommée AgentKit, destinée aux développeurs et aux entreprises pour concevoir, déployer et optimiser des agents intelligents. Je vous explique tout ça dans ce tutoriel !
Qu’est-ce que AgentKit d’OpenAI ?
Historiquement, la construction d’agents impliquait de jongler avec des outils fragmentés, nécessitant une orchestration complexe sans gestion de version, des connecteurs personnalisés, des pipelines d’évaluation manuels et des semaines de travail de développement frontal. Avec AgentKit, OpenAI propose des outils visuels pour concevoir des flux de travail et intégrer des interfaces utilisateur (UI) agentiques plus rapidement.
AgentKit se compose de plusieurs blocs de construction essentiels :
- Agent Builder : Un canevas visuel pour la création et la gestion de versions de workflows multi-agents.
- Connector registry : Un emplacement centralisé pour les administrateurs afin de gérer la manière dont les données et les outils se connectent aux produits OpenAI.
- ChatKit : Une boîte à outils pour l’intégration d’expériences d’agents conversationnels personnalisables au sein de vos produits.
1. Démarrer avec Agent Builder : le canevas visuel
Agent Builder est l’interface où l’orchestration des agents prend forme. Accessible via la plateforme OpenAI (platform.openai.com/agentbuilder), cet outil propose un canevas visuel pour composer la logique de l’agent grâce à des nœuds en glisser-déposer, permettant de connecter des outils et de configurer des garde-fous (guardrails) personnalisés. Il ne s’agit pas d’un concurrent direct des outils d’automatisation des processus comme Zapier ou N8N, mais plutôt d’un outil axé sur la construction de workflows d’agents utilisant l’Agent SDK d’OpenAI.
L’outil permet des exécutions de prévisualisation, la configuration d’évaluations en ligne (inline eval configuration) et une gestion complète des versions (full versioning), accélérant considérablement l’itération. Par exemple, des entreprises comme Ramp ont réduit les cycles d’itération de 70 %, passant de mois de travail à quelques heures pour créer un agent.
Les fondations du workflow : nœuds de démarrage et d’état
L’Agent Builder propose un canevas visuel permettant de composer la logique des agents en utilisant des nœuds que l’on peut glisser-dépos. Tous les nœuds et la logique sous-jacente s’appuient sur le Common Expression Language (CEL) pour définir les expressions logiques.
Chaque workflow commence par un nœud de démarrage (Start Node), qui reçoit une variable d’entrée standard, input as text
(le message initial de l’utilisateur). Dans ce nœud, vous pouvez également initialiser des variables d’état (state variables) globales qui peuvent être référencées partout dans le workflow.
Le nœud agent : cœur de l’exécution et configuration
Le nœud Agent est l’élément central du workflow où l’exécution de l’IA a lieu. Il offre plusieurs options de configuration :
- Modèle IA : Les modèles disponibles sont limités à ceux d’OpenAI, tels que GPT-5 Mini ou GPT-5 Pro.
- Instructions (System Prompt) : Permet de définir le rôle de l’agent et d’inclure du contexte. Vous pouvez intégrer dynamiquement les variables d’état ou l’entrée utilisateur en utilisant la syntaxe
{{...}}
ou l’option Add Context. - Historique de Chat : Option pour inclure ou exclure l’historique complet de la conversation.
- Effort de Raisonnement : Peut être configuré sur faible (pour des tâches simples) ou élevé (pour des tâches complexes), affectant le temps de réflexion du modèle.
- Outils (Tools) : Les capacités que l’agent peut utiliser, comme la recherche web (Web Search), la recherche de fichiers (File Search), le Code Interpreter, les fonctions locales, les outils ChatKit client ou les serveurs MCP.
- Format de Sortie : Le résultat peut être retourné en texte par défaut ou en JSON pour les sorties structurées, ce qui est crucial si le résultat doit être consommé par un nœud ultérieur (comme un nœud Condition ou While).
Le nœud Set State est également fondamental dans l’Agent Builder, car l’intégralité du workflow repose sur la définition et la récupération de cet état. Ce nœud permet de stocker dynamiquement des informations générées ou reçues (par exemple, sauvegarder le message de l’utilisateur dans une variable d’état nommée topic
) pour une utilisation ultérieure.
Le nœud de fin (End Node) est optionnel si le dernier nœud est un agent simple, mais il est particulièrement utile pour retourner des sorties structurées ou visualiser des valeurs générées durant le workflow. Pour cela, on peut définir un schéma de sortie (en mode simple ou avancé via JSON Schema).
2. Logique avancée, outils et sécurité
Intégrer des super-pouvoirs : outils et connecteurs (MCPs, File Search)
Les outils donnent des « super-pouvoirs » aux agents. Le Connector Registry facilite la gouvernance des données pour les entreprises, consolidant les sources de données à travers les API et ChatGPT. Il inclut les connecteurs pré-intégrés (comme Dropbox, Google Drive, Sharepoint, Microsoft Teams) ainsi que les MCPs (Multi-Channel Protocols) tiers.
Les MCPs sont un format de communication plus adapté aux grands modèles de langage (LLM) que les API traditionnelles, jugées trop lourdes ou longues. Ils permettent aux agents d’interagir avec des applications externes pour des actions concrètes (par exemple, accéder à Google Calendar, gérer des paiements via Stripe).
Le File Search permet de créer des systèmes de Retrieval-Augmented Generation (RAG). En téléchargeant des documents (PDF, etc.) et en les vectorisant automatiquement, l’agent peut se baser sur une base de connaissance spécifique plutôt que sur sa connaissance globale. C’est essentiel pour le support client ou les assistants de recherche.
Pour orchestrer des flux dynamiques, Agent Builder utilise le Common Expression Language (CEL), un format nécessaire pour définir des expressions logiques.
- Nœud Condition (If/Else) : Crée des embranchements, routant le workflow vers différentes branches en fonction de la condition évaluée.
- Nœud While (Boucle) : Répète une série d’actions tant qu’une condition définie dans l’expression CEL est vraie, permettant par exemple d’itérer sur une liste de mots-clés générés.
Sécurité et contrôle : Guardrails et approbation humaine
Le nœud Guardrails est une couche de sécurité modulaire et ouverte destinée à protéger les agents contre les comportements malveillants ou involontaires. Il peut être déployé seul ou via des librairies Python/JavaScript.
Les fonctions clés des Guardrails comprennent :
- Le masquage ou le signalement des Informations Personnelles Identifiables (PII).
- La détection et le blocage des tentatives de Jailbreak (injections de prompt).
- L’application de la Modération de contenu (filtrage du contenu illicite ou inapproprié).
Le flux Guardrails offre des chemins Pass ou Fail. En cas d’échec de modération, le workflow peut être redirigé vers un message d’erreur ou terminé.
Le Nœud User Approval (Human in the Loop) permet d’introduire une pause dans le workflow pour solliciter une validation explicite de l’utilisateur avant d’exécuter des actions critiques (comme l’exécution d’un paiement via Stripe ou l’envoi d’un email), ajoutant une couche de sécurité essentielle.
3. Le déploiement avec ChatKit
Déployer des interfaces de chat pour des agents est souvent complexe, nécessitant la gestion des réponses en streaming, des fils de discussion et de l’affichage de l’état de « réflexion » du modèle. ChatKit simplifie ce processus, permettant d’intégrer des agents conversationnels de manière native dans n’importe quel produit, application ou site web.
L’intégration se fait en utilisant le code généré pour TypeScript ou Python, en fournissant la clé API OpenAI et l’ID du workflow.
L’une des innovations de ChatKit réside dans sa capacité à afficher des widgets contextuels et visuellement riches, allant au-delà d’une simple interface de chat statique. Ces widgets permettent de rendre une impression visuelle des informations.
Par exemple, ils peuvent afficher le profil d’un client, son historique de commandes, ou d’autres données structurées, créant une expérience utilisateur bien différente. Les développeurs peuvent construire ces widgets via un widget builder et les télécharger sur la plateforme.
4. Mesure et optimisation des performances (Evals et RFT)
Assurer la fiabilité des agents prêts pour la production nécessite une évaluation rigoureuse. OpenAI a renforcé sa plateforme d’évaluation (Evals) avec de nouvelles fonctionnalités pour mesurer et améliorer la performance des agents.
Évaluation rigoureuse des agents avec evals
Les nouvelles capacités de la plateforme Evals incluent:
- Datasets : Pour construire rapidement des évaluations d’agents, enrichies par des automated graders et des annotations humaines.
- Trace grading : Des évaluations de bout en bout des workflows agentiques permettant d’identifier précisément les lacunes.
- Automated prompt optimization : La génération de prompts améliorés basée sur les annotations humaines et les résultats des évaluateurs.
- Third-party model support : La possibilité d’évaluer des modèles d’autres fournisseurs directement au sein de la plateforme Evals d’OpenAI.
L’utilisation de cette plateforme a déjà démontré des gains significatifs, comme l’augmentation de 30 % de la précision des agents pour certains clients.
Personnalisation du raisonnement via le reinforcement fine-tuning (RFT)
Le Reinforcement Fine-Tuning (RFT) permet aux développeurs de personnaliser les modèles de raisonnement d’OpenAI. Il est généralement disponible sur OpenAI o4-mini et en bêta privée pour GPT-5.
De nouvelles fonctionnalités RFT en version bêta sont conçues pour améliorer davantage les performances des agents :
- Custom tool calls : Permet de former les modèles à invoquer les outils appropriés au moment opportun, optimisant ainsi leur raisonnement.
- Custom graders : Pour définir des critères d’évaluation personnalisés qui correspondent aux besoins spécifiques du cas d’usage.
L’ensemble de ces outils, y compris Agent Builder (actuellement en bêta), ChatKit, et les nouvelles fonctionnalités Evals, sont inclus dans la tarification standard des modèles API.
Voilà, j’espère que qu’avec ce petit tutoriel, vous serez en mesure de comprendre et utiliser AgentKit et l’Agent Builder !