Idempotence des appels LLM
Un retry sur un appel LLM peut facturer deux fois, dupliquer une action, envoyer deux emails. Pourquoi l'idempotence n'est pas optionnelle dès qu'il y a des effets de bord.
L'ensemble des articles publiés, du plus récent au plus ancien.
Un retry sur un appel LLM peut facturer deux fois, dupliquer une action, envoyer deux emails. Pourquoi l'idempotence n'est pas optionnelle dès qu'il y a des effets de bord.
MCP expose trois primitives : tools, resources, prompts. Quelle différence, et quand utiliser laquelle. Un point souvent flou même chez les implementeurs.
Rester sous les quotas d'un provider LLM sans tout casser : token bucket en PHP, gestion du 429, et la différence entre limite de requêtes et limite de tokens.
Un serveur Model Context Protocol fonctionnel en moins de 100 lignes de PHP natif. JSON-RPC, transport stdio, un tool exposé. De quoi comprendre la mécanique sans librairie.
Un prompt est du code qui décide du comportement de ton produit. Le laisser en string hardcodée non versionnée est une dette. Comment traiter les prompts comme des artefacts.
Un wrapper PHP minimaliste pour logger chaque appel LLM (prompt, réponse, tokens, latence, coût) dans une table SQL. Compatible PSR-3, lisible, debuggable.
Comment tester du code qui appelle un LLM sans payer des tokens à chaque run ni dépendre d'une réponse non déterministe. Doublures, golden tests, et ce qu'on teste vraiment.
Mettre les appels LLM dans une queue Symfony Messenger pour découpler l'API utilisateur des temps de réponse imprévisibles. Setup minimal et patterns testés en production.
Obtenir du JSON structuré et valide d'un LLM de façon fiable : schéma dans le prompt, validation stricte, retry ciblé. Le pattern qui tient en prod.