Articles

Concept

Idempotence des appels LLM

Un retry sur un appel LLM peut facturer deux fois, dupliquer une action, envoyer deux emails. Pourquoi l'idempotence n'est pas optionnelle dès qu'il y a des effets de bord.

18/12/2025 à 21h12

Concept

MCP : tools vs resources

MCP expose trois primitives : tools, resources, prompts. Quelle différence, et quand utiliser laquelle. Un point souvent flou même chez les implementeurs.

06/12/2025 à 19h12

Tutoriel

Rate limiting d'une API LLM

Rester sous les quotas d'un provider LLM sans tout casser : token bucket en PHP, gestion du 429, et la différence entre limite de requêtes et limite de tokens.

27/11/2025 à 20h11

Tutoriel

Serveur MCP minimal en PHP

Un serveur Model Context Protocol fonctionnel en moins de 100 lignes de PHP natif. JSON-RPC, transport stdio, un tool exposé. De quoi comprendre la mécanique sans librairie.

16/11/2025 à 20h11

Concept

Prompt versioning en prod

Un prompt est du code qui décide du comportement de ton produit. Le laisser en string hardcodée non versionnée est une dette. Comment traiter les prompts comme des artefacts.

05/11/2025 à 22h11

Tutoriel

Logger un LLM sans dépendance

Un wrapper PHP minimaliste pour logger chaque appel LLM (prompt, réponse, tokens, latence, coût) dans une table SQL. Compatible PSR-3, lisible, debuggable.

29/10/2025 à 21h10

Tutoriel

Tester un appel LLM

Comment tester du code qui appelle un LLM sans payer des tokens à chaque run ni dépendre d'une réponse non déterministe. Doublures, golden tests, et ce qu'on teste vraiment.

20/10/2025 à 19h10

Tutoriel

Symfony Messenger + agent IA

Mettre les appels LLM dans une queue Symfony Messenger pour découpler l'API utilisateur des temps de réponse imprévisibles. Setup minimal et patterns testés en production.

11/10/2025 à 22h10

Tutoriel

JSON fiable depuis un LLM

Obtenir du JSON structuré et valide d'un LLM de façon fiable : schéma dans le prompt, validation stricte, retry ciblé. Le pattern qui tient en prod.

03/10/2025 à 21h10