J'ai trouvé le meilleur cas d'usage de Claude Fable 5. Ça m'a coûté 75% de mon quota mensuel.
Claude Fable 5 a fait son grand retour le 1er juillet, après 3 semaines de suspension liées aux contrôles d'exportation américains. En 48 heures, la réaction s'est clairement divisée en 2 camps.
Le camp 1, ce sont des adultes qui n'ont jamais vraiment quitté l'époque des LAN parties, qui explosent des clones de Rocket League et survolent un Poudlard reconstruit. Une démo aurait nécessité 4 prompts et 173$ de tokens pour produire un prototype jouable.
Le camp 2 essaie de comprendre comment transformer ce même modèle en revenus réels, sans griller un mois de crédits avant le déjeuner. J'aimerais dire que j'ai atterri directement dans le camp 2. Ce ne fut pas le cas. J'ai activé Ultracode pour voir ce que ça donnait, je lui ai confié une tâche sans pratiquement aucun périmètre, et j'ai regardé mon quota mensuel fondre en quelques minutes. Pas d'écran dramatique "You Died", juste un tranquille 0% affiché sur le tableau de bord.
Voici donc comment tirer le meilleur parti de Claude Fab(uleux ?).

Ce que fait vraiment Ultracode
Ultracode n'est pas un niveau d'effort de l'API. C'est un paramètre spécifique à Claude Code, et confondre les deux, c'est exactement comme ça que j'ai fini dans cette situation.
Le prompt qui a tout déclenché : "nettoie le tunnel de commande, c'est le bordel." Rien sur quels fichiers. Rien sur ce que "nettoyer" voulait dire. Ultracode a pris ça comme une invitation, a déployé des sous-agents dans la logique de paiement, le calculateur de livraison, et une page de paramètres que je n'avais pas touchée depuis un an, et a commencé à "nettoyer" les 3 en même temps.
Activez Ultracode et 2 choses se produisent. Chaque requête de la session est envoyée au modèle en xhigh, la profondeur de raisonnement la plus élevée disponible. Et Claude Code obtient l'autorisation permanente de lancer des Dynamic Workflows sur tout ce qui semble substantiel (le nom d'Anthropic pour l'orchestration automatique de sous-agents). La session principale se divise en autant de sous-agents qu'elle juge nécessaires pour une tâche, chacun brûlant sa propre part de tokens, sans vous demander d'abord. C'est moins un personnage unique qui lance un sort que le jeu qui décide que votre quête solo avait en fait besoin d'un groupe de raid complet.
Sur l'API, Fable 5 coûte 10$ par million de tokens d'entrée et 50$ par million de sortie, environ 2x le coût d'Opus 4.8. Cette prime est acceptable quand 1 modèle fait le travail. Elle cesse de l'être quand Ultracode transforme discrètement votre 1 requête en 12 parallèles parce qu'il a décidé que votre tâche méritait une petite armée.
Le mécanisme exact qui a grillé mon quota (raisonnement xhigh plus génération de sous-agents non supervisée) est le même mécanisme qui rend Ultracode rentable sur un vrai travail déjà délimité. Pensez à un refactoring désordonné sur 40 fichiers, ou un audit complet de codebase. Ultracode n'a pas échoué en déléguant. J'ai échoué en ne lui disant jamais ce qu'il était autorisé à déléguer.
J'avais appris une version de cette leçon de manière coûteuse auparavant, avec une session Claude Code que j'avais laissée tourner sans supervision pendant 4 heures. Les 3 composants brefs qui préviennent la dérive de périmètre se sont avérés tout aussi importants avec 1 boucle qu'avec 12 sous-agents tournant en parallèle.
Je n'étais pas le seul

En parcourant Hacker News et r/ClaudeAI dans cette même fenêtre de 48 heures, j'ai trouvé beaucoup de compagnie.
Un abonné Max (le niveau à 200$ par mois) a rapporté avoir brûlé environ 20% du quota d'une semaine en une seule journée. Un utilisateur Pro a dit avoir atteint sa limite en 10 minutes environ. 1 développeur a lancé 62 sous-agents Opus 4.8 sur une seule tâche et a atteint la limite d'usage de 5 heures en 18 minutes chrono, ce qui ressemble moins à Skynet qui se réveille qu'à un essaim de stagiaires survoltés à qui on a confié la carte de crédit de l'entreprise. Quelqu'un d'autre a déployé environ 90 agents juste pour réviser un petit package. 1 commentaire Hacker News l'a résumé mieux que je n'aurais pu : "du tokenmaxxing déguisé en produit."
Rien de tout cela n'est une moyenne mesurée, juste des anecdotes éparses de fils de discussion, pas un benchmark contrôlé. Mais le schéma s'est répété sur tous les comptes. La plainte ne portait jamais sur la qualité de sortie. C'était sur le compteur qui continuait de tourner bien après que la tâche soit déjà terminée.
Pourtant, un grillage de quota à cette échelle n'est pas une erreur d'arrondi. Sur le forfait Max, 20% de l'allocation d'une semaine parti en un jour signifie tomber à sec bien avant le prochain reset. Sur Pro, atteindre la limite en 10 minutes signifie que le reste de la journée se passe sans le modèle du tout.
L'autre camp : Créer des jeux vidéo d'un coup
Pendant que ma barre de quota chutait en temps réel, le reste d'internet passait un après-midi bien meilleur.
Le clone de Rocket League a reçu des éloges même de la part de gens qui lèvent habituellement les yeux au ciel devant les démos d'IA. Tout comme la tranche reconstruite de Poudlard, et le jeu construit à partir de 4 prompts et 173$ de tokens que j'ai mentionné plus tôt. 1 test largement regardé a opposé Fable 5 à Opus 4.8 en face à face sur exactement le même prompt. Un autre a brûlé 100$ dans une seule session Ultracode juste pour voir où était le plafond.
(Ma propre ère Rocket League a culminé quelque part autour du rang Diamond, à l'époque où les déploiements n'avaient pas encore commencé à bouffer les heures que je passais à faire du ranked. Les réflexes ne me manquent pas. Ce qui me manque, c'est d'avoir 40 minutes ininterrompues pour quoi que ce soit.)
Certaines de ces démos sont vraiment impressionnantes, le genre de chose qui aurait pris un sprint à une petite équipe pour prototyper il y a 2 ans. Mon problème n'a jamais été les goûts du camp 1. Le truc, c'est qu'un prototype de jeu fonctionnel et un client payant sont 2 livrables très différents, et un seul d'entre eux apparaît sur la facture du mois prochain comme revenu au lieu de coût.
Le paradoxe des instructions
La première chose que j'ai remarquée une fois la panique passée : Fable 5 veut moins de vous, pas plus.
Chaque modèle Claude précédent récompensait un prompt plus long et plus détaillé. Plus de contexte, plus de contraintes, meilleur output (c'était la règle empirique depuis 2 ans). Fable 5 la brise. Chargez un prompt d'instructions hyper-spécifiques, de contraintes étape par étape, de cas limites épelés à l'avance, et l'output empire souvent, au lieu de s'améliorer. Le modèle commence à optimiser pour satisfaire chaque clause que vous avez écrite au lieu de résoudre le vrai problème devant lui.
C'est un truc du quotidien, comment vous formulez une instruction unique en milieu de session, pas le plus gros choix sur l'activation ou non d'Ultracode pour un projet entier. Ça colle aussi avec ce que dit la propre documentation de prompting d'Anthropic sur le modèle : des instructions plus courtes et plus claires tendent à surpasser les exhaustives. Je lis peut-être trop dans 3 semaines de sessions, mais j'ai l'impression que le modèle récompense la confiance plus que le détail.
Ce que dit Anthropic (et ce que j'ai zappé)
La propre documentation d'Anthropic sur les niveaux d'effort est franche à ce sujet : Fable 5 tournant en effort faible ou moyen bat fréquemment les anciens modèles tournant en xhigh. Le conseil officiel est de commencer à "high" (qui est déjà le défaut) et d'escalader seulement si une tâche spécifique en a mesurément besoin, pas juste parce qu'elle semble importante.
J'ai zappé direct ce conseil et je suis allé au paramètre avec le nom le plus effrayant. Ce qui colle, parce que j'ai déjà fait exactement ça avant. Un plan structuré qui bat les paramètres d'effort brut, à chaque fois était globalement l'argument d'un article que j'avais écrit en mars, sur comment l'effort max sur un seul modèle ne corrige pas un mauvais plan. Cette leçon tient toujours. Mais elle ne couvre pas entièrement ce qui s'est passé cette fois, parce qu'Ultracode n'est pas juste un paramètre de raisonnement plus profond sur 1 modèle. C'est une permission de générer 12 modèles à la fois. L'ancienne leçon portait sur la profondeur. Celle-ci porte sur l'effectif.
Les conseils d'Anthropic s'appliquent aussi dans les sessions Ultracode. Chaque sous-agent qu'il génère hérite du niveau d'effort que vous définissez. Poussez toute la session en xhigh par défaut et vous ne payez pas la prime Fable 5 une fois. Vous la payez une fois par sous-agent, en parallèle, pour autant qu'Ultracode décide d'en lancer.
Où Fable 5 mérite vraiment son prix
Le 1 travail où Ultracode s'est payé directement : auditer une intégration d'API partenaire qui était restée intouchée pendant 2 ans. Des dizaines d'endpoints, pas de gestion d'erreur cohérente, la moitié de la logique de retry dupliquée sur 3 modules différents. J'ai d'abord délimité le périmètre. Chaque fichier en jeu, chaque contrainte, ne touche pas aux signatures de webhook, ne change pas les timeouts de retry, signale tout ce qui touche aux données de paiement au lieu de le corriger directement. Puis j'ai lâché Ultracode dessus.
15 minutes plus tard j'avais 3 sous-agents tournant en parallèle. 1 mappant chaque endpoint contre la vraie spec partenaire, 1 réécrivant la logique de retry dupliquée en 1 module partagé, 1 signalant chaque endroit où une requête touchait des données de paiement sans toucher le code lui-même. Ça a brûlé les tokens rapidement, comme avant. Mais cette fois le grillage a acheté quelque chose de réel : une carte complète de chaque incohérence dans l'intégration, une liste priorisée de corrections, et 3 de ces corrections déjà livrées le temps que je finisse mon café.
Ultracode n'est pas un paramètre à activer sur tout, et ce n'est pas non plus un à éviter. Il mérite son prix sur exactement 1 catégorie de travail : un projet déjà délimité et assez gros pour que 12 sous-agents parallèles battent 1 modèle séquentiel qui le mâche fichier par fichier.
Pour tout ce qui est plus petit, le quotidien, high effort et un prompt court suffisent amplement. Gardez Ultracode pour le 1 travail qu'il ne peut pas faire pour vous : décider ce qui est vraiment dans le périmètre.
Des crédits à revendre
Le vrai test n'a jamais été le modèle. C'est la discipline de celui qui est assis au clavier quand Ultracode est à 1 clic.
Définissez le périmètre avant de le toucher, et la différence entre un grillage de quota à 75% et un projet qui se paie tout seul se résume à cette 1 décision. Réussissez et vous bouclez le mois avec des crédits restants, quelque chose que le camp 1 arrive rarement à faire.
Alors avec ce qui me reste, je construis une petite app pour bosser mon ouverture du Jeu Italien.
Il s'avère qu'aucun paramètre d'effort ne corrige une mauvaise ouverture aux échecs. 🤓
Sources
- Tarification Fable 5 et chronologie du contrôle d'exportation : Claude Fast, Fable 5 usage credits guide
- Documentation officielle des niveaux d'effort : Claude Platform Docs, Effort
- Mécaniques Ultracode : Claude Code Docs, model configuration
- Cas rapportés de grillage de quota depuis Hacker News et Reddit : Claude Fast, Ultracode in Claude Code
- Conseils d'Anthropic sur les défauts d'effort : Developers Digest, Fable 5 effort levels explained
Cet article peut contenir des liens d'affiliation. Si vous cliquez dessus, je pourrais gagner une petite commission (ça ne vous coûte rien, et ça m'aide à continuer à livrer des articles de qualité chaque jour pour votre plaisir de lecture).