Ich habe den besten Anwendungsfall für Claude Fable 5 gefunden. Es kostete 75% meines Monatskontingents.
Claude Fable 5 ist am 1. Juli zurückgekommen – nach 3 Wochen Zwangspause wegen US-Exportkontrollen. Innerhalb von 48 Stunden teilte sich die Reaktion in 2 klare Lager.
Lager 1 besteht aus Erwachsenen, die die LAN-Party-Phase ihres Lebens nie ganz hinter sich gelassen haben – sie ballern Rocket League-Klone in einem Zug weg und fliegen durch ein nachgebautes Hogwarts. Eine Demo brauchte angeblich 4 Prompts und 173 Dollar in Tokens, um einen spielbaren Prototyp zu produzieren.
Lager 2 versucht herauszufinden, wie man dasselbe Modell in echte Einnahmen verwandelt, ohne vor dem Mittagessen ein Monatsbudget zu verbrennen. Ich hätte gerne gesagt, dass ich direkt in Lager 2 gelandet bin. Bin ich nicht. Ich habe Ultracode angeschaltet, um zu sehen, was der Hype soll, ihm eine Aufgabe ohne jeglichen Scope gegeben und zugeschaut, wie mein Monatskontingent schmolz – in wenigen Minuten. Kein dramatischer You-Died-Screen, nur eine stille 0% im Usage-Dashboard.
Also: So holst du wirklich das Beste aus Claude Fab(ulous?) heraus.

Was Ultracode tatsächlich macht
Ultracode ist kein Effort-Level der API. Es ist eine Claude Code-spezifische Einstellung, und diese beiden zu verwechseln ist genau der Grund, warum ich hier gelandet bin.
Der Prompt, der es getan hat: „räum den Checkout-Flow auf, der ist ein Chaos." Nichts über welche Dateien. Nichts darüber, was „aufräumen" bedeuten sollte. Ultracode hat das als Einladung verstanden, Subagenten in die Payment-Logik, den Versandkostenrechner und eine Einstellungsseite zu schicken, die ich seit einem Jahr nicht angefasst hatte – und hat angefangen, alle 3 gleichzeitig zu „säubern".
Schalte Ultracode an und 2 Dinge passieren. Jede Anfrage in der Session wird mit xhigh an das Modell geschickt, der höchsten verfügbaren Reasoning-Tiefe. Und Claude Code bekommt eine Dauerberechtigung, Dynamic Workflows für alles zu starten, was substanziell aussieht (Anthropics Name für automatische Subagenten-Orchestrierung). Die Hauptsession spaltet so viele Subagenten ab, wie sie für eine Aufgabe für nötig hält – jeder verbrennt seinen eigenen Anteil an Tokens, ohne vorher zu fragen. Es ist weniger ein einzelner Charakter, der einen Zauber wirkt, und mehr das Spiel, das entscheidet, dass deine Solo-Quest eigentlich eine komplette Raid-Party brauchte.
Über die API kostet Fable 5 10 Dollar pro Million Input-Tokens und 50 Dollar pro Million Output – etwa das Doppelte von Opus 4.8. Dieser Aufpreis ist in Ordnung, wenn 1 Modell die Arbeit macht. Er hört auf, in Ordnung zu sein, wenn Ultracode stillschweigend deine 1 Anfrage in 12 parallele verwandelt, weil es entschieden hat, dass deine Aufgabe eine kleine Armee rechtfertigt.
Genau der Mechanismus, der mein Kontingent verbrannt hat (xhigh Reasoning plus unüberwachtes Subagenten-Spawning), ist derselbe Mechanismus, der Ultracode den Aufpreis bei einem echten, bereits abgegrenzten Job wert macht. Denk an ein chaotisches Refactoring über 40 Dateien oder ein vollständiges Codebase-Audit. Ultracode ist nicht daran gescheitert zu delegieren. Ich bin daran gescheitert, ihm nie zu sagen, woran es delegieren durfte.
Eine Version dieser Lektion habe ich schon mal auf teure Art gelernt, mit einer Claude Code-Session, die ich 4 Stunden unbeaufsichtigt laufen ließ. Die 3 kurzen Komponenten, die Scope-Drift verhindern stellten sich als genauso wichtig mit 1 Loop heraus wie mit 12 parallel laufenden Subagenten.
Ich war nicht der Einzige

Beim Durchscrollen von Hacker News und r/ClaudeAI in demselben 48-Stunden-Fenster fand sich reichlich Gesellschaft.
Ein Max-Abonnent (der 200-Dollar-im-Monat-Tarif) berichtete, etwa 20% seines Wochenkontingents an einem einzigen Tag verbrannt zu haben. Ein Pro-User sagte, er habe sein Limit in etwa 10 Minuten erreicht. 1 Builder startete 62 Opus 4.8-Subagenten für eine einzige Aufgabe und erreichte das 5-Stunden-Nutzungslimit in 18 Minuten – das ist weniger Skynet erwacht und mehr ein Schwarm koffeinhaltiger Praktikanten mit der Firmenkreditkarte. Jemand anderes feuerte etwa 90 Agenten ab, nur um ein kleines Package zu reviewen. 1 Hacker News-Kommentar fasste es besser zusammen, als ich könnte: „tokenmaxxing als Produkt getarnt."
Nichts davon ist ein gemessener Durchschnitt, nur verstreute Anekdoten aus Forenthreads, kein kontrollierter Benchmark. Aber das Muster hielt sich über jeden Account. Die Beschwerde ging nie um Output-Qualität. Es ging darum, dass der Zähler noch lange drehte, nachdem die Aufgabe bereits erledigt war.
Trotzdem ist Kontingent-Verbrennung in diesem Ausmaß kein Rundungsfehler. Beim Max-Plan bedeuten 20% der Wochenzuteilung an einem Tag weg, dass man weit vor dem nächsten Reset auf dem Trockenen sitzt. Bei Pro bedeutet das Limit in 10 Minuten zu erreichen, dass der Rest des Tages ganz ohne das Modell stattfindet.
Das andere Lager: Videospiele in einem Zug
Während mein Kontingent-Balken in Echtzeit sank, hatte der Rest des Internets einen viel besseren Nachmittag.
Der Rocket League-Klon bekam sogar Lob von Leuten, die normalerweise bei KI-Demos die Augen verdrehen. Genauso der rekonstruierte Hogwarts-Ausschnitt und das Spiel, das aus 4 Prompts und 173 Dollar in Tokens gebaut wurde, das ich früher erwähnt habe. 1 viel beachteter Test ließ Fable 5 gegen Opus 4.8 head-to-head mit exakt demselben Prompt antreten. Ein anderer verbrannte 100 Dollar in einer einzigen Ultracode-Session, nur um zu sehen, wo die Decke liegt.
(Meine eigene Rocket League-Ära erreichte ihren Höhepunkt irgendwo um Rang Diamond, noch bevor Deploys anfingen, die Stunden zu fressen, die ich früher mit Ranked-Warteschlangen verbracht habe. Die Reflexe vermisse ich nicht. Die 40 ununterbrochenen Minuten für irgendetwas schon.)
Einige dieser Demos sind wirklich beeindruckend, die Art von Sache, für die ein kleines Team vor 2 Jahren einen Sprint für einen Prototyp gebraucht hätte. Mein Problem war nie der Geschmack von Lager 1. Die Sache ist nur: ein funktionierender Spiel-Prototyp und ein zahlender Kunde sind 2 sehr verschiedene Deliverables, und nur eines davon taucht auf der nächsten Monatsrechnung als Einnahme statt als Kosten auf.
Das Instruktions-Paradox
Das erste, was mir auffiel, nachdem die Panik abgeklungen war: Fable 5 will weniger von dir, nicht mehr.
Jedes vorherige Claude-Modell belohnte einen längeren, detaillierteren Prompt. Mehr Kontext, mehr Constraints, besserer Output (das war die Faustregel für 2 Jahre am Stück). Fable 5 bricht sie. Lade einen Prompt mit hyperspezifischen Anweisungen, Schritt-für-Schritt-Constraints, im Voraus buchstabierten Edge Cases, und der Output wird oft schlechter, nicht besser. Das Modell fängt an, dafür zu optimieren, jede Klausel zu erfüllen, die du geschrieben hast, anstatt das eigentliche Problem vor sich zu lösen.
Das ist eine alltägliche Sache, wie du eine einzelne Anweisung mitten in der Session formulierst, nicht die größere Entscheidung, ob du Ultracode für ein ganzes Projekt anschaltest. Es passt auch zu dem, was Anthropics eigene Prompting-Dokumentation über das Modell sagt: kürzere, klarere Anweisungen übertreffen tendenziell erschöpfende. Vielleicht lese ich zu viel in 3 Wochen Sessions hinein, aber es fühlt sich an, als würde das Modell Vertrauen mehr belohnen als Detail.
Was Anthropic sagt (und was ich übersprungen habe)
Anthropics eigene Dokumentation zu Effort-Levels ist unverblümt darüber: Fable 5 auf low oder medium effort schlägt häufig ältere Modelle auf xhigh. Der offizielle Rat ist, bei „high" zu starten (was bereits der Standard ist) und nur zu eskalieren, wenn eine spezifische Aufgabe es messbar braucht, nicht nur weil sie sich wichtig anfühlt.
Ich bin direkt an diesem Rat vorbei und zur Einstellung mit dem beängstigendsten Namen gegangen. Was passt, weil ich genau das schon mal gemacht habe. Ein strukturierter Plan schlägt rohe Effort-Einstellungen, jedes Mal war im Grunde das ganze Argument eines Stücks, das ich im März geschrieben habe, darüber, wie Max Effort auf einem einzelnen Modell einen schlechten Plan nicht repariert. Diese Lektion gilt immer noch. Aber sie deckt nicht vollständig ab, was diesmal passiert ist, weil Ultracode nicht nur eine tiefere Reasoning-Einstellung auf 1 Modell ist. Es ist eine Berechtigung, 12 Modelle auf einmal zu spawnen. Die alte Lektion ging um Tiefe. Diese hier geht um Personalstärke.
Die Anthropic-Anleitung gilt auch innerhalb von Ultracode-Sessions. Jeder Subagent, den es aufbaut, erbt das Effort-Level, das du einstellst. Dreh die ganze Session standardmäßig auf xhigh und du zahlst den Fable 5-Aufpreis nicht einmal. Du zahlst ihn einmal pro Subagent, parallel, für so viele Ultracode entscheidet zu starten.
Wo Fable 5 tatsächlich seinen Preis verdient
Der 1 Job, bei dem sich Ultracode direkt bezahlt gemacht hat: das Audit einer Partner-API-Integration, die 2 Jahre unberührt gelegen hatte. Dutzende Endpoints, kein konsistentes Error Handling, die halbe Retry-Logik über 3 verschiedene Module dupliziert. Ich habe es zuerst abgegrenzt. Jede Datei im Spiel, jeder Constraint, rühr die Webhook-Signaturen nicht an, ändere die Retry-Timeouts nicht, flagge alles, was Payment-Daten berührt, anstatt es direkt zu reparieren. Dann habe ich Ultracode darauf losgelassen.
15 Minuten später hatte ich 3 parallel laufende Subagenten. 1 mappte jeden Endpoint gegen die tatsächliche Partner-Spec, 1 schrieb die duplizierte Retry-Logik in 1 geteiltes Modul um, 1 flaggte jeden Ort, wo ein Request Payment-Daten berührte, ohne den Code selbst anzufassen. Es verbrannte Tokens schnell, genauso wie vorher. Aber diesmal kaufte die Verbrennung etwas Echtes: eine vollständige Karte jeder Inkonsistenz über die Integration, eine priorisierte Liste von Fixes und 3 dieser Fixes bereits ausgeliefert, bis ich meinen Kaffee ausgetrunken hatte.
Ultracode ist keine Einstellung, die man für alles laufen lässt, und auch keine, die man vermeidet. Es verdient seinen Preis bei genau 1 Kategorie von Arbeit: einem Projekt, das bereits abgegrenzt und groß genug ist, dass 12 parallele Subagenten 1 sequenzielles Modell schlagen, das sich Datei für Datei durchkaut.
Für alles Kleinere, das alltägliche Zeug, reichen high effort und ein kurzer Prompt immer noch. Spar Ultracode für den 1 Job auf, den es nicht für dich machen kann: entscheiden, was tatsächlich im Scope ist.
Credits übrig
Der echte Test war nie das Modell. Es ist die Disziplin von wem auch immer an der Tastatur sitzt, wenn Ultracode 1 Klick entfernt ist.
Setz den Scope, bevor du es anrührst, und der Unterschied zwischen einer 75%-Kontingent-Verbrennung und einem Projekt, das sich selbst bezahlt, kommt auf diese 1 Entscheidung an. Mach es richtig und du schließt den Monat mit übrigen Credits ab, etwas, was Lager 1 selten schafft.
Also baue ich mit dem, was von meinen übrig ist, eine kleine App, um meine Italienische Partie-Eröffnung zu üben.
Stellt sich heraus, kein Effort-Setting repariert eine schlechte Schacheröffnung. 🤓
Quellen
- Fable 5 Preise und Export-Control-Timeline: Claude Fast, Fable 5 usage credits guide
- Offizielle Effort-Level-Dokumentation: Claude Platform Docs, Effort
- Ultracode-Mechaniken: Claude Code Docs, model configuration
- Berichtete Kontingent-Verbrennungsfälle von Hacker News und Reddit: Claude Fast, Ultracode in Claude Code
- Anthropics Anleitung zu Effort-Standards: Developers Digest, Fable 5 effort levels explained
Dieser Post könnte Affiliate-Links enthalten. Wenn du sie anklickst, verdiene ich vielleicht eine kleine Provision (kostet dich nichts und hilft mir, weiterhin täglich Qualitätsartikel für dein Lesevergnügen zu liefern).