Markdown war ein Fehler für Agent-Ausgaben. Ein Claude Code Engineer hat es gerade bewiesen.

6 min read

„HTML ist das neue Markdown."

Das sagt Thariq Shihipar, Claude Code bei Anthropic, letzte Woche auf X.

ABER

CLAUDE.md, AGENTS.md, SKILL.md... Überall Markdown. Es wurde zur Luft, die man in Claude Code-Projekten atmet, zum Standard-Format, für das sich nie jemand bewusst entschieden hat. Wenn der Agent also einen Output produziert, liefert er Markdown. Das hat er überall gesehen.

Dann haut Thariq eine Galerie mit zwanzig HTML-Artefakten raus, um seine These zu belegen.

TLDR: Markdown hat unsere Projekte über Config-Dateien (CLAUDE.md, AGENTS.md, SKILL.md) übernommen und ist dann in alles andere eingesickert, auch in die Agent-Outputs, die sowieso niemand liest. Ein Mitglied des Claude Code-Teams hat gerade erklärt, warum er zu HTML gewechselt ist, und es läuft auf einen kurzen Befehl hinaus.

Büroangestellter überfordert von endlosem Markdown-Text auf dem Monitor, während eine Superhelden-Figur auf eine saubere HTML-Oberfläche mit organisierten Tabellen und Buttons zeigt
Markdown-Ausgaben: wo Lesbarkeit einen langsamen, schmerzhaften Tod stirbt.

Für eine Config-Datei ist das perfekt. Kurz, instruktiv, einmal gelesen und im Kontext gespeichert. Aber wenn der Agent dir einen 200-Zeilen-Plan oder einen Code-Review-Report hinwirft? Andere Geschichte. Du öffnest es, liest fünfzehn Zeilen, schließt den Tab. Drei Tage später fragst du den Agent nochmal, weil du null Erinnerung daran hast, was er entschieden hat.

Der Agent hat einwandfrei funktioniert. Das Format hat ihn verschwinden lassen.

Zurück zu den Basics. HTML ist mehr als ein Jahrzehnt älter als Markdown. Der Browser wurde dafür gebaut. Markdown war immer nur eine Abkürzung.

Warum Markdown gewonnen hat: Die 8.192-Token-Ausrede

2022 kam ChatGPT mit einem Kontextfenster von 8.192 Token raus. Das ist nicht viel. Für denselben Inhalt verbrennt HTML etwa 3x mehr Token als Markdown (die Zahlen von web2md.org liegen bei etwa 8.000 Token für HTML versus 2.800 für das Markdown-Äquivalent). Wenn dein Budget bei 8K liegt und dein Output in deinen Input reinschneidet, ist jeder gesparte Token ein Absatz, der überlebt.

Markdown hat diesen Kampf auf Kostenbasis gewonnen.

Simon Willison, eine der lautesten Stimmen in der AI-Dev-Community, hat es letzte Woche öffentlich zugegeben: Er schreibt seit den GPT-4-Tagen Markdown für LLMs, genau aus diesem Grund. Er lag nicht falsch. Niemand lag falsch, bei der damaligen Mathematik, und die Mathematik stimmte.

Tut sie nicht mehr. Kontextfenster sitzen 2026 bei einer Million Token und steigen weiter. Die Beschränkung, die Markdown rational machte, ist verdampft. Das Verhalten nicht. Wir haben weiter .md-Dateien in unsere Projekte gestopft, weil wir das schon immer so gemacht haben, nicht weil es die richtige Entscheidung für das war, was wir jetzt machen.

Reine Trägheit zu diesem Zeitpunkt.

Die Community hat das schon mal gemacht

Die AI-Community übernimmt Formate in Wellen. Jemand probiert was aus, es funktioniert, es verbreitet sich, und drei Jahre später schauen wir hoch und merken, dass die offensichtliche Wahl vom ersten Tag an direkt vor unserer Nase lag.

Derselbe Zyklus für Markdown in Agent-Outputs: schnell übernommen, spät hinterfragt.

Derselbe Instinkt hat mich vor ein paar Monaten dazu gebracht zu argumentieren, dass CLIs MCP für AI-Agenten schlagen. Die Community war auf MCP aufgesprungen, weil es neu und glänzend war, während die langweilige stabile Lösung seit Jahrzehnten in der Produktion lief. Das machen wir alle zwölf Monate ohne Ausnahme.

Der Unterschied diesmal? Es ist jemand von Anthropic selbst, der die Glocke läutet.

Was ein Mitglied des Claude Code-Teams tatsächlich macht

Thariq Shihipar, im Claude Code-Team bei Anthropic, hat gerade einen Post mit zwanzig konkreten Beispielen veröffentlicht. Keine Theorie. Echte Prompts, echte Outputs und Artefakte, die du jetzt sofort in deinem Browser öffnen kannst.

Die Galerie zeigt, was ein Agent dir in HTML liefern kann, was Markdown strukturell nicht hinbekommt. Ein Side-by-Side-Spec-Vergleich mit zwei Spalten, farbcodierten Unterschieden und einer Bewertungsbox unten. Ein Code-Review-Report, wo das Diff inline annotiert sitzt, Severity-Punkte in Rot/Gelb/Grün, Sprunglinks zu jedem Fund. Oder der Wegwerf-Editor, der mit einem „Als JSON kopieren"-Button kommt, den du nie verlangt hast, aber sofort benutzt.

Was HTML bringt: Tabellen, die rendern, Farben, die etwas bedeuten, SVG-Diagramme, Tabs, mobile-responsive Layouts, interaktive Bits, wenn du sie brauchst. Was Markdown bringt: einen langen Scroll.

Was zählt, ist nicht die Schönheit. Es ist diese Zeile aus Thariqs Post:

„Ich fühle mich mehr im Loop denn je, wenn ich HTML verwende. Ich habe ehrlich gesagt aufgehört, Markdown für fast alles zu verwenden."

Im Loop. Das ist das ganze Spiel. Ein Agent, der einen perfekten Plan produziert hat, den du nicht gelesen hast, ist ein Agent, der nichts getan hat. Der Output existiert in metaphysischem Sinne, klar. Die Entscheidung, die er dokumentiert hat, ist weg, sobald du den Tab schließt. Eine Markdown-Datei, an der du vorbeiscrollst, ist dasselbe wie gar keine Datei. Eine HTML-Datei, die du in deinem Browser öffnest, per Link teilst, für Slack screenshottest? Diese Datei existiert. Leute lesen sie. Du liest sie. Du bleibst im Bilde darüber, was dein Agent entschieden hat.

Der eigentliche Durchbruch ist, Teil des Workflows zu bleiben. Besser aussehende Artefakte sind ein Nebeneffekt.

Ein Plan, der nie gelesen wird, ist ein Plan, der nie geschrieben wurde.

Die ehrlichen Vorbehalte

HTML kostet mehr Token. Die Token-Kosten sind der ganze Pushback gegen Thariqs Post. Als die Ankündigung kam, antwortete ein Account auf X (@EXM7777): „ja klar werde ich das 5-fache an Token für gut aussehende Textdateien ausgeben." Die Antwort bekam Traction, weil sie richtig klingt.

Sie ist richtig, für einen spezifischen Fall. Sie ist falsch für den Fall, über den Thariq spricht.

Wenn der primäre Leser deines Outputs ein anderes LLM ist (ein nachgelagerter Agent, der die Datei konsumieren, parsen und darauf reagieren wird), ist Markdown in Ordnung. Der Agent kümmert sich nicht um Farben. Er rendert keine Tabellen. Token sind das Einzige, was zählt. Dieselbe Logik für schnelle Scratch-Outputs, die du in drei Minuten wegwirfst, für High-Throughput-Pipelines, wo du zweihundert Dateien pro Stunde generierst, für alles, wo die Kosten pro Output den Wert des Outputs dominieren.

Wenn der primäre Leser deines Outputs ein Mensch ist (und du, lieber Builder, bist ein Mensch, sogar am Freitagnachmittag, wenn du mental schon ausgecheckt hast und das Boot zu den Delfinen in zwei Stunden ablegt), dreht sich die Rechnung um. Die Kosten sind ein paar Cent extra in Token. Der Wert ist, ob du das Ding tatsächlich liest. Ein 5-Cent-Plan, den du liest, schlägt einen 1-Cent-Plan, den du ignoriert hast, jedes Mal.

Der andere echte Vorbehalt, den Thariq selbst zugibt: HTML-Dateien sind schmerzhaft zu diffen in git. Markdown liest sich sauber in einem Pull Request. HTML wickelt alles in eine Suppe aus Tags, die Line-by-Line-Review zur Hölle macht. Wenn das Artefakt in einem Repo leben und über Commits hinweg reviewt werden soll, gewinnt Markdown immer noch.

Cloudflare pusht auch Markdown für den Agent-Input-Flow und konvertiert Webseiten zu Markdown, damit Agenten sie effizient konsumieren können. Andere Unterhaltung. Web → Agent ist Input. Agent → Mensch ist Output. Beides kann gleichzeitig wahr sein, ohne Widerspruch.

Wenn dein Leser ein Modell ist, Markdown. Wenn dein Leser du bist, HTML.

Ein Prompt. Kein Setup.

Der ganze Wechsel passt in einen Satz am Ende deines Prompts:

„Mach das als einzelne HTML-Datei."

Das war's. Kein CLAUDE.md-Edit, kein Skill-Scaffolding, kein Setup. Thariq ist explizit darüber: Überengineere es nicht. Probier den Prompt bei deiner nächsten Planungsaufgabe. Schau, was rauskommt. Wenn du merkst, dass du dreimal hintereinander danach greifst, dann denk vielleicht über einen Skill nach. Nicht vorher.

Derselbe Nicht-Überengineering-Reflex wie damals, als ein einziges Open-Source-Repo Claude Code in einen funktionierenden n8n-Architekten verwandelte. Das Repo war der Durchbruch. Alles, was ich drumherum zu scaffolden versucht habe, war nur im Weg.

Die Galerie hat zwanzig Beispiele sortiert nach Use Case: Planung, Code Review, Design, Prototyping, Diagramme, Decks, Research, Reports, Custom Editors. Nimm das, was dem am nächsten kommt, was du morgen machst. Klaue die Prompt-Struktur. Ship.


Mein letzter Plan öffnete sich im Browser mit Tabs, einem farbcodierten Diff und einem „Als JSON kopieren"-Button, den ich nie verlangt hatte. Ich habe alles gelesen. Zum ersten Mal seit langem wusste ich genau, was mein Agent entschieden hatte, ohne zurückgehen und es dreimal lesen zu müssen.

Probier „mach das als einzelne HTML-Datei" bei deinem nächsten Plan. Du wirst es lesen.

Quellen