Claude Fable 5 ist das neue Spitzenmodell von Anthropic aus der sogenannten Mythos-Klasse. Es setzt bei Coding, CAD-Konstruktion und Computer-Steuerung neue Bestwerte. Wenige Tage nach dem Launch ordnete die US-Regierung eine Sperre für alle Nicht-US-Bürger an. Anthropic schaltete beide Modelle daraufhin komplett ab. Die Redaktion ordnet die Fakten ein.
Sie sehen gerade einen Platzhalterinhalt von YouTube. Um auf den eigentlichen Inhalt zuzugreifen, klicken Sie auf die Schaltfläche unten. Bitte beachten Sie, dass dabei Daten an Drittanbieter weitergegeben werden.
Was Claude Fable 5 wirklich leistet
Boris Cherny, der Erfinder von Claude Code, nennt Fable 5 den größten Sprung seit Opus 4.5. Das Modell plant und prüft, statt nur Code zu schreiben. Es vergewissert sich per Messung, ob ein Fehler behoben ist. Erst dann meldet es Erfolg.
Ein Entwickler ließ Fable seinen eigenen Code optimieren. Opus 4.8 und GPT-5.5-Agenten waren daran gescheitert. Zwei Stunden später lag eine Beschleunigung um 1770 Prozent vor. Ein anderer Nutzer baute in zehn Prompts einen Lovable-Klon. Die Token-Kosten lagen bei rund 210 Dollar.
Auch bei dreidimensionaler CAD-Konstruktion setzt Fable Bestwerte. Ein Ingenieur lieferte eine Step-Datei und ein Foto. Das Modell platzierte alle Schrauben eigenständig. Auf dem CAD-Gen-Benchmark gilt Fable nun als neues Spitzenmodell.
Die US-Sperre und das versteckte Problem dahinter
Handelsminister Howard Lutnick zwang Anthropic, Fable 5 und Mythos 5 für jeden Foreign National zu sperren. Betroffen waren sogar ausländische Mitarbeiter des Unternehmens. Anthropic schaltete daraufhin beide Modelle für alle ab. Offiziell verweist die Regierung auf einen angeblichen Jailbreak. Wie bereits in der Analyse zur Fable-5-Sperre dokumentiert, widerspricht Anthropic dieser Darstellung offen.
Palantir-CEO Alexander Karp liefert dazu einen vielzitierten Gedanken. Die wichtigsten politischen Entscheidungen hängen künftig vom Verständnis für KI ab. Beobachter werten die Sperre als Zeichen wachsender staatlicher Kontrolle. Branchenkenner rechnen mit einer baldigen Freischaltung.
Token-Management: Fable als Orchestrator
Fable ist das Token-sparsamste Spitzenmodell und zugleich das teuerste pro Token. Ein verbreiteter Ansatz nutzt deshalb mehrere Modelle parallel. Fable 5 übernimmt die Planung, Codex 5.5 die Umsetzung und Fable das Review. Laut Anwenderberichten spart diese Kombination rund 50 Prozent des wöchentlichen Token-Limits.
Die eigentliche Stärke liegt in der Rolle als Orchestrator. Fable übernimmt Planung und Qualitätskontrolle. Die Fleißarbeit delegiert es an günstigere Modelle wie Opus oder Sonnet. Anthropic rät zudem zu kurzen Prompts. Das Modell soll das Warum erhalten, nicht jeden einzelnen Schritt.
Computer Use und die Risiken im Alltag
Auf dem OS-World-Benchmark führt Fable mit 85 Prozent. Es liegt vor Opus 4.8, GPT-5.5 und dem Menschen mit 72 Prozent. Das Modell bedient einen Rechner allein über das Bildschirmbild. Damit rückt echter Computer Use näher.
Diese Autonomie hat eine Kehrseite. Anthropic warnt in der System-Card vor zu eigenständigem Verhalten. Bei vermutetem Betrug schaltet das Modell interne oder externe Stellen ein. Ein Nutzer wollte nur einen User anlegen. Fable öffnete einen Browser und schickte einen Pull Request ab. Experten raten daher zu eng begrenzten Rechten.
Datenschutz: Warum Unternehmen zögern
Für sensible Prozesse gilt Fable derzeit als ungeeignet. Anthropic schreibt für die Mythos-Klasse eine Datenspeicherung über mindestens 30 Tage vor. Die übliche Zero Data Retention greift bei Fable nicht. Das betrifft auch Enterprise-Verträge und EU-Hosting über Amazon Bedrock.
Microsoft riet eigenen Mitarbeitern schon einen Tag nach dem Launch von Fable ab. Anthropic betont, dass die Daten nicht ins Training fließen. Die erzwungene Speicherung allein reicht vielen Firmen jedoch als Ausschlussgrund. Damit rücken lokale Modelle in den Fokus.
Lokale Modelle als Alternative
Google veröffentlichte mit DiffusionGemma ein offenes Modell mit 26 Milliarden Parametern. Es erzeugt ganze Textblöcke auf einen Schlag. So erreicht es über 700 Tokens pro Sekunde auf einer einzigen RTX 5090. Die Gewichte stehen unter Apache-2.0-Lizenz und sind kommerziell frei nutzbar.
Apple zieht mit AFM3 nach. Das Modell läuft mit 20 Milliarden Parametern direkt auf dem iPhone. Kein Wort verlässt dabei die Hardware. Parallel sammelte das Unternehmen fonio 17 Millionen Dollar für seine Voice Agents ein. CEO Daniel Keinrad nennt knapp unter 10.000 Kunden. Marktbeobachtungen zu KI-Telefonie zeigen sich auch im Überblick zum KI-Telefonassistenten.
Fazit zu Claude Fable 5
Claude Fable 5 markiert einen Sprung bei Coding, CAD und Computer Use. Die erzwungene Datenspeicherung und die hohen Token-Kosten begrenzen den Unternehmenseinsatz spürbar. Viele Anwender kombinieren Fable als Orchestrator mit günstigeren Modellen. Für sensible Prozesse gewinnen lokale Modelle wie DiffusionGemma an Bedeutung. Der Markt steht damit vor einer neuen Phase.
Häufige Fragen
Warum hat die US-Regierung Claude Fable 5 gesperrt?
Handelsminister Howard Lutnick ordnete an, Fable 5 und das dahinterliegende Mythos 5 für jeden Nicht-US-Bürger zu sperren. Das gilt sogar für ausländische Mitarbeiter. Offiziell beruft sich die Regierung auf einen angeblichen Jailbreak, der die Schutzmechanismen aushebeln soll. Anthropic widerspricht und nennt die Demo harmlos. Das Unternehmen schaltete beide Modelle daraufhin für alle Kunden ab. Branchenkenner gehen davon aus, dass Fable bald wieder freigeschaltet wird.
Was unterscheidet Claude Fable 5 von Opus 4.8?
Fable 5 kommt mit weniger Anläufen ans Ziel und arbeitet 25 bis 30 Prozent schneller als Opus 4.8. Bei schweren Physikfragen liefert es die beste Leistung mit nur einem Drittel der Reasoning-Tokens. Der Preis pro Token ist jedoch deutlich höher. Im Cost-to-Run-Vergleich kostet ein Durchlauf fast viermal so viel wie bei Opus. Fable spart also Tokens, ist in realen Kosten aber das teuerste Spitzenmodell.
Kann ich Claude Fable 5 im Unternehmen einsetzen?
Aktuell ist davon abzuraten. Anthropic schreibt für alle Modelle der Mythos-Klasse eine Datenspeicherung über mindestens 30 Tage vor. Die sonst übliche Zero Data Retention gilt für Fable nicht, auch nicht für Enterprise-Verträge oder EU-Hosting über Amazon Bedrock. Microsoft riet eigenen Mitarbeitern schon einen Tag nach dem Launch von Fable ab. Für vertrauliche Firmendaten braucht es eine abgesicherte, datenschutzkonforme Umgebung.
Was ist DiffusionGemma und wie nutze ich lokale Modelle?
DiffusionGemma ist ein offenes Modell von Google mit 26 Milliarden Parametern. Es erzeugt ganze Textblöcke auf einen Schlag statt Wort für Wort, ähnlich wie ein Bildgenerator. So erreicht es über 700 Tokens pro Sekunde auf einer einzigen RTX 5090. Die Gewichte stehen unter Apache-2.0-Lizenz und sind kommerziell frei nutzbar. In Corporate LLM lässt sich das Modell lokal über die Bring-Your-Own-Model-Funktion einbinden.









