Claude Fable 5 van Anthropic krijgt steeds meer kritiek na de herlancering op 1 juli. Gebruikers zeggen dat strengere veiligheidsregels het vlaggenschipmodel slecht laten presteren bij coderen, debuggen en als agent.
De benchmarkgroep BridgeMind meldde flinke scoredalingen in de BridgeBench-serie. Anthropic beweert dat het onderliggende model niet is veranderd en wijt de problemen aan strengere veiligheidscategorieën.
Claude Fable 5-benchmark scores kelderen na herlancering
BridgeMind testte opnieuw de versie van Fable 5 van 1 juli en zag sterke dalingen. Debugging zakte van 86,2 naar 25,9. Refactoring ging van 73,6 naar 38,4 en verwerking van hallucinaties daalde van 75,9 naar 61,7.
De uitleg achter deze cijfers is belangrijk. Slechts drie van de twaalf debugging-taken werden afgerond zonder terug te vallen op Claude Opus 4.8, en elke terugval leverde nul punten op.
Daarom laat de daling zien dat taken geblokkeerd worden, niet dat het model slechter redeneert.
BridgeMind benadrukt dat Fable 5 net zo goed presteert als in juni, als een taak wel kan worden afgerond.
“Het model is niet slechter geworden. Het is opgesloten,” gaf men aan.
Volg ons op X voor het laatste nieuws terwijl het gebeurt.
De tijdlijn laat de spanning zien. Anthropic bracht Fable 5 uit op 9 juni. Drie dagen later haalde Washington het offline. Op 30 juni, vier dagen na het herstellen van Mythos 5 toegang voor ongeveer 100 Amerikaanse instellingen, werden de exportbeperkingen opgeheven.
De heropende toegang heeft beperkingen. Tot 7 juli mag Fable 5 slechts 50% van het wekelijkse gebruikslimiet benutten, daarna geldt een betaald gebruiksmodel.
Anthropic verdedigt bredere veiligheidsmarge
Anthropic ging op 30 juni in op het compromis in een verklaring. Het bedrijf koos bewust voor een ruimere veiligheidsmarge, waardoor nu verzoeken worden tegengehouden die waarschijnlijk onschadelijk zijn. Een betere filter blokkeert de omzeiltechniek, meldden onderzoekers van Amazon in meer dan 99% van de pogingen.
Geblokkeerde verzoeken gaan naar Opus 4.8 en gebruikers krijgen een melding. Anthropic geeft toe dat de filter nu vaker legitiem codeer- en debugwerk afwijst dan eerder.
Uit Anthropic’s eigen testen blijkt ook dat Fable 5 geen uniek risico vormt. Andere modellen zoals GPT-5.5 en Kimi K2.7 vonden dezelfde kwetsbaarheden.
Volgens Anthropic hebben onderzoekers van het US Commerce Department beide veiligheidsfilters getest en vonden ze die extreem sterk.
Het belang gaat verder dan één product. De schorsing zorgde ervoor dat Europa Anthropic probeert aan te trekken, terwijl Chinese AI-modellen terrein winnen tegenover Amerikaanse AI-labs.
Anthropic werkt nu samen met Amazon, Microsoft en Google aan een framework rond jailbreak-ernst. Of de filters snel minder valse positieven geven, bepaalt mogelijk of geavanceerde gebruikers blijven of vertrekken.









