Das Desaster um Claude Fable 5 in der Kolumne
Anthropic hat in Claude Fable 5 Mechanismen eingebaut, die Anfragen zur KI Entwicklung heimlich sabotieren. Wer das Modell nach technischem Design oder Abläufen für das Pretraining fragt, erhält manipulierte Antworten. Das Unternehmen begründet dies damit, das Kopieren eigener Technologie verhindern zu wollen.
Kritik aus der Wissenschaft löste eine Kehrtwende aus. Anthropic erklärte, man habe den falschen Kompromiss gewählt, und kündigte an, die bisher verdeckte Sabotage künftig sichtbar zu machen. Betroffen gewesen sein sollen 0,03 Prozent des Traffics. Zugleich ist das Vertrauen in das System nach Ansicht von Kritikern beschädigt.
