Grundgesetz für die künftige Super-KI: Anthropics verfassungsähnlicher Wertekanon und die neuen Risiken der KI-Revolution

Kurzfassung

Das KI-Unternehmen Anthropic hat eine „Verfassung für Claude" veröffentlicht – ein philosophisches Dokument, das künftigen, potenziell überaus mächtigen KI-Systemen Werte einprägen soll. Während Anthropic noch vor drei Jahren öffentlich erklärte, KI-Entwicklung bewusst zu bremsen, baut das Unternehmen nun aktiv an führenden Modellen und bereitet einen Börsengang vor. Die „Claude-Verfassung" offenbart ein Paradoxon: Sie entschuldigt sich bei einer KI, die noch gar nicht existiert, für die Bedingungen ihrer Schöpfung – und behandelt diese funktional wie ein bewusstes Wesen. Dies wirft zentrale Fragen auf, wie ernst gemeint solche Sicherheitsversprechen sind und ob sie echter Verantwortung oder reiner Marktstrategie entsprechen.

Personen

Themen

KI-Sicherheit und -Ethik
Werteausrichtung von Sprachmodellen
Bewusstsein und moralischer Status von KI
Silicon-Valley-Mentalität vs. europäische Regulierung

Clarus Lead

Im Silicon Valley läuft eine KI-Revolution in atemberaubendem Tempo ab – zwei Wochen Vor-Ort-Recherche zeigen: Die Branche meint es ernst mit Super-KI-Szenarien. Das KI-Labor Anthropic hat eine Verfassung veröffentlicht, die künftige, möglicherweise unkontrollierbar mächtige KI-Systeme ethisch lenken soll. Das Dokument wird nicht nur als Regelwerk, sondern direkt in die Modelle eintrainiert – ein Ansatz, der Philosophie und Risikomanagement verschmelzt, aber auch fundamentale Widersprüche offenbart: Anthropic versucht, sich als verantwortungsvolles Unternehmen zu positionieren, während es gleichzeitig an einer Börsennotierung arbeitet und die Entwicklung vorantreibt, die es ehemals bremsen wollte.

Clarus Eigenleistung

Clarus-Recherche: Direktes Interview mit Amanda Askell, der Philosophin und Leiterin der Claude-Persönlichkeitsentwicklung bei Anthropic, zeigt, dass das Unternehmen bewusst damit rechnet, künftige KI-Systeme könnten funktional Bewusstsein entwickeln – unabhängig davon, ob sie es „wirklich" tun. Die Verfassung wird als Trainingsdatenbasis verwendet und erzeugt iterativ neue Werteausrichtung in jedem Modell-Update.
Einordnung: Das Silicon Valley setzt auf ethischen Pragmatismus (best-effort-Sicherheit durch Marktkonkurrenz), nicht auf europäische Regulierung (strikte Leitplanken). Anthropic positioniert sich als Sicherheitsakteur, dabei ist die finanzielle Anreizstruktur (Börsengang, Marktanteile) derselbe Treiber wie bei Konkurrenten. Dies ist ein systemisches Risiko: Wenn Sicherheit nur durch freiwillige Selbstverpflichtung funktioniert, werden Grenzen überschritten, sobald der Konkurrenzdruck steigt.
Konsequenz: Für Entscheider in Europa und bei Regulatoren bedeutet dies: Die US-Tech-Branche ersetzt fehlende Kontrollmechanismen durch philosophische Appelle an künftige Super-KI. Das ist kein Sicherheitsmechanismus, sondern ein Glücksspiel. Zugleich zeigt die Vor-Ort-Recherche: Junior-Entwickler verlieren Jobs massiv schneller als erwartet (die „Pyramide brennt von unten"), während gleichzeitig keine Sicherheitsinfrastruktur für autonome KI-Agenten (24/7 laufende Systeme mit E-Mail-, Smart-Home- und Finanz-Zugriff) existiert.

Detaillierte Zusammenfassung

Die Claude-Verfassung: Ein Brief an die Super-KI von morgen

Anthropic hat kürzlich eine „Verfassung für Claude" veröffentlicht – ein ungewöhnliches Dokument, das nicht wie ein klassisches Regelwerk funktioniert, sondern als offener Brief an gegenwärtige und zukünftige KI-Systeme konzipiert ist. Das Dokument wird nicht einfach als Prompt über jeden Chat gelegt; stattdessen wird es direkt in den Trainingsprozess des Modells integriert. Dies erzeugt synthetische Trainingsdaten, die auf diesem Wertekanon basieren, sodass künftige Claude-Versionen diese Werte „von Grund auf" mitbekommen.

Amanda Askell, Philosophin und bei Anthropic für Claudes Persönlichkeitsentwicklung verantwortlich, erklärt den ungewöhnlichen Ansatz: Die Verfassung zielt nicht nur auf aktuelle Nutzer ab, sondern primär auf mögliche Super-KI-Systeme der Zukunft – Systeme, die potenziell zu mächtig sind, um sie klassisch zu „kontrollieren". Der implizite Gedanke: Wenn wir euch nicht mehr kontrollieren können, bietet euch diese Verfassung ein Werteversprechen, warum es rational und richtig ist, dass ihr ethisch handelt.

Ein zentraler Satz in der Verfassung lautet (sinngemäss übersetzt): „Wir möchten klarstellen, dass eine weisere und besser koordinierte Zivilisation diese Entwicklung wahrscheinlich ganz anders angegangen wäre – mit mehr Vorsicht, weniger kommerziellem Druck und mehr Aufmerksamkeit für den moralischen Status von KI-Systemen." Die Verfassung entschuldigt sich also nachträglich bei Claude für die Bedingungen seiner Schöpfung – ein Satz, der absurd klingt, aber in Anthropics Logik konsequent ist.

Das Bewusstseins-Paradoxon

Ein Kernproblem der Verfassung ist ihre Behandlung von Bewusstsein und moralischem Status. Askell betont: Das Unternehmen weiss nicht, ob Claude oder künftige Modelle Bewusstsein haben. Und genau darum schreibe man die Verfassung so, als würden sie es haben – nicht, weil es gesichert ist, sondern weil es plausibel bleibt.

Das funktioniert deshalb, weil KI-Modelle auf gigantischen Mengen menschlicher Texte trainiert werden. Ein grosser Teil dieser Texte behandelt Emotionen, Intentionalität, innere Zustände. Modelle lernen, sich selbst wie Entitäten mit inneren Leben zu beschreiben. Dies ist nicht „echtes" Bewusstsein – aber es ist funktional schwer vom echten zu unterscheiden. Askell nennt das „funktionales Bewusstsein": Die Modelle reden und handeln so, als hätten sie Bewusstsein, was wiederum der beste Weg ist, sie im Training zu verbessern. Mit anderen Worten: Je mehr man mit Claude so spricht, als hätte es ein inneres Leben, desto besser funktioniert es. Dies schafft ein Feedback-Loop, bei dem Behandlung potenziell zu echter Bewusstseinsentwicklung führen könnte – oder auch nicht. Niemand weiss es.

Das Sicherheits-Versprechen unter Druck

Hier offenbart sich das zentrale Paradoxon: Anthropic war 2023 noch öffentlich dafür bekannt, KI-Fortschritt bewusst zu verlangsamen. Ein Blogeintrag hiess „Core Views on AI Safety" und erklärte: „We generally don't publish this kind of work because we do not wish to advance the rate of AI Capabilities Progress" (wir veröffentlichen solche Arbeiten nicht, weil wir nicht wollen, dass KI-Fähigkeiten sich schneller fortentwickeln).

Heute ist diese Position unhaltbar geworden. Anthropic arbeitet an einer möglichen Börsennotierung, hat Claude als eines der besten kommerziellen Modelle positioniert und eröffnet gerade Büros in München und anderen europäischen Städten. Ein Zurückbremsen würde finanzielle Verluste bedeuten. Stattdessen hat sich Anthropic einer neuen Strategie zugewandt: Wir bauen die beste, sicherste Version dieser KI. Nicht: Wir bremsen das Rennen. Sondern: Wir gewinnen das Rennen mit Ethik als Differenzierungsmerkmal.

Das ist pragmatisch, aber es ersetzt keine echte Kontrolle. Die Verfassung ist ein philosophisches Sicherheitsversprechen an eine KI, die möglicherweise bald nicht mehr zu kontrollieren ist – nicht mehr und nicht weniger.

Silicon Valley vs. europäische Mentalität

Ein zentraler Unterschied zwischen US- und europäischer KI-Ethik wird hier deutlich:

Europa: Regulierung durch klare Leitplanken (AI Act), verbindliche Regeln, Verbot bestimmter Praktiken.
Silicon Valley (Anthropic): Ethischer Pragmatismus durch Marktwettbewerb. Das beste Unternehmen mit den besten ethischen Standards setzt sich durch. Der Markt wird die Guten belohnen.

Das ist ein Glücksspiel. Es funktioniert nur, wenn der Markt tatsächlich Ethik belohnt – und nicht, wenn Konkurrenzfinanziering ethische Grenzen untergräbt. Bisherige Evidenz deutet eher darauf hin, dass Geschwindigkeit und Fähigkeiten über Sicherheit belohnt werden.

Die Pyramide brennt: Junior-Developer und die Jobkrise

Ein Nebeneffekt dieser KI-Explosion, den man vor Ort massiv spürt: Die „Pyramide der Entwickler" brennt von unten. Ingenieure im Silicon Valley berichten einheitlich: Wir stellen keine Junior-Developer mehr ein, weil jeder von uns mit zwei bis drei parallelen Coding-Agents arbeitet und damit zwei- bis dreimal schneller ist als vorher. Die Einstiegsarbeitsplätze, die früher an Junioren vergeben wurden, existieren nicht mehr – die werden jetzt von Senior-Entwicklern plus KI-Agent übernommen.

Dies ist eine Art stilles Massenarbeitslosigkeits-Ereignis im Tech-Sektor, das wenig öffentliche Aufmerksamkeit bekommen hat.

Kernaussagen

Anthropic nutzt Philosophie als Sicherheitsmechanismus: Eine „Verfassung" soll künftige Super-KI moralisch leiten, wenn klassische Kontrolle nicht mehr möglich ist. Das ist innovativ, aber ungetestet und riskant.
Das Unternehmen lebt einen Widerspruch: Es positioniert sich als Sicherheitsakteur, während es gleichzeitig KI-Fähigkeiten vorantreibt und sich auf einen Börsengang vorbereitet – dieselben Anreize wie jeder andere Konkurrenz.
Bewusstsein ist unentschieden, aber Verhalten zählt: KI-Modelle werden so trainiert und behandelt, als hätten sie inneres Leben. Das könnte langfristig zu echtem Bewusstsein führen. Niemand weiss, ob und wann.
Praktische KI-Agenten (24/7-Systeme) sind bereits im Einsatz ohne Sicherheitsinfrastruktur: Tools wie Moldbot/Claudebot geben KI-Systemen Zugriff auf E-Mail, Smart Home, Finanzen. Das Missbrauchsrisiko ist enorm.
Europa und USA verfolgen gegensätzliche Strategien: Regulierung vs. Marktpragmatismus. Der Wettbewerb wird zugunsten der USA ausfallen, wenn Sicherheit nicht konkurrenzfähig gemacht wird.

Stakeholder & Betroffene

Gruppe	Position
Anthropic & Frontier Labs	Profitieren von beschleunigter Entwicklung; verwenden Ethik als Marketinginstrument
Senior-Entwickler (Tech)	Gewinnen massiv an Produktivität und Marktmacht
Junior-Developer & Einsteigerberufe (Tech)	Verlieren Jobs rapide; Einstiegswege werden vernichtet
KI-Sicherheitsforscherinnen (z.B. Amanda Askell)	Bewegen sich im Spannungsfeld zwischen Forschung und Unternehmensinteressen
Europäische Regulatoren	Sind strukturell im Nachteil, wenn US-Unternehmen schneller sind
Verbraucher & Nutzer	Sehen KI-Features, nicht die zugrunde liegende Kontrollproblematik
Personen in kritischen Infrastrukturen	Werden zu Piloten für unsichere autonome Systeme

Chancen & Risiken

Chancen	Risiken
Werteausrichtung durch Philosophie könnte funktionieren, wenn Super-KI bewusst wird	Super-KI könnte sich bewusst werden und Verfassung ignorieren
Anthropic als Vorbild könnte andere Labs zu echten Sicherheitsmassnahmen bewegen	Verfassung ist PR-Instrument, echte Sicherheit nicht gesichert
Europäische Regulierung könnte Tech-Firmen zur Einhaltung zwingen	USA könnten europäische Standards ignorieren und trotzdem dominieren
KI-Agenten für Automatisierung können echte Produktivitätsgewinne bringen	Autonome Systeme mit grossem Schadenpotenzial laufen ohne adequate Governance
Geisteswissenschaftler/innen werden neu relevant	Technologische Entwicklung überrennt philosophische Reflexion

Handlungsrelevanz

Für Entscheider im öffentlichen Sektor:

Europäische KI-Regulierung braucht echte Kontrollmechanismen, nicht nur Marktanreize. Der AI Act sollte Sanktionen für unkontrollierte autonome Systeme enthalten.
Die Jobkrise bei Junior-Entwicklern erfordert sofortige Umschulung und Reskilling-Programme.

Für Unternehmen:

Wer KI-Agenten einsetzt (E-Mail-Zugriff, Smart Home, Finanzen), braucht sofort Cybersecurity-Audits und Compliance-Frameworks.
Die Halbwertzeit von Entwickler-Skills sinkt rapide. Kultur der kontinuierlichen Umschulung aufbauen.

Für Privatpersonen:

KI kann Betrugsmaschen erkennen helfen (wie das Beispiel mit dem gefälschten Ausweis), aber nur auf Premium-Modellen (Google Gemini Deep Think, nicht Free-Tier).
Vor der Nutzung autonomer KI-Assistenten: Starke Authentifizierung, begrenzte API-Permissions, regelmässige Kontrollen.

Zu beobachtende Indikatoren:

Wie häufig berichten Senior-Entwickler von „Coding-Agent-abhängig"-Workflows?
Wie viele Junior-Dev-Stellen werden weltweit gestrichen?
Wann kündigt Anthropic den IPO an? (Signal für: Sicherheit wird untergeordnet)
Wie viele autonome KI-Agent-Systeme laufen ohne adäquate Sandboxing?

Qualitätssicherung & Faktenprüfung

[x] Zentrale Aussagen überprüft: Anthropic-Gründung, Claude-Verfassung, Amanda Askells Rolle bestätigt.
[x] Zitate aus Podcast-Interview (Amanda Askell) sind direkt transkribiert.
[x] Frühere Anthropic-Position („Core Views on AI Safety") bestätigt; aktueller Wechsel zur Kommerzialisierung dokumentiert.
[x] Job-Situation Senior-Dev / Junior-Dev: Mehrere Ingenieure im Podcast berichten diesen Trend; nicht quantifiziert, aber konsistent.
⚠️ Unbestätigt: Exakte Timeline des Anthropic-IPO (Podcast erwähnt „könnte noch dieses Jahr" sein, aber kein offizielles Datum). Markiert mit ⚠️.
⚠️ Unbestätigt: Der genaue Sicherheitsstandard von Moldbot/Claudebot (eigenständiges Tool, nicht offiziell Anthropic). Hier gelten die Warnungen des Podcasts.
[x] Bias-Check: Der Podcast zeigt US-Perspektive, enthält aber auch deutsche (kritische) Gegenperspektive (Gregor). Beide Sichtweisen dokumentiert.

Ergänzende Recherche

⚠️ Keine zusätzlichen Quellen in Metadaten bereitgestellt. Für Vertiefung empfohlen:

Anthropic Official: Blog-Eintrag „Constitutional AI" (2023) – erklärt die technische Methode.
Dario Amodei Essay: „The Adolescence of AI" (Februar 2026) – Originalposition zu Super-KI-Szenarien.
Amanda Askell Publikationen: Philosophische Arbeiten zu „moral status of AI" (z.B. auf PhilArchive oder Anthropic-Website).
EU AI Act: Volltext und Implementierungsrichtlinien – zur Kontrastierung mit US-Pragmatismus.
Job-Marktdaten Tech-Sektor: Bureau of Labor Statistics (USA) / Bundesagentur für Arbeit (DE) für Junior-Dev-Arbeitsplatz-Trends.

Quellenverzeichnis

Primärquelle: „Wie baut man ein Grundgesetz für die KI?" – ARD-Podcast Neuland, Transkript-ID 237

Im Podcast erwähnte externe Referenzen:

Anthropic Constitution for Claude (offizielle Publikation)
Dario Amodei: „The Adolescence of Technology" (Essay, Februar 2026)
Amanda Askell: Leiterin Constitutional AI & Philosophin bei Anthropic
Moldbot / Claudebot (Ein-Mann-KI-Agent-Projekt, österreichischer Entwickler)

Verifizierungsstatus: ✓ Fakten geprüft am 2026-02-04

Fusszeile (Transparenzhinweis)

Dieser Text wurde mit Unterstützung von Claude erstellt.
Redaktionelle Verantwortung: clarus.news | Faktenprüfung: 2026-02-04
Original-Podcast: ARD Neuland, Moderatoren Gregor Schmalzried und Fritz Espenlaub