Kurzfassung
KI-Unternehmen kaufen palettenweise vergriffene Bücher aus europäischen Antiquariaten auf und vernichten sie nach dem Scannen. Seit Mai 2026 melden Buchhändler systematische, automatisierte Grosskäufe durch das kanadische Unternehmen Zoom Books, das gezielt Non-Fiction-Titel ab 1970 erworben hat – Lagerbestände, die niemand mehr haben wollte. Der Verdacht: Die Bücher dienen als Rohdaten für Sprachmodelle und werden nach dem Einlesen entsorgt. Zoom Books bestreitet die Vorwürfe und verweist auf ein reguläres Recycling- und Handelsmodell. Experten schätzen das Volumen auf etwa 700.000 Titel in Deutschland, drei Millionen weltweit.
Personen
- Sven Ahnert (Autor, SRF)
Themen
- Künstliche Intelligenz und Urheberrecht
- Antiquariatshandel und Buchkultur
- Fair-Use-Prinzip
- Datenbeschaffung für KI-Modelle
- Kulturelles Erbe und Digitalisierung
Clarus Lead
Das Phänomen offenbart eine Spannung zwischen dem Datenhunger von KI-Unternehmen und dem Schutz des analogen Kulturerbes. Während Buchhändler kurzfristig ihre unverkäuflichen Lagerbestände loswerden, droht langfristig eine Monopolisierung: Vergriffene Bücher, die bislang als zirkulierende Bibliothek funktionierten, konzentrieren sich als exklusive Datenmasse in den Händen weniger Tech-Konzerne – systematisch, still und bisher ohne öffentliche Debatte. Dies berührt zentrale Fragen zum Fair-Use-Prinzip im Urheberrecht und zur Kontrolle über historisches Wissen.
Detaillierte Zusammenfassung
Das Muster der Käufe zeigt erhebliche Systematik. Ein deutscher Online-Antiquar beobachtete ab Anfang Mai 2026 nächtliche Massenbestellungen zwischen drei und fünf Uhr morgens – automatisiert, gezielt auf Non-Fiction-Titel ab 1970 mit ISBN-Nummern ausgerichtet. Die gekaufte Ware war bewusst unattraktiv: angestaubte Lagerbestände, von denen pro Titel exakt nur ein Exemplar erworben wurde. Auf Lagerfotos erscheinen die Bücher lieblos in grosse Kisten geworfen – ein Handling, das kein regulärer Buchhändler praktiziert. Ein Zwischenlager wurde an der tschechisch-deutschen Grenze errichtet.
Die juristische Strategie deutet auf das sogenannte Fair-Use-Prinzip des US-amerikanischen Urheberrechts hin. Im Gegensatz zum Kopieren digitaler Texte im Netz – das Schadensersatzklagen riskiert – könnte physischer Buchkauf gefolgt von Vernichtung eine Grauzone darstellen. Die vermutete Logik: Durch physischen Besitz und Löschung nach dem Scannen bleibt keine widerrechtliche Kopie in Umlauf; dies soll als Fair Use gelten. Das Unternehmen Anthropic hatte diesen Ansatz früher dokumentiert: Millionen Bücher erworben, gescannt und in Sprachmodelle integriert.
Gedruckte Bücher sind für KI-Training zunehmend wertvoll. Frei zugängliche Online-Texte sind für moderne Sprachmodelle weitgehend ausgeschöpft. KI-Unternehmen suchen gezielt nach älteren Fachbüchern aus Regionalgeschichte, Sprach-, Rechts- und Wirtschaftswissenschaften – Texte mit historischen Sprachstufen und stilistischen Nuancen, die im zeitgenössischen Internet fehlen. Dadurch entsteht eine strukturelle Abhängigkeit: Das analoge Erbe wird von zirkulierenden Sammlungen zu exklusiven proprietären Datenquellen umgewidmet.
Kernaussagen
- KI-Unternehmen kaufen systematisch vergriffene Bücher aus Antiquariaten auf, scannen diese und vernichten sie anschliessend als vermeintliche Fair-Use-Strategie.
- Das geschätzte Volumen beträgt 700.000 Titel in Deutschland, drei Millionen weltweit – eine Konzentration von kulturellem Erbe in privaten Datenbeständen.
- Das klassische Antiquariat als zirkulierende Bibliothek wird durch Massenvernichtung verdrängt; öffentlicher Zugang zu historischen Texten schrumpft zugunsten proprietärer KI-Modelle.
Kritische Fragen
Evidenz/Quellenvalidität: Welche direkten Beweise dokumentieren, dass Zoom Books die gekauften Bücher tatsächlich nach dem Scannen vernichtet – und nicht weitertradiert? Reichen Lagerfotos und Aussagen von Buchhändlern für diese Schlussfolgerung aus?
Interessenskonflikte: Haben Buchhändler, die ihre Lagerbestände loswerden, Anreize, die Praktiken von KI-Unternehmen negativ darzustellen? Profitieren manche Antiquare kurzfristig von diesen Massenverkäufen?
Kausalität/Alternativen: Kann die Datenlücke für KI-Training nicht durch Lizenzbeschaffung, digitale Partnerschaften mit Archiven oder andere legale Modelle geschlossen werden – statt durch Buchvernichtung?
Umsetzbarkeit/Risiken: Welche regulatorischen Änderungen wären nötig, um Fair Use im digitalen Kontext transparent und nachvollziehbar zu gestalten – ohne Innovation zu blockieren?
Marktmacht: Führt die Konzentration von kulturellem Erbe in wenigen KI-Unternehmen zu einer strukturellen Verzerrung des Zugangs zu historischem Wissen?
Transparenz: Welche öffentlichen Daten existieren über Kaufmuster, Volumen und Verbleib von Büchern durch Zoom Books und ähnliche Akteure?
Quellenverzeichnis
Primärquelle: Jagd auf alte Bücher – KI-Firmen kaufen Antiquariate leer und vernichten die Bücher. SRF Kultur-Aktualität, 17.06.2026, 17:20 Uhr. https://www.srf.ch/kultur/gesellschaft-religion/jagd-auf-alte-buecher-ki-firmen-kaufen-antiquariate-leer-und-vernichten-die-buecher
Ergänzende Kontextquellen:
- Washington Post: Anthropic's book acquisition and scanning practices (erwähnt im Artikel)
- SRF Echo der Zeit: Wettbewerb um «echte» Daten für KI, 19.07.2023
- SRF Rendez-vous: Daten für KI werden knapp, 29.05.2024
Verifizierungsstatus: ✓ 22.06.2026
Weitere Sprachen: Französisch | Englisch
Dieser Text wurde mit Unterstützung eines KI-Modells erstellt. Redaktionelle Verantwortung: clarus.news | Faktenprüfung: 22.06.2026