Auteur : Sven Ahnert Source : srf.ch Date de publication : 22.06.2026

Résumé

Les entreprises d'IA achètent par palettes des livres épuisés provenant de bouquineries européennes et les détruisent après les avoir numérisés. Depuis mai 2026, des libraires signalent des achats de masse systématiques et automatisés par l'entreprise canadienne Zoom Books, qui a acquis des titres de non-fiction datant de 1970 ou plus tard – des stocks d'entrepôt dont personne ne voulait plus. Le soupçon : les livres servent de données brutes pour les modèles de langage et sont éliminés après leur lecture. Zoom Books conteste les accusations et invoque un modèle de recyclage et de commerce régulier. Les experts estiment le volume à environ 700 000 titres en Allemagne, trois millions dans le monde.

Personnes

  • Sven Ahnert (auteur, SRF)

Thèmes

  • Intelligence artificielle et droit d'auteur
  • Commerce des livres anciens et culture du livre
  • Principe du fair-use
  • Collecte de données pour modèles d'IA
  • Patrimoine culturel et numérisation

Lead Clarus

Le phénomène révèle une tension entre la soif de données des entreprises d'IA et la protection du patrimoine culturel analogique. Tandis que les libraires se débarrassent à court terme de leurs stocks invendables, une monopolisation menace à long terme : les livres épuisés, qui fonctionnaient auparavant comme une bibliothèque circulante, se concentrent en tant que masse de données exclusive entre les mains de quelques géants technologiques – systématiquement, silencieusement et jusqu'à présent sans débat public. Cela soulève des questions centrales sur le principe du fair-use dans le droit d'auteur et le contrôle du savoir historique.

Résumé détaillé

Le schéma des achats révèle une systématique considérable. Un bouquiniste en ligne allemand a observé à partir du début mai 2026 des commandes de masse nocturnes entre trois et cinq heures du matin – automatisées, ciblées sur des titres de non-fiction datant de 1970 ou plus tard avec numéros ISBN. Les marchandises achetées étaient délibérément peu attrayantes : des stocks poussiéreux d'entrepôt, dont un seul exemplaire par titre était acquis. Sur les photos d'entrepôt, les livres apparaissent sans soin jetés dans de grands cartons – un traitement que nul libraire régulier ne pratiquerait. Un entrepôt intermédiaire a été installé à la frontière germano-tchèque.

La stratégie juridique laisse supposer le soi-disant principe du fair-use du droit d'auteur américain. Contrairement à la copie de textes numériques sur le net – qui risque des recours en dommages-intérêts – l'achat physique de livres suivi de leur destruction pourrait constituer une zone grise. La logique supposée : par la possession physique et la suppression après la numérisation, aucune copie contrefaisante ne reste en circulation ; cela devrait compter comme du fair-use. L'entreprise Anthropic avait documenté cette approche auparavant : achat de millions de livres, numérisation et intégration dans des modèles de langage.

Les livres imprimés deviennent de plus en plus précieux pour l'entraînement de l'IA. Les textes en ligne librement accessibles sont largement épuisés pour les modèles de langage modernes. Les entreprises d'IA recherchent spécifiquement les anciens ouvrages techniques d'histoire régionale, de linguistique, de droit et d'économie – des textes avec des stades historiques de la langue et des nuances stylistiques absentes de l'internet contemporain. Cela crée une dépendance structurelle : le patrimoine analogique est transformé de collections circulantes en sources de données propriétaires exclusives.

Affirmations principales

  • Les entreprises d'IA achètent systématiquement des livres épuisés provenant de bouquineries, les numérisent et les détruisent ensuite en tant que stratégie supposée de fair-use.
  • Le volume estimé est de 700 000 titres en Allemagne, trois millions dans le monde – une concentration du patrimoine culturel dans des bases de données privées.
  • La bouquinerie classique en tant que bibliothèque circulante est supplantée par la destruction de masse ; l'accès public aux textes historiques se réduit en faveur de modèles d'IA propriétaires.

Questions critiques

  1. Preuve/validité des sources : Quelles preuves directes documentent que Zoom Books détruit réellement les livres achetés après la numérisation – et ne les revend pas ? Les photos d'entrepôt et les déclarations des libraires sont-elles suffisantes pour cette conclusion ?

  2. Conflits d'intérêts : Les libraires qui se débarrassent de leurs stocks ont-ils intérêt à présenter négativement les pratiques des entreprises d'IA ? Certains antiquaires profitent-ils à court terme de ces ventes de masse ?

  3. Causalité/alternatives : La lacune de données pour l'entraînement de l'IA ne pourrait-elle pas être comblée par l'acquisition de licences, les partenariats numériques avec les archives ou d'autres modèles légaux – plutôt que par la destruction de livres ?

  4. Faisabilité/risques : Quels changements réglementaires seraient nécessaires pour rendre le fair-use transparent et traçable dans un contexte numérique – sans bloquer l'innovation ?

  5. Pouvoir de marché : La concentration du patrimoine culturel entre quelques entreprises d'IA entraîne-t-elle une distorsion structurelle de l'accès au savoir historique ?

  6. Transparence : Quelles données publiques existent sur les modèles d'achat, les volumes et le sort des livres par Zoom Books et des acteurs similaires ?


Bibliographie

Source primaire : Chasse aux vieux livres – Les entreprises d'IA vident les bouquineries et détruisent les livres. SRF Actualité Culture, 17.06.2026, 17:20. https://www.srf.ch/kultur/gesellschaft-religion/jagd-auf-alte-buecher-ki-firmen-kaufen-antiquariate-leer-und-vernichten-die-buecher

Sources contextuelles complémentaires :

  • Washington Post : Anthropic's book acquisition and scanning practices (mentionné dans l'article)
  • SRF Echo der Zeit : Concurrence pour les « vraies » données pour l'IA, 19.07.2023
  • SRF Rendez-vous : Les données pour l'IA deviennent rares, 29.05.2024

Statut de vérification : ✓ 22.06.2026


Ce texte a été créé avec le soutien d'un modèle d'IA. Responsabilité éditoriale : clarus.news | Vérification des faits : 22.06.2026