Internet Archive fonde une succursale suisse : l'archivage à l'ère de l'IA

Auteur : heise.de Source : heise.de

Résumé exécutif

L'Internet Archive fonde une succursale suisse à Saint-Gall. La nouvelle fondation suisse agit de manière juridiquement indépendante, mais fait partie d'un réseau mondial d'institutions d'archives. L'accent est mis sur la sécurisation des archives menacées dans le monde entier et l'archivage systématique pour la première fois de modèles d'IA. Parallèlement, de plus en plus d'éditeurs bloquent les robots d'exploration de la Wayback Machine pour protéger leurs contenus contre une utilisation injustifiée comme matériel d'entraînement de l'IA.

Personnalités

Brewster Kahle (fondateur d'Internet Archive)
Roman Griesfelder (directeur général de la branche suisse)
Damian Borth (professeur, Gen AI Archive)

Thèmes

Archivage numérique
Intelligence artificielle
Droit d'auteur et entraînement de l'IA
Mémoire culturelle
Liberté d'information

Synthèse Clarus

La création d'Internet Archive Switzerland marque un tournant stratégique : alors que la vision de Brewster Kahle d'un accès universel aux connaissances prend forme depuis 1996, la révolution actuelle de l'IA menace cette mission. Les éditeurs bloquent les archives de manière préventive pour ne pas servir de source d'entraînement incontrôlée pour les systèmes d'IA commerciaux – un conflit d'intérêts qui met en danger la mémoire publique elle-même. La présence suisse doit servir d'ancre juridiquement indépendante qui atténue structurellement cette tension.

Résumé détaillé

Le choix de Saint-Gall est justifié stratégiquement : la ville abrite une abbaye protégée par l'UNESCO avec plus d'un millénaire de tradition d'archivage – un signal symbolique et infrastructurel. Internet Archive mondial exploite déjà des succursales au Canada et en Europe ; la création suisse sous la direction de Roman Griesfelder étend ce modèle décentralisé à un statut juridique indépendant.

Un projet d'innovation central est la Gen AI Archive, dirigée par Damian Borth (Université de Saint-Gall), qui conserve systématiquement pour la première fois les modèles d'IA eux-mêmes en tant que biens culturels. Cela répond à un problème technique immédiat : les pages web sont déjà considérées comme un support éphémère ; les systèmes d'IA changent cependant si rapidement que les méthodes d'archivage classiques échouent. L'archive ne veut pas seulement documenter les résultats de l'IA, mais préserver les modèles eux-mêmes – pour montrer aux historiens futurs comment les algorithmes actuels façonnent la société.

Cependant, la résistance augmente en parallèle. De grands éditeurs comme le New York Times bloquent les robots d'exploration de la Wayback Machine, craignant que leurs contenus ne soient utilisés à titre de matériel d'entraînement de l'IA sans autorisation pour des systèmes comme OpenAI. Le directeur Mark Graham identifie un effet de dommage collatéral : l'archive devient victime d'un conflit de droit d'auteur qui devrait vraiment être résolu au niveau de la licence. Ironiquement, il s'avère que même les grands médias ne peuvent pas entretenir complètement leur propre histoire numérique – les articles manquants ne se trouvent souvent que dans la Wayback Machine. L'avocate spécialisée en médias Kendra Albert avertit : les archives bloquées globalement pourraient effacer la mémoire culturelle du présent lui-même.

Messages clés

Internet Archive s'établit avec une fondation suisse juridiquement indépendante à Saint-Gall en tant qu'ancre décentralisée pour la sécurisation des connaissances mondiales
Les modèles d'IA sont pour la première fois traités comme des objets culturels dignes d'archivage – une course contre la vitesse technologique
Les conflits de droit d'auteur entre les éditeurs et les formateurs d'IA menacent involontairement la mémoire numérique publique elle-même

Questions critiques

Preuve : Quelles métadonnées et quels systèmes de contrôle de version sont nécessaires pour conserver les modèles d'IA de manière significative, lorsque les données d'entraînement elles-mêmes sont en partie propriétaires ?
Validité des sources : Comment les archives peuvent-elles documenter complètement les modèles d'IA si des entreprises comme OpenAI ne divulguent pas les poids des modèles et les processus d'entraînement ?
Conflits d'intérêts : Dans quelle mesure la fondation suisse sera-t-elle sous pression pour faire la médiation entre les éditeurs (qui demandent des blocages) et les entreprises d'IA (qui recherchent des données d'entraînement), tout en conservant sa neutralité ?
Causalité/Alternatives : Un système de désinscription granulaire (au lieu d'un blocage global) pourrait-il résoudre à la fois le problème d'archivage et la protection des droits d'auteur ?
Faisabilité : Quel est le degré de durabilité du financement d'une fondation internationale ayant le statut juridique suisse, si les fonds publics sont limités ?
Effets secondaires : Si les éditeurs protègent leurs archives par des blocages, elles disparaissent quand même – juste pas pour les archivistes, mais pour les systèmes d'IA. Cela résout-il le problème fondamental ?

Répertoire des sources

Source primaire : Heise News – « Mémoire de l'humanité : Internet Archive s'enracine en Suisse » – https://www.heise.de/news/Gedaechtnis-der-Menschheit-Das-Internet-Archive-schlaegt-Wurzeln-in-der-Schweiz-11288151.html

Statut de vérification : ✓ 2024

Ce texte a été créé avec l'aide d'un modèle d'IA. Responsabilité éditoriale : clarus.news | Vérification des faits : 2024