La Wayback Machine : pourquoi les grands médias bloquent-ils son accès et accusent-ils l’IA ?

La Wayback Machine, outil emblématique de l’Internet Archive, permet de consulter des versions anciennes de sites web. Pourtant, plusieurs grands médias ont récemment décidé de bloquer son accès. Ils accusent l’intelligence artificielle de copier leurs contenus via cette plateforme.

© La Wayback Machine, outil de l’Internet Archive, est bloquée par plusieurs grands médias qui accusent l’intelligence artificielle de copier leurs contenus via cette plateforme.

Consulter Masquer le sommaire

En clair, un nouveau front s’ouvre dans la guerre entre les médias traditionnels et les entreprises d’IA.

Qu’est-ce que la Wayback Machine ?

La Wayback Machine est un service gratuit proposé par l’Internet Archive, une organisation à but non lucratif basée aux États-Unis. Son rôle est simple mais puissant : elle archive des milliards de pages web depuis 1996.

Un voyage dans le temps sur internet

Grâce à cet outil, n’importe qui peut voir à quoi ressemblait un site web il y a 5, 10 ou 20 ans. C’est extrêmement utile pour les chercheurs, les journalistes, les étudiants et les curieux qui veulent comprendre l’évolution d’internet.

Cependant, cette même fonctionnalité pose aujourd’hui problème aux grands médias.

Des milliards de pages archivées

L’Internet Archive conserve plus de 800 milliards de pages web. Chaque jour, des millions de nouvelles captures sont ajoutées. Ce trésor numérique est devenu l’une des plus grandes bibliothèques du monde.

Pourquoi les médias bloquent-ils l’accès ?

Depuis plusieurs mois, des médias comme le New York Times, le Washington Post ou encore des groupes européens ont commencé à bloquer techniquement la Wayback Machine.

A lire aussi :  “Loi Yadan” : pourquoi ce texte sur l’antisémitisme provoque déjà un scandale politique

L’argument principal : l’IA copie leurs contenus

Les médias accusent les entreprises d’intelligence artificielle d’utiliser la Wayback Machine pour contourner leurs paywalls et récupérer leurs articles sans payer.

Selon eux, les modèles d’IA comme ChatGPT, Claude ou Gemini s’entraînent en partie sur des données archivées par la Wayback Machine. Cela leur permettrait d’accéder à du contenu payant ou protégé sans autorisation.

La protection des droits d’auteur

Les médias estiment que la Wayback Machine facilite le piratage de leurs contenus. Ils considèrent que les entreprises d’IA profitent de cet outil pour s’approprier leur travail journalistique sans compensation.

Cependant, l’Internet Archive répond que la Wayback Machine n’est qu’un outil d’archivage et qu’elle ne peut pas contrôler l’usage qui en est fait par les IA.

Un débat qui divise le web

Cette affaire révèle les tensions actuelles entre les médias traditionnels, les archives numériques et les entreprises d’IA.

D’un côté, les médias veulent protéger leur modèle économique et leurs droits d’auteur. De l’autre, l’Internet Archive défend le principe d’une mémoire collective d’internet accessible à tous.

Par ailleurs, de nombreux experts estiment que ce blocage est une mauvaise nouvelle pour la préservation du web. Ils rappellent que la Wayback Machine est souvent le seul moyen de retrouver des articles supprimés ou modifiés.

A lire aussi :  Claude Mythos : pourquoi Anthropic ne le sort pas au grand public

Ce que ça change pour les utilisateurs

Pour les internautes ordinaires, ce blocage rend plus difficile l’accès à l’histoire du web. Il devient plus compliqué de consulter d’anciennes versions de sites d’information.

Cependant, l’Internet Archive continue de fonctionner et propose d’autres outils. Certains médias ont d’ailleurs fait marche arrière face à la polémique.

À terme, cette affaire pourrait pousser à une réglementation plus claire sur l’utilisation des données archivées par les entreprises d’IA.

Accueil » La Wayback Machine : pourquoi les grands médias bloquent-ils son accès et accusent-ils l’IA ?