Consulter Masquer le sommaire
En clair, un nouveau front s’ouvre dans la guerre entre les médias traditionnels et les entreprises d’IA.
Qu’est-ce que la Wayback Machine ?
La Wayback Machine est un service gratuit proposé par l’Internet Archive, une organisation à but non lucratif basée aux États-Unis. Son rôle est simple mais puissant : elle archive des milliards de pages web depuis 1996.
Un voyage dans le temps sur internet
Grâce à cet outil, n’importe qui peut voir à quoi ressemblait un site web il y a 5, 10 ou 20 ans. C’est extrêmement utile pour les chercheurs, les journalistes, les étudiants et les curieux qui veulent comprendre l’évolution d’internet.
Cependant, cette même fonctionnalité pose aujourd’hui problème aux grands médias.
Des milliards de pages archivées
L’Internet Archive conserve plus de 800 milliards de pages web. Chaque jour, des millions de nouvelles captures sont ajoutées. Ce trésor numérique est devenu l’une des plus grandes bibliothèques du monde.
Pourquoi les médias bloquent-ils l’accès ?
Depuis plusieurs mois, des médias comme le New York Times, le Washington Post ou encore des groupes européens ont commencé à bloquer techniquement la Wayback Machine.
L’argument principal : l’IA copie leurs contenus
Les médias accusent les entreprises d’intelligence artificielle d’utiliser la Wayback Machine pour contourner leurs paywalls et récupérer leurs articles sans payer.
Selon eux, les modèles d’IA comme ChatGPT, Claude ou Gemini s’entraînent en partie sur des données archivées par la Wayback Machine. Cela leur permettrait d’accéder à du contenu payant ou protégé sans autorisation.
La protection des droits d’auteur
Les médias estiment que la Wayback Machine facilite le piratage de leurs contenus. Ils considèrent que les entreprises d’IA profitent de cet outil pour s’approprier leur travail journalistique sans compensation.
Cependant, l’Internet Archive répond que la Wayback Machine n’est qu’un outil d’archivage et qu’elle ne peut pas contrôler l’usage qui en est fait par les IA.
Un débat qui divise le web
Cette affaire révèle les tensions actuelles entre les médias traditionnels, les archives numériques et les entreprises d’IA.
D’un côté, les médias veulent protéger leur modèle économique et leurs droits d’auteur. De l’autre, l’Internet Archive défend le principe d’une mémoire collective d’internet accessible à tous.
Par ailleurs, de nombreux experts estiment que ce blocage est une mauvaise nouvelle pour la préservation du web. Ils rappellent que la Wayback Machine est souvent le seul moyen de retrouver des articles supprimés ou modifiés.
Ce que ça change pour les utilisateurs
Pour les internautes ordinaires, ce blocage rend plus difficile l’accès à l’histoire du web. Il devient plus compliqué de consulter d’anciennes versions de sites d’information.
Cependant, l’Internet Archive continue de fonctionner et propose d’autres outils. Certains médias ont d’ailleurs fait marche arrière face à la polémique.
À terme, cette affaire pourrait pousser à une réglementation plus claire sur l’utilisation des données archivées par les entreprises d’IA.