Les entreprises spécialisées dans l’IA vident les librairies d’occasion… et détruisent les livres
Des palettes entières d’ouvrages documentaires et de romans provenant de librairies d’occasion européennes sont expédiées vers les États-Unis. Derrière cette opération se cachent vraisemblablement des entreprises spécialisées dans l’IA: celles-ci utilisent les livres imprimés comme données brutes pour leurs modèles linguistiques… puis les jettent à la poubelle une fois numérisés. Un patrimoine culturel important disparaît ainsi.
Début mai, une librairie d’occasion en ligne allemande a reçu chaque nuit, entre trois et cinq heures, des commandes massives, automatisées, systématiques. Le libraire s’en est ouvert à ses collègues. Sur les forums en ligne destinés aux libraires d’occasion, les témoignages se multiplient également.
Plus
Quoi de neuf pour l’intelligence artificielle en Suisse en 2026?
Les commandes provenaient d’une entreprise canadienne nommée Zoom Books. Elle a acheté par palettes entières des ouvrages épuisés: livres de cuisine, biographies, romans. Pas des raretés, bien au contraire, rapporte le libraire: «Les commandes visaient spécifiquement des ouvrages de non-fiction publiés à partir de 1970 et dotés d’un numéro ISBN – des invendus poussiéreux dont personne ne voulait depuis des années. Toute revente de leur part est totalement exclue. Ces livres n’ont aucune valeur et ils n’ont acheté qu’un seul exemplaire par titre.»
Démenti
Zoom Books dément catégoriquement ces accusations et invoque un modèle régulier de recyclage et de commerce. Mais la systématique de ces achats a suscité de sérieux doutes parmi les libraires. Sur les photos de l’entrepôt, on voit les livres jetés sans ménagement dans de grandes caisses – aucun libraire ne traite sa marchandise ainsi.
Un entrepôt de transit a été mis en place à la frontière tchéco-allemande pour le marché européen. Le revendeur estime le volume présumé à 700’000 titres rien qu’en Allemagne, et à trois millions dans le monde entier.
Plus
La Suisse peut-elle se passer des géants de la tech? Nous avons tenté l’expérience
La faille juridique
Ce phénomène pourrait s’expliquer par un dispositif controversé issu du droit d’auteur américain. Quiconque copie des textes numériques sur Internet s’expose à des poursuites en dommages-intérêts. En revanche, lorsque des entreprises spécialisées dans l’IA achètent les livres sous forme physique et les détruisent après les avoir numérisés, cela est considéré dans le secteur comme une tentative de se prévaloir du principe dit de «fair use» (usage loyal).
Le Washington PostLien externe a révélé comment cela pouvait se traduire dans la pratique à travers un ancien projet de numérisation mené par l’entreprise d’IA Anthropic. Anthropic avait acquis des millions de livres, numérisé les pages et intégré le contenu dans ses modèles linguistiques.
«L’hypothèse est la suivante: il faut posséder physiquement les livres et les détruire après les avoir ‘lus’ – afin de faire valoir qu’aucune copie illicite ne reste en circulation et que cela relève de l’usage loyal», explique le libraire à propos de la logique présumée qui sous-tend cette démarche.
Plus
Pour la Suisse, viser la souveraineté en IA tient du parcours du combattant
Les livres convoités
Pourquoi les livres imprimés sont-ils si recherchés? Les textes jusqu’ici librement accessibles sur Internet ont été largement exploités pour l’entraînement des modèles linguistiques modernes. Les entreprises spécialisées dans l’IA recherchent donc de manière ciblée d’anciens ouvrages spécialisés en histoire régionale, en linguistique, en droit et en sciences économiques – des textes présentant des registres linguistiques historiques et des subtilités stylistiques qui font encore défaut sur Internet aujourd’hui.
À court terme, les libraires se réjouissent de pouvoir se débarrasser de leurs stocks invendus. À long terme, cependant, une autre perspective se profile: la librairie d’occasion classique fonctionne comme une bibliothèque circulante, dans laquelle les anciens titres reviennent sans cesse sur le marché. Si les livres épuisés sont désormais détruits à grande échelle pour être transformés en papier recyclé, le patrimoine analogique se concentre irrémédiablement sous la forme d’une masse de données exclusive entre les mains d’une poignée d’entreprises – discrètement, systématiquement et, jusqu’à présent, sans débat public.
Traduit de l’allemand et vérifié par Emilie Ridard/db
En conformité avec les normes du JTI
Plus: SWI swissinfo.ch certifiée par la Journalism Trust Initiative
Vous pouvez trouver un aperçu des conversations en cours avec nos journalistes ici. Rejoignez-nous !
Si vous souhaitez entamer une conversation sur un sujet abordé dans cet article ou si vous voulez signaler des erreurs factuelles, envoyez-nous un courriel à french@swissinfo.ch.