FLASH INFO — Anthropic décroche un accord record à 1,5 milliard $: la bataille des droits d’auteur entre dans l’ère de l’IA
Publié le 4 juin 2024 – Mise à jour à 09 h 27
Le duel longtemps feutré entre grandes plateformes d’intelligence artificielle et créateurs vient de basculer. En acceptant, hier soir, de verser 1,5 milliard de dollars pour solder une action collective d’auteurs américains, Anthropic, maison-mère de Claude.ai, signe le plus grand chèque jamais vu pour une violation de droits d’auteur. Un tournant comparable, par son impact, à l’arrêt Sony Betamax de 1984 qui avait légalisé l’enregistrement domestique de vidéos.
Pourquoi cet accord change-t-il la donne pour l’IA générative ?
L’accord de San Francisco, scellé devant le juge fédéral William Alsup le 3 juin 2024, dépasse de loin la simple indemnisation.
- Montant historique : 1,5 milliard $, soit le PIB annuel du Belize.
- Destruction imposée : plus de 7 millions de livres piratés, stockés dans la « bibliothèque centrale » d’Anthropic, devront être supprimés sous contrôle judiciaire.
- Clause évolutive : tout titre supplémentaire découvert ultérieurement ouvrira droit à des réclamations additionnelles.
En pratique, Claude, le rival direct de ChatGPT, devra être ré-entraîné sans ces corpus illicites. Un cauchemar technique estimé, par des analystes de PitchBook, à « plusieurs centaines de millions de dollars » de recalibrage informatique.
Qu’est-ce que l’« usage loyal » et pourquoi ne protège-t-il pas Anthropic ?
Aux États-Unis, le « fair use » autorise certaines exploitations d’œuvres protégées (critique, parodie, enseignement). Le juge Alsup a reconnu que l’entraînement brut d’un modèle peut s’inscrire dans ce cadre. Mais il a ajouté une limite : stocker et redistribuer intégralement des textes piratés n’entre pas dans l’exception. C’est précisément ce que reprochaient les auteurs Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, figures de la non-fiction américaine.
En chiffres : la jurisprudence s’écrit à coups de milliards
| Année | Entreprise | Litige IA & copyright | Montant (USD) |
|---|---|---|---|
| 2023 | OpenAI | Sarah Silverman & Cie | En cours |
| 2024 | Anthropic | Bartz, Graeber, Johnson | 1,5 Md |
| 2024 | Meta | Authors Guild | En cours |
En 2023, les investissements mondiaux dans les modèles génératifs ont déjà atteint 27 milliards de dollars (McKinsey). Chaque procès menace désormais ces capitaux. Un rappel sec pour toute start-up IA encore tentée d’« aspirer le Web » sans vérification.
Comment Anthropic compte-t-elle rebondir ?
Les pistes internes
- Développer des partenariats éditoriaux rémunérés (modèle BloombergGPT).
- Basculer vers des bases de données publiques validées par Project Gutenberg ou l’Open Library.
- Mettre en place des filtres de détection automatique de textes protégés, fondés sur l’empreinte numérique (hash).
Les enjeux stratégiques
D’un côté, les investisseurs – dont Google et Salesforce Ventures – exigent un produit compétitif. De l’autre, les détenteurs de droits réclament une rémunération juste. L’entreprise se trouve donc sur la corde raide : maintenir la vitesse d’innovation tout en refondant son pipeline de données.
Le débat éthique : créer ou copier ?
D’un côté, les défenseurs de l’IA soutiennent que l’entraînement sur de vastes corpus constitue « l’équivalent numérique de la lecture ». Sans cette matière première, pas de modèles capables de résumer Balzac ou de générer du code Rust.
Mais de l’autre, les auteurs rétorquent qu’un système commercial qui monétise indirectement leurs œuvres doit partager la valeur créée. Le règlement d’Anthropic confirme cette seconde vision. Il ajoute sa pierre à la longue chronique d’oppositions, depuis la querelle entre Gutemberg et les moines copistes jusqu’aux procès Napster de 2001.
Foire aux requêtes des internautes
« Comment savoir si mon livre a servi à entraîner Claude.ai ? »
- Inscrivez-vous sur le portail de réclamation mis en place par les avocats des plaignants (adresse communiquée prochainement).
- Fournissez ISBN, titre, preuve de propriété.
- Une recherche par empreinte (similarité vectorielle) sera effectuée sur les sauvegardes judiciaires.
- En cas de correspondance, vous pourrez demander une indemnisation complémentaire, calculée au prorata des futures recettes d’Anthropic.
Cette procédure, calquée sur les règlements musicaux post-Spotify, pourrait devenir le standard de l’industrie.
Entre passé et futur : un précédent majeur
Dans les années 1990, la bataille du MP3 avait accouché d’iTunes. Aujourd’hui, la bataille du large language model pourrait déboucher sur un marché de licences modulaires, où chaque paragraphe, chaque photographie disposera d’un prix micro-indexé. Les éditeurs, de Hachette à Penguin Random House, y voient déjà une nouvelle manne.
Les enseignements immédiats pour votre stratégie numérique
- Audit de vos jeux de données internes.
- Traçabilité des sources via metadata enrichies.
- Dialogue avec les ayants droit dès la phase de R&D.
- Veille juridique continue (cf. nos dossiers « cybersécurité » et « data governance »).
Regard de reporter
Je couvre la tech depuis la bulle Internet de 2000. Rarement un compromis n’a résonné aussi fort, rappelant le règlement des photographes contre Google Books en 2011. À l’époque, beaucoup prédisaient la fin de la bibliothèque numérique ; elle existe toujours, mais encadrée. Il en ira de même pour l’IA. L’innovation survit toujours à la régulation, pour peu qu’elle l’intègre intelligemment.
Si vous souhaitez creuser la mécanique des grands modèles linguistiques, explorer leur impact sur la robotique ou la santé connectée, restez avec nous : les révolutions les plus passionnantes se dessinent maintenant.
