Paru en premier sur (source): journal La Presse
Une cascade d’auteurs et autrices québécois se sont épanchés depuis jeudi soir sur les réseaux sociaux après avoir constaté avec désarroi que Meta avait utilisé sans permission leur œuvre pour entraîner son intelligence artificielle (IA).
Publié à 13 h 52
Mise en contexte : Meta est impliquée dans une controverse judiciaire après la révélation que son IA a été entraînée sur des livres piratés alors qu’ils étaient répertoriés dans la base de données de la controversée bibliothèque numérique Library Genesis (LibGen).
Selon des documents judiciaires récemment dévoilés, l’entreprise de Mark Zuckerberg aurait utilisé ces contenus sans autorisation, même en sachant que télécharger illégalement des livres via des torrents posait un risque juridique et malgré le malaise de ses propres ingénieurs. La situation a conduit plusieurs auteurs à porter plainte début janvier contre l’entreprise pour violation du droit d’auteur.
Meta et OpenAI soutiennent devant les tribunaux que l’entraînement de leurs modèles d’IA générative sur des œuvres protégées sans licence relève de l’« usage équitable » (fair use), d’après ce qui est rapporté dans le magazine The Atlantic. Selon les entreprises, les modèles de langage transforment le matériel original en une nouvelle œuvre, ce qui justifierait leur approche.
Retracer les ouvrages détournés
Ainsi jeudi, c’est justement le magazine américain The Atlantic qui mettait le feu aux poudres en rendant disponible un outil pour retracer les ouvrages détournés afin d’entraîner l’IA de Meta.
Consultez l’article de The Atlantic
Développé dans le cadre de son enquête sur la bibliothèque numérique Library Genesis (LibGen), il permet grâce à une simple recherche par mots clés – comme le nom de l’auteur ou titre de livres – de retracer les ouvrages contenus dans LibGen, dont une panoplie d’ouvrages québécois.
Le best-seller de l’autrice Marie-Pierre Duval est du lot des œuvres québécoises utilisées pour entraîner l’IA de Meta. (Stanké)
Des noms comme Janette Bertrand, Michel Jean, Chrystine Brouillet, Patrick Sénécal, India Desjardins ou encore Marie-Pierre Duval y figurent le best-seller de cette dernière, Au pays du désespoir tranquille, paru chez Stanké en 2022, est du nombre des livres piratés. Sur Facebook – meilleur endroit pour rejoindre le propriétaire de la plateforme – elle qualifie le tout de mépris éhonté.
La plupart des auteurs et autrices, ici du moins, bûchent pendant des mois ou des années sur une œuvre. Ils font un acte de foi, à leurs frais pour la plupart. Aujourd’hui, ils apprennent que ce beau risque personnel a servi à nourrir l’une des plus grandes fortunes du monde qui, en plus, se fait complice d’une dictature. J’ai beau chercher des mots chics ou recherchés dans mon vocabulaire, le seul qui me vient à l’esprit : dégueulasse.
L’autrice Marie-Pierre Duval
Maryse Pagé, autrice jeunesse prolifique dont le livre Raconte-moi le Cirque du Soleil figure dans le lot des ouvrages « empruntés » en rajoute : « Ça fait peur et ça ne fait que commencer… ».
La machine qui n’ajoutait pas de point de vue
En incluant les versions allemandes de ses livres, India Desjardins a découvert que 27 titres à son nom étaient piratés. L’autrice pousse la réflexion encore plus loin.
PHOTO ALAIN ROBERGE, ARCHIVES LA PRESSE
India Desjardins
L’autrice et scénariste India Desjardins a constaté jeudi que son œuvre avait été utilisée par Meta pour entraîner son IA et se désole que ça se fasse à l’insu des créateurs. (Julie Artacho)
L’art s’est toujours inspiré de l’art. Ça fait partie du processus humain d’intégrer des influences, et d’y apporter sa touche, sa perspective, sa vision. Mais créer, c’est une volonté de s’exprimer, de proposer une nouvelle perspective ou de réagir à des réalités ou contextes spécifiques. L’intelligence artificielle ne propose pas de point de vue ou de nouvelles idées, elle réplique le travail créatif d’autres personnes à un niveau automatisé jamais vu, fait-elle voir. Et ce serait important d’y réfléchir, mais malheureusement, les compagnies qui développent ces technologies ont décidé de s’approprier des créations avant que la réflexion ait eu lieu.
L’autrice India Desjardins
Pierre-Yves Villeneuve, le président de l’Union des écrivaines et écrivains Québécois (UNEQ), lui-même auteur, est aussi affecté. Six de ses livres « ont été volés par Meta et utilisés sans mon autorisation pour entraîner leur IA », s’insurge-t-il.
En entrevue avec Le Soleil vendredi matin, il renchérit.
« On ne peut pas laisser passer ça, lance-t-il. Leur vague de pompage représente au-dessus de 200 téraoctets d’informations, donc, entre 60 et 80 millions de livres qu’ils ont piratés pour former leur intelligence. Si t’as un individu qui rentre dans une librairie, qui vole des livres, t’essaies de l’arrêter. Si c’est du vol massif, t’as la police qui est sur le cas. Mais là, t’as une compagnie qui le fait, c’est révélé, et qui vole au-dessus de 60 millions d’ouvrages. Est-ce qu’on laisse faire sous prétexte qu’elle est si puissante ? En se disant “tant pis, t’sais, elle nous a eues” ? »
Ne pas rester passif
India Desjardins, qui a déjà fait céder juridiquement un de ses éditeurs – feu Michel Brûlé des Intouchables pour ne pas le nommer – est consciente du défi, mais refuse de rester passive.
« Comme dans toute technologie, ça fait toujours peur, exprime-t-elle en entrevue. Si ce que les gens veulent faire maintenant c’est de l’utiliser, on ne pourra pas empêcher ça. Comme pour maintenant la musique en streaming. Ce qui me désole, c’est que tout est souvent fait à l’insu des artistes, qui doivent s’ajuster, une fois que leur travail est volé. »
Pour le président de l’UNEQ, l’enjeu est grave, d’autant plus que son organisation plaide depuis dix ans l’urgence de revoir la loi fédérale sur les droits d’auteurs. Une urgence maintenant exacerbée. Au Canada, l’utilisation d’œuvres littéraires pour la formation d’IA générative est soumise à la Loi sur le droit d’auteur.
Pierre-Yves Villeneuve, président de l’Union des écrivaines et écrivains québécois (UNEQ) souligne l’urgence d’agir afin de mieux protéger les créateurs et le public contre la montée de l’utilisation de l’IA. Il plaide pour une révision de la loi sur les droits d’auteurs et un meilleur encadrement de l’IA au pays. (Pierre-Yves Villeneuve)
Les contribuables interpellés autant que les auteurs
PHOTO ALAIN ROBERGE, ARCHIVES LA PRESSE
Pierre-Yves Villeneuve
Pierre-Yves Villeneuve souligne à juste titre que le domaine littéraire est largement subventionné ici, et que par ricochet, cette question touche bien sûr les auteurs, mais plus largement l’ensemble des citoyens, des contribuables.
Scientifiquement l’IA est un outil très intéressant avec lequel on est capable de faire de grandes choses, plaide-t-il. Sauf qu’il y a malheureusement aussi beaucoup de mauvais acteurs avec ça. Il faut agir vite, il faut agir bien pour protéger la population.
Pierre-Yves Villeneuve, président de l’Union des écrivaines et écrivains québécois
M. Villeneuve affirme que les subventions, c’est fait pour engager des humains et que, nécessairement, les circonstances actuelles forcent un resserrement des règles de financement dans le milieu littéraire afin d’éviter les glissements.
L’Association nationale des éditeurs de livres (ANEL) a aussi réagi.
« L’intelligence artificielle exacerbe les problèmes du piratage de livres et de contenus informationnels, a indiqué au Soleil la présidente Geneviève Pigeon. L’ANEL mène un travail soutenu sur les enjeux de l’IA et du droit d’auteur en collaboration avec des partenaires du Canada et à l’international. Des poursuites judiciaires ont commencé au pays et ailleurs dans le monde. »
Techno et culture dans des positions divergentes
Dans le rapport du gouvernement du Canada publié en début d’année, qui émane de sa Consultation sur le droit d’auteur à l’ère de l’intelligence artificielle générative menée dans les mois précédents (du 12 octobre 2023 au 15 janvier 2024), on constate à quel point les défenseurs de la culture et l’industrie de l’IA ont des positions divergentes.
Les créateurs individuels et les représentants d’industries culturelles ont fait valoir qu’à mesure que le marché de l’IA générative se développe, les titulaires de droits doivent être en mesure de consentir à l’utilisation de leur contenu dans le cadre de l’entraînement de l’IA et doivent recevoir un crédit et une rémunération pour ces utilisations.
Les acteurs de l’industrie technologique de leur côté au nom de l’innovation expriment des réserves quant à l’octroi de licences pour l’entraînement de l’IA. Leur coût élevé pourrait freiner les jeunes pousses et les petites entreprises et la nécessité d’accéder à de vastes ensembles de données diversifiés. Ils estiment aussi que la répartition des paiements entre un grand nombre de titulaires de droits pourrait réduire la compensation individuelle à des montants insignifiants.
Le prochain gouvernement fédéral devra poursuivre les travaux sur l’IA et le secteur culturel – dont les différentes associations multiplient les ateliers et espaces de discussions sur le sujet – continuera de faire valoir la défense du droit d’auteur.
Écrivains et journalistes debout
Enfin, soulignons qu’un peu partout, écrivains et journalistes osent s’attaquer en justice aux géants du numérique.
Chez nous, une coalition de médias canadiens a intenté une poursuite contre OpenAI, l’accusant d’avoir utilisé du contenu journalistique sans autorisation pour entraîner ChatGPT, son intelligence artificielle générative.
En Europe, trois organisations du milieu littéraire en France – le SNE, la SGDL et le SNAC – poursuivent Meta devant le Tribunal judiciaire de Paris. Elles l’accusent d’avoir utilisé massivement des œuvres protégées, sans autorisation des auteurs et éditeurs, pour entraîner son intelligence artificielle générative.
En janvier, la Chambre des lords du Royaume-Uni a adopté pour sa part des amendements qui obligent les entreprises d’IA à respecter la législation britannique sur le droit d’auteur, à dévoiler leur identité et leurs intentions, ainsi qu’à informer les créateurs lorsque leurs œuvres protégées sont utilisées pour l’entraînement de modèles d’intelligence artificielle.