Image

Meta | L’IA s’est entraînée sur Janette Bertrand, Michel Jean et India Desjardins

Paru en premier sur (source): journal La Presse

Une cascade d’auteurs et autrices québécois s’épanchent depuis jeudi soir sur les réseaux sociaux après avoir constaté avec désarroi que Meta avait utilisé sans permission leur œuvre pour entraîner son intelligence artificielle (IA).


Publié à 13 h 52

Pascale Lévesque

Le Soleil

Mise en contexte : Meta est impliquée dans une controverse judiciaire après la révélation que son IA a été entraînée sur des livres piratés alors qu’ils étaient répertoriés dans la base données de la bibliothèque numérique controversée Library Genesis (LibGen).

Selon des documents judiciaires récemment dévoilés, l’entreprise de Mark Zuckerberg aurait utilisé ces contenus sans autorisation, même en sachant que télécharger illégalement des livres via des torrents posait un risque juridique et malgré le malaise de ses propres ingénieurs. La situation a conduit plusieurs auteurs à porter plainte début janvier contre l’entreprise pour violation du droit d’auteur.

Meta et OpenAI soutiennent devant les tribunaux que l’entraînement de leurs modèles d’IA générative sur des œuvres protégées sans licence relève de l’« usage équitable » (fair use), rapporte le magazine The Atlantic. Selon les entreprises, les modèles de langage transforment le matériel original en une nouvelle œuvre, ce qui justifierait leur approche.

Retracer les ouvrages détournés

Jeudi, c’est justement le magazine américain The Atlantic qui mettait le aux poudres en rendant disponible un outil pour retracer les ouvrages détournés afin d’entraîner l’IA de Meta.



Consultez l’article de The Atlantic

Développé dans le cadre de son enquête sur la bibliothèque numérique Library Genesis (LibGen), il permet grâce à une simple recherche par mots clés – comme le nom de l’auteur ou le titre du livre – de retracer les ouvrages contenus dans LibGen, dont des ouvrages québécois.

Des noms comme Janette Bertrand, Michel Jean, Chrystine , Patrick Senécal et India Desjardins y figurent. Le best-seller de -Pierre Duval, Au pays du désespoir tranquille, paru chez Stanké en 2022, fait partie des livres piratés. Sur Facebook – meilleur endroit pour rejoindre le propriétaire de la plateforme –, elle qualifie le tout de mépris éhonté.

La plupart des auteurs et autrices, ici du moins, bûchent pendant des mois ou des années sur une œuvre. Ils font un acte de foi, à leurs frais pour la plupart. Aujourd’hui, ils apprennent que ce beau risque personnel a servi à nourrir l’une des plus grandes fortunes du qui, en plus, se fait complice d’une dictature. J’ai beau chercher des mots chics ou recherchés dans mon vocabulaire, le seul qui me vient à l’esprit : dégueulasse.

L’ Marie-Pierre Duval

Maryse Pagé, autrice prolifique dont le livre Raconte- le Cirque du Soleil figure dans le lot des ouvrages « empruntés », en rajoute : « Ça fait peur et ça ne fait que commencer… »

La machine qui n’ajoutait pas de point de vue

En incluant les versions allemandes de ses livres, India Desjardins a découvert que 27 titres à son nom étaient piratés. L’autrice pousse la réflexion encore plus loin.

PHOTO ALAIN ROBERGE, ARCHIVES

India Desjardins

L’art s’est toujours inspiré de l’art. Ça fait partie du processus humain d’intégrer des influences et d’y apporter sa touche, sa perspective, sa vision. Mais créer, c’est une volonté de s’exprimer, de proposer une nouvelle perspective ou de réagir à des réalités ou contextes spécifiques. L’intelligence artificielle ne propose pas de point de vue ou de nouvelles idées, elle réplique le travail créatif d’autres personnes à un niveau automatisé jamais vu. Et ce serait important d’y réfléchir, mais malheureusement, les compagnies qui développent ces technologies ont décidé de s’approprier des créations avant que la réflexion ait eu lieu.

L’autrice India Desjardins

Pierre-, président de l’Union des écrivaines et des écrivains québécois (UNEQ), lui-même auteur, est aussi touché. Six de ses livres « ont été volés par Meta et utilisés sans [mon] autorisation pour entraîner leur IA », s’insurge-t-il.

« On ne peut pas laisser passer ça, lance-t-il, en entrevue avec Le Soleil. Leur vague de pompage représente au-dessus de 200 téraoctets d’informations, donc, entre 60 et 80 millions de livres qu’ils ont piratés pour former leur intelligence. Si tu as un individu qui rentre dans une librairie, qui vole des livres, tu essaies de l’arrêter. Si c’est du vol massif, la police est sur le cas. Mais là, tu as une compagnie qui le fait, c’est révélé, et qui vole au-dessus de 60 millions d’ouvrages. Est-ce qu’on laisse faire sous prétexte qu’elle est si puissante ? En se disant : “Tant pis, tu sais, elle nous a eues” ? »

Ne pas rester passif

India Desjardins, qui a déjà fait céder juridiquement un de ses éditeurs – feu Michel Brûlé des Intouchables pour ne pas le nommer –, est consciente du défi, mais refuse de rester passive.

« Comme dans toute technologie, ça fait toujours peur, affirme-t-elle en entrevue. Si ce que les gens veulent faire maintenant, c’est de l’utiliser, on ne pourra pas empêcher ça. Comme pour maintenant la musique en streaming. Ce qui me désole, c’est que tout est souvent fait à l’insu des artistes, qui doivent s’ajuster, une fois que leur travail est volé. »

Pour Pierre-Yves Villeneuve, l’enjeu est grave, d’autant que son organisation plaide depuis dix ans l’urgence de revoir la loi fédérale sur le droit d’auteur. Une urgence maintenant exacerbée. Au Canada, l’utilisation d’œuvres littéraires pour la formation d’IA générative est soumise à la Loi sur le droit d’auteur.

Il rappelle l’urgence d’agir afin de mieux protéger les créateurs et le public contre la montée de l’utilisation de l’IA et plaide pour une révision de la loi sur le droit d’auteur et un meilleur encadrement de l’IA au pays.

Les contribuables interpellés autant que les auteurs

Pierre-Yves Villeneuve souligne que le domaine littéraire est largement subventionné ici, et que par ricochet, cette question touche bien sûr les auteurs, mais plus largement l’ensemble des citoyens, des contribuables.

Scientifiquement, l’IA est un outil très intéressant avec lequel on est capable de faire de grandes choses. Sauf qu’il y a malheureusement aussi beaucoup de mauvais acteurs avec ça. Il faut agir vite, il faut agir bien pour protéger la population.

Pierre-Yves Villeneuve, président de l’Union des écrivaines et des écrivains québécois

M. Villeneuve affirme que les subventions, c’est fait pour engager des humains et que, nécessairement, les circonstances actuelles forcent un resserrement des règles de financement dans le milieu littéraire afin d’éviter les glissements.

L’Association nationale des éditeurs de livres (ANEL) a aussi réagi.

« L’intelligence artificielle exacerbe les problèmes du piratage de livres et de contenus informationnels, a indiqué au Soleil la présidente Geneviève Pigeon. L’ANEL mène un travail soutenu sur les enjeux de l’IA et du droit d’auteur en collaboration avec des partenaires du Canada et à l’international. Des poursuites judiciaires ont commencé au pays et ailleurs dans le monde. »

Techno et culture dans des positions divergentes

Dans le rapport du gouvernement du Canada publié en début d’année, qui émane de sa Consultation sur le droit d’auteur à l’ère de l’intelligence artificielle générative menée dans les mois précédents (du 12 octobre 2023 au 15 janvier 2024), on constate à quel point les défenseurs de la culture et l’industrie de l’IA ont des positions divergentes.



Consultez le rapport

Les créateurs individuels et les représentants d’industries culturelles ont fait valoir qu’à mesure que le marché de l’IA générative se développe, les titulaires de droits doivent être en mesure de consentir à l’utilisation de leur contenu dans le cadre de l’entraînement de l’IA et doivent recevoir un crédit et une rémunération pour ces utilisations.

Les acteurs de l’industrie technologique de leur côté au nom de l’innovation expriment des réserves quant à l’octroi de licences pour l’entraînement de l’IA. Leur coût élevé pourrait freiner les jeunes pousses et les petites entreprises et la nécessité d’accéder à de vastes ensembles de données diversifiés. Ils estiment aussi que la répartition des paiements entre un grand nombre de titulaires de droits pourrait réduire la compensation individuelle à des montants insignifiants.



Lisez le texte sur le site du Soleil

[...] continuer la lecture sur La Presse.

Palmarès des livres au Québec