Par Valérie Laure Benabou – Professeure de droit privé à l’Université Paris Saclay/UVSQ
Il est difficile de suivre la rationalité propre d’Elon Musk dont certaines déclarations peuvent paraître quelque peu fantasques sur les questions dites d’intelligence artificielle – ce qui est un terme devenu générique mais qui charrie de nombreux contresens sur le phénomène décrit. Il est en effet l’un des leaders du secteur, tout en ayant invité récemment le monde à faire une « pause » pour prendre le temps de mettre en place une régulation appropriée.

Quelles sont les raisons avancées par Elon Musk pour s’opposer à l’extraction massive des données figurant sur Twitter ?

Elon Musk a annoncé le 1er juillet que seuls les détenteurs d’un compte peuvent avoir accès aux tweets, tout en établissant des plafonds (10.000 tweets par jour pour les comptes vérifiés – payants-, 1.000 pour les non vérifiés et à 500 pour les nouveaux comptes non vérifiés). Il a d’abord justifié sa décision par le fait que le moissonnage massif des données pesait sur le réseau Twitter puisque pour faire face à toutes ces requêtes il était nécessaire de « devoir ajouter, en urgence, un nombre important de serveurs pour le seul fait de justifier la valorisation indécente de certaines start-ups de l’IA. » Puis, il a prétendu que sa position était motivée par la nécessité de poser des limites à l’usage pour que les personnes se détournent de l’addiction des réseaux sociaux. Mais ses motivations véritables sont sans doute plus complexes.

En premier lieu, la limitation opérée peut avoir pour objectif premier d’augmenter la rentabilité de Twitter en boostant l’offre de service payant, qui pour l’heure, a du mal à démarrer. La réduction du volume des requêtes devrait également avoir pour conséquence de réduire les besoins de stockage. Tout ceci devrait permettre à Elon Musk de faire face à ses dettes colossales vis-à-vis des serveurs qui stockent les données de Twitter détenus par Google (de l’ordre du milliard de dollars) et à réduire la facture. Ceci est d’autant plus important qu’en ayant également annoncé qu’il ne suivrait pas les codes de conduite européens en matière de modération des contenus, Elon Musk a détourné de Twitter un certain nombre d’annonceurs publicitaires qui ne souhaitent pas voir leurs marques associées à des contenus haineux ou excessifs. On note toutefois que d’autres services, jusqu’alors gratuits commencent à développer des offres payantes, ce qui marque peut-être une évolution dans un contexte où l’énergie devient de plus en plus coûteuse et l’économie de la publicité non extensible à l’infini.  

En second lieu, Elon Musk se trouve dans une position schizophrène car d’une part son empire se positionne depuis longtemps sur le développement d’applications puissantes utilisant des technologies de traitement des données et d’autre part, en tant que nouveau patron de Twitter, il se retrouve à la tête d’un gisement gigantesque de données servant à alimenter ce type d’applications. Il est donc délicat d’apprécier l’objectivité des raisons qui motivent sa volonté de limiter l’accès à ce gisement en bloquant la quantité d’extractions réalisées par les tiers puisque ces limitations lui permettent nécessairement de conserver une forme d’avantage pour ses propres services. En d’autres termes, en interdisant le scraping (l’extraction massive de données) par les autres, il pourra jouir d’une forme d’exclusivité sur l’utilisation des données issues de l’usage de Twitter pour ses propres services.

Est-ce qu’une bataille juridique pour l’accès aux données d’entraînement des intelligences artificielles est en train de s’annoncer ?

L’émergence de cette nouvelle génération de machines logicielles qui n’ont rien d’intelligent dans l’acception usuelle du terme suscite à la fois beaucoup d’inquiétudes et de convoitises. Les possibilités de développement de ces applications sont potentiellement gigantesques et chacun souhaite pouvoir se positionner au plus vite dans une logique du « winner takes all ». Ceux qui sont en avance comme Open AI avec notamment Chat GPT ou Dall-E revendiquent une liberté de miner, d’extraire les données – comme auparavant les moteurs de recherche ont plaidé pour une liberté de crawler, à savoir copier les Urls des sites pour les indexer et les hiérarchiser. Ceux qui n’ont pas encore assez développé leurs applications peuvent être tentés de freiner le jeu, soit en appelant à davantage de régulation, soit en bloquant les possibilités d’accès à des jeux de données. Dans cette perspective, l’asséchement du filon (pour filer la métaphore minière) pourrait devenir délicat pour certains acteurs et donner un avantage concurrentiel aux groupes qui ont à la fois la maitrise de flux de données et qui développent des applications. Google vient également de changer ses conditions d’utilisation pour s’assurer la possibilité d’utiliser les données de ses utilisateurs. 

Que peut-on attendre du droit dans cette perspective ?

Le droit peut servir à donner des orientations sur le marché en interdisant ou en encadrant certaines pratiques. Les autorités de protection des données à caractère personnel ont déjà mis en garde contre la violation potentielle de la législation par les applications génératives de contenus (voir à ce sujet le dossier du LINC, le laboratoire d’Innovation Numérique de la CNIL) , à telle enseigne que, de manière spectaculaire, l’intervention de l’autorité italienne avait conduit provisoirement à la suspension de certains services de Open AI  qu’ils ne soient repris après une discussion autour de certains engagements. Le droit de la concurrence a également son mot à dire et le Digital Market Act applicable depuis le 2 mai 2023, notamment par ses articles 5 et 6 va empêcher les pratiques d’auto-préférence lorsque les acteurs sont à la fois présents sur les marchés amont et aval. L’alliance de ces deux mécanismes de régulation peut s’avérer puissante. Très récemment, la Cour de Justice, dans une affaire ayant condamné Méta pour l’utilisation des données personnelles dans son modèle publicitaire, a considéré qu’une autorité de concurrence peut constater, dans le cadre de l’examen d’un abus de position dominante, une violation du RGPD (Décision du 4 juillet 2023, aff. C 252-51).

Le droit d’auteur est, quant à lui, sans doute passé partiellement à côté de l’enjeu puisque l’article 4 de la directive dite Droit d’Auteur dans le Marché Unique Numérique du 17 avril 2019 a consacré une exception de fouilles de texte et de données (text and data mining) favorable aux opérateurs, en établissant un système d’opt out leur permettant, par défaut, de procéder aux extractions des œuvres pour entraîner leurs modèles, sauf lorsque des mécanismes techniques d’empêchement ont été installés. Plusieurs voix s’élèvent pour demander de reconsidérer le droit afin de permettre aux auteurs de disposer de plus de pouvoirs sur ces pratiques et d’être associés à la valeur créée. La discussion actuelle du règlement sur l’Intelligence Artificielle, voté par le Parlement européen le 14 juin avant d’entrer en trilogue, dont l’objet est bien plus large, prévoit d’ores et déjà, à la charge des fournisseurs de services d’intelligence artificielle générative, certaines obligations de transparence (actuel article 28 ter paragraphe 4) notamment quant à l’utilisation des contenus protégés par le droit d’auteur.

 

[vcex_button url= »https://www.leclubdesjuristes.com/newsletter/ » title= »Abonnement à la newsletter » style= »flat » align= »center » color= »black » size= »medium » target= » rel= »none »]En savoir plus…[/vcex_button]