Note de lecture : L’empire des données

12 novembre 2018

Adrien Basdevantet Jean-Pierre Mignard,L’empire des données : essai sur la société, les algorithmes et la loi, Paris, Don Quichotte éditions, 2018.

Introduction — Les données, nouvelles clés du pouvoir

Plus de données ont été extraites en 2011 que dans toute l’histoire de l’humanité, et la massification de la collecte ne cesse d’augmenter. Avec la diversification de ses usages, le big dataa conduit à la transformation numérique de toutes les sphères de notre société. Toutefois, la révolution numérique porte avec elle des défis juridiques inédits : (i) qu’est-ce que le « coup data » et d’où vient-il ? (ii) Comment réguler le forage des données et le profilage comportemental ? (iii) Quelle gouvernance instaurer pour assainir les nouveaux rapports de force ?

i. Une histoire des data

La première partie de l’ouvrage retrace l’histoire des chiffres et des statistiques afin d’établir des liens entre ces dernières et les algorithmes d’intelligence artificielle. Les chiffres sont apparus en même temps que les premières activités marchandes d’Homo sapiens en Mésopotamie. Leur utilisation a évolué au Moyen-Âge avec la notion de redditionde compte, puis s’est formellement transposée en droit avec l’instauration de la responsabilité commerciale dans les cités-États marchandes italiennes et dans la lex mercatoria.

Le « tournant mathématique » du droit prend place lorsque les statistiques deviennent des outils techniques d’organisation des sociétés, ce que les auteurs appellent « arithmétique politique ». Les États-nations sont les premiers à les intégrer en droit afin de gérer la disparition du système féodal. La description statistique du réel sert alors à appréhender les phénomènes de masse et dote les nouveaux États d’une prétendue objectivité qui inspire leur légitimité. Une culture de la statistique émerge et s’impose après la découverte du vaccin contre la variole en 1774, permise par des représentations statistiques qui indiquaient que les femmes travaillant au contact des bovins n’attrapaient pas la maladie.

En évoluant, l’arithmétique politique devient également « physique sociale ». Les statistiques sont dès lors de véritables outils du pouvoir, capables d’expliquer et de réguler les comportements humains. Les politiques ne s’intéressent toutefois qu’à l’existence de corrélations statistiques pour expliquer les phénomènes sociaux, en omettant toute relation de causalité. Cette tendance est déjà largement critiquée par les grands penseurs de l’époque, tel Auguste Comte. Par ailleurs, l’« homme moyen » étant une fatalité statistique, il représente un idéal à atteindre. Les « anormaux », d’abord ignorés, car considérés comme des occurrences imparfaites, sont ensuite repérés pour être ramenés à la normale. La différence de traitement entre les lépreux (exclusion totale des malades) et les individus atteints de la peste (quadrillage stratégique) en témoigne.

L’utilisation des statistiques se généralise donc en droit, en politique et au sein du secteur privé. Elle donne aux nombres une valeur, puis à sa collecte une utilité. La gouvernance par les nombres laisse aujourd’hui place au fantasme cybernétique de l’autorégulation, soit « la promesse d’une normativité fluide et efficace, n’ayant plus besoin du temps long des débats parlementaires et législatifs, au profit d’une programmation instantanée adaptable en temps réel et auto-apprenante »[1]. Le « coup data » reflète donc l’image de la prise de pouvoir des données sur la géopolitique du monde numérique.

Avec le big data, il n’est plus question d’oublier les comportements minoritaires, la norme devient l’énorme. Les outils de traçage sur le web (tels les témoins ou cookies), alliés des multiples gadgets de l’internet of things, permettent de tout détecter. Les algorithmes d’intelligence artificielle gèrent cette « infobésité » : ils font émerger des modèles (patterns) à partir de données peu structurées en détectant les répétitions et en modélisant les comportements. Le raisonnement n’est plus déductif, mais inductif. Néanmoins, ces modèles doivent être interprétés puisqu’ils ne permettent pas toujours d’expliquer les comportements humains en dégageant de simples corrélations. Aux États-Unis, il existe par exemple une corrélation — évidemment fallacieuse — de 95,86 % entre la consommation par habitant de mozzarella et la délivrance de doctorats en génie civil. Reste que les avancées permises sont sans précédent, notamment dans les domaines de la médecine, de la fiscalité, de la lutte contre le terrorisme et la radicalisation, de la transition écologique ou encore des villes intelligentes.

ii. La régulation des algorithmes

Les auteurs affirment que personne n’est anonyme sur internet : « [t] rente-six heures de navigation suffisent pour que cent cinq sociétés prennent connaissance de nos activités en ligne »[2]. Le traçage des données en ligne a mené à la création de profils comportementaux qui servent notamment au marketing personnalisé. Mais ces profils nous enferment dans des avatars comportementaux auxquels nous n’avons pas toujours accès en raison des règles de la propriété intellectuelle. En contrepartie, ils influencent nos choix, statuent sur notre solvabilité, déterminent notre employabilité et vont parfois même jusqu’à juger de notre culpabilité (logiciel Compas, États-Unis). Des mouvements émergent afin de réclamer des droits, tel celui de connaître la logique algorithmique utilisée en cas de traitement automatique. En France, de telles concessions ont été (en partie) accordées dans la foulée du scandale de la plateforme Admission post-bac en 2016 dans la Loi n° 20161321 du 7 octobre 2016 pour une République numérique.

Mais à qui appartiennent les données ? L’approche « personnaliste » européenne se heurte à l’approche « réaliste » américaine. La première veut lier la donnée à la personne en lui accordant un droit à l’autodétermination informationnelle, soit la possibilité de contrôler son identité dans l’espace numérique. La seconde prône la patrimonialisation des données, mais elle fait face à une horde de critiques fonctionnelles et théoriques, notamment parce que les attributs traditionnels de la propriété n’y sont pas applicables (usus, fructuset abusus). Une troisième approche utilise quant à elle le droit de la concurrence afin d’ériger les données en nouvelles « facilités essentielles »[3]. Dans ses grandes lignes, elle avance que le constat d’un monopole d’acteurs privés (en l’occurrence, les GAFAM[4]) détenant une infrastructure non reproductible dans des conditions économiques raisonnables (les plateformes de ces géants) obligerait le partage de la ressource (les données) avec leurs concurrents.

Avant de traiter du Règlement européen sur la protection des données du 16 avril 2016 (RGPD), Basdevant et Mignard effectuent une précision terminologique importante sur les données. Ces dernières sont généralement « personnelles » lorsqu’elles permettent l’identification directe ou indirecte d’un individu. Toutefois, une étude américaine récente démontre qu’il est devenu « algorithmiquement impossible » de rester anonyme sur la toile en raison du développement des techniques de recoupement des données venant de bases différentes. Dans ces circonstances, l’ajout de l’adjectif « personnel » au concept de donnée est obsolète. La terminologie est malgré tout employée par le RGPD, ce que les auteurs déplorent.

Le RGPD offre par ailleurs le cadre législatif le plus ambitieux à ce jour sur la question des données personnelles. Son objectif est clair : faciliter la libre circulation des données tout en protégeant les droits des personnes physiques. L’une des mesures les plus importantes est l’élargissement de la responsabilité des opérateurs et de leurs intermédiaires, qui engendre une forme d’autorégulation pour ceux-ci. Les « sanctions-amendes » en cas de non-respect y sont par conséquent très lourdes, pouvant atteindre 20 millions d’euros ou 4 % du chiffre d’affaires, selon le plus élevé des deux. Les auteurs émettent toutefois quelques réserves quant à la complétude du RGPD, notamment en ce qu’il protège les données dans le prisme du droit à la vie privée, alors qu’eux l’envisagent comme un droit distinct à part entière. Ils proposent en sus la création d’un contentieux européen du numérique afin de traiter les questions de cybercriminalité, négligées par manque de proactivité, quoiqu’urgentes et complexes.

iii. La gouvernance des données

« Google en sait plus que l’INSEE sur la France »[5]. Un combat pour la souveraineté est engagé entre les États-nations et les géants du numérique, nouveaux « États-plateformes »[6]. Ces derniers connaissent une montée en puissance avant tout économique, mais le caractère nouveau de leur pouvoir réside dans l’influence inédite qu’ils détiennent sur les populations. Sur la toile, les lois nationales ont moins de poids que les conditions générales d’utilisation (CGU), contrats d’adhésion auxquels adhèrent effectivement les internautes sans les lire ni les comprendre[7]. Le grand perdant de ce combat est donc le citoyen-utilisateur, qui doit rapidement trouver un moyen de faire valoir ses intérêts dans la géopolitique du numérique.

L’enjeu est d’amener les milliards d’internautes à prendre conscience de l’existence d’intérêts communs et à se regrouper. Dès lors, la société civile pourrait réclamer sa place légitime dans le débat numérique, en tant que troisième pilier d’une gouvernance mondiale d’internet. Un contrat social des donnéestripartite apporterait une forme de représentativité plus juste basée sur la confiance et l’éthique. Les auteurs prônent ainsi l’insufflation d’un sentiment partagé de responsabilité, forme d’autorégulation en amont qui serait garantie par l’imposition de codes déontologiques, de standards, etc. Le RGPD contient une telle forme de soft law dans sa disposition 25 intitulée « Protection des données dès la conception et protection des données par défaut »[8]. Toutefois, le changement civilisationnel que suppose la nouvelle responsabilité partagée doit, pour être véritablement inclusif, s’accompagner du développement d’une culture du numérique.

Finalement, le coup data efface progressivement la démocratie d’hier. La migration des normes juridiques dans le code informatique est amorcée[9], et l’avenir laisse entrevoir la possibilité d’algorithmes illégitimes pour effectuer la mise en œuvre du droit. Si cette éventualité se réalise, la société de demain sera dirigée par des algorithmes qui appréhendent les sujets de droit comme des échantillons d’une masse de données qu’il s’agit de représenter, calculer et modéliser. Même si le modèle qui précède promet l’objectivité absolue, les algorithmes comportent encore leur lot d’erreur, de biais et de partialité qui ne peuvent être corrigés autrement que par intervention humaine. Par ailleurs, cette « gouvernementalité algorithmique »[10] se donne pour mission de neutraliser l’incertitude en préconfigurant le champ du possible à partir de profils comportementaux induits. Toutefois, ce modèle omet des réalités fondamentales, telle la liberté d’action de chaque individu, source intarissable d’inattendu et d’imprévisibilité.

Conclusion — La démocratie en numérique

Adrien Basdevant et Jean-Pierre Mignard font le constat d’un renversement du règne de la loi au profit d’une gouvernance par le calcul froide, efficace, objective et fluide. Les données font désormais autorité, et les seuls capables de les traiter sont les algorithmes. Selon eux, le défi lancé par l’intelligence artificielle consiste à ramener l’humanité au premier plan dans nos sociétés. Il faut se tourner vers un humanisme technologique qui cesse de vouloir mettre fin à l’incertitude et au hasard, mais les perçoit comme intrinsèques et nécessaires. « Notre livre est une affirmation de la vie, avec tout ce qu’elle suppose d’incertitude, ses parts de risque, d’avènement de nouveau, de créativité »[11].

Adrien Basdevant et Jean-Pierre Mignard

SOLEÏCA MONNIER

[1] Adrien Basdevant et Jean-Pierre Mignard,L’empire des données : essai sur la société, les algorithmes et la loi, Paris, Don Quichotte éditions, 2018, p. 53.

[2] Préc., note 1, p. 94.

[3] Voir le Rapport annuel de la Cour de cassation en France, 2005.

[4] Le terme désigne les géants du web américains : Google, Apple, Facebook, Amazon et Microsoft.

[5] À la page 212.

[6] Préc., note 4.

[7] Pour approfondir au sujet des CGU, et notamment sur les avenues étudiées en droit de la consommation, voir Vanessa MAK, « Contract and Consumer Law » (2018) 07-2017 Tilburg Private Law Working Paper Series. En ligne : https://ssrn.com/abstract=3161930 or http://dx.doi.org/10.2139/ssrn.3161930(consulté le 06 novembre 2018).

[8] Plus connue sous son appellation anglaise privacy by design and default, voir RGPD, art. 25.

[9] À propos de la migration des normes juridiques dans les dispositifs technologiques, consulter Elizabeth L. Eisenstein,The printing revolution in early modern Europe, Canto Classics ed, coll. Canto classics, Cambridge, Cambridge Univ. Press, 2012 ; LawrenceLessig, Code and other laws of cyberspace, New York, Basic Books, 1999; et les travaux de Gregory Lewkowicz et David Restrepo Amariles sur le tournant mathématiques du droit, en ligne : « https://www.crdp.umontreal.ca/nouvelles/2017/09/20/smart-law-le-tournant-mathematique-du-droit/ » (consulté le 07 novembre 2018).

[10] Préc., note 1, p. 255.

[11] Id., p. 276.

Ce contenu a été mis à jour le 26 février 2020 à 14 h 47 min.