Skip to main content
logo
Lancer la vidéo

Big data, la donnée c’est toi ! Quelques repères sur la connexion de nos subjectivités

Numéro 8 - 2016 par Thomas Lemaigre

décembre 2016

« Com­ment fonc­tionne inter­net, à l’attention de ceux qui n’y com­prennent rien, mais qui se disent quand même qu’il se passe là quelque chose d’important ? » Tel aurait pu être le titre de cet article. Un quart de l’humanité vibrionne sur ce réseau des réseaux. Inter­net est un conti­nent éco­no­mique, social et cultu­rel à part entière, où les rap­ports de force ont dia­mé­tra­le­ment chan­gé en un quart de siècle. En témoigne la mai­trise des don­nées sur les uti­li­sa­teurs : pour les cap­ter, les sto­cker et les trai­ter, fabri­quer inter­net revient désor­mais à doter nos sub­jec­ti­vi­tés de mul­tiples appa­reils connectés.

Dossier

« La dif­fi­cul­té, c’est de trans­mettre à chaque homme la sen­sa­tion que même au fond d’une cel­lule exigüe, il conserve une capa­ci­té de contrôle sur le monde qui est le sien », Gon­ça­lo M. Tava­rez1.

« We know where you are. We know where you’ve been. We can more or less know what you’re thin­king about », Eric Schmidt, ancien PDG de Google, 20102.

L’interconnexion d’une infi­ni­té d’ordinateurs, c’est la défi­ni­tion mini­male que l’on peut don­ner d’internet. Cette inter­con­nexion repose sur toutes sortes d’appareils : des câbles, des rou­teurs, des ordi­na­teurs dédi­ca­cés que l’on appel­le­ra des ser­veurs, éven­tuel­le­ment réunis en grand nombre dans des fermes comme le centre de don­nées ouvert par Google à Saint-Ghis­lain (Mons) depuis 2007. Et cette inter­con­nexion devient inter­ac­tion grâce à des lan­gages infor­ma­tiques, dont le plus visible est le HTTP, inven­té en 1992. C’est bien comme une com­bi­nai­son de machines et de lan­gages qu’internet est inven­té au tour­nant des décen­nies 1980 – 1990. Sans entrer dans les détails sur ces débuts, il est très ins­truc­tif de se deman­der dans quels ter­reaux cultu­rels ils se sont joués. Le pre­mier est sans doute l’armée amé­ri­caine, en quête d’avantages stra­té­giques avec un sys­tème de télé­com­mu­ni­ca­tions si décen­tra­li­sé qu’il res­te­rait fonc­tion­nel en cas de frappes nucléaires sovié­tiques. Le deuxième est la com­mu­nau­té scien­ti­fique qui y ins­tille ses valeurs : « coopé­ra­tion, répu­ta­tion entre pairs, auto­no­mie, gra­tui­té, consen­sus et liber­té de parole. […] Dépour­vue de centre, (leur) archi­tec­ture rend d’emblée dif­fi­cile le contrôle et vise à favo­ri­ser la connec­ti­vi­té et l’expansion du réseau » (Richard, 2015). Troi­sième milieu qui féconde l’imaginaire d’internet : un ensemble épars d’entrepreneurs et de tech­ni­ciens influen­cés par la contre­cul­ture post-hip­pie de la côte Ouest, à la fois radi­ca­le­ment indi­vi­dua­liste et liber­ta­rienne, atti­rée par la tech­no­lo­gie en tant que moyen d’émancipation en marge de la socié­té, pour peu qu’on par­vienne à la détour­ner et se l’approprier. Dans les années 1980 déjà, le numé­rique, c’était d’un côté l’informatique pro­prié­taire avec le lea­deur IBM, pre­mière firme à avoir tiré des pro­fits impor­tants de ces tech­no­lo­gies en met­tant sur le mar­ché les pre­miers PC, et de l’autre la nais­sance du logi­ciel libre et des licences qui en empêchent la pri­va­ti­sa­tion — celles-là mêmes qui ouvri­ront la voie aux crea­tive com­mons, alter­na­tive aux formes usuelles de pro­prié­té intel­lec­tuelle, jugées trop restrictives.

Cette généa­lo­gie com­po­site va struc­tu­rer l’histoire d’internet et les récits à son pro­pos, ten­dus entre ouver­ture et contrôle, liber­té et domi­na­tion, gra­tui­té et libre entre­prise ; elle est au cœur d’une dyna­mique de rap­ports de force entre ses acteurs et marque pour long­temps encore notre rap­port ambi­gu au numé­rique. C’est ce qu’illustrera notre chro­no­lo­gie au galop en ten­tant de lier trois niveaux de réa­li­tés : l’évolution des tech­niques, l’évolution des usages et l’évolution des dis­cours et des représentations.

Entre nouveau monde et nouvelle économie (1992 – 2000)

La pre­mière moi­tié des années 1990, inter­net reste domi­né par les cher­cheurs, les tech­ni­ciens et les artistes. On y navigue à l’aventure, en tra­çant son che­min de lien en lien et en sui­vant les recom­man­da­tions d’annuaires et autres por­tails com­pi­lés béné­vo­le­ment et plus ou moins spé­cia­li­sés. C’est aus­si par cour­rier élec­tro­nique qu’on s’échange les adresses de sites web. « L’imaginaire qui se met en place dans ces années-là est fon­da­men­ta­le­ment ambi­gu. Le cybe­res­pace peut être aus­si bien liber­taire que libé­ral » et se pense autour de termes comme la déma­té­ria­li­sa­tion, la réin­ven­tion conti­nue de soi, l’adaptation au chan­ge­ment, l’obsolescence des médias tra­di­tion­nels et de l’État, « entre révo­lu­tion et entre­prise, nou­veau monde et nou­velle éco­no­mie » (Richard, 2015).

Fon­da­trice, cette époque a encore une place de pre­mier plan dans la repré­sen­ta­tion que se fait tout un cha­cun d’internet. Mais elle sera brève. Entre 1997 et 2001, la pre­mière bulle spé­cu­la­tive gonfle autour des socié­tés qui ont déve­lop­pé de nou­velles offres et acti­vi­tés en ligne, depuis la libé­ra­li­sa­tion des noms de domaine «.com » en 1995. Cette période voit inter­net se restruc­tu­rer. Quelques sites com­mencent à concen­trer des volumes de tra­fic très impor­tants : cer­tains por­tails et les pre­miers moteurs de recherche (Alta­vis­ta). Le com­merce en ligne s’impose avec Ama­zon, AOL et Ebay. Ces socié­tés connaissent des capi­ta­li­sa­tions bour­sières records, tout comme quelques autres actives dans les logi­ciels (Nets­cape), la micro-infor­ma­tique (Intel) et les com­mu­ni­ca­tions en géné­ral (Alca­tel, Lucent, Cis­co), voire la pro­duc­tion de conte­nus (Viven­di). C’est aus­si dans cette ambiance que sont déré­gu­lés les mar­chés des télé­coms des pays de l’OCDE et pri­va­ti­sés ou auto­no­mi­sés les mono­poles his­to­riques, à l’instar de Bel­ga­com. L’accès aux capi­taux leur per­met, avec leurs concur­rents, de déve­lop­per et de démo­cra­ti­ser les réseaux à haut débit (ADSL et télé­dis­tri­bu­tion) et la télé­pho­nie mobile.

Beau­coup de monde se fait beau­coup d’argent grâce à inter­net, par­fois avec de très petites mises de départ, ce qui enflamme les fan­tasmes d’entrepreneurs de tout poil et nour­rit les ambi­tions d’acteurs des mar­chés finan­ciers comme les fonds d’investissement en capi­tal-risque. C’est la pre­mière bulle inter­net, qui finit par explo­ser avec le krach de mars 2000 : il n’est plus pos­sible aux entre­pre­neurs du web de répondre aux attentes de gains de leurs appor­teurs de capi­ta­li­sa­tion bour­sière ou leurs créanciers.

Nombre de nou­veaux ser­vices en ligne reposent bien­tôt sur une petite inven­tion : le cookie. Il s’agit d’un simple fichier texte qu’un site web dépose sur votre ordi­na­teur et qui va y res­ter plus ou moins long­temps. Quand vous repas­se­rez sur ce site, son cookie pour­ra, avant de se remettre à jour, lui rendre des infor­ma­tions, par exemple le conte­nu de votre panier d’achats pour un site de vente en ligne. Si l’idée de base est d’authentifier l’accès à votre compte et de flui­di­fier votre navi­ga­tion, par exemple en pré­rem­plis­sant des for­mu­laires en ligne, le cookie est un outil très puis­sant et très peu trans­pa­rent : non seule­ment il ren­seigne les entre­prises du web sur vous (don­nées per­son­nelles, numé­ro de carte de cré­dit, codes d’accès) et sur vos pra­tiques de navi­ga­tion (lieux et temps de connexion, maté­riel, autres pages visi­tées), mais il peut aus­si être dépo­sé dans votre machine par un site web que vous n’avez jamais visi­té (mais qui incruste de la publi­ci­té dans un site que vous visi­tez) — c’est cette tech­nique qui vous fait envoyer de la publi­ci­té ciblée. Si le cookie peut être un mou­chard très effi­cace avec les raf­fi­ne­ments tech­no­lo­giques qui se suc­cè­de­ront, ces cookies par­ti­cu­liers dits de tierce par­tie trans­forment vos sites pré­fé­rés en rien de moins que des détour­neurs de temps de connexion. Ils moné­tisent votre atten­tion, soit en louant à un tiers l’accès à votre ses­sion, soit en reven­dant à des inter­mé­diaires spé­cia­li­sés les don­nées col­lec­tées à votre sujet, le tout à votre insu. Ils trans­forment le face-à-face avec votre machine en deux choses : une mar­chan­dise et un acte qui n’a plus rien d’intime ou de dis­cret. De façon géné­rale, la gra­tui­té d’internet n’aura désor­mais plus rien de dés­in­té­res­sé : le ser­vice va être pen­sé comme un moyen de vendre de l’audience à des annonceurs.

Le désenchantement du web (2000 – 2007)

La décen­nie qui s’ouvre va voir au moins trois évo­lu­tions cru­ciales d’un inter­net qui n’est pas encore le fameux « web 2.0 » : la supré­ma­tie de Google, l’apparition des big data et le retour de l’État.

Google s’impose comme moteur de recherche à par­tir de 2000. Pour le socio­logue Domi­nique Car­don, il s’agit d’un chan­ge­ment de para­digme : inter­net fonc­tion­nait sur des logiques de popu­la­ri­té, avec des tech­niques de mesure d’audience simi­laires à celles de la presse tra­di­tion­nelle. Avec Google, il bas­cule dans une logique d’autorité. Le cri­tère de base, à l’instar des cita­tions dans la lit­té­ra­ture scien­ti­fique, est le nombre de liens qui pointent vers un site web. Telle est la clé de l’un des plus fameux algo­rithmes : le page­rank, qui cal­cule l’ordre d’affichage des résul­tats d’une requête. D’autres cri­tères du même type sont pris en compte, notam­ment en enre­gis­trant et en trai­tant les mil­liards de requêtes reçues. Google va vite diver­si­fier ses ser­vices pour deve­nir l’acteur domi­nant d’internet (car­to­gra­phie, cour­riel, pub, blogs, agen­da, tra­duc­tion et mesure d’audience, c’est-à-dire accès aux don­nées de tra­fic d’innombrables sites tiers). Google, sui­vi par d’autres, s’est en réa­li­té tôt mis à trai­ter des énormes quan­ti­tés de don­nées sur ses uti­li­sa­teurs pour per­son­na­li­ser les pages que ses sites affichent et les liens publi­ci­taires qu’elles leur pro­pulsent sous les yeux.

Cette évo­lu­tion favo­rise et est atti­sée par une accé­lé­ra­tion spec­ta­cu­laire, autour de 2002, des capa­ci­tés de sto­ckage de l’information, de la puis­sance des pro­ces­seurs et de la dimi­nu­tion de leurs prix. Tout peut désor­mais être sto­cké et trai­té. À ces res­sources, Google ajoute deux atouts de taille en matière de qua­li­té des don­nées : la gra­tui­té de leur cap­ta­tion et leur diver­si­té. Les big data seront désor­mais cen­traux dans le fonc­tion­ne­ment d’internet, bas­cu­le­ment dis­cret qui n’est por­té à la connais­sance du public qu’à postériori.

Troi­sième tour­nant impor­tant : l’arrivée de l’État sur la scène inter­net dans la fou­lée des atten­tats du 11 sep­tembre 2001. Le Patriot Act d’octobre 2001 ouvre aux admi­nis­tra­tions amé­ri­caines des faci­li­tés juri­diques et des bud­gets consi­dé­rables pour sur­veiller les com­mu­ni­ca­tions, au point qu’il fau­dra plus de dix ans pour qu’on se rende compte des pro­por­tions que cette acti­vi­té a prises. Ici aus­si, les big data sont un enjeu cen­tral et plus que dis­cret alors que les usages d’internet conti­nuent à se démo­cra­ti­ser et à se banaliser.

Keep smiling (2007-aujoud’hui)

Une nou­velle forme d’interaction en réseau, très décen­tra­li­sée, s’était ins­tal­lée et bana­li­sée au début de la décen­nie 2000 avec Naps­ter et les appli­ca­tions d’échange pair-à-pair de fichiers mul­ti­mé­dias. Il s’agissait ici d’échapper à la fois au mar­ché et à l’État, au droit d’auteur et aux agences sup­po­sées le faire res­pec­ter. Cette nou­velle uti­li­sa­tion des réseaux va très vite désta­bi­li­ser les indus­tries cultu­relles et être inter­dite (Hado­pi, par exemple). Sans avoir d’effet mas­sif, ces inter­dic­tions ouvrent la voie à une éco­no­mie pirate en ligne, d’un côté, et, de l’autre, incitent de nou­veaux acteurs éco­no­miques à récu­pé­rer ces logiques de par­tage et de com­mu­nau­tés dans des entre­prises mar­chandes. Entre uto­pies liber­ta­riennes, contrôle et — encore — liber­té d’entreprise.

On l’a com­pris, c’est la nais­sance des réseaux sociaux, avec le pre­mier d’entre eux, Face­book, qui, à par­tir de 2007, se répand comme une trai­née de poudre au-delà des États-Unis. Ici, tou­jours selon Car­don, appa­rait une troi­sième géné­ra­tion d’algorithmes : ceux qui pro­duisent de la répu­ta­tion. Ce à quoi l’on porte atten­tion acquiert de la valeur et cette valeur per­met d’attirer l’attention. Tout cela se cal­cule, tou­jours de façon invi­sible, pour sus­ci­ter un maxi­mum de pas­sages à l’acte (clics, likes et autres) per­met­tant de cap­ter un maxi­mum de don­nées. L’exemple par excel­lence de ce type de dis­po­si­tif est l’algorithme de recom­man­da­tion de sites comme Ama­zon : si vous ache­tez tel ouvrage, il vous en pro­pose trois ou quatre autres, ceux qui ont éga­le­ment été ven­dus à l’acheteur du pre­mier ouvrage. Si vous avez consul­té telle et telle autre page juste avant, le choix qui vous est pro­po­sé sera encore plus poin­tu… et infaillible.

Les réseaux sociaux sont le fer de lance d’une évo­lu­tion plus large, celle du web 2.0 : les tech­niques d’édition de pages html et de com­mu­ni­ca­tion entre sites inter­net per­mettent désor­mais de mettre en scène des pos­si­bi­li­tés d’inter­action autour des conte­nus en ligne. On passe de flux d’information essen­tiel­le­ment à sens unique à un inter­net pen­sé et uti­li­sé comme un véri­table espace de socia­li­sa­tion. Et de nou­veau, chaque inter­ac­tion pro­duit de la donnée.

Ce bas­cu­le­ment est sou­te­nu par la vague d’objets nomades qui déferle sur les mar­chés, avec, par exemple, l’Iphone 3G d’Apple lan­cé mi-2008. Ces appa­reils sont acces­sibles par­tout et tout le temps et per­mettent des inter­ac­tions en ligne beau­coup plus convi­viales. Le smart­phone n’est en effet rien d’autre qu’un minus­cule ordi­na­teur, connec­té à inter­net et inté­gré à un télé­phone por­table com­plé­té par des sys­tèmes de prise de vue (pho­to et vidéo), de géo­lo­ca­li­sa­tion (GPS) et autres. Très vite naissent des tas de variantes (Ipod, tablettes, etc.), mais sur­tout une énorme diver­si­té d’applications, ces petits logi­ciels per­met­tant d’activer une offre de ser­vice en ligne. Il en résulte une aug­men­ta­tion spec­ta­cu­laire des temps d’utilisation et du tra­fic, et donc des volumes de don­nées échan­gées — cap­tées — et de leur varié­té. Il se vend aujourd’hui plus d’un mil­liard de smart­phones par an et toutes les « apps » qu’on peut y ins­tal­ler ne sont dis­po­nibles que sur… trois pla­te­formes (Itunes d’Apple, Goo­gle­play et le Store de Micro­soft). Cha­cun de nous ayant plu­sieurs points d’accès à inter­net, il stocke de plus en plus ses don­nées en ligne plu­tôt que dans la mémoire des appa­reils — vous avez recon­nu ce qu’on appelle le cloud, le nuage, en clair les ser­veurs de ces mêmes mul­ti­na­tio­nales… qui ne doivent même plus se don­ner la peine de venir cher­cher vos don­nées chez vous.

Tous ces flux de don­nées sont de mieux en mieux moné­ti­sés par des inter­mé­diaires spé­cia­li­sés et très dis­crets. Par exemple, la page d’accueil du site du jour­nal Le Soir vous connecte à au moins dix-huit autres sites ou ser­veurs tiers3, soit autant d’entreprises qui vont trans­for­mer en mar­chan­dise votre géné­reux et inno­cent pas­sage. La mar­chan­di­sa­tion de la culture, dénon­cée dans les années 1980 par les oppo­sants à la publi­ci­té à la télé­vi­sion, appa­rait rétros­pec­ti­ve­ment comme de bien inno­centes semonces…

Big Brother is hijacking you

La crise des sub­primes de 2008 ne met­tra pas de frein à l’évolution d’internet. Au début de la décen­nie 2010, la quan­ti­té et la varié­té des conte­nus qui y cir­culent sont inéga­lées, les « tuyaux » qui les véhi­culent ont des capa­ci­tés jamais atteintes (norme 4G de débit des don­nées de télé­pho­nie mobile, fibre optique) et l’écosystème éco­no­mique lié est extrê­me­ment concen­tré autour de quelques mul­ti­na­tio­nales de droit amé­ri­cain — on parle désor­mais des Gafam (Google, Ama­zon, Face­book, Apple, Micro­soft) comme d’un quasi-cartel.

Avec l’économie de pla­te­forme que génèrent les appli­ca­tions de tout poil, les impacts d’internet sur la vie quo­ti­dienne sont de plus en plus visibles (Szoc, 2015). Airbnb et l’hôtellerie, Uber et le trans­port de per­sonnes, etc., tous ont des impacts éco­no­miques qui se mettent à mar­quer direc­te­ment les ter­ri­toires. Inter­net n’est plus un monde à part, soi-disant vir­tuel. Les jeux vidéo, les logi­ciels péda­go­giques, les liseuses, les chat­bots (voir la nou­velle « Ma femme 3.0 » dans la rubrique « Ita­lique »), struc­turent la vie quo­ti­dienne de conci­toyens chaque jour plus nom­breux. Les don­nées qui cir­culent ne se limitent plus à votre iden­ti­té ou vos temps de connexion : il s’agit aus­si de votre san­té, votre car­rière, votre pou­voir d’achat et vos consom­ma­tions, vos dépla­ce­ments, vos centres d’intérêt, vos opi­nions, votre réseau de rela­tions. Et cette numé­ri­sa­tion du quo­ti­dien n’a même pas encore pris sa véri­table dimen­sion puisque la fin de la décen­nie ver­ra vrai­sem­bla­ble­ment l’essor des objets connec­tés à inter­net : jouets, vête­ments, domo­tique, véhi­cules, drones, etc. Déjà votre télé­vi­seur trans­met des don­nées sur ce que vous regar­dez, mais en plus, pour peu qu’il soit équi­pé d’une com­mande vocale, il trans­met aus­si des enre­gis­tre­ments de votre voix — afin d’améliorer sans cesse les logi­ciels de recon­nais­sance vocale, bien sûr… (Manise, 2016). « À la limite, pour­quoi déve­lop­per des tech­niques de sur­veillance directe […]? On n’aurait plus qu’à col­ler son oreille sur la coquille élec­tro­nique et à écou­ter le son de l’océan des don­nées » (Cha­mayou, 2015).

On n’est plus très loin des « télé­crans » de 1984 d’Orwell, mais avec plu­sieurs dimen­sions en plus : ce n’est pas Big Bro­ther qui vous a impo­sé l’omniprésence de l’appareil, c’est vous qui l’avez ache­té ; per­sonne ne vous oblige à lire en ligne tel quo­ti­dien, mais per­sonne ne l’oblige non plus à vous dire à com­bien de « par­te­naires » il pro­pose de cap­ter votre temps de navi­ga­tion. Le tout dans la convi­via­li­té, la même que dans les shows télé­vi­sés qui servent à vendre votre « temps de cer­veau » à telle ou telle marque. Bref, le cau­che­mar d’Orwell sans doute, mais aus­si celui de Guy Debord, pour­fen­deur de la publi­ci­té et de la socié­té du spec­tacle4. Sans oublier une ultime couche, plus pré­oc­cu­pante encore, celle des biais plus ou moins inten­tion­nels intro­duits en toute opa­ci­té dans notre per­cep­tion du monde ain­si appa­reillée, comme on com­mence à peine à l’entrevoir avec les tra­vaux de Cit­ton, Stie­gler ou Rou­vroy (Point­Cul­ture, 2016 — voir les autres contri­bu­tions de ce dossier).

Tout va donc bien dans un monde de par­ti­ci­pa­tion et de par­tage, les sou­ris cliquent, les ser­veurs chauffent, les capi­taux se concentrent et sont géné­reu­se­ment rému­né­rés5. On se ras­sure en se disant que les don­nées col­lec­tées sont si foi­son­nantes que nul n’est capable de les trai­ter, ou alors si mal (Cha­mayou, 2015). Un quart de la popu­la­tion mon­diale uti­lise inter­net. Le consom­ma­teur conscien­ti­sé, lui, peut tou­jours modi­fier les réglages par défaut de ses appli­ca­tions pour se pro­té­ger de la publi­ci­té ou navi­guer dis­crè­te­ment. Et les uto­pistes, les liber­ta­riens ou les défen­deurs des com­muns conquièrent eux aus­si de nou­veaux ter­ri­toires, avec l’encyclopédie col­la­bo­ra­tive Wiki­pe­dia, le site Wiki­leaks qui sert de por­te­voix et de cou­ver­ture aux lan­ceurs d’alertes, ou encore le Bit­coin et les mon­naies sans auto­ri­té d’émission6.

Tout va bien… jusqu’au 6 juin 2013, jour où com­mence un nou­veau retour­ne­ment. Le lan­ceur d’alerte Edward Snow­den se met à dis­til­ler dans la presse des docu­ments clas­si­fiés à pro­pos des dis­po­si­tifs de sur­veillance des com­mu­ni­ca­tions élec­tro­niques des États-Unis et du Royaume-Uni. On savait depuis le Patriot Act que de tels dis­po­si­tifs exis­taient, et avaient déjà don­né des résul­tats tant sur le ter­ri­toire amé­ri­cain que sur des théâtres d’opérations exté­rieures (Pakis­tan). On savait qu’«On ne sur­veille pas les ter­ro­ristes pré­su­més, on sur­veille tout le monde dans l’hypothèse où se cache­rait un ter­ro­riste dans la foule » (Cam­pion, 2013). Mais ce qui frappe, c’est plu­tôt l’incroyable ser­vi­li­té des mul­ti­na­tio­nales, Gafam et autres, qui déve­loppent les appli­ca­tions en ligne, celles qui four­nissent les accès à inter­net et celles qui pos­sèdent ses infra­struc­tures (Pes­not, 2014). L’exemple le plus frap­pant est celui des portes déro­bées, des mor­ceaux de pro­gramme ins­tal­lés secrè­te­ment dans des logi­ciels (par exemple de ges­tion de rou­teurs ou de chif­fre­ment) pour trans­mettre les infor­ma­tions de ses uti­li­sa­teurs, en temps réel et sans inter­mé­diaire, à des agences de ren­sei­gne­ment. Un autre ensei­gne­ment des révé­la­tions de Snow­den concerne les nou­velles méthodes de trai­te­ment des don­nées col­lec­tées. Que l’on soit une mul­ti­na­tio­nale du web ou un ser­vice de ren­sei­gne­ment, il y a moyen de prendre d’immenses quan­ti­tés de don­nées et de les trai­ter pour en faire émer­ger des récur­rences ou des « signa­tures ». C’est ce que l’on appelle l’apprentissage pro­fond ou l’apprentissage semi-super­vi­sé par la machine7 — tout l’inverse de ce que vous avez appris en matière de cal­cul de pro­ba­bi­li­tés dans vos pre­mières années d’université, où il fal­lait tou­jours par­tir d’hypothèses, bref com­men­cer par savoir ce que l’on cher­chait. Ici, ce sont ces algo­rithmes, que Car­don appelle pré­dic­tion­nels, qui vont pro­duire des ana­lyses de la réa­li­té à par­tir de don­nées brutes, et affi­ner leurs propres règles en fonc­tion de ce qu’ils découvrent.

C’est une évo­lu­tion récente, appa­rue cette décen­nie et pas encore arri­vée à matu­ri­té. C’est sur­tout un nou­veau moment de bas­cule dans la nature même d’internet puisque se démul­ti­plient par là les usages et la valeur que l’on peut tirer des big data cap­tés. Bref, alors qu’internet s’est orga­ni­sé comme une vaste machine de sur­veillance publique et pri­vée, que le pou­voir s’y est concen­tré à outrance, en Europe conti­nen­tale pas moins qu’ailleurs, l’évolution des tech­no­lo­gies et des usages dote les acteurs domi­nants d’outils de mai­trise de l’information qui désor­mais dépassent lit­té­ra­le­ment l’entendement.

Face à tout cela, le web busi­ness conti­nue comme depuis un quart de siècle, ce qui n’est pas sans poser de pro­fondes ques­tions sur la (dé)mobilisation des consciences chez nos contem­po­rains. Heu­reu­se­ment, contre­pro­po­si­tions et contre­pou­voirs se mul­ti­plient, certes tra­ver­sés par les ten­sions congé­ni­tales d’internet que nous avons effleu­rées. Les logiques soli­daires et non mar­chandes com­mencent elles aus­si à se nour­rir des big data et trouvent dans inter­net de quoi se réin­ven­ter et faire mou­ve­ment — sans avoir encore trou­vé d’effets de seuil.

  1. Apprendre à prier à l’ère de la tech­nique, éd. Viviane Hamy, 2010 (trad. D. Nédellec).
  2. « Nous savons où vous êtes. Nous savons où vous êtes allé. Nous pou­vons à peu près savoir ce que vous pen­sez », inter­view vidéo du 4 octobre 2010.
  3. |Cha­cun peut faci­le­ment rem­pla­cer son navi­ga­teur pro­prié­taire (Chrome, Safa­ri ou Explo­rer) par le pro­gramme libre Fire­fox, qui per­met d’installer des modules com­plé­men­taires comme Ghos­te­ry ou Ublock Ori­gin, qui per­mettent de détec­ter ou d’empêcher ces inter­ac­tions non sollicitées.
  4. Dès les années 1960, Debord refor­mule la théo­rie mar­xiste à la lumière des médias de masse et de l’industrialisation de la culture, et cherche les formes de résis­tance pos­sible à ces nou­velles formes de dis­pa­ri­tion du sujet.
  5. On pour­rait ici noyer le lec­teur sous un tor­rent de chiffres illus­trant la dimen­sion finan­cière indis­pen­sable aux évo­lu­tions décrites. Il suf­fit de rele­ver l’évolution de la valeur de mar­ché des actions en cir­cu­la­tion de Google : en dix ans (2004 – 2014), elle a aug­men­té de 1294 %. La per­sonne qui aurait inves­ti 1000 $ dans ces actions au moment de leur intro­duc­tion en Bourse le 19 aout 2004 se trou­vait dix ans plus tard avec 13945 $!
  6. Sans oublier les makers. Voir l’article épo­nyme de Lio­nel Maes, La Revue nou­velle, n° 5, 2015.
  7. Voir un exemple de manuel dans les docu­ments publiés par Snow­den, le « Data Mining Research Pro­blem Book » des ser­vices anglais (2011).

Thomas Lemaigre


Auteur

Thomas Lemaigre est économiste et journaliste. Il opère depuis 2013 comme chercheur indépendant, spécialisé sur les politiques sociales et éducatives, ainsi que sur les problématiques socio-économiques régionales. Il exerce également des activités de traduction NL>FR et EN>FR. Il est co-fondateur de l'Agence Alter, éditrice, entre autres, du mensuel {Alter Echos}, qu'il a dirigée jusqu'en 2012. Il enseigne ou a enseigné dans plusieurs Hautes écoles sociales (HE2B, Helha, Henallux).