Siège de la NSA

Une opportunité pour la France dans l’économie de l’innovation

Dossier : BIG DATAMagazine N°693 Mars 2014
Par Paul HERMELIN

Une révolution pour nos sociétés

Le monde crée aujourd’hui en deux jours autant de don­nées que toute l’humanité en a créées pen­dant deux mille ans. C’est l’avènement des big data qui émergent sous nos yeux en com­bi­nant trois carac­té­ris­tiques : volume, vitesse, variété.

  • Le volume des don­nées géné­rées aug­mente de 30 % à 40 % chaque année.
  • Les vitesses de trai­te­ment sont proches aujourd’hui de l’instantané dans de nom­breux cas (notam­ment dans le com­merce en ligne).
  • La varié­té des don­nées s’est for­te­ment accrue ; celles-ci sont issues de sources tou­jours plus nombreuses.

La mul­ti­pli­ca­tion des équi­pe­ments (smart­phones, cap­teurs divers) et des oppor­tu­ni­tés de créa­tion de don­nées (blogs, réseaux sociaux) créent une richesse et une com­plexi­té des don­nées croissantes.

REPÈRES

En avril 1812 les « luddites », des artisans tisserands, attaquent une fabrique de draps dans le Yorkshire en Angleterre. C’est le premier conflit industriel violent de notre temps, qui opposa artisans de l’ancien monde et nouveaux industriels. Au cours du siècle qui suivit, la révolution industrielle du Royaume-Uni puis celle du monde entier procurèrent à l’homme une prospérité matérielle inconnue jusqu’alors. Bien sûr, cette révolution ne se déroula pas sans heurt, tandis qu’elle engendrait une transformation fondamentale des métiers et des activités humaines.
Nous sommes à l’aube d’une telle révolution, et la responsabilité incombe au politique d’agir sans attendre pour gérer au mieux la transition sociétale qui s’ouvre devant nous.

Un « thesaurus » de milliards de données

Il y a long­temps, on pre­nait les don­nées et on les met­tait dans des registres, dans des bases de données.

Le volume des données générées augmente de 30 à 40% chaque année

Main­te­nant, on exploite toutes les don­nées que laisse l’utilisateur dans l’infosphère, en uti­li­sant son télé­phone por­table, en se connec­tant à un site Web, en payant ses achats, etc. On récu­père ain­si des mil­liards de don­nées, qui deviennent un « the­sau­rus » de don­nées don­nant des indi­ca­tions sur ce que les gens font, sur ce que les gens ont envie de faire, peut-être aus­si ce qu’ils veulent évi­ter de faire.

Cela pose des pro­blèmes d’anonymat à l’évidence, mais c’est un maté­riau très riche qu’il nous faut exploi­ter pour créer de la valeur en France et pour la France.

Naissance de nouvelles technologies

Les tech­no­lo­gies sont prêtes pour exploi­ter les don­nées recueillies en masses consi­dé­rables et dans des for­mats tou­jours plus variés. Ce sont ain­si de nou­veaux modes de « ran­ge­ment » ou de visualisation.

Lutter contre la fraude

Le groupement Visa estime aujourd’hui déjouer deux milliards de dollars de tentatives de fraude par an. De 40 critères en 2005, Visa est passé à 500 critères aujourd’hui. Et les big data ont marqué la fin de l’échantillonnage : désormais, 100% des transactions sont analysées, contre 2% en 2005.

Google a jeté les bases d’un sys­tème de fichiers dis­tri­bué qui a ins­pi­ré la mise au point de Hadoop et MapRe­duce, tech­no­lo­gies sous l’égide de la Fon­da­tion Apache per­met­tant de répar­tir le trai­te­ment des don­nées struc­tu­rées ou semi-struc­tu­rées sur de mul­tiples ser­veurs à bas coûts.

D’autres solu­tions de big data sont appa­rues, comme les bases dites NoS­QL, dont la par­ti­cu­la­ri­té est d’aller au-delà des limites impo­sées par le SQL, le lan­gage stan­dard d’interrogation des bases de don­nées struc­tu­rées (NoS­QL signi­fiant Not only SQL, soit « pas seule­ment SQL »).

D’autres solu­tions orien­tées temps réel ont aus­si fait leur appa­ri­tion, et notam­ment la tech­no­lo­gie dite « SAP HANA », qui per­met le trai­te­ment des don­nées en ins­tan­ta­né grâce à un sto­ckage en mémoire (In Memo­ry) plu­tôt que sur un disque. Ces dif­fé­rentes tech­no­lo­gies repré­sentent des réponses à l’évolution des besoins fonc­tion­nels des entreprises.

Cinq enjeux pour les entreprises

Les enjeux des big data peuvent être consi­dé­rés selon cinq angles d’approche possibles.

  • La pre­mière approche consiste à affi­ner les ana­lyses stra­té­giques, en four­nis­sant des élé­ments ana­ly­tiques inac­ces­sibles aupa­ra­vant – notam­ment en consi­dé­rant les phé­no­mènes non plus sous une forme moyenne mais en tenant compte de leur diversité.
  • Une deuxième approche est fon­dée sur l’amélioration des pro­ces­sus coeur de métier. Par exemple, les opé­ra­teurs du sec­teur des télé­com­mu­ni­ca­tions ont là des outils pour réduire le taux de déper­di­tion sur leur base de clients.
  • Une troi­sième approche est celle qui vise à accé­lé­rer la prise de (meilleures) déci­sions grâce à de nou­veaux sys­tèmes d’information d’entreprises (par exemple le pri­cing dyna­mique en temps réel des pro­duits de grande consommation).
  • Une qua­trième approche vise à exploi­ter l’évolution de la chaîne de valeur d’une indus­trie sous l’effet des don­nées via la trans­for­ma­tion du busi­ness model exis­tant. C’est le cas de l’intermédiation des hôte­liers déve­lop­pée par Booking.com.
  • Enfin, une der­nière approche est la créa­tion de reve­nus entiè­re­ment nouveaux.
Le siège de la NSA (Fort George G. Meade, Mary­land). L’affaire Snow­den a ser­vi de révé­la­teur.© REUTERS
Data center de la NSA
Data cen­ter de la NSA (Bluff­dale, Utah). Sa capa­ci­té est esti­mée à 1 yot­ta­bytes soit 1 000 mil­liards de terrabytes

Un rôle particulier pour la France

Com­ment mettre ces don­nées intel­li­gentes au ser­vice du pro­grès et de la crois­sance ? Com­ment les exploi­ter tout en res­pec­tant la vie pri­vée ? Je porte sur ce sujet à la fois le regard d’un acteur des big data à qui le gou­ver­ne­ment a confié la coor­di­na­tion d’un plan indus­triel sur le sujet, et le regard d’un consom­ma­teur et d’un citoyen.

Le mar­ché des big data, au sens le plus strict du terme (c’est-à-dire la vente de logi­ciels ou de ser­vices spé­cia­li­sés), est esti­mé en France à envi­ron 500 mil­lions d’euros par an aujourd’hui, et près de 2 mil­liards d’ici trois ans.

Innovation publicitaire

Criteo, une start-up française fondée en 2008 désormais cotée au Nasdaq, est aujourd’hui leader devant Google du « reciblage publicitaire ».
Par exemple, Criteo offre aux sites marchands du Web la possibilité d’adresser un message personnalisé aux internautes qui quittent leur site sans faire d’achats, afin de les faire revenir sur le site.

Mais cela n’est que la (toute petite) pointe de l’iceberg. Le véri­table enjeu est ailleurs : il est dans la trans­for­ma­tion numé­rique des entre­prises et de notre socié­té. Trans­for­ma­tion qui se pro­dui­ra de toute façon, soit volon­tai­re­ment, soit contrainte et forcée.

Repre­nons l’exemple de l’hôtellerie en France : elle repré­sente envi­ron 185 000 emplois directs. Or Booking.com capte 23 % des reve­nus hôte­liers pour toute réser­va­tion faite via son inter­mé­diaire. En fai­sant l’hypothèse (certes un peu sim­pliste), de la pro­por­tion­na­li­té entre reve­nus et emplois directs, 42 000 emplois seraient direc­te­ment mena­cés. Aujourd’hui, Booking.com réfé­rence 420 000 hôtels dans le monde (alors que la France compte au total un peu moins de 17 000 hôtels) et a une part de mar­ché de 70% sur les réser­va­tions online en France.

Mobiliser informaticiens et mathématiciens

100% des métiers du marketing direct touchés par les big data

La pre­mière révo­lu­tion indus­trielle a vu notre socié­té deve­nir un monde d’usines. Le monde de demain sera un monde de pla­te­formes. Lors de la pre­mière révo­lu­tion indus­trielle, c’est l’éducation des masses qui per­mit de trai­ter le pro­blème des rup­tures des métiers, et qui fit pas­ser en deux siècles notre socié­té d’une situa­tion où 75% des tra­vailleurs étaient dans les champs, à 2% aujourd’hui. De nom­breux métiers actuels vont dis­pa­raître dans les décen­nies à venir. Mais de nom­breux nou­veaux métiers vont apparaître.

Or, la France pos­sède un atout unique par rap­port à ces nou­veaux modèles : son sys­tème édu­ca­tif. Infor­ma­ti­ciens et mathé­ma­ti­ciens fran­çais sont plé­bis­ci­tés dans le monde. Les big data, c’est l’alliance de ces deux dis­ci­plines. Là doit por­ter l’effort de notre pays, pour construire un avan­tage concur­ren­tiel, créer de nou­veaux Cri­teo, et gagner la bataille mon­diale des big data.

Aider les entreprises à accélérer

Une carte bancaire
La lutte contre la fraude fait de plus en plus appel aux big data© iStock

Deux contraintes majeures pèsent aujourd’hui sur l’essor des big data : la dis­po­ni­bi­li­té des res­sources humaines d’un nou­veau type – nom­mées data scien­tist –, et les règles de mani­pu­la­tion des don­nées, héri­tées d’un monde où les réseaux sociaux n’existaient pas.

Concer­nant la for­ma­tion, les fon­de­ments sont là, grâce à l’esprit même de notre sys­tème édu­ca­tif. Mais l’État doit aug­men­ter dès la ren­trée 2014 les contin­gents de spé­cia­listes, pour four­nir à l’industrie hi-tech fran­çaise des res­sources, rares dans le monde entier, qui leur per­met­tront d’aller plus vite, plus loin que leurs concur­rents internationaux.

Revisiter la loi Informatique et Libertés

Sur l’aspect régle­men­taire, nous vivons aujourd’hui avec des prin­cipes, for­ma­li­sés dans le cadre de la loi Infor­ma­tique et Liber­tés de 1978. Récem­ment, l’affaire Snow­den a confir­mé la néces­saire pru­dence dont nos socié­tés doivent faire preuve dès lors qu’il s’agit d’autoriser (ou non) l’usage des don­nées informatiques.

Une révolution multiforme

De nombreux secteurs ont été, ou sont en train d’être révolutionnés. Les majors du disque disparaissent au profit des plateformes de streaming comme Deezer ou Spotify. Les agences de voyages disparaissent au profit de Booking.com ou Expedia. Demain, les assureurs verront Google débarquer dans leur pré carré.
Toutes les industries traitant des clients finals évoluent vers une intermédiation par de nouveaux acteurs, Google étant le premier d’entre eux.

Mais ne fau­drait-il pas revi­si­ter ces prin­cipes, au risque sinon de prendre du retard sur les pays qui, eux, ne s’embarrassent pas de telles pré­cau­tions ? Bien sûr, il ne s’agit pas d’ouvrir les don­nées à tous vents sans contrôles ni contreparties.

Il s’agirait plu­tôt d’adopter une démarche d’expérimentation, fon­dée sur la notion de réci­pro­ci­té, et qui per­met­trait à nos start-ups d’exprimer toute leur créa­ti­vi­té et de pou­voir conqué­rir le monde.

Un levier de croissance

Le monde de demain sera un monde de plateformes

Les big data sont plus que nais­sants, mais ils ne forment pas encore un mar­ché struc­tu­ré. Je consi­dère qu’ils consti­tuent une chance for­mi­dable pour notre pays de repar­tir de plain-pied dans l’économie de l’innovation. C’est un levier de crois­sance majeur.

L’État doit aider nos entre­prises à accé­lé­rer, en menant des actions fortes de for­ma­tion. Et par ailleurs enga­ger sans attendre la réflexion sur l’évolution de notre cadre réglementaire.

Commentaire

Ajouter un commentaire

Tru Dô-Khac répondre
21 mars 2014 à 9 h 21 min

MOOC d’en­tre­prise pour for­mer les ingé­nieurs au big data

Cher camarade,

C’est avec un inté­rêt par­ti­cu­lier que j’ai lu votre article sur lequel je conviens sur bien des points.
Pour for­mer les ingé­nieurs mathé­ma­ti­ciens et infor­ma­ti­ciens big data atten­dus par les entre­prises, les MOOC uni­ver­si­taires seront sans doute un levier impor­tant. Ain­si les trois pre­miers MOOC de l’X (une Intro­duc­tion aux Pro­ba­bi­li­tés, théo­rie des dis­tri­bu­tions , concep­tion et mise en oeuvre d’al­go­rithmes) ont per­mis d’a­dres­ser des pré­re­quis à la mise en œuvre des big data.

En plus de la maî­trise de ces savoirs fon­da­men­taux et tech­niques de l’in­gé­nieur, il faut des méthodes.

Sur ce point, les entre­prises pour­raient, avec les MOOC d’en­tre­prise, appor­ter leur contri­bu­tion tout en valo­ri­sant leur marque employeur.

Bien cordialement

Tru Dô-Khac

Répondre