Siège de la NSA

Une opportunité pour la France dans l’économie de l’innovation

Dossier : BIG DATAMagazine N°693 Mars 2014
Par Paul HERMELIN

Une révolution pour nos sociétés

Le monde crée aujourd’hui en deux jours autant de don­nées que toute l’humanité en a créées pen­dant deux mille ans. C’est l’avènement des big data qui émer­gent sous nos yeux en com­bi­nant trois car­ac­téris­tiques : vol­ume, vitesse, variété.

  • Le vol­ume des don­nées générées aug­mente de 30 % à 40 % chaque année.
  • Les vitesses de traite­ment sont proches aujourd’hui de l’instantané dans de nom­breux cas (notam­ment dans le com­merce en ligne).
  • La var­iété des don­nées s’est forte­ment accrue ; celles-ci sont issues de sources tou­jours plus nombreuses.

La mul­ti­pli­ca­tion des équipements (smart­phones, cap­teurs divers) et des oppor­tu­nités de créa­tion de don­nées (blogs, réseaux soci­aux) créent une richesse et une com­plex­ité des don­nées croissantes.

REPÈRES

En avril 1812 les « luddites », des artisans tisserands, attaquent une fabrique de draps dans le Yorkshire en Angleterre. C’est le premier conflit industriel violent de notre temps, qui opposa artisans de l’ancien monde et nouveaux industriels. Au cours du siècle qui suivit, la révolution industrielle du Royaume-Uni puis celle du monde entier procurèrent à l’homme une prospérité matérielle inconnue jusqu’alors. Bien sûr, cette révolution ne se déroula pas sans heurt, tandis qu’elle engendrait une transformation fondamentale des métiers et des activités humaines.
Nous sommes à l’aube d’une telle révolution, et la responsabilité incombe au politique d’agir sans attendre pour gérer au mieux la transition sociétale qui s’ouvre devant nous.

Un « thesaurus » de milliards de données

Il y a longtemps, on pre­nait les don­nées et on les met­tait dans des reg­istres, dans des bases de données.

Le volume des données générées augmente de 30 à 40% chaque année

Main­tenant, on exploite toutes les don­nées que laisse l’utilisateur dans l’infosphère, en util­isant son télé­phone portable, en se con­nec­tant à un site Web, en payant ses achats, etc. On récupère ain­si des mil­liards de don­nées, qui devi­en­nent un « the­saurus » de don­nées don­nant des indi­ca­tions sur ce que les gens font, sur ce que les gens ont envie de faire, peut-être aus­si ce qu’ils veu­lent éviter de faire.

Cela pose des prob­lèmes d’anonymat à l’évidence, mais c’est un matéri­au très riche qu’il nous faut exploiter pour créer de la valeur en France et pour la France.

Naissance de nouvelles technologies

Les tech­nolo­gies sont prêtes pour exploiter les don­nées recueil­lies en mass­es con­sid­érables et dans des for­mats tou­jours plus var­iés. Ce sont ain­si de nou­veaux modes de « range­ment » ou de visualisation.

Lutter contre la fraude

Le groupement Visa estime aujourd’hui déjouer deux milliards de dollars de tentatives de fraude par an. De 40 critères en 2005, Visa est passé à 500 critères aujourd’hui. Et les big data ont marqué la fin de l’échantillonnage : désormais, 100% des transactions sont analysées, contre 2% en 2005.

Google a jeté les bases d’un sys­tème de fichiers dis­tribué qui a inspiré la mise au point de Hadoop et MapRe­duce, tech­nolo­gies sous l’égide de la Fon­da­tion Apache per­me­t­tant de répar­tir le traite­ment des don­nées struc­turées ou semi-struc­turées sur de mul­ti­ples serveurs à bas coûts.

D’autres solu­tions de big data sont apparues, comme les bases dites NoSQL, dont la par­tic­u­lar­ité est d’aller au-delà des lim­ites imposées par le SQL, le lan­gage stan­dard d’interrogation des bases de don­nées struc­turées (NoSQL sig­nifi­ant Not only SQL, soit « pas seule­ment SQL »).

D’autres solu­tions ori­en­tées temps réel ont aus­si fait leur appari­tion, et notam­ment la tech­nolo­gie dite « SAP HANA », qui per­met le traite­ment des don­nées en instan­ta­né grâce à un stock­age en mémoire (In Mem­o­ry) plutôt que sur un disque. Ces dif­férentes tech­nolo­gies représen­tent des répons­es à l’évolution des besoins fonc­tion­nels des entreprises.

Cinq enjeux pour les entreprises

Les enjeux des big data peu­vent être con­sid­érés selon cinq angles d’approche possibles.

  • La pre­mière approche con­siste à affin­er les analy­ses stratégiques, en four­nissant des élé­ments ana­ly­tiques inac­ces­si­bles aupar­a­vant – notam­ment en con­sid­érant les phénomènes non plus sous une forme moyenne mais en ten­ant compte de leur diversité.
  • Une deux­ième approche est fondée sur l’amélioration des proces­sus coeur de méti­er. Par exem­ple, les opéra­teurs du secteur des télé­com­mu­ni­ca­tions ont là des out­ils pour réduire le taux de déperdi­tion sur leur base de clients.
  • Une troisième approche est celle qui vise à accélér­er la prise de (meilleures) déci­sions grâce à de nou­veaux sys­tèmes d’information d’entreprises (par exem­ple le pric­ing dynamique en temps réel des pro­duits de grande consommation).
  • Une qua­trième approche vise à exploiter l’évolution de la chaîne de valeur d’une indus­trie sous l’effet des don­nées via la trans­for­ma­tion du busi­ness mod­el exis­tant. C’est le cas de l’intermédiation des hôte­liers dévelop­pée par Booking.com.
  • Enfin, une dernière approche est la créa­tion de revenus entière­ment nouveaux.
Le siège de la NSA (Fort George G. Meade, Mary­land). L’affaire Snow­den a servi de révéla­teur.© REUTERS
Data center de la NSA
Data cen­ter de la NSA (Bluff­dale, Utah). Sa capac­ité est estimée à 1 yot­tabytes soit 1 000 mil­liards de terrabytes

Un rôle particulier pour la France

Com­ment met­tre ces don­nées intel­li­gentes au ser­vice du pro­grès et de la crois­sance ? Com­ment les exploiter tout en respec­tant la vie privée ? Je porte sur ce sujet à la fois le regard d’un acteur des big data à qui le gou­verne­ment a con­fié la coor­di­na­tion d’un plan indus­triel sur le sujet, et le regard d’un con­som­ma­teur et d’un citoyen.

Le marché des big data, au sens le plus strict du terme (c’est-à-dire la vente de logi­ciels ou de ser­vices spé­cial­isés), est estimé en France à env­i­ron 500 mil­lions d’euros par an aujourd’hui, et près de 2 mil­liards d’ici trois ans.

Innovation publicitaire

Criteo, une start-up française fondée en 2008 désormais cotée au Nasdaq, est aujourd’hui leader devant Google du « reciblage publicitaire ».
Par exemple, Criteo offre aux sites marchands du Web la possibilité d’adresser un message personnalisé aux internautes qui quittent leur site sans faire d’achats, afin de les faire revenir sur le site.

Mais cela n’est que la (toute petite) pointe de l’iceberg. Le véri­ta­ble enjeu est ailleurs : il est dans la trans­for­ma­tion numérique des entre­pris­es et de notre société. Trans­for­ma­tion qui se pro­duira de toute façon, soit volon­taire­ment, soit con­trainte et forcée.

Reprenons l’exemple de l’hôtellerie en France : elle représente env­i­ron 185 000 emplois directs. Or Booking.com capte 23 % des revenus hôte­liers pour toute réser­va­tion faite via son inter­mé­di­aire. En faisant l’hypothèse (certes un peu sim­pliste), de la pro­por­tion­nal­ité entre revenus et emplois directs, 42 000 emplois seraient directe­ment men­acés. Aujourd’hui, Booking.com référence 420 000 hôtels dans le monde (alors que la France compte au total un peu moins de 17 000 hôtels) et a une part de marché de 70% sur les réser­va­tions online en France.

Mobiliser informaticiens et mathématiciens

100% des métiers du marketing direct touchés par les big data

La pre­mière révo­lu­tion indus­trielle a vu notre société devenir un monde d’usines. Le monde de demain sera un monde de plate­formes. Lors de la pre­mière révo­lu­tion indus­trielle, c’est l’éducation des mass­es qui per­mit de traiter le prob­lème des rup­tures des métiers, et qui fit pass­er en deux siè­cles notre société d’une sit­u­a­tion où 75% des tra­vailleurs étaient dans les champs, à 2% aujourd’hui. De nom­breux métiers actuels vont dis­paraître dans les décen­nies à venir. Mais de nom­breux nou­veaux métiers vont apparaître.

Or, la France pos­sède un atout unique par rap­port à ces nou­veaux mod­èles : son sys­tème édu­catif. Infor­mati­ciens et math­é­mati­ciens français sont plébisc­ités dans le monde. Les big data, c’est l’alliance de ces deux dis­ci­plines. Là doit porter l’effort de notre pays, pour con­stru­ire un avan­tage con­cur­ren­tiel, créer de nou­veaux Criteo, et gag­n­er la bataille mon­di­ale des big data.

Aider les entreprises à accélérer

Une carte bancaire
La lutte con­tre la fraude fait de plus en plus appel aux big data© iStock

Deux con­traintes majeures pèsent aujourd’hui sur l’essor des big data : la disponi­bil­ité des ressources humaines d’un nou­veau type – nom­mées data sci­en­tist –, et les règles de manip­u­la­tion des don­nées, héritées d’un monde où les réseaux soci­aux n’existaient pas.

Con­cer­nant la for­ma­tion, les fonde­ments sont là, grâce à l’esprit même de notre sys­tème édu­catif. Mais l’État doit aug­menter dès la ren­trée 2014 les con­tin­gents de spé­cial­istes, pour fournir à l’industrie hi-tech française des ressources, rares dans le monde entier, qui leur per­me­t­tront d’aller plus vite, plus loin que leurs con­cur­rents internationaux.

Revisiter la loi Informatique et Libertés

Sur l’aspect régle­men­taire, nous vivons aujourd’hui avec des principes, for­mal­isés dans le cadre de la loi Infor­ma­tique et Lib­ertés de 1978. Récem­ment, l’affaire Snow­den a con­fir­mé la néces­saire pru­dence dont nos sociétés doivent faire preuve dès lors qu’il s’agit d’autoriser (ou non) l’usage des don­nées informatiques.

Une révolution multiforme

De nombreux secteurs ont été, ou sont en train d’être révolutionnés. Les majors du disque disparaissent au profit des plateformes de streaming comme Deezer ou Spotify. Les agences de voyages disparaissent au profit de Booking.com ou Expedia. Demain, les assureurs verront Google débarquer dans leur pré carré.
Toutes les industries traitant des clients finals évoluent vers une intermédiation par de nouveaux acteurs, Google étant le premier d’entre eux.

Mais ne faudrait-il pas revis­iter ces principes, au risque sinon de pren­dre du retard sur les pays qui, eux, ne s’embarrassent pas de telles pré­cau­tions ? Bien sûr, il ne s’agit pas d’ouvrir les don­nées à tous vents sans con­trôles ni contreparties.

Il s’agirait plutôt d’adopter une démarche d’expérimentation, fondée sur la notion de réciproc­ité, et qui per­me­t­trait à nos start-ups d’exprimer toute leur créa­tiv­ité et de pou­voir con­quérir le monde.

Un levier de croissance

Le monde de demain sera un monde de plateformes

Les big data sont plus que nais­sants, mais ils ne for­ment pas encore un marché struc­turé. Je con­sid­ère qu’ils con­stituent une chance for­mi­da­ble pour notre pays de repar­tir de plain-pied dans l’économie de l’innovation. C’est un levi­er de crois­sance majeur.

L’État doit aider nos entre­pris­es à accélér­er, en menant des actions fortes de for­ma­tion. Et par ailleurs engager sans atten­dre la réflex­ion sur l’évolution de notre cadre réglementaire.

Commentaire

Ajouter un commentaire

Tru Dô-Khac répondre
21 mars 2014 à 9 h 21 min

MOOC d’en­tre­prise pour for­mer les ingénieurs au big data

Cher camarade,

C’est avec un intérêt par­ti­c­uli­er que j’ai lu votre arti­cle sur lequel je con­viens sur bien des points.
Pour for­mer les ingénieurs math­é­mati­ciens et infor­mati­ciens big data atten­dus par les entre­pris­es, les MOOC uni­ver­si­taires seront sans doute un levi­er impor­tant. Ain­si les trois pre­miers MOOC de l’X (une Intro­duc­tion aux Prob­a­bil­ités, théorie des dis­tri­b­u­tions , con­cep­tion et mise en oeu­vre d’al­go­rithmes) ont per­mis d’adress­er des préreq­uis à la mise en œuvre des big data.

En plus de la maîtrise de ces savoirs fon­da­men­taux et tech­niques de l’ingénieur, il faut des méthodes.

Sur ce point, les entre­pris­es pour­raient, avec les MOOC d’en­tre­prise, apporter leur con­tri­bu­tion tout en val­orisant leur mar­que employeur.

Bien cordialement

Tru Dô-Khac

Répondre