Un peu de code calcul dans la Data

La gouvernance de la data est une affaire de statégie

Dossier : Dossier FFEMagazine N°725 Mai 2017
Par Charles BATTISTA

Qu’entend-on par gouvernance des données dans l’entreprise ?

La gou­ver­nance des don­nées est une mis­sion opéra­tionnelle et stratégique. 

Dans le cas d’une entre­prise qui s’investit dans un pro­jet data, elle implique de pren­dre en con­sid­éra­tion les divers impacts liés à l’afflux mas­sif des don­nées dont l’un est lié aux nou­velles men­aces qui vont oblig­er les direc­tions infor­ma­tiques à revoir leur sécurité. 

La data gouvernance est-elle la chasse gardée des DSI ?

Non, c’est pour cela que cette mis­sion est, dans la majorité des cas, cha­peautée par le CDO (directeur des don­nées) et non par le CTO (directeur de la technologie). 

On n’appréhende pas de la même façon le con­tenu (la data) et le con­tenant (le sys­tème informatique). 

Quels sont les risques en cas de mauvaise gouvernance ?

Il est pri­mor­dial de s’assurer de la fia­bil­ité des don­nées et la notion de data qual­i­ty doit être mise en œuvre et respec­tée. Sinon, nous sommes dans un risque de dégra­da­tion de l’image et de la répu­ta­tion de l’entreprise vis-à-vis des clients et des partenaires. 

Il existe aus­si un risque de statut : prenons ain­si Altares, qui est « tiers de con­fi­ance » dans la chaîne d’acheminement de la data : s’il y a une défail­lance à quelque niveau que ce soit, les con­séquences seront impor­tantes par rap­port à ce « label ». 

Il y a enfin un risque lié à la matière pre­mière, la data qui peut être cor­rompue soit de façon involon­taire, soit par une action malveil­lante voulue. 

Comment, justement, garantir l’exactitude, la fraîcheur et la complétude d’une donnée ?

C’est un méti­er, notre méti­er ! Il est indis­pens­able de s’assurer que la prove­nance des don­nées ne puisse être remise en cause à la fois pour les raisons de sécu­rité évo­quées ci-dessus, mais aus­si pour des raisons de sta­bil­ité et de régu­la­tion (la don­née est une matière vivante qui doit pou­voir être traçable). 

Sur ce dernier point, il faut être par­ti­c­ulière­ment vigilant. 

Avez-vous un exemple ?

Un exem­ple tout sim­ple : quand on loue un fichi­er avec des noms, il faut pou­voir s’assurer que les per­son­nes citées peu­vent à tout moment pren­dre la déci­sion d’en retir­er leur nom. 

On est ici dans une néces­sité de réac­tiv­ité qui paraît évi­dente sur le papi­er, mais qui, dans la pra­tique, représente une énorme con­trainte qui devra être absorbée par une infra­struc­ture spé­ci­fique et performante. 

Comment se concentrer sur les données ayant une valeur importante pour l’entreprise ?

Il y a deux types de valeur data pour l’entreprise : la valeur méti­er, opéra­tionnelle et la valeur struc­turelle, interne. 

Dans le pre­mier cas, on est un peu sur un mod­èle de data on demand : on sélec­tionne et on tra­vaille les don­nées en fonc­tion des objec­tifs métiers de l’entreprise (mar­ket­ing, acqui­si­tion, fidéli­sa­tion, pro­duc­tion, ges­tion des ressources humaines, risque…). 

Dans le sec­ond cas, on par­le des don­nées référen­tielles qui sont gérées par le sys­tème GDR (Ges­tion des Don­nées Référen­tielles) ou Mas­ter Data Man­age­ment (MDM) et qui sont les don­nées internes qui vont servir à pilot­er la dig­i­tal­i­sa­tion des process. 

C’est le volet pure­ment « tech­no-data » de la gou­ver­nance et c’est la base qui va servir à pilot­er le sourc­ing des datas, à con­di­tion­ner toute la chaîne de pro­duc­tion en amont (stock­age, main­te­nance, distribution…). 

Quelles démarches l’entreprise doit-elle mettre en œuvre pour gouverner ses données ?

Elle doit répon­dre à plusieurs ques­tions, qui ont d’ailleurs été « offi­cial­isées » par l’ISACA, l’association pro­fes­sion­nelle inter­na­tionale de référence dans le domaine de la gou­ver­nance des sys­tèmes d’informations :

  • quelle con­fi­ance porter aux bases de données ? 
  • À quels types appar­ti­en­nent les infor­ma­tions qui sont col­lec­tées et quels sont les défis juridiques et régle­men­taires qui y sont liés ? 
  • Com­ment pro­téger les sources, les proces­sus et les déci­sions con­tre le vol et la corruption ? 
  • Com­ment est assurée la con­fi­den­tial­ité des infor­ma­tions, quelles poli­tiques et quels proces­sus ont été mis en place vis-à-vis des employés ? 
  • Quels sont les actes de l’entreprise pou­vant être exploités par ses adversaires ? 

Par où commencer ?

“ LA GOUVERNANCE DES DONNÉES EST UN PROJET PLUTÔT TRANSVERSAL ET QUI IMPLIQUE BEAUCOUP DE COMPÉTENCES DANS L’ENTREPRISE ”, EXPLIQUE CHARLES BATTISTA

On peut ne rien met­tre en place au niveau de la gou­ver­nance s’il n’y a pas une déci­sion stratégique prise par la direc­tion générale. Ce type de déci­sion implique tout le monde et est irrémédiable. 

Beau­coup d’entreprises com­men­cent par la rédac­tion de guide­lines exhaus­tives per­me­t­tant de savoir où on va et par quels moyens on y va (référen­tiel, data ware­house, data lake, etc.) 

Quels bénéfices peut-elle en tirer et comment les mesurer ?

Je vois 3 béné­fices principaux : 

  • La con­nais­sance clients qui aidera à ratio­nalis­er les offres 
  • La flu­id­i­fi­ca­tion de la com­mu­ni­ca­tion interne et externe 
  • Le ren­force­ment du statut de tiers de con­fi­ance qui est vital pour des acteurs dont la data est le cœur d’activité.

Quelles sont les contraintes réglementaires appliquées aux entreprises ?

Elles sont, pour le meilleur et pour le pire, très nom­breuses. D’aucuns par­lent même de litanie réglementaire ! 

Rien que la fameuse GDPR (Gen­er­al Data Pro­tec­tion Reg­u­la­tion) ou autrement dit la Régle­men­ta­tion européenne sur la pro­tec­tion des don­nées entrée en vigueur en mai 2016 (et applic­a­ble en mai 2018) est un cor­pus de 99 arti­cles de lois ! 

Ajou­tons ensuite les lois fran­co-français­es et les régle­men­ta­tions spé­ci­fiques à chaque secteur d’activité. La mon­tagne est haute ! 

Toutes ces con­traintes sont à inté­gr­er à la fois dans la con­cep­tion et la con­struc­tion du référen­tiel data, mais égale­ment dans la con­struc­tion des mod­èles qui vien­nent répon­dre aux exi­gences des pro­jets data spé­ci­fiques de l’entreprise ou de ses clients. 

Quels sont les acteurs de cette gouvernance des données et est-ce que cela implique de nouveaux métiers ?

Les avo­cats et les juristes ! 

Plus sérieuse­ment, la gou­ver­nance est un pro­jet plutôt trans­ver­sal et qui implique beau­coup de com­pé­tences dans l’entreprise.

On part donc de la direc­tion générale qui donne l’impulsion et la stratégie, on embar­que un CDO qui va être le « mas­ter and com­man­der » du pro­jet, un CTO qui sera câblé sur les nou­velles prob­lé­ma­tiques liées à la data, des datas sci­en­tists, des ana­lystes, des développeurs et tous les représen­tants des métiers de l’entreprise qui peu­vent apporter leur con­tri­bu­tion opéra­tionnelle à la gouvernance. 

En plus de ces métiers, ce sont aus­si de nou­velles méth­odes de tra­vail, for­cé­ment plus trans­ver­sales, plus agiles (DevOps, Lean Man­age­ment) qui seront mis­es en place. 

Comment voyez-vous l’avenir de la gouvernance des données ?

Il s’articule autour de 2 thèmes : la dig­i­tal­i­sa­tion réelle des entre­pris­es et, en par­al­lèle, l’Open Data. Ces trans­for­ma­tions entrainent de nou­velles problématiques : 

  • Nou­veaux référen­tiels : On par­le de la qual­ité et de la longévité des don­nées sous une forme exploitable et stan­dard­is­ée ; il fau­dra trou­ver un for­mat sta­ble spé­ci­fique pour la con­cep­tion des modèles. 
  • Nou­velles rela­tions : la rela­tion fournisseur/ client n’est pas la même si la don­née est gra­tu­ite ou si le four­nisseur est payant. 
  • Nou­veaux mod­èles économiques : L’arrivée de nou­veaux acteurs low cost de la four­ni­ture de don­nées vont faire tomber des bar­rières ; les acteurs tra­di­tion­nels n’auront d’autre choix que de sor­tir par le haut en pro­posant de la valeur ajoutée en ter­mes de ser­vices ou de con­seil stratégique.
    Par ailleurs, la data est en voie de trans­former le busi­ness mod­el des entre­pris­es data dri­ven qui passeront d’une logique de ROI à une logique de R.O.D.I (Return On Data Investment).
     

Page de publicité Altares

Poster un commentaire