Data & Entreprises : des opportunités à saisir et des enjeux à relever

Sicara : Data & Entreprises, des opportunités à saisir et des enjeux à relever

Dossier : Vie des entreprisesMagazine N°781 Janvier 2023
Par Pierre-Henri CUMENGE (X02)

Pierre-Hen­ri Cumenge (X02), cofon­da­teur et CTO de Sica­ra, nous pré­sente cette socié­té et son posi­tion­ne­ment dans le monde de la data et de l’intelligence arti­fi­cielle. Il revient notam­ment sur le péri­mètre d’action de Sica­ra et dresse un état des lieux de la place de la data dans le monde de l’entreprise. Rencontre.

Que propose Sicara ?

Sica­ra est une socié­té de ser­vices spé­cia­li­sée dans la data. Nous tra­vaillons avec nos clients pour construire des solu­tions qui couvrent l’ensemble de leur chaîne data. His­to­ri­que­ment, nous nous sommes d’abord posi­tion­nés sur des pro­duits de recon­nais­sance d’images. Nous nous sommes très vite ren­du compte que la com­pé­tence pure­ment algo­rith­mique ne suf­fi­sait pas. Il nous a fal­lu élar­gir notre péri­mètre de com­pé­tences. D’une part, nous avons déve­lop­pé une com­pé­tence sur le data engi­nee­ring qui est la capa­ci­té à inté­grer, agré­ger et mettre à dis­po­si­tion des flux de don­nées issus de diverses sources dans un entre­pôt de don­nées. D’autre part, nous inter­ve­nons sur des phases vision pro­duits afin de conce­voir des solu­tions uti­li­sables et uti­li­sées par les uti­li­sa­teurs finaux. En effet, cette typo­lo­gie de pro­jets requiert une com­pré­hen­sion fine d’enjeux spé­ci­fiques à la don­née et des exper­tises dont nos clients ne dis­posent pas for­cé­ment en interne : par exemple la manière de mesu­rer la per­ti­nence d’un algo­rithme au regard des enjeux métier, ou le contrôle de la qua­li­té de la donnée.

Dès le départ, nous avons aus­si accor­dé une atten­tion par­ti­cu­lière à la qua­li­té du déve­lop­pe­ment logi­ciel pour accé­lé­rer la mise en pro­duc­tion des pro­jets et pro­duits. Une de nos mis­sions est de garan­tir que les pro­duits soient inté­grés aux sys­tèmes d’information de nos clients et que les appli­ca­tions data qui en résultent soient robustes et pérennes. Il est donc cri­tique que nos data scien­tists aient aus­si la com­pé­tence néces­saire pour non seule­ment déve­lop­per des algo­rithmes per­for­mants, mais aus­si pour les expo­ser au sein d’une base de code facile à déployer, main­te­nir et monitorer.

Au-delà, nous avons la par­ti­cu­la­ri­té et l’avantage de faire par­tie du groupe Theo­do qui regroupe 10 enti­tés aux exper­tises com­plé­men­taires. Cela nous per­met de cou­vrir l’ensemble des exper­tises néces­saires au déploie­ment de solu­tions data, par exemple pour mettre en place l’infrastructure cloud sous-jacente ou déve­lop­per les appli­ca­tions web ou mobiles exploi­tant les don­nées et algo­rithmes sur les­quels nous tra­vaillons. Cela per­met à nos clients de sim­pli­fier la ges­tion de leurs pro­jets avec une approche de gui­chet unique. Au-delà de cette capa­ci­té à déve­lop­per un pro­duit de bout en bout pour nos clients, nous nous appuyons aus­si sur deux autres socié­tés du groupe res­pec­ti­ve­ment spé­cia­li­sées dans le domaine de la san­té et de la finance. Pour nos clients posi­tion­nés sur ces sec­teurs, c’est la pos­si­bi­li­té d’avoir accès à des experts métier.

Pouvez-vous nous donner des exemples pour illustrer votre périmètre d’action ?

Nous avons construit une appli­ca­tion de fac­tu­ra­tion auto­ma­tique des pla­teaux repas pour un acteur spé­cia­li­sé dans la fabri­ca­tion de maté­riel pour la res­tau­ra­tion. Cela per­met de réduire les files d’attente aux caisses et aux clients de man­ger chaud ! 

Concrè­te­ment, quand ces der­niers posent leur pla­teau sur une borne, des pho­tos sont prises et ana­ly­sées grâce aux tech­niques de recon­nais­sance d’images, ce qui per­met de recon­naître les plats et de cal­cu­ler ins­tan­ta­né­ment le mon­tant à fac­tu­rer. Pour ce pro­jet, nous sommes par­tis d’une feuille blanche. Le déve­lop­pe­ment de la solu­tion tech­nique a néces­si­té une impor­tante phase de R&D ini­tiale. Aujourd’hui, le pro­jet est en plein déploie­ment avec plu­sieurs dizaines de res­tau­rants déjà équi­pés. L’objectif est main­te­nant d’accélérer ce déploie­ment à moindre coût afin que notre client puisse pro­po­ser cette solu­tion à l’ensemble de sa clientèle.

Dans l’univers médi­cal, pour un grand labo­ra­toire phar­ma­ceu­tique, nous avons tra­vaillé sur une solu­tion visant à digi­ta­li­ser les études cli­niques menées dans le domaine des mala­dies neu­ro­dé­gé­né­ra­tives. Cela a per­mis un gain moyen de 18 mois sur l’ensemble du pro­ces­sus qui contri­bue à réduire les coûts et accé­lé­rer la recherche sur les mala­dies neu­ro­dé­gé­né­ra­tives. Les études cli­niques sont une étape indis­pen­sable à la mise sur le mar­ché de nou­veaux médi­ca­ments, durant les­quelles le labo­ra­toire sol­li­cite des patients qui se sont por­tés volon­taires. Ce sont des phases longues et coû­teuses. Les patients par­ti­ci­pant doivent se rendre régu­liè­re­ment à l’hôpital pour par­ti­ci­per aux tests visant à col­lec­ter les don­nées. Nous avons tra­vaillé sur une appli­ca­tion mobile per­met­tant de faire ces tests depuis chez soi sur un smart­phone, avec deux impacts : limi­ter le temps pris aux méde­cins pour réa­li­ser les tests sur place, donc le coût d’une étude, et élar­gir le pool de patients poten­tiels à l’ensemble des zones géo­gra­phiques, ce qui aug­mente les chances de mener à bien les études sur des mala­dies rares. Sur ce pro­jet, nous avons col­la­bo­ré avec d’autres start-up du groupe : BAM pour le déve­lop­pe­ment de l’application mobile, Padok pour l’ingestion, le trai­te­ment et la mise à dis­po­si­tion de la don­née, et Hok­la qui apporte son exper­tise en déve­lop­pe­ment de dis­po­si­tifs médi­caux. Nous sommes mobi­li­sés sur ce pro­jet com­plexe depuis deux ans. Il implique un contrôle opti­mal de la don­née, de son uti­li­sa­tion et de la docu­men­ta­tion des flux parce que nous inter­ve­nons sur un sec­teur sou­mis à de très fortes contraintes réglementaires.

Enfin, nous avons aus­si récem­ment accom­pa­gné une entre­prise à deux niveaux : la mise en place d’une solu­tion tech­nique et celle de son équipe data. Cette socié­té four­nit des infor­ma­tions et de la don­née très fine sur la fré­quen­ta­tion des lieux. Elle aide, par exemple, à opti­mi­ser la prise de déci­sion d’une enseigne sur un futur empla­ce­ment. Nous les avons aidés à conce­voir et mettre en place l’architecture tech­nique de leur data lake et des flux d’ingestion et d’agrégation de don­nées, et à poser les bases de leur orga­ni­sa­tion data. Aujourd’hui, ils dis­posent de leur propre équipe et pour­suivent de manière auto­nome le déve­lop­pe­ment de leur solution.

Sur l’ensemble de ces enjeux et problématiques, quel est le niveau des entreprises ? Qu’observez-vous ? Quels sont les freins qui persistent ?

C’est très hété­ro­gène ! À notre niveau, nous obser­vons un écart qui se creuse entre les entre­prises qui ont une démarche proac­tive vis-à-vis de la data et ceux qui n’en ont pas encore mesu­ré toute l’importance. La dif­fé­rence vient en géné­ral d’un spon­sor­ship fort au niveau comex. En paral­lèle, d’autres sec­teurs ont été contraints de se lan­cer par la pres­sion du mar­ché ou la régle­men­ta­tion. C’est notam­ment le cas du sec­teur ban­caire. Sur un sujet comme le KYC (Know Your Cus­to­mer), le contrôle de la qua­li­té de la don­née et sa maî­trise sont une obli­ga­tion règle­men­taire assor­tie de fortes péna­li­tés, ce qui a pous­sé les acteurs concer­nés à s’intéresser for­te­ment à la valeur ajou­tée qu’une bonne maî­trise de la don­née peut appor­ter. Encore aujourd’hui, il y a une forme de sous-inves­tis­se­ment dans la don­née. Je suis très sou­vent en contact avec des entre­prises qui ont recru­té des data scien­tists en interne pour déve­lop­per des algo­rithmes, mais qui, en amont, n’ont pas réa­li­sé le tra­vail néces­saire de récu­pé­ra­tion, de net­toyage et d’homogénéisation de la don­née, qui est la matière pre­mière que les data scien­tists vont exploi­ter. Sur un plan orga­ni­sa­tion­nel, la bonne connexion et coopé­ra­tion des équipes data avec le reste des équipes pour four­nir de la data aux métiers et conce­voir des pro­duits data avec une véri­table uti­li­té est une néces­si­té abso­lue. Les modèles orga­ni­sa­tion­nels autour de la data consti­tuent un sujet de dis­cus­sion et d’expérimentation très fort en ce moment. Nous obser­vons notam­ment un mou­ve­ment vers la décen­tra­li­sa­tion de la res­pon­sa­bi­li­té de la don­née afin d’impliquer plus for­te­ment les pro­duc­teurs de don­nées. En paral­lèle, nous nous diri­geons vers un rééqui­li­brage entre les par­ties data science et data engi­nee­ring. Comme évo­qué plus haut, le data engi­nee­ring per­met une mise à dis­po­si­tion d’une don­née de bonne qua­li­té. Cette prise de conscience qui s’opère depuis envi­ron 5 ans crée, et va conti­nuer à créer, une forte ten­sion sur les pro­fils de data engi­neers sur le mar­ché du tra­vail. Si, au cours des der­nières années, nous avons vu appa­raître de nom­breuses for­ma­tions et mas­ters spé­cia­li­sés en data science, l’offre reste assez limi­tée sur la par­tie data ingé­nie­rie. D’ailleurs, en interne, actuel­le­ment, nous recru­tons essen­tiel­le­ment sur cette par­tie data engi­nee­ring et for­mons d’anciens data scien­tists ou déve­lop­peurs au data engi­nee­ring. En paral­lèle, nous recher­chons aus­si des pro­fils avec une spé­cia­li­sa­tion dans la par­tie ana­ly­tique et busi­ness intel­li­gence, c’est-à-dire des experts capables de mettre en place des tableaux de bord pour rendre la don­née acces­sible visuel­le­ment aux décideurs.

Et pour conclure, quelles sont les tendances qui vous intéressent ? Comment vous projetez-vous ?

Nous évo­luons dans un sec­teur en pleine effer­ves­cence. De plus en plus d’entreprises se dotent de Chief Data Offi­cers (CDO) et ont pris conscience que le sujet de la data doit être trai­té dans les sphères déci­sion­nelles de leur orga­ni­sa­tion. Pour­tant, actuel­le­ment, peu de CDO sont membres des comi­tés de direc­tion des entre­prises. Je pense que cette situa­tion va évo­luer et que dans quelques années, on trou­ve­ra anor­mal de ne pas avoir un CDO membre d’un comi­té de direc­tion. En paral­lèle, sur le plan tech­nique et tech­no­lo­gique, le rythme des évo­lu­tions accé­lère. Il y a un inté­rêt crois­sant pour le concept de data cen­tric AI ; la ges­tion du cycle de vie d’un algo­rithme ou encore le SSL (Self-Super­vi­sed Lear­ning) afin de réduire les coûts rela­tifs à l’entraînement des algo­rithmes sur d’importantes volu­mé­tries de data. Côté trai­te­ment de don­nées, nous obser­vons un usage crois­sant des data pla­te­formes, comme Data­bricks ou Snow­flake avec qui nous avons mis en place des par­te­na­riats afin d’accélérer les déve­lop­pe­ments de nos pro­jets client. Ce type de pla­te­formes leur per­met d’avoir une solu­tion inté­grée pour l’ensemble des trai­te­ments et expo­si­tion de don­nées, donc de limi­ter la com­plexi­té tech­nique de leurs solu­tions data.

Au delà de la com­mu­nau­té data, l’explosion des per­for­mances des LLM (Large Lan­guage Models) et leur acces­si­bi­li­té au plus grand nombre a le poten­tiel de modi­fier en pro­fon­deur la manière de tra­vailler pour un grand nombre de métiers. Dans les métiers du numé­rique par exemple, l’assistance à la géné­ra­tion de code ou à la recherche d’informations pour débug­guer son code devraient trans­for­mer le quo­ti­dien des déve­lop­peurs. Tous les métiers tou­chant à la créa­tion de conte­nu ou à la recherche d’information sont concer­nés, et le chan­ge­ment pour­rait être très rapide. Ce qui est fas­ci­nant ici pour moi c’est que nous assis­tons à des avan­cées qui arrivent beau­coup plus tôt que ce que j’aurais ima­gi­né. Il y a 5 ans, si on m’avait deman­dé com­bien d’années de recherche étaient néces­saires pour obte­nir un sys­tème d’intelligence arti­fi­cielle capable de pro­duire ce que les outils d’openAI par exemple font aujourd’hui, j’aurais pro­ba­ble­ment répon­du plus de 10 ans. L’engouement récent pour chatGPT parle de lui-même : il a été tes­té par 1 mil­lion d’utilisateurs en moins de 3 jours. 

Poster un commentaire