Bag Data

Former des ingénieurs à la science des données

Dossier : TrajectoiresMagazine N°737 Septembre 2018
Par Charles SUTTON (2012)
Par Hervé KABLA (84)

Créée en 2016, Data­Scien­test offre aux entre­pris­es une for­ma­tion aux métiers de la data sci­ence, qui per­met de dévelop­per des com­pé­tences en un temps record grâce à une tech­nolo­gie et une méthode péd­a­gogique innovantes.

Comment est née l’idée ?

Elle est née d’une prise de con­science dans la struc­ture de con­seil créée avec mes asso­ciés Ben­jamin Bra­mi et Yoel Tord­j­man : pénurie de pro­fils, offre de for­ma­tions plutôt lim­itée, néces­sité pour un grand pan de l’économie française d’amorcer une tran­si­tion, flou autour du terme même de data sci­en­tist. Esti­mant que les pro­fils data sci­en­tists ne se valaient pas néces­saire­ment les uns les autres et qu’il était dif­fi­cile d’évaluer leurs com­pé­tences, nous avons conçu plus d’une cen­taine d’examens pour tester des can­di­dats pour tous les types de postes pro­pres à cet univers.

La société est née du besoin d’un client : le groupe Cov­ea (chez qui nous étions en mis­sion) cher­chait une solu­tion pour faire appren­dre la data sci­ence à des employés répar­tis sur dif­férents sites, sans sol­liciter la DSI.

Quel est le parcours des fondateurs ?

J’ai inté­gré l’X après être passé à Paris-Dauphine où j’ai ren­con­tré les cofon­da­teurs. Yoel (CEO) a ter­miné sa for­ma­tion en recherche opéra­tionnelle, puis un mas­ter à l’École des mines. Ben­jamin (CFO) a suivi un par­cours d’ingénierie finan­cière et statistiques.

Qui sont les concurrents ?

La for­ma­tion en data sci­ence est très con­cur­ren­tielle, et nous nous sommes inspirés de leurs points forts, en ne repro­duisant pas leurs points faibles. Les plate­formes de MOOCs (Cours­era, ou EdX, FUN) ont une approche clas­sique, sans pro­gram­ma­tion en ligne, qui ne per­met pas une mon­tée en com­pé­tence rapi­de : les aban­dons en cours sont fréquents.

Nos con­cur­rents étrangers (Dat­a­Camp, DataQue­st) ont une approche B2C, alors que nous visons le marché des entre­pris­es. Les organ­ismes de for­ma­tion pro­fes­sion­nels tra­di­tion­nels n’ont plus trop leur place dans ce paysage. Les plate­formes data sci­ence clés en main, comme Dataiku, qui ne résol­vent pas la ques­tion de l’expertise des utilisateurs.

Quelles ont été les étapes clés depuis la création ?

Notre pre­mier con­trat avec Cov­ea nous a per­mis de prou­ver le con­cept et de penser à une indus­tri­al­i­sa­tion de la solu­tion. Nous avons pu ensuite béné­fici­er de finance­ments publics en sub­ven­tions et en prêts d’honneur qui nous ont per­mis de recruter nos pre­miers tal­ents. L’année 2017 nous a per­mis de tester et valid­er notre méthode péd­a­gogique, et de dévelop­per un con­tenu riche et com­péti­tif avec les offres con­cur­rentes. Nous avons obtenu notre agré­ment de for­ma­tion la même année, ce qui nous a per­mis de rem­porter de nom­breux appels d’offres.

Nos prochaines étapes sont la final­i­sa­tion de notre lev­ée de fonds en série A, pour faire grandir nos équipes, puis la sig­na­ture de parte­nar­i­ats stratégiques avec les branch­es pro­fes­sion­nelles et les insti­tu­tions publiques pour gag­n­er en vis­i­bil­ité, le développe­ment d’une offre en ligne B2C et l’acquisition de comptes étrangers.

Quelle est l’originalité de DataScientest ?

Nous avons mis au point une plate­forme en ligne qui pro­pose un con­tenu adap­té aux besoins métiers, et nous accom­pa­gnons la mon­tée en com­pé­tence des util­isa­teurs à l’aide d’une méthode péd­a­gogique inno­vante. Chaque util­isa­teur a accès à un par­cours sur mesure, qui cor­re­spond à une série de mod­ules cer­ti­fi­ants. Chaque mod­ule com­mence par une série d’« expéri­ences data » : un for­mat péd­a­gogique à mi-chemin entre une leçon et un exer­ci­ce, et qui se con­clut par la réal­i­sa­tion d’un pro­jet final, avec un exa­m­en de pro­gram­ma­tion en ligne récom­pen­sé par une cer­ti­fi­ca­tion. La réus­site des for­ma­tions sur notre plate­forme tient à un accom­pa­g­ne­ment sur mesure, et l’élimination de tous les con­tenus où l’utilisateur est pas­sif (notam­ment les longues vidéos des cours mag­is­traux). L’expérience de la pro­gram­ma­tion est cen­trale, et c’est pourquoi nous avons mis en place une plate­forme en ligne qui per­met de pro­gram­mer sans instal­la­tion de logi­ciel préalable.

Est-ce que tout le monde peut devenir data scientist ?

Le poste de data sci­en­tist requiert des capac­ités d’analyse et de pro­gram­ma­tion qui ne sont pas rapi­de­ment acces­si­bles. De nom­breux pro­fes­sion­nels peu­vent toute­fois envis­ager une recon­ver­sion, ou une mon­tée en com­pé­tence ou une accul­tur­a­tion au sujet pour gag­n­er en pro­duc­tiv­ité. Plus de 200 000 per­son­nes ont les bases néces­saires pour devenir data sci­en­tist : chercheurs, sta­tis­ti­ciens, actu­aires, etc. Data­Scien­test peut déjà les former.

Est-ce le seul besoin de formation à couvrir ?

Non, car il y a aus­si l’acculturation qui con­cerne beau­coup de monde : le top man­age­ment qui doit gag­n­er en con­nais­sance opéra­tionnelle, les infor­mati­ciens qui col­la­borent avec les data sci­en­tists et les col­lab­o­ra­teurs tiers qui col­lectent les don­nées utilisées.

Que deviennent les personnes formées par DataScientest ?

La plu­part des 500 util­isa­teurs que nous avons for­més se recon­ver­tis­sent en tant que data sci­en­tist dans leurs entre­pris­es. Les autres ont amené une « col­oration » data dans leur méti­er. Par exem­ple, des con­sul­tants financiers sont passés de Excel à Python pour leurs mod­èles d’élaboration des prix.

Envisagez-vous d’exporter votre modèle et si oui, où ?

Nous envis­ageons une expan­sion d’abord sur les marchés fran­coph­o­nes en Europe et au Maghreb, puis dans le monde anglo­phone : nous final­isons la tra­duc­tion de notre con­tenu péd­a­gogique en anglais et sommes en con­tact avec des groupes d’assurances au Royaume-Uni.

Nos pri­or­ités sont d’une part les pays où l’usage du big data est avancé – USA, Chine, Israël, etc. – car le besoin en data sci­en­tist y est énorme et d’autre part ceux qui présen­tent des grands pools d’ingénieurs infor­ma­tiques – Inde, Maghreb, Viet­nam, Ukraine… – et qui cherchent à mon­ter en compétence.

Data science vs IA, qui gagnera le match ?

La ques­tion est de savoir quel est l’avenir des data sci­ence, et où nous en sommes con­cer­nant l’IA. Les algo­rithmes de deep learn­ing per­me­t­tent d’appréhender de mieux en mieux les don­nées non struc­turées comme le lan­gage naturel, l’image ou le son, et vont par­ticiper dans les prochaines années à un essor de l’IA.

Deux points soulèvent cepen­dant mon inquié­tude. Tout d’abord la RGPD à court terme. Bien que le cor­pus de lois soit posi­tif pour la pro­tec­tion de nos don­nées per­son­nelles, peu de data sci­en­tists ont été con­sultés et beau­coup de flou sub­siste. Cette réforme risque de tuer dans l’œuf de nom­breux pro­jets de start-up.

Je suis aus­si inqui­et de la dia­boli­sa­tion de l’IA. Des risques exis­tent, mais il est impor­tant de mieux présen­ter le domaine pour éviter les con­fu­sions et d’ouvrir la porte à toutes sortes de fan­tasmes pessimistes.

Poster un commentaire