Les data en 120 points et 0 prérequis

Les data en 120 points et 0 prérequis

Dossier : Arts, lettres et sciencesMagazine N°793 Mars 2024Par : Frédéric Lefebvre-Naré (X84)Rédacteur : Michel Volle (X60)Editeur : Amazon KDP, août 2023

Ce livre clair, sobre et com­plet fait en 120 pages le tour du monde des don­nées. Il sera utile aux étu­diants, aux experts et à ceux qu’intéresse l’« or noir du XXIe siècle ».

« La data science sans science des don­nées, c’est l’agriculture sans bota­nique » : or les don­nées sont quan­ti­ta­tives ou qua­li­ta­tives, ponc­tuelles ou pério­diques, per­ti­nentes ou inadé­quates, exactes ou biai­sées, etc.

Il faut redres­ser les don­nées biai­sées, cor­ri­ger les aber­rantes, inter­pré­ter les extrêmes, esti­mer les man­quantes, accep­ter des approxi­ma­tions, extraire des ten­dances, et le « singe dac­ty­lo­graphe » qui tape les com­mandes au hasard obtien­dra des « résul­tats » dépour­vus de sens.

Fré­dé­ric Lefebvre-Naré évoque rare­ment les mau­vaises pra­tiques. Mais, si la qua­li­té des don­nées fait défaut, le pro­ces­sus de pro­duc­tion sera coû­teux, les pro­duits de mau­vaise qua­li­té, la part de mar­ché compromise.

Cer­taines don­nées sont mal­saines : les concepts comp­tables dif­fèrent des concepts éco­no­miques. D’autres sont empoi­son­nées : la comp­ta­bi­li­té ana­ly­tique sus­cite des conflits. Les tableaux de bord qui accu­mulent moyennes mobiles et cumuls, « R / P » (réa­li­sé sur pré­vu) et « m / (m – 12) » (mois sur mois de l’année pré­cé­dente) sont illisibles.

Les data scien­tists ren­con­tre­ront l’illogisme des habi­tudes et le par­ti­cu­la­risme des cor­po­ra­tions. Il ne leur suf­fi­ra pas d’être « bons en maths » pour se tirer d’affaire… 

Poster un commentaire