De l’intelligence dans le stockage

Dossier : Vie des entreprisesMagazine N°756 Juin 2020
Par Laurent DENEL

Offrant une sca­la­bi­li­té ins­tan­ta­née et des per­for­mances adap­tées aux nou­veaux usages des don­nées (Big Data, IA, HPC…), la tech­no­lo­gie d’Object Sto­rage Ope­nIO est idéale pour sto­cker la pro­duc­tion de don­nées des entre­prises, qui ne cesse de croître. Expli­ca­tion de Laurent Denel, CEO et cofon­da­teur de l’entreprise.

Dans quel contexte est née la technologie OpenIO ?

World­Line, mon ancien employeur, héber­geait les pla­te­formes de mes­sa­ge­rie des prin­ci­paux FAI fran­çais. Nous avons assis­té, après 2010, à un bas­cu­le­ment des usages : les uti­li­sa­teurs ont délais­sé le sto­ckage local de leurs e‑mails au pro­fit du sto­ckage sur les ser­veurs de mes­sa­ge­rie, ceci pour y accé­der depuis n’importe quel appa­reil. Le défi consis­ta alors à sto­cker un volume crois­sant de fichiers, fré­quem­ment accé­dés, sans que les coûts d’infrastructure n’explosent.

Les solu­tions de sto­ckage tra­di­tion­nelles, basées sur du file sys­tem, ont mon­tré leurs limites. Pour absor­ber le volume, il fal­lait démul­ti­plier les machines et opé­rer des migra­tions pour équi­li­brer la charge et pré­ser­ver de l’espace dis­po­nible. Ce sont des opé­ra­tions à risque, mobi­li­sant des res­sources humaines.

En tant que res­pon­sable de l’industrialisation de ces pla­te­formes de sto­ckage, je me suis inté­res­sé au sto­ckage en mode objet, une nou­velle manière de sto­cker les don­nées per­met­tant de « sca­ler » une pla­te­forme sans créer de silos, tout en exploi­tant des ser­veurs stan­dards x86, bien meilleur mar­ché que les machines spé­ci­fi­que­ment conçues pour le sto­ckage des données.

Quels sont les avantages du stockage objet ?

C’est une manière de sto­cker les don­nées, au même titre que le file sys­tem et le block sto­rage. Si les pre­miers tra­vaux de recherche concer­nant l’Object Sto­rage remontent à plus de 20 ans, la tech­no­lo­gie com­mence seule­ment à se démo­cra­ti­ser. Ses avan­tages sont de plus en plus évi­dents avec l’explosion du volume de don­nées col­lec­tées et pro­duites par les entre­prises — des don­nées non struc­tu­rées pour l’essentiel.

La rup­ture tech­no­lo­gique, avec l’Object Sto­rage, consiste à trans­fé­rer l’intelligence du maté­riel vers le logiciel.
Le soft­ware-defi­ned sto­rage est la suite logique du mou­ve­ment qui a révo­lu­tion­né le com­pute (avec les machines vir­tuelles) puis le réseau (avec l’approche soft­ware-defi­ned network).

Les pro­messes ori­gi­nelles de l’Object Sto­rage sont nom­breuses : la sca­la­bi­li­té infi­nie, per­met­tant de créer de gigan­tesques « data lakes », l’agnosticité hard­ware qui explique en par­tie la baisse des coûts, la pro­tec­tion et la haute dis­po­ni­bi­li­té des données… 

L’Object Sto­rage a d’abord été vu comme une solu­tion « cheap and deep » des­ti­née à des besoins d’archivage, avant d’être uti­li­sée pour par­ta­ger des res­sources dans le but de col­la­bo­rer (le web 2.0). Aujourd’hui, alors que les entre­prises exploitent de plus en plus les tech­niques du Big Data et de l’IA, ce sont des machines qui lisent les don­nées, et non plus des humains. Cela néces­site de pou­voir lire et écrire les don­nées à grande vitesse. Le cri­tère de la per­for­mance devient donc essen­tiel dans le choix d’une solu­tion de stockage.

Quelle est votre proposition de valeur sur ce segment ?

Ope­nIO appar­tient à la nou­velle géné­ra­tion des solu­tions d’Object Sto­rage, com­pa­tible S3 – l’API deve­nue le stan­dard de fac­to du marché.

Notre tech­no­lo­gie a été conçue pour réa­li­ser les pro­messes de l’Object Sto­rage, en impo­sant le moins de contraintes pos­sible. Nous sommes ain­si l’une des rares tech­no­lo­gies à sup­por­ter l’hétérogénéité hard­ware au sein d’un même clus­ter ! Nous avons, en outre, deux atouts, qui sus­citent l’intérêt des entre­prises qui veulent sto­cker, mais aus­si et sur­tout exploi­ter leurs don­nées pour en extraire de la valeur : 

  • L’ « Ins­tant Sca­ling » : la capa­ci­té de pou­voir ajou­ter des res­sources à un clus­ter et d’en pro­fi­ter immé­dia­te­ment, alors que la plu­part des tech­no­lo­gies concur­rentes néces­sitent un rebras­sage des don­nées pour rééqui­li­brer la charge après l’ajout de nou­velles machines, une opé­ra­tion qui peut ralen­tir la pla­te­forme pen­dant des semaines, voire des mois entiers ;
  • La per­for­mance : nous sommes recon­nus comme l’une des solu­tions les plus per­for­mantes du mar­ché, en termes de bande pas­sante attei­gnable. Fin 2019, nous avons déployé Ope­nIO sur plus de 350 ser­veurs, mis à dis­po­si­tion par Cri­teo. Ce bench­mark a per­mis d’atteindre 1.372 téra­bit de don­nées écrites par seconde. Si nous n’avions pas été contraints par la capa­ci­té réseau dis­po­nible, nous aurions pu aller encore au-delà. Plus récem­ment, nous avons com­pa­ré les per­for­mances d’OpenIO à celles d’HDFS, le sys­tème de fichier dis­tri­bué de l’écosystème Big Data Hadoop. Ope­nIO appa­raît plus rapide qu’HDFS pour ser­vir les don­nées à un clus­ter de calcul !

Enfin, le cœur de notre tech­no­lo­gie est open source, une garan­tie de péren­ni­té. Nous pro­po­sons une sous­crip­tion annuelle pour faire béné­fi­cier nos clients de l’expertise et du sup­port de nos équipes.

“Les meilleures innovations technologiques
ne viennent pas toutes de la Silicon Valley.
La France compte
d’excellents ingénieurs.”

Qui sont vos clients ?

Aujourd’hui, la plu­part des entre­prises se disent « data cen­tric ». Elles mani­pulent des volumes consé­quents de don­nées et elles en extraient de la valeur : meilleure connais­sance de leurs clients, amé­lio­ra­tion de leurs pro­duits et ser­vices, inno­va­tion, accé­lé­ra­tion de la recherche… 

Ope­nIO compte ain­si par­mi ses clients des entre­prises comme la start-up fran­çaise Kayr­ros, lea­der de l’intelligence éco­no­mique dans le domaine de l’énergie ; ou Relex Solu­tions, ori­gi­naire de Fin­lande, qui uti­lise les don­nées des acteurs du retail pour opti­mi­ser leur sup­ply chain. Notre tech­no­lo­gie a aus­si été choi­sie par le CEA, ain­si que l’Institut du cer­veau de la moelle épi­nière à Paris.

Nous avons éga­le­ment des clients dans le domaine des médias, comme Dai­ly­mo­tion ou Canal+, dont les besoins de sto­ckage excèdent les dizaines de péta­oc­tets. Enfin, notre tech­no­lo­gie inté­resse les Cloud pro­vi­ders, qui four­nissent à leurs clients des ser­vices d’hébergement et de stockage.

scalabilité de sa solution d’Object Storage, OpenIO
Pour démon­trer la per­for­mance et la sca­la­bi­li­té de sa solu­tion d’Object Sto­rage, Ope­nIO a déployé sa tech­no­lo­gie sur plus de 350 ser­veurs, gra­cieu­se­ment mis à dis­po­si­tion par Cri­teo. Ce bench­mark a per­mis d’atteindre 1.372 téra­bit de don­nées écrites par seconde.

En quoi la volonté de reconquérir notre souveraineté numérique est-elle favorable à des technologies comme OpenIO ?

L’usage de l’Object Sto­rage a été lar­ge­ment démo­cra­ti­sé par Ama­zon Web Ser­vices (AWS) avec Simple Sto­rage Ser­vice (S3) qui est aujourd’hui le lea­der du mar­ché. On observe tou­te­fois un mou­ve­ment de « Data Repa­tria­tion », c’est-à-dire de migra­tion des don­nées depuis les clouds publics, tels que celui d’AWS, vers des clouds pri­vés. Il y a deux rai­sons à cela. Sur le plan éco­no­mique, alors que les usages de la don­née s’intensifient, le modèle du pay as you go, où la fac­tu­ra­tion est en fonc­tion du volume sto­cké, de la consom­ma­tion de bande pas­sante et du volume de requêtes se révèle être un gouffre finan­cier. En outre, l’entrée en vigueur du RGPD en 2018 a mar­qué une prise de conscience des enjeux liés à la pro­tec­tion des don­nées per­son­nelles. Les entre­prises euro­péennes sont aujourd’hui nom­breuses à vou­loir reprendre le contrôle de leurs don­nées, en les héber­geant sur leurs propres infra­struc­tures et/ou en choi­sis­sant la zone géo­gra­phique où celles-ci seront phy­si­que­ment héber­gées, pour évi­ter qu’elles ne soient sou­mises à des légis­la­tions étran­gères à l’instar du Cloud Act aux États-Unis. C’est exac­te­ment ce qu’OpenIO per­met, en offrant la pos­si­bi­li­té de déployer sa pla­te­forme de sto­ckage on-pre­mise (sur site) ou chez un héber­geur euro­péen tel qu’OVHcloud, dont nous sommes partenaires.

Enfin, même s’il est dif­fi­cile de se battre contre les géants du numé­rique amé­ri­cains et chi­nois, qui béné­fi­cient de vastes mar­chés inté­rieurs et de lois pro­tec­tion­nistes, nous pou­vons d’ores et déjà, pour res­tau­rer notre sou­ve­rai­ne­té numé­rique, arrê­ter de culti­ver notre com­plexe d’infériorité. Les meilleures inno­va­tions tech­no­lo­giques ne viennent pas toutes de la Sili­con Val­ley. La France compte d’excellents ingé­nieurs. Les Gafam, d’ailleurs, ne se les arrachent-ils pas ? 

Poster un commentaire