De l’intelligence dans le stockage

Dossier : Vie des entreprisesMagazine N°756 Juin 2020
Par Laurent DENEL

Offrant une scal­a­bil­ité instan­ta­née et des per­for­mances adap­tées aux nou­veaux usages des don­nées (Big Data, IA, HPC…), la tech­nolo­gie d’Object Stor­age Ope­nIO est idéale pour stock­er la pro­duc­tion de don­nées des entre­pris­es, qui ne cesse de croître. Expli­ca­tion de Lau­rent Denel, CEO et cofon­da­teur de l’entreprise.

Dans quel contexte est née la technologie OpenIO ?

World­Line, mon ancien employeur, hébergeait les plate­formes de mes­sagerie des prin­ci­paux FAI français. Nous avons assisté, après 2010, à un bas­cule­ment des usages : les util­isa­teurs ont délais­sé le stock­age local de leurs e‑mails au prof­it du stock­age sur les serveurs de mes­sagerie, ceci pour y accéder depuis n’importe quel appareil. Le défi con­sista alors à stock­er un vol­ume crois­sant de fichiers, fréquem­ment accédés, sans que les coûts d’infrastructure n’explosent.

Les solu­tions de stock­age tra­di­tion­nelles, basées sur du file sys­tem, ont mon­tré leurs lim­ites. Pour absorber le vol­ume, il fal­lait démul­ti­pli­er les machines et opér­er des migra­tions pour équili­br­er la charge et préserv­er de l’espace disponible. Ce sont des opéra­tions à risque, mobil­isant des ressources humaines.

En tant que respon­s­able de l’industrialisation de ces plate­formes de stock­age, je me suis intéressé au stock­age en mode objet, une nou­velle manière de stock­er les don­nées per­me­t­tant de « scaler » une plate­forme sans créer de silos, tout en exploitant des serveurs stan­dards x86, bien meilleur marché que les machines spé­ci­fique­ment conçues pour le stock­age des données.

Quels sont les avantages du stockage objet ?

C’est une manière de stock­er les don­nées, au même titre que le file sys­tem et le block stor­age. Si les pre­miers travaux de recherche con­cer­nant l’Object Stor­age remon­tent à plus de 20 ans, la tech­nolo­gie com­mence seule­ment à se démoc­ra­tis­er. Ses avan­tages sont de plus en plus évi­dents avec l’explosion du vol­ume de don­nées col­lec­tées et pro­duites par les entre­pris­es — des don­nées non struc­turées pour l’essentiel.

La rup­ture tech­nologique, avec l’Object Stor­age, con­siste à trans­fér­er l’intelligence du matériel vers le logiciel.
Le soft­ware-defined stor­age est la suite logique du mou­ve­ment qui a révo­lu­tion­né le com­pute (avec les machines virtuelles) puis le réseau (avec l’approche soft­ware-defined network).

Les promess­es orig­inelles de l’Object Stor­age sont nom­breuses : la scal­a­bil­ité infinie, per­me­t­tant de créer de gigan­tesques « data lakes », l’agnosticité hard­ware qui explique en par­tie la baisse des coûts, la pro­tec­tion et la haute disponi­bil­ité des données… 

L’Object Stor­age a d’abord été vu comme une solu­tion « cheap and deep » des­tinée à des besoins d’archivage, avant d’être util­isée pour partager des ressources dans le but de col­la­bor­er (le web 2.0). Aujourd’hui, alors que les entre­pris­es exploitent de plus en plus les tech­niques du Big Data et de l’IA, ce sont des machines qui lisent les don­nées, et non plus des humains. Cela néces­site de pou­voir lire et écrire les don­nées à grande vitesse. Le critère de la per­for­mance devient donc essen­tiel dans le choix d’une solu­tion de stockage.

Quelle est votre proposition de valeur sur ce segment ?

Ope­nIO appar­tient à la nou­velle généra­tion des solu­tions d’Object Stor­age, com­pat­i­ble S3 – l’API dev­enue le stan­dard de fac­to du marché.

Notre tech­nolo­gie a été conçue pour réalis­er les promess­es de l’Object Stor­age, en imposant le moins de con­traintes pos­si­ble. Nous sommes ain­si l’une des rares tech­nolo­gies à sup­port­er l’hétérogénéité hard­ware au sein d’un même clus­ter ! Nous avons, en out­re, deux atouts, qui sus­ci­tent l’intérêt des entre­pris­es qui veu­lent stock­er, mais aus­si et surtout exploiter leurs don­nées pour en extraire de la valeur : 

  • L’ « Instant Scal­ing » : la capac­ité de pou­voir ajouter des ressources à un clus­ter et d’en prof­iter immé­di­ate­ment, alors que la plu­part des tech­nolo­gies con­cur­rentes néces­si­tent un rebras­sage des don­nées pour rééquili­br­er la charge après l’ajout de nou­velles machines, une opéra­tion qui peut ralen­tir la plate­forme pen­dant des semaines, voire des mois entiers ;
  • La per­for­mance : nous sommes recon­nus comme l’une des solu­tions les plus per­for­mantes du marché, en ter­mes de bande pas­sante atteignable. Fin 2019, nous avons déployé Ope­nIO sur plus de 350 serveurs, mis à dis­po­si­tion par Criteo. Ce bench­mark a per­mis d’atteindre 1.372 téra­bit de don­nées écrites par sec­onde. Si nous n’avions pas été con­traints par la capac­ité réseau disponible, nous auri­ons pu aller encore au-delà. Plus récem­ment, nous avons com­paré les per­for­mances d’OpenIO à celles d’HDFS, le sys­tème de fichi­er dis­tribué de l’écosystème Big Data Hadoop. Ope­nIO appa­raît plus rapi­de qu’HDFS pour servir les don­nées à un clus­ter de calcul !

Enfin, le cœur de notre tech­nolo­gie est open source, une garantie de péren­nité. Nous pro­posons une souscrip­tion annuelle pour faire béné­fici­er nos clients de l’expertise et du sup­port de nos équipes.

“Les meilleures innovations technologiques
ne viennent pas toutes de la Silicon Valley.
La France compte
d’excellents ingénieurs.”

Qui sont vos clients ?

Aujourd’hui, la plu­part des entre­pris­es se dis­ent « data cen­tric ». Elles manip­u­lent des vol­umes con­séquents de don­nées et elles en extraient de la valeur : meilleure con­nais­sance de leurs clients, amélio­ra­tion de leurs pro­duits et ser­vices, inno­va­tion, accéléra­tion de la recherche… 

Ope­nIO compte ain­si par­mi ses clients des entre­pris­es comme la start-up française Kayrros, leader de l’intelligence économique dans le domaine de l’énergie ; ou Relex Solu­tions, orig­i­naire de Fin­lande, qui utilise les don­nées des acteurs du retail pour opti­miser leur sup­ply chain. Notre tech­nolo­gie a aus­si été choisie par le CEA, ain­si que l’Institut du cerveau de la moelle épinière à Paris.

Nous avons égale­ment des clients dans le domaine des médias, comme Dai­ly­mo­tion ou Canal+, dont les besoins de stock­age excè­dent les dizaines de pétaoctets. Enfin, notre tech­nolo­gie intéresse les Cloud providers, qui four­nissent à leurs clients des ser­vices d’hébergement et de stockage.

scalabilité de sa solution d’Object Storage, OpenIO
Pour démon­tr­er la per­for­mance et la scal­a­bil­ité de sa solu­tion d’Object Stor­age, Ope­nIO a déployé sa tech­nolo­gie sur plus de 350 serveurs, gra­cieuse­ment mis à dis­po­si­tion par Criteo. Ce bench­mark a per­mis d’atteindre 1.372 téra­bit de don­nées écrites par seconde.

En quoi la volonté de reconquérir notre souveraineté numérique est-elle favorable à des technologies comme OpenIO ?

L’usage de l’Object Stor­age a été large­ment démoc­ra­tisé par Ama­zon Web Ser­vices (AWS) avec Sim­ple Stor­age Ser­vice (S3) qui est aujourd’hui le leader du marché. On observe toute­fois un mou­ve­ment de « Data Repa­tri­a­tion », c’est-à-dire de migra­tion des don­nées depuis les clouds publics, tels que celui d’AWS, vers des clouds privés. Il y a deux raisons à cela. Sur le plan économique, alors que les usages de la don­née s’intensifient, le mod­èle du pay as you go, où la fac­tura­tion est en fonc­tion du vol­ume stocké, de la con­som­ma­tion de bande pas­sante et du vol­ume de requêtes se révèle être un gouf­fre financier. En out­re, l’entrée en vigueur du RGPD en 2018 a mar­qué une prise de con­science des enjeux liés à la pro­tec­tion des don­nées per­son­nelles. Les entre­pris­es européennes sont aujourd’hui nom­breuses à vouloir repren­dre le con­trôle de leurs don­nées, en les hébergeant sur leurs pro­pres infra­struc­tures et/ou en choi­sis­sant la zone géo­graphique où celles-ci seront physique­ment hébergées, pour éviter qu’elles ne soient soumis­es à des lég­is­la­tions étrangères à l’instar du Cloud Act aux États-Unis. C’est exacte­ment ce qu’OpenIO per­met, en offrant la pos­si­bil­ité de déploy­er sa plate­forme de stock­age on-premise (sur site) ou chez un hébergeur européen tel qu’OVHcloud, dont nous sommes partenaires.

Enfin, même s’il est dif­fi­cile de se bat­tre con­tre les géants du numérique améri­cains et chi­nois, qui béné­fi­cient de vastes marchés intérieurs et de lois pro­tec­tion­nistes, nous pou­vons d’ores et déjà, pour restau­r­er notre sou­veraineté numérique, arrêter de cul­tiv­er notre com­plexe d’infériorité. Les meilleures inno­va­tions tech­nologiques ne vien­nent pas toutes de la Sil­i­con Val­ley. La France compte d’excellents ingénieurs. Les Gafam, d’ailleurs, ne se les arrachent-ils pas ? 

Poster un commentaire