Bioptimus : des modèles fondation pour révéler les lois du vivant


Fondée fin 2023, Bioptimus développe des modèles d’intelligence artificielle à large échelle pour révolutionner notre compréhension du vivant et accélérer les innovations biomédicales. L’ambition : créer le « GPT du vivant » en bâtissant le premier modèle fondation d’IA entraîné sur des données biologiques multiscales et multimodales. À l’initiative de ce projet audacieux, des anciens de Google, Deepmind et Owkin, dont Jean-Philippe Vert (X92, CEO) et Zelda Mariet (X11, VP Research), qui reviennent sur la genèse de Bioptimus, ses premières réalisations, et la vision à long terme.
Comment est née Bioptimus ?
Jean-Philippe Vert : Le projet est né d’une intuition forte : les modèles d’intelligence artificielle qui ont transformé le traitement du langage ou de l’image n’ont pas encore eu d’équivalent en biologie. Pourtant, les données issues du vivant sont incroyablement riches et dotées d’une structure indéniable. Cependant, ces données sont également très complexes. Pour en extraire du sens, il faut des modèles capables d’intégrer leur structure, leur hiérarchie, leur contexte. Avec Zelda et quatre autres cofondateurs, nous avons imaginé une startup dédiée à cette ambition : construire des foundation models spécifiquement entraînés sur les données biologiques, à la croisée de l’IA, de la bioinformatique et de la médecine personnalisée. À ce jour, nous avons levé 76 millions de dollars auprès d’investisseurs de premier plan, pour faire émerger une équipe, une infrastructure technologique, et notre premier modèle d’envergure.
Zelda, que développe concrètement Bioptimus aujourd’hui ?
Zelda Mariet : Notre feuille de route repose sur une série de modèles de fondation de complexité croissante, chacun pré-entraîné sur des quantités massives de données biologiques, avec pour but de capturer les (ir-)régularités du vivant. Une fois entraînés, ces modèles peuvent soit être utilisés tels quels pour stocker, comprimer et interroger les données biologiques, soit être spécialisés (on parle souvent de « fine-tuning ») pour réaliser des tâches très spécifiques, comme prédire si un patient donné va répondre à un traitement candidat. En 2024, nous avons publié notre premier modèle de fondation pour l’histologie, entraîné sur plus d’un million d’images numériques de tissus. Ce modèle est aujourd’hui l’état de l’art sur plusieurs tâches de diagnostic en pathologie, notamment en cancers : colorectal, sein ou prostate ; il a été téléchargé plus d’un million de fois (chose surprenante pour un domaine si spécialisé !).
Nous avons aussi récemment développé des modèles capables de croiser des images de tissus avec les profils transcriptomiques obtenus par séquençage spatial, ouvrant la voie à une compréhension intégrée des processus cellulaires dans leur environnement. C’est une première étape vers des modèles véritablement multimodaux, capables de raisonner sur des données très différentes, une étape qui ouvre la voie vers la compréhension des mécanismes interconnectés des lois du vivant.
En quoi votre approche diffère-t-elle des précédentes tentatives ?
J-P.V : La principale différence, c’est l’échelle scientifique et technique à laquelle nous opérons. Il ne s’agit plus d’entraîner des modèles par tâche ou par modalité, mais de créer une infrastructure unifiée d’apprentissage biologique — un modèle aux capacités générales, que l’on fine-tune ensuite pour des usages concrets : prédire la réponse à un traitement, inférer des relations cellule-microenvironnement, détecter des mutations pathogènes inconnues, etc. Nos modèles sont conçus pour être interprétables, portables et utiles sur des cas rares — ce qui est fondamental en biomédecine.
Comment gérez-vous l’accès aux données et les collaborations scientifiques ?
Z.M : Nous collaborons avec plusieurs hôpitaux, biobanques, entreprises et centres de recherche en France et à l’international. Notre stratégie consiste à fédérer les données existantes, souvent sous-utilisées, en garantissant la sécurité, l’éthique et la souveraineté numérique. Ces partenariats sont au cœur de notre approche, parce que la qualité et la diversité des données sont aussi importantes que la taille des modèles.
Quelles applications concrètes visez-vous à court terme ?
J-P.V : Nos premiers cas d’usage concernent la recherche translationnelle et clinique : prédiction de biomarqueurs, détection de sous-types cellulaires, aide au diagnostic, stratification de patients pour les essais cliniques. Nous travaillons déjà avec plusieurs partenaires industriels sur des problématiques concrètes d’oncologie et d’immunothérapie. Notre technologie peut aussi servir à accélérer la découverte de nouvelles cibles thérapeutiques, en analysant les signatures transcriptionnelles dans le microenvironnement tumoral, par exemple.
La France et l’Europe peuvent-elles jouer un rôle central dans cette révolution biologique computationnelle ?
Z.M : Absolument ! L’écosystème scientifique européen est d’un niveau exceptionnel, tant en biologie qu’en IA, et attire de nombreux talents. Après l’X, j’ai moi-même effectué un PhD en mathématiques au MIT, puis travaillé chez Google Deepmind à Boston, avant de revenir en France pour fonder Bioptimus. Il faut maintenant créer des infrastructures qui permettent d’exploiter ce savoir à grande échelle. Bioptimus, en construisant des modèles de fondations pour le vivant, se veut un acte de souveraineté scientifique et technologique. C’est aussi dans cette optique que nous ancrons notre développement technique en Europe, avec un premier centre de R&D à Paris où nous réunissons régulièrement nos équipes techniques distribuées en Europe.
Comment votre formation à l’X a-t-elle influencé cette trajectoire ?
J-P.V : L’X forme à penser « systèmes », à aborder les disciplines avec rigueur et curiosité, et surtout à ne pas avoir peur des problèmes complexes et mal définis. La biologie est le système complexe par excellence, et il faut souvent jongler entre mathématiques, physique, informatique, biologie… Cette approche interdisciplinaire est dans l’ADN même de Bioptimus.
Un exemple marquant de ce que Bioptimus pourrait permettre demain ?
Z.M : Imaginez que l’on puisse identifier très tôt, à partir d’un simple prélèvement, un dérèglement cellulaire imperceptible, prédictif d’une maladie dégénérative cinq ans avant l’apparition des symptômes. Ou bien modéliser digitalement l’environnement tumoral d’un patient pour prédire l’effet d’un traitement personnalisé, sans essais multiples. Ces applications sont à portée si l’on s’appuie sur les bons modèles, entraînés à grande échelle, sur des données bien contextualisées.
Quels sont vos prochains jalons ?
J-P.V : Notre prochaine étape est de lancer notre premier modèle généraliste multimodal et multi-échelle du vivant, capable d’intégrer image, séquence, expression génique et structure 3D. Cela nécessite des jeux de données encore plus vastes, des infrastructures GPU dédiées, et des avancées méthodologiques. En parallèle, nous développons des cas d’usage cliniques avec des partenaires stratégiques, et dès 2026 nous visons la mise à disposition de modèles open source pour la communauté académique, ainsi que des solutions commerciales pour l’industrie biopharma.
Un dernier mot pour les jeunes X qui s’intéressent à la fusion IA/biologie ?
J-P.V : C’est le moment idéal pour rejoindre ce mouvement ! On vit une bascule technologique où les frontières entre code, cellule et cognition s’effacent. Pour les jeunes diplômés, c’est une opportunité rare d’avoir un impact profond, que ce soit en recherche ou en start-up. Et si cette aventure résonne avec vous… Bioptimus recrute !


