Orasio : détecter des situations critiques dans des flux vidéo

En 2024, Arnaud Delaunay (X12) a cofondé Orasio, qui développe et exploite une IA vidéo européenne pour détecter, alerter et éclairer l’action. Orasio transforme les flux vidéo en informations facilement exploitables pour les villes, les forces de sécurité intérieure et les entreprises.
Arnaud, quel est ton parcours ?
J’ai intégré l’École polytechnique en 2012 après une prépa à Ginette, où j’ai rencontré mes deux cofondateurs, Florian Fournier (X13) et Fabio Gennari. Après l’X, j’ai fait une 4A à Télécom Paris en maths appliquées et informatique, avec une spécialisation en Machine Learning. Dès le début, j’ai monté ma première start-up en parallèle avec mes études : une solution d’IA appliquée à la vidéo et à l’image pour la publicité en ligne, utilisant du deep learning pour détecter des produits dans les images et les rendre « achetables ». Cette aventure m’a lancé dans l’IA appliquée à l’image.
Ensuite, j’ai rejoint Linkvalue, une entreprise de services, pour y créer un pôle Machine Learning. Pendant six ans, j’ai travaillé sur des projets dans l’assurance, l’e-commerce et le voyage, tout en structurant ce pôle. Puis j’ai rejoint FarmWise, une start-up de robotique agricole, pour diriger leur équipe IA. Là, j’ai découvert « l’embarqué » (Embodied AI ou « IA embarquée ») : des modèles d’IA intégrés dans des robots, avec des contraintes fortes (temps réel, ressources limitées, conditions extrêmes).

Vous êtes trois cofondateurs. Peux-tu nous parler de Florian Fournier et Fabio Gennari ?
Florian a un parcours entrepreneurial très solide. Il a cofondé PayFit, une solution de paie pour les PME, qui est devenue une licorne. Il a quitté PayFit il y a deux ans avec l’envie de monter un nouveau projet, cette fois dans la défense et la souveraineté européenne. Pendant un an, il a rencontré des centaines d’acteurs du secteur avant de converger vers l’idée d’allier IA et vidéo. C’est lui qui est venu nous chercher, Fabio et moi. Il apporte une expertise précieuse : il connaît l’exécution, le go-to-market, et a un réseau solide pour développer un champion européen. Fabio, lui, a un profil très différent. Après HEC et l’ENA, il a été juge au Conseil d’État, puis a travaillé en cabinet ministériel. Son expérience est cruciale pour nous : il maîtrise les questions légales (vie privée, gestion des données) et comprend les attentes des institutions publiques, qui sont nos clients finaux.
Quelle est l’activité d’Orasio ?
Chez Orasio, on développe des solutions de vidéo intelligence – c’est-à-dire de l’IA appliquée à l’analyse vidéo, spécifiquement pour la défense et la sécurité intérieure. Les solutions d’Orasio permettent de détecter en temps réel ou a posteriori des situations critiques dans des flux vidéo. À l’origine, le projet est né d’un constat : l’IA appliquée à la vidéo va connaître une adoption massive ces dix prochaines années et va jouer un rôle de plus en plus important dans les problématiques de sécurité intérieure et de défense, mais les leaders du marché sont américains, israéliens ou chinois. En Europe, on dépend souvent de solutions non souveraines, ce qui pose des problèmes de conformité légale (le RGPD, par exemple, n’est pas toujours respecté) et de souveraineté. On a voulu créer une solution européenne, performante et alignée avec nos valeurs.




Qui sont vos clients ?
Nous travaillons avec trois types de clients. D’abord les armées et services spécialisés européens : forces spéciales, services de renseignement, et de plus en plus les armées régulières. Elles utilisent des capteurs vidéo, que ce soit sur des véhicules, sur des drones, ou des caméras « abandonnées » (posées discrètement pour préparer des opérations ou recueillir du renseignement). Ensuite les acteurs de la sécurité intérieure : collectivités locales, polices municipales qui ont déjà des parcs de vidéoprotection. Notre technologie les aide à accélérer leurs enquêtes ou à recevoir des alertes en temps réel. Par exemple, si un événement se produit, elles peuvent retrouver rapidement les extraits vidéo pertinents ou être alertées automatiquement. Enfin les infrastructures critiques : aéroports, gares, centrales nucléaires… Ces sites ont souvent des systèmes de vidéosurveillance et notre IA les renforce en analysant les flux pour détecter des situations à risque.

Peux-tu m’en dire plus sur votre modèle et vos produits ?
Notre approche est simple : on ne vend pas de caméras. On part du principe que nos clients ont déjà des équipements et on leur propose un système pour analyser leurs flux vidéo existants. Nos solutions s’appuient sur deux piliers. D’une part l’embarqué : un produit qui analyse les flux en temps réel, sans dépendre du cloud et avec une signature électromagnétique réduite pour éviter d’être repéré. C’est une solution conçue pour les forces spéciales ou les unités en mission.
D’autre part sur site : pour les villes ou les infrastructures critiques, on déploie notre logiciel directement dans leurs salles serveurs. Les données restent locales et on utilise des modèles d’IA optimisés pour traiter des milliers de flux sans faire exploser les coûts. La clé, c’est notre maîtrise des modèles d’IA. On utilise ce qu’on appelle des modèles open world : contrairement aux systèmes classiques, qui ne reconnaissent que des objets prédéfinis (une voiture, un piéton…), nos modèles comprennent des descriptions libres. Par exemple, si un enquêteur cherche un van jaune avec une barre de toit, notre IA peut retrouver les séquences correspondantes, même si ces détails n’étaient pas dans sa base d’apprentissage. C’est une vraie révolution pour les utilisateurs, qui étaient jusqu’alors limités à des recherches basiques.

Comment faites-vous pour avoir la maîtrise de vos solutions en intégrant des composants non européens ?
Aujourd’hui, dans nos boîtiers, il y a par exemple des composants pour la partie accélération hardware qui sont américains, mais notre stack logiciel est conçu pour être agnostique. Si demain un fabricant européen ou chinois propose une autre solution, on pourra facilement basculer. En effet nous n’utilisons pas les librairies logicielles proposées par ces fournisseurs qui facilitent l’utilisation de leurs produits ; nous faisons le choix de tout réécrire pour ne pas être dépendants. La souveraineté, c’est aussi ça : ne pas être prisonnier d’un seul fournisseur. Côté hébergement, nous entraînons nos modèles chez Scaleway, entreprise française avec des serveurs en France.
En quoi vos solutions sont-elles différentes des caméras « intelligentes » qui existent depuis plus longtemps ?
Les caméras intelligentes actuelles embarquent des modèles très limités : elles peuvent détecter des voitures ou des piétons, mais seulement si ces classes ont été programmées à l’avance. Nous, nous allons bien plus loin. Nos modèles comprennent le contexte sémantique – ils ne se contentent pas de reconnaître des objets, ils interprètent des descriptions complexes. C’est un peu comme un moteur de recherche pour la vidéo : l’utilisateur décrit ce qu’il cherche en langage naturel et l’IA trouve les extraits correspondants. On s’inspire des travaux de Yann LeCun (qui est d’ailleurs un de nos investisseurs) : plutôt que de miser sur des modèles génératifs larges et très consommateurs en ressources, on optimise des modèles spécialisés dans la compréhension et la recherche d’informations. Cela permet de traiter les flux en temps réel, ce qui est indispensable pour nos clients.
Où en êtes-vous aujourd’hui, après quinze mois d’existence ?
Dès le départ, on a voulu une entreprise européenne. On a levé 16 millions d’euros en 2025 avec des investisseurs français, allemands et polonais (Frst, GFC, Expeditions) et on s’est entouré de senior advisors comme Jürgen Stock (ex-numéro 1 d’Interpol) ou Jens Henrik Højbjerg (ex-chef de la police danoise), pour n’en citer que deux. Leur expérience nous aide à comprendre les besoins du terrain et à nous déployer rapidement en Europe – on est déjà présent en Belgique, au Danemark, en Lituanie, en Estonie, et même en Ukraine, où nos outils sont testés en conditions.
“On est présent même en Ukraine, où nos outils sont testés en conditions.”
En France, nous avons déjà reçu des commandes directement de certaines unités des forces spéciales, ainsi que, plus récemment, de l’Amiad. L’Amiad, créée en mai 2024, est l’Agence ministérielle pour l’intelligence artificielle de défense. Dirigée par Bertrand Rondepierre (X10), elle a pour mission de développer des solutions pour les armées françaises et d’acquérir des innovations en matière d’IA auprès d’acteurs industriels. Côté sécurité intérieure, nous collaborons déjà avec une trentaine de villes, en France comme en Europe. Notre équipe est volontairement restreinte (une vingtaine de personnes) pour rester agile, mais elle couvre tous les métiers : ingénieurs IA, experts hardware, développeurs web, et une équipe commerciale qui connaît bien le marché. On mise aussi beaucoup sur l’UX : nos outils doivent être intuitifs, même pour des utilisateurs non techniques.
Quelles sont vos perspectives de développement ?
Le marché de l’IA vidéo est en pleine expansion, surtout dans la défense. Avec la guerre en Ukraine, on voit à quel point les drones et la vidéo sont devenus centraux. Les armées régulières ont besoin d’outils performants pour analyser ces données et c’est une occasion pour nous de proposer des solutions souveraines. Côté sécurité intérieure, on travaille aussi avec la police judiciaire et la gendarmerie, qui exploitent de plus en plus de vidéos dans leurs enquêtes. Et, bien sûr, on continue à innover : les modèles d’IA progressent vite, et on collabore avec des chercheurs comme Yann LeCun pour rester à la pointe. Il y a encore beaucoup à faire sur la sécurité intérieure et la défense européenne dans les prochaines années.





