Des algorithmes et des hommes, Applications de l’intelligence artificielle à la justice

Dossier : Nouvelles du PlatâlMagazine N°742 Février 2019
Par Robert RANQUET (72)
La JR a rencontré le professeur Michalis Vazirgiannis, chef du DaSciM (Data Science and Mining Team) au LiX – École polytechnique : travaux pionniers pour l’application des techniques d’IA et de machine learning au domaine de la justice.

Notre équipe tra­vaille à par­tir de l’idée que, avec les moyens de cal­cul et les bases de don­nées dont on dis­pose main­tenant, il est désor­mais pos­si­ble d’extraire et d’exploiter des infor­ma­tions intéres­santes de grands ensem­bles de don­nées. C’est quelque chose qui avait été entre­vu dès les années 90, avec un pre­mier intérêt pour l’intelligence arti­fi­cielle à l’époque, mais les moyens tech­niques n’étaient pas au ren­dez-vous. Main­tenant, ils le sont, et on pro­gresse vite.

J’ai rejoint l’X en 2013, venant d’Athènes où j’enseignais l’informatique à l’université d’Économie et d’Affaires. Nous avons démar­ré dans le cadre d’un pro­jet financé par le réseau de recherche Dig­i­teo de Saclay, et nous avons dévelop­pé trois piliers pour notre activité.

En pre­mier lieu, l’enseignement. Nous avons intro­duit ce domaine pour la pre­mière fois dans les enseigne­ments du cycle ingénieur poly­tech­ni­cien, autour de notions comme le Text Min­ing (extrac­tion de texte) ou le NLP (traite­ment du lan­gage naturel).

Ensuite, bien sûr la recherche. Nous tra­vail­lons sur l’apprentissage automa­tique (machine learn­ing) sur des don­nées à grande échelle, avec un intérêt par­ti­c­uli­er pour ce qui est textes et graphes. En effet, beau­coup de choses sont représenta­bles par des graphes. Nous avons tra­vail­lé sur un nou­veau con­cept de « graphes de mots », en mélangeant des doc­u­ments sous formes de textes et de graphes.

Et enfin, des pro­jets final­isés, car il faut bien financer toute notre recherche : nous avons ain­si obtenu 2 mil­lions d’euros de finance­ment indus­triel en cinq ans, avec notam­ment une chaire de « Data Sci­ence » portée par AXA, mais nous avons tra­vail­lé aus­si avec Google, Microsoft, la FDJ…

“L’IA produit une cartographie
sociale de la pratique des avocats
et des juges”

C’est ain­si que j’en suis venu à m’intéresser à la smart law, c’est-à-dire les appli­ca­tions de l’intelligence arti­fi­cielle au domaine de la jus­tice. C’est un tra­vail que nous avons entre­pris avec David Restre­po, qui est pro­fesseur de droit à HEC. Il con­siste à s’intéresser à l’extraction d’information utile à par­tir des don­nées con­sti­tuées par les déci­sions de jus­tice du ressort de la cour d’appel de Paris. C’est la cour d’appel la plus impor­tante de France, avec plus de 50 juri­dic­tions sub­or­don­nées (tri­bunaux de grande instance, tri­bunaux de com­merce, prud’hommes, etc.) répar­ties sur six départe­ments français. Elle pro­duit un grand nom­bre de déci­sions de jus­tice : nous tra­vail­lons actuelle­ment sur une base de don­nées de 12 000 textes, com­pilée par Dal­loz. À terme, on devrait arriv­er à un mil­lion de textes.

Nous appliquons donc nos méth­odes sur ces don­nées-textes pour en tir­er dif­férents types d’informations.

Par exem­ple, nous tra­vail­lons sur le « réseau social » con­sti­tué par les juges et les avo­cats impliqués dans ces déci­sions (ils sont près de 3 000…). On peut ain­si car­togra­phi­er ce réseau et y iden­ti­fi­er des infor­ma­tions intéres­santes : par exem­ple en faisant de la « détec­tion de com­mu­nautés » : quels sont les avo­cats qui se retrou­vent le plus sou­vent dans les mêmes affaires, quels sont ceux qui gag­nent le plus sou­vent, ou bien qui per­dent le plus sou­vent, et con­tre qui, etc. L’IA pro­duit ain­si une car­togra­phie sociale de la pra­tique des avo­cats et des juges. On débouche sur un classe­ment des avo­cats par type d’affaires traitées, ou par chance de suc­cès. Le bar­reau de Paris est très intéressé par ces avancées.

On peut tra­vailler aus­si, non plus sur les acteurs judi­ci­aires et leurs réseaux, mais sur les affaires elles-mêmes. Les mêmes tech­niques per­me­t­tent de visu­alis­er com­ment les affaires traitées par la cour d’appel de Paris s’organisent autour de thèmes iden­ti­fiés par les arti­cles de loi aux­quels il est fait référence dans les déci­sions. Les graphes repro­duits ci-dessus représen­tent les 1 500 affaires traitées par la cour d’appel au dernier trimestre 2018. On voit que le niveau de struc­tura­tion se pré­cise quand on aug­mente le nom­bre d’articles de loi com­muns à plusieurs déci­sions que l’on retient comme paramètre de mise en rela­tion de deux affaires (paramètre k = 2, 3, 4…) : pour k = 2 (c’est-à-dire quand on retient de met­tre en rela­tion les affaires qui impliquent 2 arti­cles de loi iden­tiques), le résul­tat reste très con­fus. Quand on passe à k = 3 puis 4, le graphe se struc­ture pro­gres­sive­ment. On fait ain­si appa­raître des réseaux prin­ci­paux et des sous-réseaux, et on iden­ti­fie des thèmes autonomes, c’est-à-dire qui ne se con­nectent pas aux réseaux prin­ci­paux, comme on le voit sur la fig­ure. Ici, on iden­ti­fie des groupes de déci­sions isolés por­tant par exem­ple sur les lit­iges au sujet des Airbnb, ou un autre relatif à des lit­iges con­cer­nant la SNCF… On accède ain­si à une appréhen­sion glob­ale du champ des déci­sions judi­ci­aires. Tout cela peut con­tribuer à davan­tage d’accessibilité de ce champ pour les jus­ti­cia­bles, et à davan­tage de trans­parence du sys­tème dans son ensemble. 

Poster un commentaire