Des algorithmes et des hommes, Applications de l’intelligence artificielle à la justice

Dossier : Nouvelles du PlatâlMagazine N°742 Février 2019
Par Robert RANQUET (72)
La JR a rencontré le professeur Michalis Vazirgiannis, chef du DaSciM (Data Science and Mining Team) au LiX – École polytechnique : travaux pionniers pour l’application des techniques d’IA et de machine learning au domaine de la justice.

Notre équipe tra­vaille à par­tir de l’idée que, avec les moyens de cal­cul et les bases de don­nées dont on dis­pose main­te­nant, il est désor­mais pos­sible d’extraire et d’exploiter des infor­ma­tions inté­res­santes de grands ensembles de don­nées. C’est quelque chose qui avait été entre­vu dès les années 90, avec un pre­mier inté­rêt pour l’intelligence arti­fi­cielle à l’époque, mais les moyens tech­niques n’étaient pas au ren­dez-vous. Main­te­nant, ils le sont, et on pro­gresse vite.

J’ai rejoint l’X en 2013, venant d’Athènes où j’enseignais l’informatique à l’université d’Économie et d’Affaires. Nous avons démar­ré dans le cadre d’un pro­jet finan­cé par le réseau de recherche Digi­teo de Saclay, et nous avons déve­lop­pé trois piliers pour notre activité.

En pre­mier lieu, l’enseignement. Nous avons intro­duit ce domaine pour la pre­mière fois dans les ensei­gne­ments du cycle ingé­nieur poly­tech­ni­cien, autour de notions comme le Text Mining (extrac­tion de texte) ou le NLP (trai­te­ment du lan­gage naturel).

Ensuite, bien sûr la recherche. Nous tra­vaillons sur l’apprentissage auto­ma­tique (machine lear­ning) sur des don­nées à grande échelle, avec un inté­rêt par­ti­cu­lier pour ce qui est textes et graphes. En effet, beau­coup de choses sont repré­sen­tables par des graphes. Nous avons tra­vaillé sur un nou­veau concept de « graphes de mots », en mélan­geant des docu­ments sous formes de textes et de graphes.

Et enfin, des pro­jets fina­li­sés, car il faut bien finan­cer toute notre recherche : nous avons ain­si obte­nu 2 mil­lions d’euros de finan­ce­ment indus­triel en cinq ans, avec notam­ment une chaire de « Data Science » por­tée par AXA, mais nous avons tra­vaillé aus­si avec Google, Micro­soft, la FDJ…

“L’IA produit une cartographie
sociale de la pratique des avocats
et des juges”

C’est ain­si que j’en suis venu à m’intéresser à la smart law, c’est-à-dire les appli­ca­tions de l’intelligence arti­fi­cielle au domaine de la jus­tice. C’est un tra­vail que nous avons entre­pris avec David Restre­po, qui est pro­fes­seur de droit à HEC. Il consiste à s’intéresser à l’extraction d’information utile à par­tir des don­nées consti­tuées par les déci­sions de jus­tice du res­sort de la cour d’appel de Paris. C’est la cour d’appel la plus impor­tante de France, avec plus de 50 juri­dic­tions subor­don­nées (tri­bu­naux de grande ins­tance, tri­bu­naux de com­merce, prud’hommes, etc.) répar­ties sur six dépar­te­ments fran­çais. Elle pro­duit un grand nombre de déci­sions de jus­tice : nous tra­vaillons actuel­le­ment sur une base de don­nées de 12 000 textes, com­pi­lée par Dal­loz. À terme, on devrait arri­ver à un mil­lion de textes.

Nous appli­quons donc nos méthodes sur ces don­nées-textes pour en tirer dif­fé­rents types d’informations.

Par exemple, nous tra­vaillons sur le « réseau social » consti­tué par les juges et les avo­cats impli­qués dans ces déci­sions (ils sont près de 3 000…). On peut ain­si car­to­gra­phier ce réseau et y iden­ti­fier des infor­ma­tions inté­res­santes : par exemple en fai­sant de la « détec­tion de com­mu­nau­tés » : quels sont les avo­cats qui se retrouvent le plus sou­vent dans les mêmes affaires, quels sont ceux qui gagnent le plus sou­vent, ou bien qui perdent le plus sou­vent, et contre qui, etc. L’IA pro­duit ain­si une car­to­gra­phie sociale de la pra­tique des avo­cats et des juges. On débouche sur un clas­se­ment des avo­cats par type d’affaires trai­tées, ou par chance de suc­cès. Le bar­reau de Paris est très inté­res­sé par ces avancées.

On peut tra­vailler aus­si, non plus sur les acteurs judi­ciaires et leurs réseaux, mais sur les affaires elles-mêmes. Les mêmes tech­niques per­mettent de visua­li­ser com­ment les affaires trai­tées par la cour d’appel de Paris s’organisent autour de thèmes iden­ti­fiés par les articles de loi aux­quels il est fait réfé­rence dans les déci­sions. Les graphes repro­duits ci-des­sus repré­sentent les 1 500 affaires trai­tées par la cour d’appel au der­nier tri­mestre 2018. On voit que le niveau de struc­tu­ra­tion se pré­cise quand on aug­mente le nombre d’articles de loi com­muns à plu­sieurs déci­sions que l’on retient comme para­mètre de mise en rela­tion de deux affaires (para­mètre k = 2, 3, 4…) : pour k = 2 (c’est-à-dire quand on retient de mettre en rela­tion les affaires qui impliquent 2 articles de loi iden­tiques), le résul­tat reste très confus. Quand on passe à k = 3 puis 4, le graphe se struc­ture pro­gres­si­ve­ment. On fait ain­si appa­raître des réseaux prin­ci­paux et des sous-réseaux, et on iden­ti­fie des thèmes auto­nomes, c’est-à-dire qui ne se connectent pas aux réseaux prin­ci­paux, comme on le voit sur la figure. Ici, on iden­ti­fie des groupes de déci­sions iso­lés por­tant par exemple sur les litiges au sujet des Airbnb, ou un autre rela­tif à des litiges concer­nant la SNCF… On accède ain­si à une appré­hen­sion glo­bale du champ des déci­sions judi­ciaires. Tout cela peut contri­buer à davan­tage d’accessibilité de ce champ pour les jus­ti­ciables, et à davan­tage de trans­pa­rence du sys­tème dans son ensemble. 

Poster un commentaire