La transformation des métiers de la santé

Dossier : L'intelligence artificielleMagazine N°733 Mars 2018
Par Jean-Philippe VERT (X92)

Les algo­rithmes d’intelligence arti­fi­cielle cherchent main­tenant à exploiter l’im­men­sité des dossiers médi­caux pour essay­er d’as­sur­er une bonne préven­tion ou pre­scrire un traite­ment per­son­nal­isé. Pour de mul­ti­ples raisons les résul­tats obtenus sont mit­igés, on arrive à égaler l’ex­pert, mais pas encore à le surpasser.

En dépit de toutes les don­nées dont on dis­pose, le choix d’un traite­ment con­tre un can­cer (chirurgie, chimio­thérapie, thérapie ciblée…) s’effectue, à quelques excep­tions près, comme il y a quinze ans, à par­tir d’un nom­bre lim­ité de paramètres comme l’âge du patient, la taille et l’aspect au micro­scope de la tumeur, la présence ou non de métas­tases, ou l’expression de deux ou trois pro­téines connues.

REPÈRES

Le génome humain a été décrypté il y a quinze ans, et les médecins disposent maintenant de technologies permettant de caractériser au niveau moléculaire chaque patient, par exemple en identifiant la liste exhaustive des milliers de mutations dans son ADN ou celle de sa tumeur.
Les techniques d’imagerie ont également beaucoup progressé depuis quinze ans, et les médecins ont par ailleurs accès à l’ensemble du dossier médical de chaque patient sous forme électronique, notamment les diverses analyses biologiques, radiographies, échographies, IRM, etc.
Mises bout à bout, ces données représentent facilement des téraoctets de données par patient.

ASSISTER L’EXPERTISE HUMAINE

On peut légitime­ment se deman­der si une meilleure exploita­tion des don­nées de san­té, cou­plée à des algo­rithmes d’intelligence arti­fi­cielle, pour­rait amélior­er la pra­tique médi­cale, par exem­ple pour iden­ti­fi­er le traite­ment le plus effi­cace pour chaque patient, éviter des traite­ments inutiles ou néfastes, voire pour pro­pos­er des approches thérapeu­tiques com­plète­ment nouvelles.

La réponse à cette ques­tion est cer­taine­ment pos­i­tive, au moins pour cer­taines appli­ca­tions de l’intelligence arti­fi­cielle visant à automa­tis­er ou imiter cer­taines tâch­es faites actuelle­ment par des experts humains ; elle me sem­ble moins évi­dente, au moins sur le court et moyen terme, pour ce qui con­cerne le dépasse­ment de l’expertise humaine.

MIEUX INTERPRÉTER LES CLICHÉS MÉDICAUX

Le pre­mier type d’applications com­prend des tâch­es visant à « imiter » l’expertise humaine.


L’IA peut aider les médecins à inter­préter des clichés. © FOTOGRAFICHE.EU

Par exem­ple, quand il s’agit de détecter une tumeur sur une mam­mo­gra­phie ou de décider si un grain de beauté pris en pho­to par un smart­phone est poten­tielle­ment un mélanome.

Ces tâch­es sont effec­tuées aujourd’hui par des humains, générale­ment experts et entraînés pen­dant de longues années. Il est dif­fi­cile d’automatiser ces tâch­es avec des algo­rithmes basés sur des règles fix­es, car il est dif­fi­cile de coder explicite­ment com­ment l’expert prend sa décision.

Mais il est facile de col­lecter de grandes quan­tités de don­nées annotées par ces experts, ce qui ouvre la voie à l’utilisation de tech­niques d’apprentissage super­visée pour laiss­er le pro­gramme « appren­dre » à imiter l’expert.

UNE AIDE AU DIAGNOSTIC

De telles appli­ca­tions peu­vent avoir un impact impor­tant et rapi­de sur la pra­tique médi­cale. Elles four­nissent un référen­tiel con­sis­tant, util­is­able dans de nom­breux hôpi­taux, notam­ment aux endroits ne dis­posant pas des meilleurs experts. Elles peu­vent démoc­ra­tis­er et faciliter l’accès à cer­tains exa­m­ens, comme l’analyse rapi­de d’images pris­es par un smart­phone, afin de faire entr­er dans le sys­tème de soins des patients à un stade plus pré­coce de la mal­adie, et donc plus facile à traiter.

Elles peu­vent aus­si décharg­er les experts de cer­taines tâch­es répéti­tives afin qu’ils puis­sent se con­cen­tr­er sur les tâch­es à plus forte valeur ajoutée, comme l’analyse plus fine des images ou des dossiers iden­ti­fiés à risque par un algo­rithme automatique.

IMITER OU DÉPASSER L’EXPERT

Plutôt qu’imiter un expert, un sys­tème infor­ma­tique peut-il le dépass­er et, par exem­ple, faire des diag­nos­tics plus pré­cis que les humains ou sug­gér­er de nou­velles approches thérapeutiques ?

PRÉDICTIONS PAR ALGORITHME

Des équipes de l’université Stanford ont entraîné un réseau de neurones pour reconnaître des cancers potentiels à partir d’images de la peau, en entraînant le modèle sur 130 000 images annotées par des experts.
Dans une étude publiée en 2017 dans la revue Nature, elles ont montré qu’après entraînement les prédictions de l’algorithme étaient aussi précises que celles de dermatologistes professionnels.

Cette vision séduisante, large­ment véhiculée par les médias, fait l’objet d’intenses efforts de recherche et d’investissement de la part du monde académique et indus­triel. Dans le lan­gage de l’intelligence arti­fi­cielle, la dif­férence entre « imiter l’expert » et « dépass­er l’expert » n’est pas très impor­tante et s’appuie sur les mêmes con­cepts et out­ils algorithmiques.

“ La révolution génomique des années 2000 n’a pas encore révolutionné le traitement des cancers ”

En effet, pour imiter l’expert, un sys­tème d’apprentissage automa­tique sera entraîné de manière super­visée avec des don­nées pour lui appren­dre le lien entre des mesures (par exem­ple, un dossier médi­cal) et une déci­sion prise par un expert (par exem­ple, iden­ti­fi­er une tumeur).

Pour dépass­er l’expert, il suf­fit d’entraîner le même sys­tème non pas avec les déci­sions de l’expert, mais par exem­ple avec l’évolution observée de la mal­adie suite à un traitement.

DES RÉSULTATS PARFOIS EN DEÇÀ DES ESPOIRS

Mal­gré sa sim­plic­ité con­ceptuelle, la tâche peut cepen­dant se révéler ardue, et les résul­tats tar­dent encore à se con­cré­tis­er dans la pra­tique médi­cale. Prenons l’exemple du choix thérapeu­tique dans le can­cer du sein.

Consultation médicale et recueil de données
Col­lecter des mil­lions de paramètres ne suf­fit pas à révo­lu­tion­ner les pra­tiques. © SEPY

Depuis une quin­zaine d’années, plusieurs études ont col­lec­té des grandes quan­tités de don­nées génomiques sur des cohort­es de patients atteints de can­cer, afin d’identifier des mod­èles pré­dic­tifs de risque de récidive ou de réponse aux traite­ments par appren­tis­sage statistique.

Cer­taines études ont d’ailleurs abouti à des mod­èles pré­dic­tifs com­mer­cial­isés, bas­ant leur pré­dic­tion sur l’analyse de quelques dizaines de gènes iden­ti­fiés par des procé­dures automatiques.

Mais leur per­for­mance est au plus mar­ginale­ment supérieure aux approches stan­dard, pour un coût bien supérieur ; la révo­lu­tion génomique des années 2000 n’a pas encore révo­lu­tion­né le traite­ment des can­cers, mal­gré les quan­tités phénomé­nales de don­nées collectées.

Il sem­ble donc qu’il ne suff­ise pas de col­lecter des mil­lions de paramètres a pri­ori intéres­sants et d’entraîner des mod­èles d’apprentissage automa­tique pour révo­lu­tion­ner une pra­tique qui peut sem­bler bien naïve, mais reste large­ment util­isée dans les hôpitaux.

BIG DATA VS DIRTY DATA

Pourquoi de telles approches, con­sis­tant à col­lecter des grandes quan­tités de don­nées et à entraîn­er des mod­èles (par­fois com­plex­es), n’améliorent-elles pas tou­jours des approches stan­dard sou­vent basées sur un petit nom­bre de paramètres ? On peut avancer plusieurs raisons. Tout d’abord se pose la ques­tion de la qual­ité des don­nées : il peut arriv­er que big data soit sou­vent lié à dirty data, et que le bruit des don­nées cache le sig­nal intéressant.

“ Le moteur de l’intelligence artificielle est de parvenir à collecter de grandes quantités de données sur beaucoup d’individus ”

Les pro­grès tech­nologiques et la stan­dard­i­s­a­tion des pro­to­coles peu­vent résoudre en par­tie cette ques­tion, même si les don­nées comme les comptes ren­dus d’examens médi­caux rédigés en texte libre par des médecins restent red­outable­ment dif­fi­ciles à standardiser.

Deux­ième­ment, il se peut que, même sans bruit, les don­nées mesurées ne con­ti­en­nent pas l’information per­ti­nente pour résoudre le prob­lème iden­ti­fié. Par exem­ple, il se peut que le niveau d’expression des 20 000 gènes codés par notre génome ne con­ti­enne pas plus d’information que qua­tre ou cinq paramètres clin­iques stan­dard pour prédire le risque d’une récidive du cancer.

CROISER LES APPROCHES

Pour pal­li­er ce prob­lème, une solu­tion sem­ble alors de col­lecter des don­nées dif­férentes, par exem­ple de com­pléter l’expression des gènes par les muta­tions de l’ADN, les images d’IRM, l’ensemble du dossier médi­cal, etc., en espérant qu’en com­bi­nant plus de don­nées, on aug­mente l’information qu’elles con­ti­en­nent pour le prob­lème de pré­dic­tion que l’on cherche à résoudre.

Cepen­dant, cette ten­dance se heurte frontale­ment à une troisième rai­son qui peut expli­quer la faible per­for­mance des mod­èles pré­dic­tifs : le fait que pour entraîn­er des mod­èles pré­dic­tifs per­for­mants par appren­tis­sage automa­tique, il faut beau­coup d’exemples, dans notre cas beau­coup de patients ; et plus on mesure de paramètres dif­férents, plus il faut d’exemples, pour des raisons pure­ment math­é­ma­tiques et statistiques.

Morceau d'ADN
Il se peut que le niveau d’expression des 20 000 gènes codés par notre génome ne con­ti­enne pas plus d’information que qua­tre ou cinq paramètres clin­iques stan­dard pour prédire le risque d’une récidive du can­cer.
© VITSTUDIO

Cela pose la ques­tion de dévelop­per la théorie et les algo­rithmes pour l’apprentissage automa­tique de mod­èles com­plex­es à par­tir de rel­a­tive­ment peu de don­nées, ques­tion pas­sion­nante mais difficile.

DES QUESTIONS ÉTHIQUES ET LÉGALES

Le moteur de l’intelligence arti­fi­cielle étant de par­venir à col­lecter de grandes quan­tités de don­nées sur beau­coup d’individus, le domaine de la san­té soulève des ques­tions spé­ci­fiques à ce sujet. En plus de la dif­fi­culté fon­da­men­tale de réu­nir des cohort­es de patients de taille suff­isante, les ques­tions éthiques et légales autour de la manip­u­la­tion des don­nées de san­té sont nombreuses.

Qui pos­sède les don­nées ? Qui peut les utilis­er ? À quelles fins ? À qui appar­tien­dront les résul­tats ? Autant de ques­tions au cœur de nom­breuses dis­cus­sions actuelle­ment entre les dif­férents acteurs, notam­ment la société civile et les asso­ci­a­tions de patients, le lég­is­la­teur, le corps médi­cal et les entreprises.

Ces débats dépassent le côté pure­ment tech­nique de savoir si, grâce à ces don­nées, un ordi­na­teur aura un jour la capac­ité de mieux traiter un malade qu’un médecin aujourd’hui.

Poster un commentaire