La modélisation permet d’utiliser au mieux les données disponibles

Dossier : Épidémiologie : au service de la santéMagazine N°670 Décembre 2011
Par Pierre-Yves BOËLLE

REPÈRES

REPÈRES
L’épidémiologie étudie les vari­a­tions de fréquence des mal­adies et recherche les déter­mi­nants de ces vari­a­tions. Cer­taines de ces vari­a­tions ne peu­vent être étudiées expéri­men­tale­ment en pra­tique : le rôle du tabag­isme dans le can­cer des bronch­es, la fer­me­ture des écoles pour lim­iter une épidémie, etc. L’épidémiologie doit donc s’appuyer avant tout sur des don­nées obser­va­tion­nelles (non expéri­men­tales). Le recours à la mod­éli­sa­tion math­é­ma­tique, sta­tis­tique et infor­ma­tique per­met l’analyse et la con­clu­sion à par­tir de telles don­nées en réduisant les erreurs d’interprétation. Elle per­met égale­ment, lorsque cela est per­ti­nent, de faire des pré­dic­tions qui pour­ront être validées par des obser­va­tions ultérieures.

En épidémi­olo­gie, il n’existe pas de con­sen­sus sur ce qui con­stitue un tra­vail de mod­éli­sa­tion, ou plus exacte­ment sur l’existence d’une fron­tière nette entre analyse de don­nées et modélisation.

L’étude des épidémies a sus­cité de nom­breux travaux de modélisation

Une analyse sta­tis­tique n’est générale­ment pas con­sid­érée comme une mod­éli­sa­tion, même si elle fait appel à des math­é­ma­tiques élaborées (par exem­ple la régres­sion de Cox en analyse de survie) ; alors qu’un arbre de déci­sion, fondé sur de sim­ples règles de pro­por­tion­nal­ité, est générale­ment qual­i­fié de mod­èle. Les trois exem­ples suiv­ants illus­trent la place essen­tielle de la mod­éli­sa­tion dans l’épidémiologie moderne.

Épidémies et démographie

Les équa­tions de Ross
Les bases de la mod­éli­sa­tion des épidémies ont été posées par Ross, lors de ses travaux sur la malar­ia au début du XXe siè­cle. La for­mu­la­tion repose sur la déf­i­ni­tion de com­par­ti­ments regroupant des indi­vidus arrivés à la même étape dans l’histoire naturelle de l’infection, puis du flux entre ces com­par­ti­ments. Un sys­tème d’équations dif­féren­tielles ordi­naires per­met de retrou­ver la forme typ­ique d’une épidémie, avec une crois­sance qua­si expo­nen­tielle au départ, suiv­ie d’un pic et d’une diminu­tion plus lente. Ce mod­èle per­met égale­ment une avancée con­ceptuelle majeure avec la notion de seuil épidémique, qui per­me­t­tra de quan­ti­fi­er avec quelle force inter­venir pour con­trôler une épidémie.

L’étude des épidémies est un sujet qui a sus­cité de nom­breux travaux de mod­éli­sa­tion. La présence d’effets non linéaires rend en effet dif­fi­cile la prévi­sion de l’extension d’une épidémie, et l’extrapolation sim­ple, dans le futur ou d’un lieu à un autre, ne donne pas de bons résul­tats. La mod­éli­sa­tion a alors deux ambi­tions : la pre­mière, cog­ni­tive, est de per­me­t­tre une meilleure com­préhen­sion des phénomènes observés et de leurs déter­mi­nants, la sec­onde, opéra­tionnelle, de per­me­t­tre une pré­dic­tion quan­ti­ta­tive afin d’aider à la déci­sion en san­té publique.

La simulation numérique

Aujourd’hui, pour par­venir à des résul­tats quan­ti­ta­tive­ment valides, les mod­éli­sa­tions math­é­ma­tiques utilisent plus la sim­u­la­tion numérique que l’approche ana­ly­tique, ce qui per­met de traiter des mod­èles plus com­plex­es. Lors de l’émergence de la grippe pandémique A/H1N1 en 2009, des mod­èles ont été dévelop­pés à par­tir des trans­ports aériens et des dates d’arrivée de voyageurs infec­tés au retour du Mex­ique pour estimer ce qui se pas­sait réelle­ment dans ce pays. En effet, en sup­posant que les voyageurs soient en con­tact avec le reste de la pop­u­la­tion lors de leur séjour, le nom­bre de voyageurs infec­tés et la date de leur arrivée peu­vent ren­seign­er sur la taille de l’épidémie d’origine, et cela de manière plus fiable que les sys­tèmes de sur­veil­lance locaux. Ain­si, en exam­i­nant les dates d’introduction dans plusieurs pays reliés au Mex­ique par avion, ces mod­èles ont per­mis d’évaluer que la taille de l’épidémie était déjà de l’ordre de 30 000 cas alors que moins de 1 000 étaient con­nus des autorités mexicaines.

Varicelle et socialisation

Mod­èles et recommandations
Les mod­èles pour la vari­celle qui pren­nent en compte les don­nées du recense­ment ont des capac­ités pré­dic­tives supérieures aux autres approches. Avec l’essor de ces mod­èles dont les pré­dic­tions sont quan­ti­ta­tive­ment cor­rectes, il est devenu pos­si­ble de les utilis­er en sup­port à l’évaluation médi­co-économique. Les résul­tats d’analyse en coût-effi­cac­ité ont été pris en compte dans la déci­sion de recom­man­der la vac­ci­na­tion con­tre le rotavirus.

Ces mod­èles détail­lés ont égale­ment per­mis de remet­tre en avant l’importance de la struc­ture de la pop­u­la­tion dans la cir­cu­la­tion effec­tive d’un pathogène. Par exem­ple, la vari­celle, une mal­adie infan­tile com­mune, présente une très grande hétérogénéité selon les pays : bien qu’à peu près tout le monde soit infec­té durant l’enfance, l’âge moyen à l’infection se révèle très vari­able, 2 ans aux Pays-Bas, 4 ans en France, 6 ans en Ital­ie. Il s’agit pour­tant du même virus. Ce qui change, selon les lieux, c’est la struc­ture de la pop­u­la­tion et les habi­tudes de social­i­sa­tion des enfants. On con­state qu’une sco­lar­i­sa­tion plus pré­coce est asso­ciée à un âge plus pré­coce à l’infection dans les pays européens. Il est donc impor­tant, pour avoir des résul­tats réal­istes, d’intégrer autant que pos­si­ble une descrip­tion détail­lée de la pop­u­la­tion et des con­tacts. Cela est pos­si­ble avec les don­nées du recense­ment, qui infor­ment sur la répar­ti­tion des indi­vidus, leurs déplace­ments de rou­tine, etc.

L’analyse causale

La mod­éli­sa­tion est égale­ment néces­saire pour essay­er d’obtenir une inter­pré­ta­tion non biaisée des don­nées en sit­u­a­tion d’observation. Dans une « cohorte », par exem­ple, des per­son­nes sont suiv­ies en rai­son de leur expo­si­tion à un fac­teur d’intérêt (comme le tabag­isme), et on enreg­istre des événe­ments de san­té au cours du temps (un can­cer des bronch­es). Le prob­lème essen­tiel de l’épidémiologiste est de déter­min­er si une dif­férence estimée entre exposés et non-exposés n’est qu’une asso­ci­a­tion, non causale, ou plutôt un effet, causal.

Des mod­èles dévelop­pés à par­tir des trans­ports aériens

En sit­u­a­tion d’observation, des asso­ci­a­tions peu­vent en effet être la con­séquence de dif­férences sys­té­ma­tiques préex­is­tantes entre exposés et non-exposés. Ain­si, on observe que la con­som­ma­tion d’alcool est plus élevée chez les fumeurs, ce qui pour­ra entraîn­er une plus forte inci­dence du can­cer des bronch­es chez les buveurs (une asso­ci­a­tion non causale), alors même que c’est le tabac qui est respon­s­able (effet causal).

L’existence de dif­férences sys­té­ma­tiques entre exposés et non-exposés – autres que l’exposition – requiert une mod­éli­sa­tion sta­tis­tique : le score de propen­sion, couram­ment util­isé en économétrie, est fréquem­ment employé. Des développe­ments méthodologiques motivés par des prob­lèmes épidémi­ologiques sont aujourd’hui rap­portés dans les meilleurs jour­naux de sta­tis­tique théorique et appliquée. Les scores de propen­sion, les mod­èles causals util­isant les « graphes dirigés acy­cliques », les mod­èles struc­turaux mar­gin­aux sont des exem­ples de ces nou­velles approches de mod­éli­sa­tion statistique.

La greffe de rein

La mod­éli­sa­tion est util­isée aus­si à des fins très opéra­tionnelles d’organisation pour résoudre des prob­lèmes de san­té publique.

Résoudre des prob­lèmes de san­té publique

Aux États-Unis, par­mi les per­son­nes qui chaque année requièrent une greffe de rein (receveurs), cer­taines dis­posent d’un don­neur vivant mais incom­pat­i­ble. Pro­pos­er des échanges entre duos don­neurs-receveurs per­me­t­trait de rem­plac­er deux duos incom­pat­i­bles par deux greffes pos­si­bles. Appliquée sur la base du « pre­mier arrivé, pre­mier servi », cette stratégie con­duit 40% des duos incom­pat­i­bles à une greffe pos­si­ble par appariement avec un autre duo.

L’algorithme d’Edmonds

La gas­tro­plas­tie per­met-elle de réduire la mor­tal­ité chez le patient obèse ?
Un exem­ple récent con­cerne la mor­tal­ité après gas­tro­plas­tie (réduc­tion stom­acale dans le traite­ment de l’obésité). L’hypothèse est que l’intervention chirur­gi­cale peut réduire la mor­tal­ité en évi­tant le développe­ment de patholo­gies liées à l’obésité. Les auteurs com­par­ent donc 850 patients ayant subi une gas­tro­plas­tie à une pop­u­la­tion con­trôle de 41244 per­son­nes. La mor­tal­ité observée, six ans après l’intervention, est de 7% dans le groupe des opérés con­tre 15% chez les autres. Peut-on con­clure qu’il s’agit de l’effet de l’intervention ? En effet, les indi­vidus opérés étaient plus sou­vent obès­es, ce qui aug­men­tait leur risque ; mais aus­si plus sou­vent jeunes et de sexe féminin, ce qui rédui­sait leur risque. Les auteurs cal­cu­lent alors un « score de propen­sion », c’est-à-dire la prob­a­bil­ité d’avoir subi l’intervention selon l’âge, le sexe, le diag­nos­tic, le poids, etc. À l’issue de ce cal­cul, il est pos­si­ble de sélec­tion­ner 847 patients et 847 con­trôles ayant le même score de propen­sion : ils sont donc com­pa­ra­bles en tout point sauf en ce qui con­cerne la gas­tro­plas­tie. La com­para­i­son finale de ces deux groupes ne mon­tre alors plus aucune dif­férence de mor­tal­ité (7% cha­cun) : la gas­tro­plas­tie ne sem­ble donc pas réduire la mortalité.

Mais est-il pos­si­ble de faire mieux ? La meilleure stratégie pour réalis­er ces échanges con­siste à réalis­er le plus grand nom­bre pos­si­ble d’appariements entre des duos incom­pat­i­bles. Le prob­lème se refor­mule math­é­ma­tique­ment : com­ment réalis­er le plus grand nom­bre d’appariements 2 à 2 dans les nœuds d’un graphe ? La réponse repose sur l’algorithme d’Edmonds, bien con­nu des infor­mati­ciens, qui per­met de trou­ver le nom­bre max­i­mum d’appariements pos­si­bles. L’approche per­met, de plus, d’intégrer les préférences indi­vidu­elles, par exem­ple accepter ou non de se déplac­er, par la sup­pres­sion d’arêtes dans le graphe. La con­clu­sion est que cet appariement opti­mal per­met un gain d’au moins 5% du nom­bre de greffes, tout en réduisant les coûts et les désagré­ments pour les patients participants.

Une évolution souhaitable

Cette rapi­de illus­tra­tion de l’utilisation des mod­èles en épidémi­olo­gie ne cou­vre qu’une petite par­tie des champs d’application pos­si­bles. D’autres domaines épidémi­ologiques ont égale­ment une util­i­sa­tion impor­tante de la mod­éli­sa­tion : l’épidémiologie spa­tiale, sociale, l’épidémiologie géné­tique, l’étude des inter­ac­tions gène envi­ron­nement, etc. Avec la disponi­bil­ité de bases de don­nées décrivant fine­ment l’activité humaine et l’environnement (recense­ment, util­i­sa­tion des sols, météo, qual­ité de l’eau) et celle de don­nées indi­vidu­elles, le recours à la mod­éli­sa­tion ne pour­ra que s’accentuer. L’évolution mar­quée vers une plus grande place de l’outil math­é­ma­tique et des mod­èles dans cette dis­ci­pline pose de façon cru­ciale la ques­tion de la for­ma­tion ini­tiale des prati­ciens de l’épidémiologie, et de l’encouragement des voca­tions chez des per­son­nes ayant une bonne for­ma­tion math­é­ma­tique initiale.

BIBLIOGRAPHIE

■ Valleron A.-J., L’Épidémiologie humaine : con­di­tions de son développe­ment en France, et rôle des math­é­ma­tiques, Paris, EDP Sci­ences, 2006.

■ Cauchemez S., Boëlle P. Y., Thomas G. et al., « Esti­mat­ing in real time the effi­ca­cy of mea­sures to con­trol emerg­ing com­mu­ni­ca­ble dis­eases », Amer­i­can Jour­nal of Epi­demi­ol­o­gy, 2006 (164:591- 597).

■ Nar­done A., de Ory F., Car­ton M. et al., « The com­par­a­tive sero-epi­demi­ol­o­gy of vari­cel­la zoster virus in 11 coun­tries in the Euro­pean region », Vac­cine, 2007 (25:7866–7872).

2 Commentaires

Ajouter un commentaire

Anonymerépondre
14 décembre 2011 à 21 h 43 min

Gas­tro­plas­mie
Très éclairant l’ex­em­ple de la gastroplasmie.

Mais con­stituer un échan­til­lon com­pa­ra­ble ne suf­fit pas. Parce que ceux qui ont été opérés étaient volon­taires pour l’opéra­tion, alors que ceux de l’échan­til­lon com­pa­ra­ble ne l’é­taient pas. Et peut-être le fait d’être volon­taire pour l’opéra­tion provient du fait qu’on est davan­tage malade (ou qu’on sent qu’on est très malade)…
Pour pou­voir faire une analyse cor­recte, il aurait fal­lu tir­er au sort les per­son­nes opérées par­mi les volon­taires et n’opér­er que la moitié… (voire faire sem­blant d’opér­er la moitié : placebo).

thameurrépondre
4 mai 2012 à 13 h 54 min

très intéres­sant, mais
très intéres­sant, mais sou­vent la nature est plus com­pliquée, dans le sens de l’évo­lu­tion, pour per­me­t­tre de met­tre en place des mod­èles de prévi­sion efficaces.
Merci

Répondre