Covid-19 : Enseignements et crédibilité des modèles épidémiologiques

Dossier : ExpressionsMagazine N°764 Avril 2021
Par François Xavier MARTIN (63)

Covid-19 : Enseigne­ments et crédi­bil­ité des mod­èles épidémi­ologiques. Essay­er d’y voir clair grâce à un mini-mod­èle graphique inter­ac­t­if basé sur un sim­ple tableur et n’utilisant que les math­é­ma­tiques enseignées à l’école primaire.

Rappel du modèle fondateur de 1927

La mod­éli­sa­tion mod­erne des épidémies remonte à une com­mu­ni­ca­tion faite en 1927 à la Roy­al Soci­ety de Lon­dres par les Écos­sais Ker­ma­ck (biochimiste) et McK­endrick (médecin militaire).

Cette com­mu­ni­ca­tion, dont dérivent la plu­part des mod­èles actuels, est en fait une vari­ante du tra­di­tion­nel prob­lème de réser­voir et de robi­net de l’ex Cer­ti­fi­cat d’é­tudes pri­maires. La pop­u­la­tion est répar­tie en 3 réser­voirs (dits com­par­ti­ments SIR) : les Sains (sus­cep­ti­bles d’être infec­tés), les Infec­tés (malades pou­vant con­t­a­min­er des per­son­nes saines) et les Rétab­lis (ne pou­vant plus con­t­a­min­er per­son­ne, car guéris et immu­nisés, ou décédés).

Les équa­tions du mod­èle de 1927 définis­sent les débits dynamiques entrant (robi­net) et sor­tant (bonde) dans le réservoir/compartiment des Infec­tés, leur sor­tie ten­ant compte du débit d’entrée et de la durée de la péri­ode d’in­fec­tion (dans ce mod­èle sim­ple, on con­sid­ère que les durées d’infection et de con­ta­giosité coïncident).

Au début de leur com­mu­ni­ca­tion (page 702), Ker­ma­ck et McK­endrick ont envis­agé un mod­èle où tous les paramètres, dont les taux de con­t­a­m­i­na­tion φ(t) et de sor­tie d’infection ψ(t) pou­vaient vari­er au cours de l’épidémie. Mais comme en 1927 n’ex­is­taient ni ordi­na­teurs ni solveurs infor­ma­tiques, ils ont défi­ni des ver­sions sim­pli­fiées (“Spe­cial cas­es”, voir page 709) des équa­tions générales, vraisem­blable­ment dans l’e­spoir (vain) de pou­voir trou­ver une manière d’ex­primer S, I et R sous forme de fonc­tions ana­ly­tiques du temps.

Le deux­ième « Spe­cial case » (page 712) dit « Con­stant rates » sup­pose que les taux d’infections φ et de « removal » (guérisons et décès) ψ sont con­stants, ce qui con­duit à la forme clas­sique fig­u­rant depuis 1927 dans tous les cours d’épidémiologie :

Covid-19 Théorie mathématiques des épidémies

Ces équa­tions sont à la base de la plu­part des mul­ti­ples sys­tèmes de sim­u­la­tion d’épidémies pro­posés depuis cette époque, avec des nota­tions qui sont habituellement :

dS / dt = — β S I nou­velles infections

dI / dt = β S I – γ I

dR / dt = γ I guérisons ou décès

γ est l’inverse de la durée moyenne d’infection D sup­posée rel­a­tive­ment uniforme

L’erreur provenant de l’expression γ I

La dernière équa­tion est tout à fait inex­acte dans le cas d’une hausse ou d’une baisse rapi­de du nom­bre d’infectés I.

En cas de hausse de I, les per­son­nes qui guéris­sent (ou meurent) à l’instant t sont celles qui sont tombées malades à l’instant (t‑D). Dire que le rythme de ces guérisons est égal à γ I revient à le sures­timer en le cal­cu­lant non pas à par­tir de la pop­u­la­tion infec­tée à l’instant (t‑D), mais à par­tir de celle qui a été infec­tée de façon crois­sante entre (t‑D) et t. Ceci con­duit donc à sous-estimer le nom­bre d’infectés et donc le nom­bre de nou­velles infec­tions qui lui est pro­por­tion­nel d’après la 1ère équation.

Inverse­ment, en cas de baisse de I, l’utilisation de γ I revient à sous-estimer le rythme des guérisons en le cal­cu­lant à par­tir de la pop­u­la­tion qui a été infec­tée de façon décrois­sante entre (t‑D) et t, ce qui con­duit à sures­timer le nom­bre d’infectés et donc le nom­bre de nou­velles infections.

L’équa­tion à « Con­stant rates » “étouffe” donc par effet tam­pon les vari­a­tions rapi­des du nom­bre de per­son­nes infec­tées et de nou­velles infec­tions, à la hausse (début de l’épidémie, décon­fine­ment) comme à la baisse (con­fine­ment).

Curieuses dérives mathématiques 

Un mystère

Pourquoi les mod­élisa­teurs épidémi­ologiques réputés sérieux ont-ils préféré conserver

(et enseign­er sans mise en garde dans leurs cours aux étu­di­ants) l’équation erronée de 1927, tout en util­isant dans leurs mod­èles des procédés divers, pro­pres à cha­cun d’entre eux, pour en cor­riger les défauts ?

Il sem­ble qu’aurait été plus sim­ple de rem­plac­er l’équation

dR / dt = γ I

par

dR / dt = — dS(t ‑ D) /dt où D = 1/ γ

Quand les math­é­mati­ciens qui cher­chaient à simuler l’évolution des épidémies ont réal­isé que les résul­tats de mod­èles basés sur les « Con­stant rates » de 1927 ne cor­re­spondaient pas à la réal­ité, ils n’ont pas voulu remet­tre en cause de façon vis­i­ble l’équation erronée de 1927. Plutôt que de rem­plac­er cette dernière par une équa­tion presqu’aus­si sim­ple, mais adap­tée aux con­textes dynamiques (voir encadré plus haut), ils ont préféré don­ner l’illusion qu’ils con­ser­vaient l’équation de 1927 comme base de leurs mod­èles, tout en intro­duisant dans ces derniers divers­es cor­rec­tions math­é­ma­tiques plus ou moins com­plex­es. On peut citer par exem­ple le pas­sage à des mod­èles sto­chas­tiques ou à ce que Cédric Vil­lani a qual­i­fié de « dis­créti­sa­tion du mod­èle, de façon à pou­voir incor­por­er un effet mémoire » dans sa note sur la mod­éli­sa­tion épidémi­ologique remise le 30 avril 2020 à l’Office par­lemen­taire d’évaluation des choix sci­en­tifiques et tech­nologiques qu’il pré­side actuellement.

Modèles stochastiques

Ayant con­staté que l’utilisation des équa­tions dif­féren­tielles du « Con­stant rates » con­dui­sait à un démar­rage trop lent d’une épidémie simulée à par­tir de l’arrivée d’un unique infec­té (le « patient 0 ») cer­tains math­é­mati­ciens ont estimé qu’il était indis­pens­able de pass­er à de com­plex­es mod­èles prob­a­bilistes. Voir par exem­ple « Mod­élis­er la prop­a­ga­tion d’une épidémie » d’Hugo Fal­conet et Antoine Jego https://docplayer.fr/56627577-Modeliser-la-propagation-d-une-epidemie.html qui con­tient de nom­breuses pages de cal­cul basées sur des chaînes de Markov, choix quelque peu étrange puisqu’il repro­duit à chaque étape l’ « erreur de 1927 » (prob­a­bil­ité de guéri­son ne dépen­dant pas de l’ « âge » de l’infection).

Discrétisation du modèle

Voici le com­men­taire qu’a déposé après l’article https://www.lajauneetlarouge.com/modeles-mathematiques-depidemies-les-plus-elabores-pourquoi-leurs-previsions-initiales-sont-elles-souvent-excessivement-pessimistes/ un mem­bre du CNRS (qui n’est pas spé­cial­iste du domaine, mais a vis­i­ble­ment été bien ren­seigné par ses col­lègues qui le sont).

” Mal­gré ce que vous sem­blez penser les mod­élisa­teurs pro­fes­sion­nels con­nais­sent évidem­ment ce que vous appelez l’erreur de 1927, et savent quand elle est gênante ou pas, selon ce que l’on veut faire. S’il le faut ils l’éliminent. On peut le faire de dif­férentes façons. Par exem­ple en la mul­ti­pli­ant, si je puis dire : sup­posons qu’on veut décrire la ciné­tique du pas­sage I–>R d’un mod­èle SIR.

La ver­sion basique du mod­èle donne dI/dt=-I/D et dR/dt=I/D, soit une décrois­sance de type expo­nen­tielle de I (avec une prob­a­bil­ité de guéri­son indépen­dante de la date d’infection, comme vous le dites). Main­tenant intro­duisez n stades inter­mé­di­aires entre I et R, appelons les J1, J2 etc, et écrivez : dI/dt=-I/D, dJ1/dt=I/D‑J1/D’, dJ2/dt=J1/D’-J2/D’ etc … jusqu’à dR/dt=Jn/D’. Ce faisant vous intro­duisez un retard à la guéri­son. L’effectif total des per­son­nes infec­tées (la somme de I et de tous les Jn) ne décroit plus expo­nen­tielle­ment, mais selon une fonc­tion de type sig­moïde, avec une péri­ode pen­dant laque­lle il ne se passe pas grand‑chose, suiv­ie d’une décrois­sance con­cen­trée autour d’une durée bien déter­minée depuis la date de con­t­a­m­i­na­tion. De cette façon on génère très facile­ment une dis­tri­b­u­tion de type loi gam­ma pour la prob­a­bil­ité de guéri­son en fonc­tion du temps écoulé depuis la con­t­a­m­i­na­tion (on peut jouer sur n et D’).Je ne suis pas l’inventeur de cette astuce numérique, elle fait par­tie de celles couram­ment util­isée par les mod­élisa­teurs.… Ils n’en restent évidem­ment pas à la ver­sion de 1927 du modèle ! ”

On peut légitime­ment se deman­der si ces cor­rec­tions plus ou moins occultes à une insuff­isante réac­tiv­ité de mod­èles basés sur les équa­tions à « Con­stant rates » sont effi­caces quand on réalise que les prévi­sions des mod­élisa­teurs ont générale­ment sous-estimé la vigueur de la 2ème vague de sep­tem­bre-octo­bre 2020 ain­si que la rapid­ité de la réac­tion au con­fine­ment de la fin octo­bre 2020 qui a fait que la prévi­sion prési­den­tielle de 9 000 per­son­nes en réan­i­ma­tion au 15 novem­bre “quoi qu’on fasse” a été démen­tie par les faits.

Ne pas faire d’amalgame entre complexification légitime du modèle SIR et complexification destinée à compenser l’erreur du SIR à « Constant rates » de 1927

Bien enten­du il existe une forme de com­plex­i­fi­ca­tion tout à fait légitime du mod­èle SIR de base, mais celle-ci ne devrait venir qu’après une rec­ti­fi­ca­tion préal­able de l’« erreur de 1927 » et ne pas servir de cam­ou­flage à l’absence de cette rec­ti­fi­ca­tion, poten­tielle cause d’erreurs importantes.

Une forme de com­plex­i­fi­ca­tion « saine » con­siste par exem­ple à tenir compte du fait que les indi­vidus n’ont pas une con­ta­giosité homogène, que les inter­ac­tions entre indi­vidus peu­vent dépen­dre de mul­ti­ples fac­teurs (âge, type d’habitat, d’activité, …)

Exemple d’un modèle compensant de façon claire l’erreur du SIR à « Constant rates » de 1927

Exemple d’un modèle compensant de façon claire l’erreur du SIR à « Constant rates » de 1927

COVID-19 epi­dem­ic dis­crete time mod­el structure.
Each square rep­re­sents a group of indi­vid­u­als who share the same clin­i­cal kinet­ics and who con­tribute equal­ly to the epi­dem­ic dynam­ics. Con­tigu­ous squares form a com­part­ment, in which each indi­vid­ual pro­gress­es day after day, there­fore allow­ing to cap­ture mem­o­ry effects of the infec­tion age
Sché­ma extrait de ⟨hal-02619546⟩ Mircea Sofonea, Bastien Reyné, Bap­tiste Elie, Ram­sès Djid­jou-Demasse, Chris­t­ian Selinger, et al.. Epi­demi­o­log­i­cal mon­i­tor­ing and con­trol per­spec­tives : appli­ca­tion of a par­si­mo­nious mod­el­ling frame­work to the COVID-19 dynam­ics in France.

Réactions opposées des universitaires mathématiciens et physiciens et des universitaires du milieu médical

Lorsqu’on leur présente ce qui précède, les uni­ver­si­taires math­é­mati­ciens et physi­ciens rom­pus aux tech­niques de sim­u­la­tion esti­ment générale­ment que ne serait que du replâ­trage toute approche qui ne rem­plac­erait pas l’équation erronée de 1927 par une équa­tion adap­tée à la mod­éli­sa­tion d’un phénomène dynamique.

L’approche du monde médi­cal est rad­i­cale­ment dif­férente. En général, ses mem­bres (même « infec­ti­o­logues ») fuient tout débat sur ce sujet, en arguant du fait que la sim­u­la­tion épidémi­ologique est un secteur extrême­ment spé­cial­isé, qui fait appel à des notions math­é­ma­tiques de très haut niveau. Les seules per­son­nes qual­i­fiées pour répon­dre à une telle remise en cause seraient les rares mod­élisa­teurs de grands organ­ismes aux­quels ils font confiance.

Conséquences sur les prises de décisions des pouvoirs publics

Les pou­voirs publics sont donc entretenus par le milieu médi­cal dans l’idée que la mod­éli­sa­tion épidémi­ologique est une activ­ité extrême­ment com­plexe, faisant appel à des notions math­é­ma­tiques de très haut niveau, que ne maîtrise générale­ment pas la qua­si-total­ité du per­son­nel admin­is­tratif et poli­tique qui prend finale­ment les grandes décisions.

Sont donc présen­tés aux décideurs les résul­tats de « boîtes noires » provenant de dif­férentes équipes, dont les codes infor­ma­tiques ne sont pas ren­dus publics. Seuls sont acces­si­bles des rap­ports dont un exem­ple-type datant du 23 févri­er 2021 :

« A race between SARS-CoV­‑2 vari­ants and vac­ci­na­tion : the case of the B.1.1.7 vari­ant in France » par Pao­lo Boset­ti, Cécile Tran Kiem, Alessio Andron­i­co, Juli­ette Paireau, Daniel Levy Bruhl, et al. https://hal.archives-ouvertes.fr/pasteur-03149525

qui con­tient l’examen d’un nom­bre lim­ité d’hypothèses, mais ne per­met pas à des non‑spécialistes de mod­i­fi­er eux-mêmes de façon fine des hypothès­es telles que le rythme des vac­ci­na­tions, la date à laque­lle sont mis­es en œuvre des mesures de cou­vre-feu, de con­fine­ment, de décon­fine­ment, etc …

Intérêt d’un mini-modèle graphique interactif basé la correction de l’erreur du « Constant rates » de 1927 et l’utilisation d’un tableur

Pour com­pren­dre les per­spec­tives d’évolution à court terme d’une épidémie il serait intéres­sant d’évaluer les résul­tats don­nés par l’utilisation d’un tableur après cor­rec­tion de la sim­pli­fi­ca­tion erronée du « Con­stant rates » de 1927 (voir plus haut la méthode pro­posée dans l’encadré « Un mystère »).

Un tableur de type Excel présente l’avantage d’être con­nu d’une pop­u­la­tion beau­coup plus large qu’un solveur con­nu des seuls math­é­mati­ciens. Son emploi pour simuler une épidémie est expliqué dans l’annexe de l’article https://www.lajauneetlarouge.com/covid-19-une-modelisation-simple-utilisant-excel-accessible-aux-non-mathematiciens-et-pleine-denseignements/

Voici ce que donne l’exploitation d’un tel tableur après intro­duc­tion de paramètres con­nus ou vraisem­blables à la date du 6 avril 2021.

Evolution de l'épidémie Covid-19 avec variant "anglais", hypothèse de vaccination et "3ème confinement"

Atten­tion, les nom­bres de nou­veaux infec­tés annon­cés quo­ti­di­en­nement par les pou­voirs publics ne sont pas les nom­bres réels, mais ceux des seuls nou­veaux infec­tés détec­tés par des tests. Ils dépen­dent donc entière­ment de la poli­tique de tests. On estime générale­ment que début 2021 le nom­bre quo­ti­di­en réel de nou­veaux infec­tés (dont les asymp­to­ma­tiques) était le dou­ble du nom­bre de nou­veaux infec­tés annoncé.

Une ver­sion inter­ac­tive télécharge­able per­met au lecteur de voir l’effet de dif­férentes hypothès­es qu’il peut intro­duire lui-même dans le tableur :

- sup­plé­ment de con­ta­giosité du vari­ant « anglais » par rap­port au virus « 2020 » : case W24

- R0 cor­re­spon­dant au virus « 2020 » et au com­porte­ment de la pop­u­la­tion : colonne W à par­tir du 1er avril 2021

- nom­bre quo­ti­di­en de per­son­nes immu­nisées par vac­ci­na­tion : colonne Q

Hypothès­es (mod­i­fi­ables) du tableur téléchargé :

  • sup­plé­ment de con­ta­giosité du vari­ant « anglais » de 48% par rap­port au virus « 2020 ». (soit un R0 très élevé de 4,44 dans les con­di­tions de vie du “monde d’avant”)
  • 75% des vac­cinés sont immu­nisés 10 jours après la 1ère injec­tion. Il a été tenu compte du nom­bre réel d’injections en jan­vi­er, févri­er et mars (moyenne jour­nal­ière établie à par­tir du total men­su­el). Le nom­bre de mars a été recon­duit dans le tableur jusqu’à la fin de l’année. Bien enten­du, le nom­bre quo­ti­di­en d’immunisations à par­tir d’avril devra être mis à jour
  • le R0 du virus de type “2020” suit le mieux pos­si­ble jusqu’à fin mars l’épidémie réelle, en ten­ant compte des mesures gou­verne­men­tales (con­fine­ments, cou­vre-feux, décon­fine­ments, port de masques, …). Pour mémoire ce R0 était d’en­v­i­ron 3 jusqu’au 1er con­fine­ment, pen­dant lequel il est passé env­i­ron à 0,7. Depuis il se promène entre 0,9 et 1,5

Poster un commentaire