Covid-19 : Enseignements et crédibilité des modèles épidémiologiques

Dossier : ExpressionsMagazine N°764 Avril 2021
Par François Xavier MARTIN (63)

Covid-19 : Ensei­gne­ments et cré­di­bi­li­té des modèles épi­dé­mio­lo­giques. Essayer d’y voir clair grâce à un mini-modèle gra­phique inter­ac­tif basé sur un simple tableur et n’utilisant que les mathé­ma­tiques ensei­gnées à l’école primaire.

Rappel du modèle fondateur de 1927

La modé­li­sa­tion moderne des épi­dé­mies remonte à une com­mu­ni­ca­tion faite en 1927 à la Royal Socie­ty de Londres par les Écos­sais Ker­mack (bio­chi­miste) et McKen­drick (méde­cin militaire).

Cette com­mu­ni­ca­tion, dont dérivent la plu­part des modèles actuels, est en fait une variante du tra­di­tion­nel pro­blème de réser­voir et de robi­net de l’ex Cer­ti­fi­cat d’é­tudes pri­maires. La popu­la­tion est répar­tie en 3 réser­voirs (dits com­par­ti­ments SIR) : les Sains (sus­cep­tibles d’être infec­tés), les Infec­tés (malades pou­vant conta­mi­ner des per­sonnes saines) et les Réta­blis (ne pou­vant plus conta­mi­ner per­sonne, car gué­ris et immu­ni­sés, ou décédés).

Les équa­tions du modèle de 1927 défi­nissent les débits dyna­miques entrant (robi­net) et sor­tant (bonde) dans le réservoir/compartiment des Infec­tés, leur sor­tie tenant compte du débit d’entrée et de la durée de la période d’in­fec­tion (dans ce modèle simple, on consi­dère que les durées d’infection et de conta­gio­si­té coïncident).

Au début de leur com­mu­ni­ca­tion (page 702), Ker­mack et McKen­drick ont envi­sa­gé un modèle où tous les para­mètres, dont les taux de conta­mi­na­tion φ(t) et de sor­tie d’infection ψ(t) pou­vaient varier au cours de l’épidémie. Mais comme en 1927 n’exis­taient ni ordi­na­teurs ni sol­veurs infor­ma­tiques, ils ont défi­ni des ver­sions sim­pli­fiées (« Spe­cial cases », voir page 709) des équa­tions géné­rales, vrai­sem­bla­ble­ment dans l’es­poir (vain) de pou­voir trou­ver une manière d’ex­pri­mer S, I et R sous forme de fonc­tions ana­ly­tiques du temps.

Le deuxième « Spe­cial case » (page 712) dit « Constant rates » sup­pose que les taux d’infections φ et de « remo­val » (gué­ri­sons et décès) ψ sont constants, ce qui conduit à la forme clas­sique figu­rant depuis 1927 dans tous les cours d’épidémiologie :

Covid-19 Théorie mathématiques des épidémies

Ces équa­tions sont à la base de la plu­part des mul­tiples sys­tèmes de simu­la­tion d’épidémies pro­po­sés depuis cette époque, avec des nota­tions qui sont habituellement :

dS / dt = – β S I nou­velles infections

dI / dt = β S I – γ I

dR / dt = γ I gué­ri­sons ou décès

γ est l’inverse de la durée moyenne d’infection D sup­po­sée rela­ti­ve­ment uniforme

L’erreur provenant de l’expression γ I

La der­nière équa­tion est tout à fait inexacte dans le cas d’une hausse ou d’une baisse rapide du nombre d’infectés I.

En cas de hausse de I, les per­sonnes qui gué­rissent (ou meurent) à l’instant t sont celles qui sont tom­bées malades à l’instant (t‑D). Dire que le rythme de ces gué­ri­sons est égal à γ I revient à le sur­es­ti­mer en le cal­cu­lant non pas à par­tir de la popu­la­tion infec­tée à l’instant (t‑D), mais à par­tir de celle qui a été infec­tée de façon crois­sante entre (t‑D) et t. Ceci conduit donc à sous-esti­mer le nombre d’infectés et donc le nombre de nou­velles infec­tions qui lui est pro­por­tion­nel d’après la 1ère équation.

Inver­se­ment, en cas de baisse de I, l’utilisation de γ I revient à sous-esti­mer le rythme des gué­ri­sons en le cal­cu­lant à par­tir de la popu­la­tion qui a été infec­tée de façon décrois­sante entre (t‑D) et t, ce qui conduit à sur­es­ti­mer le nombre d’infectés et donc le nombre de nou­velles infections.

L’é­qua­tion à « Constant rates » « étouffe » donc par effet tam­pon les varia­tions rapides du nombre de per­sonnes infec­tées et de nou­velles infec­tions, à la hausse (début de l’épidémie, décon­fi­ne­ment) comme à la baisse (confi­ne­ment).

Curieuses dérives mathématiques 

Un mystère

Pour­quoi les modé­li­sa­teurs épi­dé­mio­lo­giques répu­tés sérieux ont-ils pré­fé­ré conserver

(et ensei­gner sans mise en garde dans leurs cours aux étu­diants) l’équation erro­née de 1927, tout en uti­li­sant dans leurs modèles des pro­cé­dés divers, propres à cha­cun d’entre eux, pour en cor­ri­ger les défauts ?

Il semble qu’aurait été plus simple de rem­pla­cer l’équation

dR / dt = γ I

par

dR / dt = – dS(t ‑ D) /dt où D = 1/ γ

Quand les mathé­ma­ti­ciens qui cher­chaient à simu­ler l’évolution des épi­dé­mies ont réa­li­sé que les résul­tats de modèles basés sur les « Constant rates » de 1927 ne cor­res­pon­daient pas à la réa­li­té, ils n’ont pas vou­lu remettre en cause de façon visible l’équation erro­née de 1927. Plu­tôt que de rem­pla­cer cette der­nière par une équa­tion pres­qu’aus­si simple, mais adap­tée aux contextes dyna­miques (voir enca­dré plus haut), ils ont pré­fé­ré don­ner l’illusion qu’ils conser­vaient l’équation de 1927 comme base de leurs modèles, tout en intro­dui­sant dans ces der­niers diverses cor­rec­tions mathé­ma­tiques plus ou moins com­plexes. On peut citer par exemple le pas­sage à des modèles sto­chas­tiques ou à ce que Cédric Vil­la­ni a qua­li­fié de « dis­cré­ti­sa­tion du modèle, de façon à pou­voir incor­po­rer un effet mémoire » dans sa note sur la modé­li­sa­tion épi­dé­mio­lo­gique remise le 30 avril 2020 à l’Office par­le­men­taire d’évaluation des choix scien­ti­fiques et tech­no­lo­giques qu’il pré­side actuellement.

Modèles stochastiques

Ayant consta­té que l’utilisation des équa­tions dif­fé­ren­tielles du « Constant rates » condui­sait à un démar­rage trop lent d’une épi­dé­mie simu­lée à par­tir de l’arrivée d’un unique infec­té (le « patient 0 ») cer­tains mathé­ma­ti­ciens ont esti­mé qu’il était indis­pen­sable de pas­ser à de com­plexes modèles pro­ba­bi­listes. Voir par exemple « Modé­li­ser la pro­pa­ga­tion d’une épi­dé­mie » d’Hugo Fal­co­net et Antoine Jego https://docplayer.fr/56627577-Modeliser-la-propagation-d-une-epidemie.html qui contient de nom­breuses pages de cal­cul basées sur des chaînes de Mar­kov, choix quelque peu étrange puisqu’il repro­duit à chaque étape l’ « erreur de 1927 » (pro­ba­bi­li­té de gué­ri­son ne dépen­dant pas de l’ « âge » de l’infection).

Discrétisation du modèle

Voi­ci le com­men­taire qu’a dépo­sé après l’article https://www.lajauneetlarouge.com/modeles-mathematiques-depidemies-les-plus-elabores-pourquoi-leurs-previsions-initiales-sont-elles-souvent-excessivement-pessimistes/ un membre du CNRS (qui n’est pas spé­cia­liste du domaine, mais a visi­ble­ment été bien ren­sei­gné par ses col­lègues qui le sont).

» Mal­gré ce que vous sem­blez pen­ser les modé­li­sa­teurs pro­fes­sion­nels connaissent évi­dem­ment ce que vous appe­lez l’erreur de 1927, et savent quand elle est gênante ou pas, selon ce que l’on veut faire. S’il le faut ils l’éliminent. On peut le faire de dif­fé­rentes façons. Par exemple en la mul­ti­pliant, si je puis dire : sup­po­sons qu’on veut décrire la ciné­tique du pas­sage I–>R d’un modèle SIR.

La ver­sion basique du modèle donne dI/dt=-I/D et dR/dt=I/D, soit une décrois­sance de type expo­nen­tielle de I (avec une pro­ba­bi­li­té de gué­ri­son indé­pen­dante de la date d’infection, comme vous le dites). Main­te­nant intro­dui­sez n stades inter­mé­diaires entre I et R, appe­lons les J1, J2 etc, et écri­vez : dI/dt=-I/D, dJ1/dt=I/D‑J1/D’, dJ2/dt=J1/D’-J2/D’ etc … jusqu’à dR/dt=Jn/D’. Ce fai­sant vous intro­dui­sez un retard à la gué­ri­son. L’effectif total des per­sonnes infec­tées (la somme de I et de tous les Jn) ne décroit plus expo­nen­tiel­le­ment, mais selon une fonc­tion de type sig­moïde, avec une période pen­dant laquelle il ne se passe pas grand‑chose, sui­vie d’une décrois­sance concen­trée autour d’une durée bien déter­mi­née depuis la date de conta­mi­na­tion. De cette façon on génère très faci­le­ment une dis­tri­bu­tion de type loi gam­ma pour la pro­ba­bi­li­té de gué­ri­son en fonc­tion du temps écou­lé depuis la conta­mi­na­tion (on peut jouer sur n et D’).Je ne suis pas l’inventeur de cette astuce numé­rique, elle fait par­tie de celles cou­ram­ment uti­li­sée par les modé­li­sa­teurs.… Ils n’en res­tent évi­dem­ment pas à la ver­sion de 1927 du modèle ! »

On peut légi­ti­me­ment se deman­der si ces cor­rec­tions plus ou moins occultes à une insuf­fi­sante réac­ti­vi­té de modèles basés sur les équa­tions à « Constant rates » sont effi­caces quand on réa­lise que les pré­vi­sions des modé­li­sa­teurs ont géné­ra­le­ment sous-esti­mé la vigueur de la 2ème vague de sep­tembre-octobre 2020 ain­si que la rapi­di­té de la réac­tion au confi­ne­ment de la fin octobre 2020 qui a fait que la pré­vi­sion pré­si­den­tielle de 9 000 per­sonnes en réani­ma­tion au 15 novembre « quoi qu’on fasse » a été démen­tie par les faits.

Ne pas faire d’amalgame entre complexification légitime du modèle SIR et complexification destinée à compenser l’erreur du SIR à « Constant rates » de 1927

Bien enten­du il existe une forme de com­plexi­fi­ca­tion tout à fait légi­time du modèle SIR de base, mais celle-ci ne devrait venir qu’après une rec­ti­fi­ca­tion préa­lable de l’« erreur de 1927 » et ne pas ser­vir de camou­flage à l’absence de cette rec­ti­fi­ca­tion, poten­tielle cause d’erreurs importantes.

Une forme de com­plexi­fi­ca­tion « saine » consiste par exemple à tenir compte du fait que les indi­vi­dus n’ont pas une conta­gio­si­té homo­gène, que les inter­ac­tions entre indi­vi­dus peuvent dépendre de mul­tiples fac­teurs (âge, type d’habitat, d’activité, …)

Exemple d’un modèle compensant de façon claire l’erreur du SIR à « Constant rates » de 1927

Exemple d’un modèle compensant de façon claire l’erreur du SIR à « Constant rates » de 1927

COVID-19 epi­de­mic dis­crete time model structure.
Each square repre­sents a group of indi­vi­duals who share the same cli­ni­cal kine­tics and who contri­bute equal­ly to the epi­de­mic dyna­mics. Conti­guous squares form a com­part­ment, in which each indi­vi­dual pro­gresses day after day, the­re­fore allo­wing to cap­ture memo­ry effects of the infec­tion age
Sché­ma extrait de ⟨hal-02619546⟩ Mir­cea Sofo­nea, Bas­tien Rey­né, Bap­tiste Elie, Ram­sès Djid­jou-Demasse, Chris­tian Selin­ger, et al.. Epi­de­mio­lo­gi­cal moni­to­ring and control pers­pec­tives : appli­ca­tion of a par­si­mo­nious model­ling fra­me­work to the COVID-19 dyna­mics in France.

Réactions opposées des universitaires mathématiciens et physiciens et des universitaires du milieu médical

Lorsqu’on leur pré­sente ce qui pré­cède, les uni­ver­si­taires mathé­ma­ti­ciens et phy­si­ciens rom­pus aux tech­niques de simu­la­tion estiment géné­ra­le­ment que ne serait que du replâ­trage toute approche qui ne rem­pla­ce­rait pas l’équation erro­née de 1927 par une équa­tion adap­tée à la modé­li­sa­tion d’un phé­no­mène dynamique.

L’approche du monde médi­cal est radi­ca­le­ment dif­fé­rente. En géné­ral, ses membres (même « infec­tio­logues ») fuient tout débat sur ce sujet, en arguant du fait que la simu­la­tion épi­dé­mio­lo­gique est un sec­teur extrê­me­ment spé­cia­li­sé, qui fait appel à des notions mathé­ma­tiques de très haut niveau. Les seules per­sonnes qua­li­fiées pour répondre à une telle remise en cause seraient les rares modé­li­sa­teurs de grands orga­nismes aux­quels ils font confiance.

Conséquences sur les prises de décisions des pouvoirs publics

Les pou­voirs publics sont donc entre­te­nus par le milieu médi­cal dans l’idée que la modé­li­sa­tion épi­dé­mio­lo­gique est une acti­vi­té extrê­me­ment com­plexe, fai­sant appel à des notions mathé­ma­tiques de très haut niveau, que ne maî­trise géné­ra­le­ment pas la qua­si-tota­li­té du per­son­nel admi­nis­tra­tif et poli­tique qui prend fina­le­ment les grandes décisions.

Sont donc pré­sen­tés aux déci­deurs les résul­tats de « boîtes noires » pro­ve­nant de dif­fé­rentes équipes, dont les codes infor­ma­tiques ne sont pas ren­dus publics. Seuls sont acces­sibles des rap­ports dont un exemple-type datant du 23 février 2021 :

« A race bet­ween SARS-CoV‑2 variants and vac­ci­na­tion : the case of the B.1.1.7 variant in France » par Pao­lo Boset­ti, Cécile Tran Kiem, Ales­sio Andro­ni­co, Juliette Pai­reau, Daniel Levy Bruhl, et al. https://hal.archives-ouvertes.fr/pasteur-03149525

qui contient l’examen d’un nombre limi­té d’hypothèses, mais ne per­met pas à des non‑spécialistes de modi­fier eux-mêmes de façon fine des hypo­thèses telles que le rythme des vac­ci­na­tions, la date à laquelle sont mises en œuvre des mesures de couvre-feu, de confi­ne­ment, de décon­fi­ne­ment, etc …

Intérêt d’un mini-modèle graphique interactif basé la correction de l’erreur du « Constant rates » de 1927 et l’utilisation d’un tableur

Pour com­prendre les pers­pec­tives d’évolution à court terme d’une épi­dé­mie il serait inté­res­sant d’évaluer les résul­tats don­nés par l’utilisation d’un tableur après cor­rec­tion de la sim­pli­fi­ca­tion erro­née du « Constant rates » de 1927 (voir plus haut la méthode pro­po­sée dans l’encadré « Un mystère »).

Un tableur de type Excel pré­sente l’avantage d’être connu d’une popu­la­tion beau­coup plus large qu’un sol­veur connu des seuls mathé­ma­ti­ciens. Son emploi pour simu­ler une épi­dé­mie est expli­qué dans l’annexe de l’article https://www.lajauneetlarouge.com/covid-19-une-modelisation-simple-utilisant-excel-accessible-aux-non-mathematiciens-et-pleine-denseignements/

Voi­ci ce que donne l’exploitation d’un tel tableur après intro­duc­tion de para­mètres connus ou vrai­sem­blables à la date du 6 avril 2021.

Evolution de l'épidémie Covid-19 avec variant "anglais", hypothèse de vaccination et "3ème confinement"

Atten­tion, les nombres de nou­veaux infec­tés annon­cés quo­ti­dien­ne­ment par les pou­voirs publics ne sont pas les nombres réels, mais ceux des seuls nou­veaux infec­tés détec­tés par des tests. Ils dépendent donc entiè­re­ment de la poli­tique de tests. On estime géné­ra­le­ment que début 2021 le nombre quo­ti­dien réel de nou­veaux infec­tés (dont les asymp­to­ma­tiques) était le double du nombre de nou­veaux infec­tés annoncé.

Une ver­sion inter­ac­tive télé­char­geable per­met au lec­teur de voir l’effet de dif­fé­rentes hypo­thèses qu’il peut intro­duire lui-même dans le tableur :

- sup­plé­ment de conta­gio­si­té du variant « anglais » par rap­port au virus « 2020 » : case W24

- R0 cor­res­pon­dant au virus « 2020 » et au com­por­te­ment de la popu­la­tion : colonne W à par­tir du 1er avril 2021

- nombre quo­ti­dien de per­sonnes immu­ni­sées par vac­ci­na­tion : colonne Q

Hypo­thèses (modi­fiables) du tableur téléchargé :

  • sup­plé­ment de conta­gio­si­té du variant « anglais » de 48% par rap­port au virus « 2020 ». (soit un R0 très éle­vé de 4,44 dans les condi­tions de vie du « monde d’avant »)
  • 75% des vac­ci­nés sont immu­ni­sés 10 jours après la 1ère injec­tion. Il a été tenu compte du nombre réel d’injections en jan­vier, février et mars (moyenne jour­na­lière éta­blie à par­tir du total men­suel). Le nombre de mars a été recon­duit dans le tableur jusqu’à la fin de l’année. Bien enten­du, le nombre quo­ti­dien d’immunisations à par­tir d’avril devra être mis à jour
  • le R0 du virus de type « 2020 » suit le mieux pos­sible jusqu’à fin mars l’épidémie réelle, en tenant compte des mesures gou­ver­ne­men­tales (confi­ne­ments, couvre-feux, décon­fi­ne­ments, port de masques, …). Pour mémoire ce R0 était d’en­vi­ron 3 jus­qu’au 1er confi­ne­ment, pen­dant lequel il est pas­sé envi­ron à 0,7. Depuis il se pro­mène entre 0,9 et 1,5

Poster un commentaire