Covid-19 modélisation Excel

Covid-19 : une modélisation simple utilisant Excel, accessible aux non-mathématiciens et pleine d’enseignements

Dossier : Covid-19Magazine N°758 Octobre 2020
Par François Xavier MARTIN (63)

Les équa­tions dif­féren­tielles établies par Ker­ma­ck et McK­endrick en 1927 per­me­t­tent de mod­élis­er le développe­ment d’une épidémie. Mal­gré leur sim­plic­ité, elles n’ont pas de solu­tion pou­vant être exprimée sous forme ana­ly­tique. Quant aux mul­ti­ples mod­èles dérivés, de plus en plus com­plex­es sur le plan math­é­ma­tique, leurs prévi­sions n’ont pas tou­jours été fiables. Or l’emploi d’Excel n’est pra­tique­ment jamais évo­qué dans les cours d’épidémiologie, alors qu’il per­met de ren­dre la mod­éli­sa­tion d’une épidémie com­préhen­si­ble à des non-math­é­mati­ciens, de leur de mon­tr­er sa per­ti­nence et de leur faire com­pren­dre quelles sont les futures évo­lu­tions possibles.

Pour le non-math­é­mati­cien, tir­er per­son­nelle­ment des enseigne­ments pra­tiques du mod­èle épidémi­ologique de Ker­ma­ck et McK­endrick, même sous sa forme la plus sim­ple dite SIR, paraît très ardu : les spé­cial­istes lui par­lent d’exponentielles, de dérivées, d’équations dif­féren­tielles non linéaires impos­si­bles à résoudre sans recourir à des solveurs infor­ma­tiques. Le résul­tat est une prise de dis­tance fréquente vis-à-vis de cette dis­ci­pline de la part de beau­coup de médecins, qui va pour cer­tains jusqu’à l’affirmation qu’elle n’est pas plus crédi­ble que l’astrologie.

Le modèle SIR 

Rap­pelons que dans ce mod­èle la pop­u­la­tion com­posée de N indi­vidus est divisée en 3 « compartiments » :

  • S pop­u­la­tion saine non contaminée ;
  • I pop­u­la­tion infec­tée réputée contagieuse ;
  • R pop­u­la­tion « remise » c’est-à-dire guérie et réputée immu­nisée, ou décédée.

Exprimées en lan­gage de non-math­é­mati­ciens util­isa­teurs d’Excel, les équa­tions de Ker­ma­ck et McK­endrick sig­ni­fient que :


  • La pop­u­la­tion S (au départ égale à N moins quelques indi­vidus infec­tés) dimin­ue quo­ti­di­en­nement de β.S.I indi­vidus (β est égal à R0 /(N.D), R0 étant le « taux de repro­duc­tion ini­tial » sou­vent évo­qué par les médias et D la durée moyenne pondérée en jours d’infection avant guéri­son ou décès).

Bien not­er que la nota­tion tra­di­tion­nelle R0 n’a rien à voir avec R à l’instant 0.

  • La pop­u­la­tion R (au départ nulle) aug­mente quo­ti­di­en­nement de γ.I indi­vidus (γ étant l’inverse de D).
  • La pop­u­la­tion I (au départ quelques indi­vidus) est la dif­férence entre N et (S + R).

Nota : paraî­trait plus logique une mod­éli­sa­tion où, au lieu de γ.I indi­vidus entrant le jour J dans le com­par­ti­ment R, y bas­culeraient ceux qui ont quit­té le jour (J‑D) le com­par­ti­ment S. Néan­moins les équa­tions clas­siques de Ker­ma­ck et McK­endrick présen­tent l’avantage d’avoir fait depuis 1927 l’objet de nom­breuses études qui ont fourni un cer­tain nom­bre de con­clu­sions validées par l’observation de cas con­crets d’épidémie. Une com­para­i­son entre des mod­éli­sa­tions Excel fondées sur les deux types d’équations n’a pas mon­tré de dif­férence affec­tant de façon fon­da­men­tale les résul­tats exposés dans cet arti­cle, qui est donc basé sur l’utilisation des équa­tions traditionnelles. 

Où Excel excelle

À par­tir de D, N et R0 il est facile de bâtir un tableau Excel don­nant l’évolution de S, I et R et de leurs vari­a­tions quo­ti­di­ennes pen­dant quelques cen­taines de jours. L’avantage sur des méth­odes math­é­ma­tiques clas­siques est l’extrême sou­p­lesse avec laque­lle ce logi­ciel per­met d’introduire des don­nées d’entrée suiv­ant n’importe quelle évo­lu­tion au cours du temps, en par­ti­c­uli­er pour R0 (et par voie de con­séquence β).

Le dia­gramme suiv­ant mon­tre l’évolution de I et de R au début d’une épidémie qui, dans le cadre de vie habituel d’un pays de 67 mil­lions d’habitants, présente un R0 de 3. Le 17 mars le nom­bre de nou­veaux infec­tés quo­ti­di­ens atteint 100 000, ce qui risque d’entraîner 20 jours plus tard un nom­bre de décès quo­ti­di­en de 500 à 1 000, compte tenu d’une létal­ité réelle de 0,5 à 1 % (voir plus loin). Les pou­voirs publics décrè­tent alors un con­fine­ment général qui fait baiss­er immé­di­ate­ment R0 à 0,7 pen­dant 55 jours. Après le décon­fine­ment du 11 mai, en par­ti­c­uli­er sous l’influence de mou­ve­ments lib­er­taires niant la per­sis­tance de l’épidémie, R0 remonte pro­gres­sive­ment de façon linéaire jusqu’à 1,3 en 4 mois, puis se sta­bilise à ce niveau à par­tir de sep­tem­bre 2020.

R et I (millions d'habitants)

Le mod­èle SIR util­isant Excel mon­tre que le nom­bre d’infectés simul­tanés qui avait aug­men­té jusqu’au début du con­fine­ment (mars 2020) décroît jusqu’à la fin juil­let 2020. Ensuite, si le virus n’évolue pas, si R0 reste sta­ble à 1,3 et si aucun nou­veau traite­ment effi­cace n’est mis en œuvre, le nom­bre d‘infectés simul­tanés croît jusqu’à un max­i­mum en juin 2021 (courbe bleu fon­cé) puis dimin­ue jusqu’à ce que l’immunité col­lec­tive cor­re­spon­dant à R0 = 1,3 soit atteinte (env­i­ron 40 % de la pop­u­la­tion immu­nisée suite à guéri­son ou à toute autre cause, voir plus bas), ce qui ne survient qu’en 2022.

À la mi-août 2020, le cumul de per­son­nes qui ont été con­t­a­m­inées (courbe bleu clair) est d’environ 4 mil­lions. Une létal­ité réelle de 0,5 à 1 % con­duit à 20 à 40 000 décès depuis le début de la pandémie, fourchette com­pat­i­ble avec les chiffres observés en France.

Si les con­di­tions rap­pelées plus haut restent inchangées, l’évolution ultérieure prévue par Excel cor­re­spond ensuite à une hausse sen­si­ble entre le creux de juil­let 2020 et le print­emps 2021 du nom­bre quo­ti­di­en de nou­veaux infec­tés. Toute­fois cette hausse sera beau­coup moins rapi­de que celle de mars 2020 où le nom­bre de nou­veaux con­t­a­m­inés et de décès dou­blait chaque semaine. On assis­tera ensuite à une lente décrois­sance jusqu’à extinc­tion de l’épidémie début 2022 (à con­di­tion que R0 reste à 1,3 !). Mais plusieurs élé­ments sont sus­cep­ti­bles de mod­i­fi­er cette prévi­sion : muta­tions imprévis­i­bles du virus, disponi­bil­ité de traite­ments des malades réduisant la durée d’infection, arrivée de vac­cins, sans oubli­er les réac­tions com­porte­men­tales de la pop­u­la­tion, que ce soit par prise de con­science et ini­tia­tives indi­vidu­elles (surtout chez les plus vul­nérables) ou par respect de con­signes indica­tives ou coerci­tives des pou­voirs publics.

Létalités réelle et apparente 

Le taux de létal­ité réel, ou infec­tion facil­i­ty rate (IFR), est le rap­port entre le nom­bre de décès imputés à l’épidémie et le nom­bre total de per­son­nes (y com­pris les asymp­to­ma­tiques) qui ont été infec­tées par le virus cor­re­spon­dant. Pour des raisons pra­tiques, ce dernier nom­bre ne peut être qu’estimé, car il n’est pas mesurable : pour un pays comme la France, à rai­son de 100 000 tests par jour, il faudrait près de deux ans pour tester une seule fois toute la population.

Cette létal­ité dépend de car­ac­téris­tiques du virus qui, dans le cas de la Covid-19, parais­sent jusqu’à main­tenant assez sta­bles et assez sem­blables dans l’ensemble des pays touchés. Des dif­férences entre pays et régions peu­vent appa­raître pour des raisons de fond (état de san­té général de la pop­u­la­tion, qual­ité du sys­tème de soins) et des méth­odes diver­gentes de saisie des motifs de décès, en par­ti­c­uli­er dans les cas fréquents de comor­bid­ité. Au moment où cet arti­cle est écrit, l’estimation du taux de létal­ité réel de cette infec­tion, au moins en France et dans des pays de niveau de développe­ment com­pa­ra­ble, sem­ble être une fourchette allant de 0,5 à 1 %.

Le taux de létal­ité appar­ent, ou case facil­i­ty rate (CFR), est le rap­port entre le nom­bre de décès imputés à l’épidémie et le nom­bre de per­son­nes qui ont été testées pos­i­tives. La létal­ité appar­ente est donc totale­ment dépen­dante de la poli­tique de tests qui varie énor­mé­ment de pays à pays (par exem­ple aux États-Unis, on a longtemps testé beau­coup plus qu’en France). Lorsqu’ils sont fondés sur des « létal­ités » tout court qui sont en fait des létal­ités appar­entes, les nom­breux arti­cles ou ouvrages qui pré­ten­dent com­par­er à par­tir de ce chiffre l’efficacité de dif­férents sys­tèmes de soins face à ce virus sont donc ineptes.

“La létalité n’a pas d’influence directe sur la propagation de l’épidémie.”

Dans un mod­èle épidémi­ologique, la létal­ité n’a pas d’influence directe sur la prop­a­ga­tion de l’épidémie, puisque ce qui déter­mine cette dernière est la baisse pro­gres­sive du nom­bre d’individus pou­vant être con­t­a­m­inés, que les autres aient été immu­nisés par infec­tion-guéri­son ou vac­ci­na­tion ou qu’ils n’aient pas survécu à l’infection.

Taux de contamination de la population apportant une immunité collective (herd immunity)

L’emploi d’Excel per­met de déter­min­er facile­ment le taux d’immunité col­lec­tive, c’est-à-dire le pour­cent­age de la pop­u­la­tion qui doit avoir été con­t­a­m­iné (ou vac­ciné) pour que l’épidémie s’arrête d’elle-même. Il suf­fit de pro­longer le tableau con­tenant S, I et R jusqu’à ce que I devi­enne nul. La courbe R se ter­mine par une droite hor­i­zon­tale don­nant le taux d’infectés min­i­mal dans la pop­u­la­tion pour que l’épidémie s’arrête.

On remar­que que ce taux est très dépen­dant de R0. Une série d’essais Excel avec des R0 allant de 1 à 4 donne la courbe suivante.

Immunité collective en fonction de R0

Les cours d’épidémiologie don­nent pour cette courbe l’équation suivante :

Tauxcol­lec­tive = 1 — exp ( — R0 x Tauxcol­lec­tive )

qui con­firme les résul­tats obtenus grâce à Excel, méth­ode qui ne demande aucune con­nais­sance math­é­ma­tique particulière.

Est donc inex­acte l’affirmation que l’on entend ou lit sou­vent, selon laque­lle pour attein­dre une immu­nité col­lec­tive il faut que le taux total de per­son­nes ayant été infec­tées dépasse 60 ou 70 %. La courbe mon­tre que, si une pop­u­la­tion réus­sit à main­tenir de façon durable un R0 inférieur à 1,5, l’immunité col­lec­tive est obtenue pour des valeurs inférieures à 60 % (par exem­ple env­i­ron 40 % pour un R0 de 1,3). La com­bi­nai­son d’un R0 et d’un taux d’infection de la pop­u­la­tion per­me­t­tant de se posi­tion­ner au-dessus de la courbe per­met aus­si d’attendre l’arrivée d’un vac­cin, d’un remède ou d’une éventuelle muta­tion favor­able du virus. Il est pos­si­ble que cer­taines zones à forte den­sité de pop­u­la­tion soient actuelle­ment proches de cette immu­nité col­lec­tive (Stock­holm ?), mais s’y main­tenir de façon durable impose de ne pas laiss­er aug­menter le R0 qui aura per­mis d’en bénéficier.

9 Commentaires

Ajouter un commentaire

Hugues Sévéracrépondre
7 octobre 2020 à 3 h 24 min

Mer­ci, c’est très intéres­sant. Je me per­me­ts une remar­que com­plé­men­taire : la dif­fi­culté c’est qu’on a des paramètres pour l’épidémie que sont très dif­férents selon les class­es d’âge, aus­si bien en taux de létal­ité (par exem­ple près de 30% des hos­pi­tal­isés de plus de 80 ans suc­combent, alors que l’on est net­te­ment sous 1% pour les moins de 30 ans), qu’en taux de con­t­a­m­i­na­tion (par exem­ple fin sep­tem­bre la pré­va­lence est de 200 / 100 000 hab sur les 15–44 ans et env­i­ron 50 chez les > 75 ans). En défini­tive, ce qui définit la courbe de mor­tal­ité sur le long terme, c’est surtout la façon dont les plus âgés se seront pro­tégés, tan­dis que d’un pays à l’autre il faut aus­si com­par­er les pyra­mides des âges.

francois-xavier.martin.1963répondre
7 octobre 2020 à 17 h 10 min

Pen­dant l’u­nité de temps un indi­vidu infec­té (donc faisant par­tie du com­par­ti­ment I) a en moyenne κ con­tacts poten­tielle­ment con­t­a­m­i­nants avec un autre mem­bre de la pop­u­la­tion, donc κ.S/N avec un indi­vidu sus­cep­ti­ble d’être con­t­a­m­iné. Si τ est la pro­por­tion moyenne de ces con­tacts débouchant sur une con­t­a­m­i­na­tion, il en con­t­a­mine donc κ.τ. S/N. En moyenne, au bout d’un cer­tain temps (sor­tie de con­fine­ment …) les plus âgés ont un κ.τ plus faible que les plus jeunes en rai­son d’un com­porte­ment plus pru­dent. On peut faire des esti­ma­tions rel­a­tives à l’influence de l’âge sur la moyenne de κ.τ (et son évo­lu­tion dans le temps) ce qui impacte β (= κ.τ/N ) et R0 (= κ.τ.D ). Le mod­èle Excel à β et R0 vari­ables présen­té per­met donc la prise en compte de cette dif­férence de com­porte­ment avec l’âge (qui fait plus que com­penser une éventuelle propen­sion supérieure à être con­t­a­m­iné lors d’une ren­con­tre en rai­son d’un sys­tème immu­ni­taire affaibli).
La dif­férence de létal­ité entre jeunes et plus âgés n’a pas d’in­flu­ence sur le développe­ment de l’épidémie pour lequel on peut dire cynique­ment qu’un décès a le même effet qu’une guéri­son immu­nisante : c’est de dimin­uer d’une unité le nom­bre d’in­di­vidus sus­cep­ti­bles d’être contaminés.

philippe.fleury.1959répondre
10 octobre 2020 à 17 h 54 min

Bra­vo ! Ton raison­nement est très clair.
Nul n’est cen­sé per­sévér­er dans l’er­reur. Tu pré­conis­es page 7 de mieux déter­min­er le coef­fi­cient béta face à un nou­veau virus. Mais pourquoi pas déjà avec le virus en cours ? L’im­pact sur l’é­conomie des mesures « bar­rière », et a for­tiori un futur con­fine­ment, sera cat­a­strophique. Voir à ce sujet l’ex­cel­lent livre de notre cama­rade Robert Boy­er (X 62) sur les cap­i­tal­ismes à l’épreuve de la pandémie. Il insiste lour­de­ment sur l’im­pact en fonc­tion de la durée de la pandémie. C’est effec­tive­ment un des très grands risques.
Ce serait bien d’avoir ton fichi­er Excel.

Jean-Bap­tisterépondre
17 octobre 2020 à 20 h 47 min

Bel arti­cle.
L’im­mu­nité de groupe sem­ble tomber à l’eau avec des réin­fec­tions à 6 mois, ce qui laisse plan­er des doutes sur l’ef­fi­cac­ité mag­ique d’un vaccin.
De même le nom­bre de cas dépend du nom­bre de per­son­nes symp­to­ma­tiques qui sont volon­taires pour se faire tester. Ce qui néces­site d’être symp­to­ma­tique (~50% ?) et volon­taire pour un test (d’ex­péri­ence quo­ti­di­enne depuis 7 mois, à la louche 50%). Le virus est donc mal tracé et comme bien pré­cisé, il s’in­fil­tr­era chez les plus fragiles.
Avec un hôpi­tal tou­jours aus­si mal géré et pour­tant pléthorique.
Des mois de douleur en perspective.

francois-xavier.martin.1963répondre
24 octobre 2020 à 14 h 28 min

A Jean-Bap­tiste. En fait j’ai fait une erreur de vocab­u­laire : j’ai écrit qu’on atteignait l’im­mu­nité de groupe lorsqu’il n’y avait plus du tout d’in­fec­tés, alors qu’habituelle­ment ceci veut dire qu’on a atteint ce qui s“appelle Imax (max­i­mum d’in­fec­tés simul­tanés), moment à par­tir duquel l’épidémie s’ar­rête d’elle-même.
Ceci ne veut pas dire qu’il n’y aura plus de nou­velles infec­tions pen­dant cette péri­ode de décrois­sance, mais qu’elles seront en nom­bre insuff­isant pour que l’épidémie per­dure. Donc si le taux de perte de l’im­mu­nité après 6 mois n’est pas trop élevé, ceci n’empêchera pas l’épidémie de s’ar­rêter (tout au plus ça retardera la fin).
Le nom­bre de per­son­nes infec­tées ou ayant été infec­tées est incon­nu faute de tests dits aléa­toires (par sondage sous la houlette d’or­gan­ismes spé­cial­isés, éventuelle­ment en rétribuant des pan­els de sondés). C’est une grosse lacune dans le suivi de l’épidémie qui rend hasardeuses toutes les prévisions.

Patrickrépondre
2 novembre 2020 à 1 h 14 min

Mer­ci, c’est très clair. Tout petit cor­rec­tif, je pense qu’on par­le d’ Infec­tion *Fatal­i­ty* Rate (IFR) et de Case *Fatal­i­ty* Rate (CFR)

francois-xavier.martin.1963répondre
7 novembre 2020 à 11 h 33 min

Mer­ci Patrick de cette correction.
J’ai rec­ti­fié un autre point dans un nou­v­el arti­cle qui va fig­ur­er dans la J&R de novem­bre et qui con­cerne l’im­mu­nité col­lec­tive. J’ai inclus dans l’ar­ti­cle d’oc­to­bre la courbe en fonc­tion de R du total cumulé des infec­tions depuis le début de l’épidémie jusqu’à sa dis­pari­tion. Or tra­di­tion­nelle­ment la lit­téra­ture sur ce sujet con­sid­ère qu’on a atteint l’im­mu­nité col­lec­tive non pas lorsque l’épidémie se ter­mine mais dès qu’elle com­mence à dimin­uer. Le taux cumulé d’in­fec­tions à ce moment ne tient donc pas compte de celles sur­venant pen­dant la phase de décrois­sance de l’épidémie. Je donne les 2 courbes dans l’ar­ti­cle de novembre.

jean luc therouderépondre
11 janvier 2021 à 18 h 56 min

bon­jour,
voilà je ne suis pas un grand util­isa­teur d ‘excel , par con­tre auriez vous une idée pour inté­gr­er les paramètres com­plé­men­taires ci-dessous
a) impact poten­tiel de la vac­ci­na­tion en fonc­tion de sa pro­gres­sion ( nom­bres de vac­cinés prévus par semaine , )
b ) durée de la vac­ci­na­tion ’ impact de la durée ’ sur l’évo­lu­tion (hypothèse exem­ple n vac­cins par semaine)
c ) inté­gr­er ou à mod­uler par la durée de vie de la pro­tec­tion ( en mois ou semaines estimation)
cor­diale­ment jean luc theroude

francois-xavier.martin.1963répondre
11 janvier 2021 à 23 h 11 min
– En réponse à: jean luc theroude

Tout d’abord vous avez les tableaux Excel (sans vac­ci­na­tion) dans un arti­cle du mois de novem­bre acces­si­ble à https://www.lajauneetlarouge.com/deuxieme-vague-covid-19-perspectives-2020–2021_modele_sir/ Ce tableau per­met de cal­culer les flux entre 3 « com­par­ti­ments » : S (Sains), I (Infec­tés) et R (Rétab­lis ou décédés !), les indi­vidus pas­sant de S à I (où ils séjour­nent pen­dant la durée de leur infec­tion) puis de I à R.
Si on vac­cine, dans la mod­éli­sa­tion la plus sim­ple il faut ajouter chaque jour aux débits précé­dents un débit direct de vac­cinés de S vers R, que vous pou­vez mod­uler en fonc­tion de votre poli­tique de vac­ci­na­tion (en principe dans ces sim­u­la­tions il faut utilis­er des pas d’une journée). Après si vous voulez raf­fin­er vous pou­vez ne les faire pass­er dans R que quelques jours après la vac­ci­na­tion (temps néces­saire pour qu’ils soient immu­nisés), les faire remon­ter de R dans S au bout de quelques mois (perte d’im­mu­nité après vac­ci­na­tion), etc. Le but est de vider le plus vite pos­si­ble S car l’épidémie com­mence à s’étein­dre quand Ro x S / N passe en-dessous de 1 (ce qui ne sig­ni­fie pas qu’elle est ter­minée, l’ex­tinc­tion prend un cer­tain temps)

Répondre