Skip to main content
logo
Lancer la vidéo

Vous avez dit « modèle » ?

Numéro 3 – 2020 - Covid-19 modèle modélisation pandémie scientifiques par Pierre de Buyl

avril 2020

Lors de l’épidémie de coro­na­vi­rus, le comi­té fédé­ral belge d’experts scien­ti­fiques a été le centre de l’attention média­tique et poli­tique. Mais… com­ment les scien­ti­fiques peuvent-ils com­prendre l’évolution d’une épi­dé­mie ? En uti­li­sant ce qu’on appelle un « modèle », c’est-à-dire une repré­sen­ta­tion mathé­ma­tique d’un phé­no­mène. En variant les para­mètres du modèle, on peut tes­ter de façon théo­rique des situa­tions nou­velles. Petit décryptage…

Dossier

La plu­part des théo­ries scien­ti­fiques sont des modèles qui acquièrent un rôle plus ou moins impor­tant en fonc­tion de leur vali­da­tion par l’expérience. Un des exemples les plus célèbres est pro­ba­ble­ment la méca­nique clas­sique : les équa­tions et prin­cipes énon­cés par New­ton sur le mou­ve­ment des corps.

On sait aujourd’hui que cette théo­rie doit être rem­pla­cée, selon les situa­tions, par la méca­nique quan­tique ou la rela­ti­vi­té géné­rale (ces deux théo­ries n’étant pas uti­li­sables simul­ta­né­ment). Mais dans son domaine de vali­di­té, la méca­nique clas­sique conserve toute son impor­tance comme pour le gui­dage de fusées et de satel­lites et l’étude de la struc­ture des pro­téines, par exemple.

Dans cet article, nous ver­rons d’abord le concept de modèle, pour ensuite consi­dé­rer une illus­tra­tion de modèle de pro­pa­ga­tion virale que cer­tains cher­cheurs ont uti­li­sé pour le coro­na­vi­rus… afin, en conclu­sion, de reve­nir sur l’actualité.

Un modèle jouet de modèle

Le carac­tère sim­pli­fié d’un modèle est sou­vent iden­ti­fié par l’adjectif « jouet ». L’intérêt de cette démarche n’est alors plus d’estimer des résul­tats quan­ti­ta­tifs, mais de com­prendre un méca­nisme d’action à des fins de recherche ou d’illustration péda­go­gique. Je vais donc prendre un tel modèle jouet comme pre­mier objet d’étude.

Concen­trons-nous un moment sur le phé­no­mène des nais­sances. Fai­sons l’hypothèse que le nombre de nais­sances à chaque ins­tant soit pro­por­tion­nel à la taille P de la popu­la­tion. On écrit alors la varia­tion de la popu­la­tion comme le pro­duit de P avec le nombre d’enfants de chaque indi­vi­du. La solu­tion de ce modèle est simple, il s’agit de la fameuse fonc­tion expo­nen­tielle. On connait donc la taille de la popu­la­tion au cours du temps. On peut en déduire éga­le­ment le temps néces­saire au dou­ble­ment de la population.

Quelles sont les limites de ce modèle ? Pri­mo, il n’y a pas de valeur maxi­male : la popu­la­tion pour­rait bien atteindre un mil­liard de mil­liards de per­sonnes ! Secun­do, toute la popu­la­tion est consi­dé­rée comme « iden­tique », sans nuan­cer la varia­tion de fer­ti­li­té d’une région à une autre, par exemple.

Cer­tains ensei­gne­ments du modèle sont trans­po­sables, par contre. D’une part, la défi­ni­tion même du taux de repro­duc­tion est utile pour construire des modèles plus éla­bo­rés. D’autre part, la for­mule mathé­ma­tique pour la popu­la­tion se visua­lise clai­re­ment avec une ligne droite sur un gra­phique dit loga­rith­mique. C’est pour cette rai­son que de nom­breuses illus­tra­tions ont une échelle de don­nées de type « 1, 10, 100, 1000 » (loga­rith­mique) plu­tôt que « 1, 2, 3, 4 » (linéaire). Je montre dans le gra­phique 1 la fonc­tion expo­nen­tielle sur les deux types de graphiques.

croissance_exponentielle.jpg

population_mondiale.jpg

La popu­la­tion mon­diale, pour de longues périodes his­to­riques, a sui­vi une crois­sance approxi­ma­ti­ve­ment expo­nen­tielle. Je montre les don­nées dans le gra­phique 2, accom­pa­gnées d’ajustements de courbes expo­nen­tielles pour deux périodes tem­po­relles. De l’origine des don­nées en 5000 avant notre ère jusqu’environ 1600, on obtient un temps de dou­ble­ment d’environ 1.000 ans et un taux d’environ 0,07 % par année. Après 1600, le taux monte à 0,9 % et le temps de dou­ble­ment est de sep­tante-quatre ans. Même si la popu­la­tion ne suit pas une crois­sance expo­nen­tielle, l’utilisation du gra­phique loga­rith­mique et l’analyse en termes de taux de dou­ble­ment aident à la com­pré­hen­sion des données.

Un modèle épidémiologique

La pro­pa­ga­tion d’une épi­dé­mie virale peut sou­vent être décrite par un modèle. Des cher­cheurs chi­nois ont uti­li­sé le modèle dit « SEIR » qui com­par­ti­men­ta­lise la popu­la­tion en per­sonnes sus­cep­tibles (S), expo­sées (E), infec­tées (I) et remises ®. Le modèle mathé­ma­tique défi­nit la varia­tion du nombre de per­sonnes dans les dif­fé­rentes caté­go­ries en don­nant une expres­sion pour le taux de varia­tion (la déri­vée tem­po­relle) des variables S, E, I et R. Il faut com­plé­ter ce modèle par des para­mètres qui cor­res­pondent à l’infection étu­diée (délai d’incubation et de gué­ri­son, taux de repro­duc­tion). Dans la ver­sion simple du modèle, on omet le taux de décès natu­rels de la popu­la­tion, ce qui est une hypo­thèse cohé­rente pour de courtes épidémies.

Au début de l’épidémie, la qua­si-tota­li­té de la popu­la­tion est consi­dé­rée comme sus­cep­tible d’être expo­sée à la conta­mi­na­tion venant des per­sonnes infec­tées (l’infection prend place dans une deuxième étape). Le nombre de per­sonnes expo­sées aug­mente donc pro­por­tion­nel­le­ment à la taille du réser­voir de per­sonnes sus­cep­tibles d’être atteintes et au nombre de per­sonnes infectées.

Une fois tout le modèle écrit, reste à résoudre les équa­tions. Par­fois on obtient une solu­tion sous la forme d’une for­mule mathé­ma­tique directe. Sou­vent, on uti­lise l’ordinateur pour obte­nir une réponse numé­rique qu’on peut affi­cher et ana­ly­ser en détail. Pour le modèle SEIR, j’ai réa­li­sé dif­fé­rentes esti­ma­tions de l’épidémie par réso­lu­tion numé­rique. Moti­vé par la publi­ca­tion de Nico­las Van­de­walle sur Twit­ter, j’ai repris la des­crip­tion dans l’article publié par l’équipe de l’école de san­té publique de Shan­ghai Jiao (Tong Uni­ver­si­ty School of Medi­cine) dans lequel les scien­ti­fiques chi­nois estiment la valeur de plu­sieurs para­mètres spé­ci­fi­que­ment pour le Covid-19. Un des para­mètres, le coef­fi­cient de repro­duc­tion R0, est fort dépen­dant des com­por­te­ments humains (proxi­mi­té, échanges sociaux, etc.) et est donc impos­sible à déter­mi­ner de façon universelle.

Je montre dans le gra­phique 3 les résul­tats du modèle à titre d’exemple, pour toutes les sous-populations.

modele_seir.jpg

Le com­por­te­ment géné­ral du modèle, visible dans ce gra­phique, est le sui­vant : le nombre de per­sonnes expo­sées, puis infec­tées avec un délai, aug­mente for­te­ment jusqu’à obte­nir une valeur maxi­male de I, le pic de l’épidémie. L’augmentation de I est expo­nen­tielle du jour 10 au jour 50 envi­ron et appa­rait donc comme une droite sur le gra­phique loga­rith­mique. On peut donc défi­nir un temps de dou­ble­ment pour le nombre de per­sonnes infec­tées, comme dans le modèle jouet de popu­la­tion. Après le pic, les infec­tés deve­nant gué­ris et sup­po­sés immu­ni­sés, le réser­voir de per­sonnes sus­cep­tibles dimi­nue et les quan­ti­tés E et I dimi­nuent éga­le­ment. Le pire est pas­sé. Le nombre de décès ou de per­sonnes néces­si­tant des soins inten­sifs est géné­ra­le­ment consi­dé­ré comme une frac­tion de I. Dans les gra­phiques sui­vants, je montre uni­que­ment les don­nées pour I.

Je pré­sente main­te­nant une uti­li­sa­tion typique du modèle : que se passe-t-il si on varie le para­mètre de repro­duc­tion R0 ? Il suf­fit d’afficher la courbe I pour plu­sieurs valeurs. Je prends la gamme de valeurs esti­mées par l’article de réfé­rence pour le coro­na­vi­rus, R0 = 1,9 et R0 = 3,1. Je rajoute la valeur R0 = 4 qui semble per­ti­nente pour l’évolution ini­tiale de la mala­die en Belgique.

scenarios_seir.jpg

De cette étude, on peut tirer l’observation sui­vante : la valeur de R0 influence for­te­ment la hau­teur et le moment du pic de l’épidémie. Les consé­quences pour la san­té publique sont très impor­tantes car la hau­teur du pic déter­mine la sur­charge du sys­tème de soins. En effet, une frac­tion des per­sonnes infec­tées néces­site une hos­pi­ta­li­sa­tion. Dans ces patients, cer­tains auront besoin d’un lit en uni­té de soins inten­sifs. Si l’épidémie dépasse ce seuil, la situa­tion devient dra­ma­tique, comme cela a été le cas en Ita­lie par exemple. Pour une situa­tion idéa­li­sée, je trace la barre hori­zon­tale de satu­ra­tion du sys­tème de soins inten­sifs vers 1,14 mil­lion de cas infec­tés (une frac­tion seule­ment de ces cas néces­si­tant des soins inten­sifs). C’est le fameux effet d’aplatissement de la courbe dont les médias ont fait la pré­sen­ta­tion : en pre­nant des mesures qui réduisent le taux de conta­mi­na­tion, le scé­na­rio d’épidémie peut deve­nir gérable.

Une fois l’épidémie enta­mée, on peut mal­heu­reu­se­ment com­pa­rer les résul­tats du modèle avec les don­nées col­lec­tées. Cette phase est essen­tielle pour cali­brer le modèle, c’est-à-dire pour véri­fier et éven­tuel­le­ment mettre à jour les para­mètres. Le modèle et l’exploration d’hypothèses deviennent des outils d’aide à la déci­sion et per­mettent d’estimer si on réus­sit à « apla­tir la courbe ».

Dans le cas du coro­na­vi­rus, plu­sieurs obser­va­tions ont été faites concer­nant la qua­li­té des don­nées. La pre­mière est le déca­lage entre le nombre de per­sonnes effec­ti­ve­ment infec­tées et le nombre de tests posi­tifs obte­nus, ce der­nier étant pro­ba­ble­ment lar­ge­ment infé­rieur au pre­mier. Une réponse pos­sible est, consi­dé­rant le nombre d’hospitalisations comme une frac­tion fixe de I, de déduire cette der­nière valeur. La seconde objec­tion est qu’une frac­tion impor­tante des per­sonnes infec­tées ne montre aucun symp­tôme (on parle des cas asymp­to­ma­tiques), et qu’il est dès lors dif­fi­cile de connaitre l’am­pleur de la pro­pa­ga­tion du virus. En appli­quant ces cor­rec­tions aux don­nées, en fonc­tion des études dans d’autres pays, on obtient une vision plus réa­liste de la situation.

Le modèle SEIR pré­sen­té ci-des­sus consi­dère uni­que­ment la taille des sous-popu­la­tions S, E, I et R. En l’utilisant, on néglige donc la struc­ture de la socié­té des points de vue géo­gra­phique et d’âge, entre autres. La théo­rie des réseaux per­met de com­bler ce manque : on repré­sente alors les indi­vi­dus comme élé­ment de base du modèle en réseau et la trans­mis­sion de la mala­die peut alors prendre en compte les contacts entre per­sonnes, en fonc­tion de leur lieu d’habitation et de leur âge.

Au fur et à mesure qu’on aug­mente le détail du modèle, on oublie faci­le­ment la ques­tion des hypo­thèses sous-jacentes et celle du domaine de vali­di­té des équa­tions. Il est alors ten­tant de confondre modèle et réa­li­té et de don­ner une force pré­dic­tive exa­gé­rée au modèle. C’est à ce moment que l’expert·e (soit l’expert·e du domaine, soit l’expert·e en modé­li­sa­tion, idéa­le­ment les deux ensemble) doit exer­cer son esprit cri­tique et rap­pe­ler ces limites.

Tous les modèles sont faux, certains sont utiles

Le titre de cette sec­tion fait réfé­rence à un dic­ton attri­bué au sta­tis­ti­cien George Box. En éta­blis­sant une des­crip­tion mathé­ma­tique de la réa­li­té, les scien­ti­fiques se fondent sur des hypo­thèses et acceptent des approxi­ma­tions, ce qui suf­fi­rait à les qua­li­fier de faux. On peut cepen­dant bâtir une com­pré­hen­sion fon­da­men­tale de cer­tains phé­no­mènes grâce à ces sim­pli­fi­ca­tions. Le dic­ton sert donc de rap­pel aux uti­li­sa­teurs de modèle plus que de cri­tique aveugle. L’utilisation d’un modèle pour influen­cer des choix poli­tiques ne peut négli­ger les limites énon­cées ci-des­sus, par­ti­cu­liè­re­ment lorsqu’il s’agit de san­té publique. Igno­rer les appren­tis­sages de ces modèles serait tout aus­si malheureux.

Appli­quons cette stra­té­gie au modèle d’épidémie : quels sont les appren­tis­sages ? Quelles sont les limites ? En pre­mier lieu, on peut conclure que dimi­nuer la vitesse de pro­pa­ga­tion de l’épidémie dimi­nue le nombre maxi­mum de per­sonnes infec­tées à un moment don­né. En consé­quence, la durée d’application des mesures de ralen­tis­se­ment doit aus­si aug­men­ter. Le nombre de per­sonnes qui auront été infec­tées à un moment ou un autre est d’au moins 90% dans la plu­part des scé­na­rios, confir­mant le mes­sage des médias qu’aplatir la courbe sert prin­ci­pa­le­ment à ne pas satu­rer le sys­tème hos­pi­ta­lier. L’hy­po­thèse de base sur laquelle se basent ces conclu­sions est qu’on peut influen­cer le taux de repro­duc­tion R0 en pre­nant des mesures de type confi­ne­ment et fer­me­ture d’é­coles, sui­vant en ça la lit­té­ra­ture scien­ti­fique. L’in­ter­pré­ta­tion des don­nées jour­na­lières de l’épidémie se fera par ailleurs à la lumière du modèle, sou­li­gnant son uti­li­té comme point de repère.

Du côté des limites, il faut rap­pe­ler que le modèle pré­sen­té ici est une approxi­ma­tion qui réduit les rela­tions entre des mil­lions d’individus à quatre quan­ti­tés mathé­ma­tiques et trois para­mètres. Par­mi ceux-ci, R0 varie en fonc­tion de la popu­la­tion et doit être cali­bré pour chaque pays. Les dif­fé­rences de pyra­mide des âges, d’immunité et de com­por­te­ment social sont, en effet, négli­gées et résu­més de façon glo­bale dans cette valeur. Une autre cri­tique est liée à l’utilisation des résul­tats : là où l’é­vi­dence mathé­ma­tique devrait être non ambigüe, dif­fé­rents pays ont tiré des conclu­sions com­plè­te­ment dif­fé­rentes sur les poli­tiques de san­té publique à adop­ter. La chaine d’analyse modèle-scien­ti­fique-poli­tique est donc fort sen­sible aux variations.

En guise de conclu­sion, il nous faut insis­ter : dis­po­ser d’un modèle n’est pas suf­fi­sant. Ce qui compte c’est l’expérience com­bi­née des modélisateur·rice·s qui, avec des spé­cia­listes du domaine concer­né, pour­ront mettre les résul­tats en pers­pec­tive. Construire un modèle n’est pas construire une poli­tique publique.

Pierre de Buyl


Auteur

docteur en sciences physiques de l’université libre de Bruxelles. Il est assistant scientifique à l'Institut royal météorologique, http://pdebuyl.be/