L’exercice complexe du calcul du R0, l’approche gouvernementale

Avec le contexte du déconfinement en vigueur depuis près de trois semaines, la surveillance de l’épidémie de covid-19 en France s’appuie sur quatre indicateurs. Ils ont été présentés en conférence de presse par le Ministre de la santé Olivier Véran, jeudi 28 mai. Un de ces indicateurs est le nombre R0, qu’on a déjà évoqué dans des précédents articles sur le site. Qu’est-ce que le R0 ? Comment est-il calculé, que signifie-t-il ? La réponse dans cet article.

Capture de la conférence de presse, jeudi 28 mai 2020

Définition de R0

Pour commencer, revenons sur la définition de R0. On l’appelle le nombre de reproduction de base car il indique le nombre de personnes qui seront contaminées par une personne infectieuse pendant la durée de la contagiosité. Plus sa valeur est élevée, plus l’épidémie est forte. Voici une illustration rapide de l’arbre de contagion, telle que représenté dans un document de l’Université de Stanford, par James Holland Jones :

Jones-on-R0, Stanford University, JH Jones, May 2007, generations on an epidemic, page 14

On pourrait imaginer que pour cette illustration R0 est compris entre 2 et 3, car le nombre de nouvelles personnes infectées dans chaque génération est doublé voire triplé. Le R0 correspond au taux de reproduction au début de l’épidémie. On parle ensuite de Reffectif ou de Rt ; la lettre t faisant référence au temps.

Première évaluation officielle de R0 par l’Institut Pasteur, le 21 avril 2020

L’Institut Pasteur est en première ligne dans le combat contre l’épidémie. Dans un communiqué de presse le 21 avril, l’Institut annonçait qu’un des effets du confinement avait été de réduire le nombre de reproduction R de 3,3 à 0,5. Depuis l’étude a été mise à jour pour sa publication dans la revue Science le 13 mai, l’évolution de R lors du passage au confinement en France est estimée de 2,9 à 0,7.

Dans l’étude détaillée de l’Institut Pasteur on peut lire que le modèle épidémiologique utilisée est de type SEIR : Susceptible-Exposed-Infected-Removed

Extrait de l’étude Institut Pasteur Estimating the burden of SARS-CoV-2 in France, 20 avril 2020, page 10

Le modèle épidémiologique SEIR comporte des équations qui permettent d’évaluer R0. C’est assez complexe, le document de Mr Jones de l’université de Stanford propose aussi un schéma du modèle SEIR :

Jones-on-R0, Stanford University, JH Jones, May 2007, SEIR model, page 4

Pour les lecteurs voulant en savoir plus, l’article Wikipedia sur les modèles compartimentaux en épidémiologie permet d’en apprendre davantage sur ces représentations.

Une approche graphique de R0 avec un modèle SIR

Le modèle épidémiologique SIR (Susceptible-Infected-Removed) est plus simple que le modèle SEIR. C’est celui utilisé dans le simulateur CovidTracker jusqu’à présent. À l’image du graphique des générations proposé en haut de l’article, nous avons établi un graphique du début de l’épidémie covid-19 en France. Les données prises en compte concernent le nombre de personnes testées positives PCR. Ce nombre ne représente pas toutes les personnes susceptibles d’être touchées et infectieuses car nous ne pouvons pas connaître l’effectif de toutes les personnes asymptomatiques. Il s’agit d’une approche en choisissant des données et un modèle épidémiologique pour le calcul. Selon Santé publique France, les premiers relevés du nombre de personnes testées positives entre le 24 avril et le 4 mars correspond à cette suite : 12, 14, 18, 38, 57, 100, 130, 191, 212, 285. La durée de la période infectieuse est évaluée à 3 jours (en référence au document de l’Institut Pasteur) donc nous avons imaginé de séparer le groupe en 3.

Approche graphique de R0 pour le covid-19 en France, avec un modèle SIR, entre le 24 février et le 4 mars 2020

Ce modèle est simple, pourtant il présente l’avantage d’être plus facilement compréhensible. Avec R0 approximativement égal à 4,6 (il s’agit d’une moyenne sur 6 jours) dans ce cas c’est sensiblement plus fort que la valeur communiquée par l’Institut Pasteur (rappel R0 = 2,9 avant la mise en place du confinement). Il faut surtout y voir que R n’est pas constant. Le graphique proposé lors de la conférence de presse du Ministre de la santé le 28 mai représente une courbe qui descend rapidement. Alors, quelle est la différence entre la modélisation avec une courbe et celle par paliers ? Nous allons voir ça tout de suite.

Approche calculée de R0 avec un modèle SEIR, données nombre de tests positifs PCR

Le simulateur CovidTracker a été revu pour prendre en considération l’approche de l’Institut Pasteur. Nous avons repensé l’algorithme de calcul pour prévoir une période E (Exposed) de 5 jours entre le moment où une personne S (Susceptible) est en contact avec une autre I (Infected) et le moment où la personne devient à son tour infectieuse. Ensuite la période I est toujours de 3 jours. Nous avons effectué une première approche avec des valeurs palier de R, puis à l’aide d’une courbe faisant l’interpolation entre des valeurs palier.

Approche de la valeur R0, simulateur CovidTracker avec une méthode SEIR sur les données du nombre de tests positifs RT-PCR selon Santé publique France

Deux choses intéressantes à remarquer, la dynamique de la courbe calculée est similaire à celle présentée lors de la conférence de presse du 28 mai et la valeur de R0 vers le 25 février pourrait être proche de 10, ce qui n’est pas très éloigné des valeurs calculées graphiquement avec la méthode SIR.

Approche gouvernementale

Le Gouvernement français, tout comme le Gouvernement allemand, se base sur les données des urgences hospitalières. Les Autorités françaises communiquent quotidiennement le nombre de personnes admises aux urgences pour suspicion de Covid19. Une estimation du Reffectif est alors le rapport entre le nombre de personnes admises aux urgences pour Covid19 un certain jour et ce même nombre, mais pris quelques jours plus tôt. Le délai entre ces deux nombres correspond au décalage entre l’admission d’une personne atteinte du Covid19 et l’admission des personnes qui ont été contaminées par cette personne atteinte.

Malheureusement le Gouvernement ne communique pas le détail de ses calculs. Cependant, CovidTracker a été en mesure de s’approcher de la courbe obtenue par le Gouvernement. Voici la courbe du Reffectif obtenue par CovidTracker.

Pour cela, nous avons calculé le taux entre le nombre de personnes admises aux urgences pour suspicion de Covid19 et ce même nombre calculé 5 jours plus tôt. Ces deux nombres sont issus d’une moyenne sur 12 jours afin de lisser les données. La moyenne est obtenue grâce à une fenêtre gaussienne (d’écart-type 3 jours), cela permet de simuler les conditions réelles. En effet, une personne serait potentiellement contagieuse pendant 12 jours. Mais cette contagiosité est plus forte au milieu de cette fenêtre (autour de J+6).

L’épidémie régresse toujours

Comme nous l’avons vu, il existe différentes méthodes pour calculer le taux de reproduction R. On peut se baser sur des méthodes théoriques, comme le modèle épidémiologique SEIR, ou des méthodes plus empiriques, comme a choisi de le faire le Gouvernement français. Les différentes méthodes donnent des résultats qui peuvent varier de façon non négligeable, il serait donc préférable que le Gouvernement indique clairement les paramètres utilisés. Contacté par nos soins, le Ministère de la santé n’a pas répondu à l’heure actuelle.

Dans tous les cas, on trouve une valeur du taux de reproduction actuellement comprise entre 0.5 et 1, ce qui signifie que l’épidémie régresse toujours. Il va falloir suivre de près son évolution. Il faut avant tout veiller à maintenir R en dessous de 1 pour ne pas voir se former une éventuelle seconde vague épidémique.

Restons prudents

Guillaume Rozier et Philippe Brouard

  1. […] de la difficulté d’estimer cette valeur de R, comme indiqué dans notre article dédié : l’exercice complexe du calcul de R0, l’approche gouvernementale. Le bilan hebdomadaire publié par Santé publique France le 18 juin donne accès à une nouvelle […]

  2. […] Reffectif. Pour rappel sur ce que signifie ce nombre, voir notre article détaillé sur la complexité de l’évaluation de R0. Que ce soit par des traitements médicamenteux, un vaccin, ou les gestes barrières, au final la […]

  3. Batal dit :

    Bonjour,

    Avez-vous enfin eu des précisions du Ministère de la Santé sur les paramètres utilisés pour leurs calculs officiels du R-eff ?

    Merci.

    • Philippe Brouard dit :

      Bonjour, dans les bulletins de Santé publique France il est précisé : « Le nombre de reproduction R (nombre moyen de personnes infectées par un cas) est estimé selon la méthode de Cori, avec une fenêtre temporelle mobile de sept jours ». La référence de cette méthode est : Cori A, Ferguson NM, Fraser C, Cauchemez S. A new framework and software to estimate time-varying reproduction numbers during epidemics. Am J Epidemiol 2013;178:1505-12. Le document scientifique est disponible sur le web : https://academic.oup.com/aje/article/178/9/1505/89262, et le code source et sur github https://github.com/mrc-ide/EpiEstim. Le groupe de scientifiques à l’origine de cette méthode met à disposition un feuille Excel de calcul : http://tools.epidemiology.net/EpiEstim.xls

      C’est malgré tout assez compliqué. S’il fallait résumer simplement, comme il s’agit d’une fenêtre mobile de sept jours, on pourrait dire que R = nombre de nouveaux cas (J) / nombre de nouveaux cas (J – 7).

  4. Ledoux dit :

    En dehors de la période infectieuse, les variables utilisées sont complètement aléatoires et déconnectées des réalités scientifiques, médicales, démographiques…

    Le R0 ignore les spécificités spatiales, démographiques ou médicales propres à chaque territoire ou chaque tranche de population. Que vaut le R0 de Santé Public France pour un territoire rural ?

    Que vaut un R0 qui oublie qu’un virus respiratoire se transmet davantage en milieu confiné ?

    Ne faudrait-il pas définir des R0 contextualisés ?

  5. Hermann dit :

    Pourquoi on utilise les données journalières dans la modélisation ?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *