Amélioration du simulateur Covid19 de CovidTracker et réponse à vos questions

La semaine dernière, nous vous avions annoncé avoir créé un simulateur de l’épidémie de Coronavirus en France. Il est conseillé de lire ce premier article et ce second article sur le sujet.

Tout d’abord, merci aux lecteurs ayant laissé des commentaires et des questions sur les deux articles concernant le simulateur épidémiologique covid-19 France, élaboré par CovidTracker. Grâce à vous, nous avons cherché à améliorer le simulateur et cet article présente le résultat.

Dans la suite de l’article, vous trouverez des interrogations que vous vous êtes posées, ou que nous nous sommes posées, ainsi que des réponses ou des précisions sur la manière dont elles ont été gérées.

Scénario patient covid et sortie de réanimation

Yannick Le Gargasson nous a interpellé sur le premier article, au sujet du schéma de modélisation du circuit patient covid :

Bravo pour ce travail statistique et graphique. Il aide vraiment à comprendre.
J’ai toutefois une observation méthodologique, elle concerne les sorties de réanimation. Soit hélas la personne décède, soit elle quitte le service de réanimation. Mais dans ce dernier cas elle sera selon toute vraisemblance encore hospitalisée, soit dans un hôpital (service de Médecine) soit dans un service de rééducation et de soins de suite (SSR). Il faut alors compter, de fait, une nouvelle hospitalisation. Dans le schéma de base j’ai le sentiment qu’une sortie de réanimation équivaut à une sortie du système hospitalier. Nous l’avons vu ce n’est pas le cas. Il faudra alors compter de fait une nouvelle hospitalisation. Est-ce le cas? Merci de votre retour.

Yannick Le Gargasson

La question est très pertinente. Le simulateur est une simplification de la réalité. La simplification se fait aussi au niveau de la gestion indifférenciée des personnes selon leur âge, leur sexe, etc. Le résultat obtenu par le calculateur montre des écarts plus ou moins grands avec certaines courbes de Santé publique France. Ceux-ci sont plus importants sur les courbes vertes et rouges, concernant justement les notions de passage en réanimation et sortie de l’hôpital. En améliorant le scénario du patient covid et en retraduisant ce scénario en algorithme, il doit être possible d’obtenir moins d’écarts et donc un meilleur simulateur. Voici le schéma actualisé du scénario patient covid.

Scénario patient covid avec prise en charge des soins SSR Soins de Suite et de Réadaptation

Le modèle s’est enrichi de nouvelles variables pour intégrer ce circuit. La traduction en algorithme pour le calcul du nombre de personnes hospitalisées change. Ça devient de plus en plus compliqué, mais voici encore un peu de code pour tenter d’expliquer (vous pouvez passer à la suite si vous n’aimez pas l’informatique).

Délais en jours
Quotas variant de 0 à 1

Nombre d'hospitalisations
= Nombre d'hospitalisations de la veille
+ Nombre d'entrées du jour à l'hôpital
- Nombre de sorties du jour de l’hôpital pour les personnes en voie de guérison simple
- Nombre de sorties du jour de l’hôpital pour les personnes quittant les soins SSR
- Nombre de décès du jour

étant calculé que 

Nombre d'entrées du jour à l'hôpital
= Nombre de nouveaux cas positifs au jour précédent la durée avant hospitalisation (dph)
* quota de personnes malades devant aller à l'hôpital (qh)

Nombre de sorties du jour de l’hôpital pour les personnes en voie de guérison simple
= Nombre de personnes entrées à l'hôpital au jour précédent la durée avant sortie en voie de guérison (dhe)
* quota de personnes hospitalisées qui guérissent sans passer ni par la réanimation ni par les soins SSR (1-qr-qs)

Nombre de sorties du jour de l’hôpital de personnes quittant les soins SSR
= Nombre de personnes entrées en soins SSR au jour précédent la durée avant sortie de soins SSR (dse)

Nombre de décès du jour
= Nombre de personnes entrées en réanimation au jour précédent la durée avant décès en réanimation (drd)
* quota de personnes qui décèdent en réanimation (qd)

étant calculé que

Nombre de personnes qui entrent en réanimation à une date donnée
= Nombre de personnes entrées à l'hôpital au jour précédent la durée avant passage en réanimation (dhr)
* quota de personnes hospitalisées qui entrent en réanimation (qr)

Avec ce bloc d’algorithme mis à jour, le simulateur pourra donner des résultats plus fidèles, nous verrons ça en fin d’article.

Valeur de R0

Fabien Mery nous a interpellé sur le deuxième article avec en fin de commentaire une question sur R0 :

Dernière remarque : Quelle est la valeur du R0 ?

Fabien Méry

Après réflexion, nous allons communiquer sur cette valeur. Ça pourrait être un sujet de discussion à part entière. Nous avons appris pas mal de choses à son sujet dernièrement, notamment grâce à l’équipe ETE de l’université de Montpellier. L’équipe publie aussi un simulateur covid, http://covid-ete.ouvaton.org/. Le site est très fourni en informations scientifiques, et il y a un estimateur du nombre de reproduction R(t). Dans la présentation méthodologique de ce logiciel, on s’aperçoit que beaucoup de théorie entoure l’estimation de R0 et R(t). Premièrement les définitions plus précises :

  • R0 est le nombre de reproduction de base. C’est en fait la valeur de R au tout début de l’épidémie. Il est significatif de la force du virus car c’est le moment où il n’y a aucune protection mise en place.
  • R(t) est le nombre de reproduction au cours de l’évolution de l’épidémie. C’est ce nombre qui varie dans le temps, indiquant la dynamique de l’épidémie.

R doit être interprété différemment selon la durée de contagiosité. Ce n’est pas la même chose de contaminer 2 personnes en 3 jours que 2 personnes en 6 jours. Dans le deuxième cas l’effet est moins fort car plus dilué dans le temps. En conséquence ce deuxième cas correspondrait à une épidémie “plus molle”, même si une personne contagieuse en contamine deux autres.

Notre méthode d’évaluation de R est basée sur l’approche de la courbe des tests positifs PCR selon les données de Santé publique France. La modélisation de cette courbe a été présentée dans le premier article. Avec le simulateur CovidTracker il s’agit toujours de faire des essais et retouches successives en changeant les paramètres, jusqu’à obtenir une courbe “qui colle”. Dans notre cas, la dynamique de l’épidémie covid-19 semble correspondre à une durée de contagiosité de 3 jours. Étant donné ce socle de contagiosité de 3 jours, nous pourrons indiquer R car il sera alors comparable avec d’autres résultats obtenu ailleurs. La valeur de R évolue dans le temps, donc nous l’indiquerons sur le graphique du simulateur.

Précision de l’extrapolation

Fabien Méry pose aussi cette question :

Bonjour,
L’extrapolation n’a de sens que si on est capable d’avoir une incertitude sur la valeur calculée (elle doit être croissante plus on extrapole).
De plus, la base d’apprentissage est incertaine, par certains aspects artificielle, voire limitée : en effet le nombre de PCR positifs dépend aussi du nombre de PCR possibles, le nombre de décès a subi des mises à jour brutales au cours du temps (liée à la remontée d’information), les données statistiques ont aussi une periodicité liée aux week end et jour fériés…. Comment l’apprentissage (d’ailleurs quel algorithme est utilisé je n’ai pas trouvé la référence?) tient compte de tout cela?

Fabien Méry

Cette question est très pertinent aussi, merci. La version actuelle du simulateur ne permet pas de calculer la marge d’erreur. Cependant, on peut en avoir une idée par l’intermédiaire de “l’épaisseur du trait”. Nous avons choisi de représenter avec un trait plus épais les données du simulateur. Nous adaptons cette épaisseur selon la cohérence des courbes de même couleur dans le passé (pas trop ancien). Ensuite, la situation ne change pas radicalement d’un jour sur l’autre. Enfin, des changements dans la valeur de R dans l’avenir sont difficilement anticipables. Notre choix est alors de projeter les calculs dans l’avenir en gardant R constant. La fiabilité du simulateur pourra être évaluée de jours en jours en regardant les actualisations.

Pour résumer, le simulateur indique une tendance uniquement.

Quelle est l’utilité d’un modèle par rapport à du bon sens ?

Hugo nous a laissé un commentaire sur le premier article :

Heu, sans être statisticien, le nombre de cas de Covid, comme le nombre de décès, ne peut qu’augmenter car ce sont des cas cumulés depuis le début… alors que les hospitalisations sont des cas en temps réel… Non ?

Hugo

Très judicieux, le cumul du nombre de cas covid ne peut qu’augmenter ou se stabiliser à une valeur plancher, résultat de l’effectif de personnes ayant connu un épisode covid-19. Le nombre d’hospitalisations en temps réel baisse à partir du moment où ça va mieux. Sans être statisticien, Hugo témoigne du simple bon sens, merci.

Ce qui nous préoccupe, c’est surtout comment ça descend. Est-ce que ça descend vite ou pas? C’est le rôle du simulateur. Alors voici le graphique de la situation actualisée au samedi 2 mai. En référence de couleurs très claires, vous apercevez la précédente simulation.

Simulateur CovidTracker actualisé le 02/05/2020

Ce nouveau calcul est la conséquence du travail mené suite à vos questions.

  • La simulation est plus précise grâce à la question n°1. Il reste des écarts entre les courbes de même couleur. Nous chercherons à encore améliorer la simulation.
  • Les valeurs de R sont affichées car nous précisons la base de calcul de R à 3 jours.
  • L’incertitude se remarque aussi par les différences entre deux simulations à deux dates séparées de quelques jours.
  • On constate que le nombre d’hospitalisations aurait tendance à baisser moins vite qu’initialement prévu. C’est peut-être une conséquence du fait d’avoir ajouté le service SSR. Les personnes restent plus longtemps à l’hôpital.

Vérification de la somme des effectifs à l’extrémité droite du graphique. Il y aurait lors d’une situation presque stabilisée :

  • positifs tests PCR : environ 150 000
  • sorties de l’hôpital : environ 78 000
  • guérisons à domicile : environ 44 000
  • décès : environ 19 000
  • hospitalisations : environ 10 000

78 000 + 44 000 + 19 000 + 10 000 = 151 000. Le compte présente un écart de 1000 personnes environ.

Conclusion

Dans cet article nous avons donc répondu à vos principales interrogations concernant le modèle que nous avons développé.

Merci encore pour vos questions. Ce travail collectif nous permet d’améliorer le simulateur avec comme objectif de voir mieux et plus loin dans l’avenir. Nous proposerons régulièrement des actualisations de graphique, donc restez connectés sur CovidTracker.

Dans les prochains jours, nous continuerons de développer le modèle, et de tirer des conclusions quand à l’évolution du virus.

Prenez soin de vous et de vos proches, courage à tous pour maintenir les efforts de confinement dans l’attente du 11 mai.

Philippe Brouard
Ingénieur en informatique à l’université de Lorraine

  1. […] faire suite à la simulation de la tendance épidémiologique au 2 mai, la valeur plancher pour le nombre d’hospitalisations en fin de graphique pouvait poser […]

  2. […] sortant en voie de guérison simple, nous avions présenté dans le premier article sur l’amélioration du simulateur le calcul suivant […]

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *