L’analyse d’une pandémie aussi complexe que le COVID 19 exige l’apport de plusieurs disciplines scientifiques et sociales :
- La connaissance de la thématique elle-même (sciences épidémiologiques, médecine, biologie, virologie, etc.);
- La technologie biomédicale pour les analyses, les prises de mesures, la radiologie et le scanner, etc…;
- L’examen approfondi des origines probables de propagation (interactions humaines, distances, aérosol, etc..;
- Les technologies de l’information et des télécommunications (capteurs, GPS, Drones, etc.) pour la collecte et l’acquisition de données spatialisées des divers paramètres en jeu ;
- L’organisation et l’analyse approfondie des données, les sciences de données (données massives et intelligence artificielle);
- La modélisation scientifique et numérique ainsi que la simulation pour les possibilités de prédiction et d’analyse de stratégies d’aide à la décision;
- L’analyse, l’optimisation et le contrôle de stratégies de mise en œuvre, déploiement d’infrastructures, gouvernance et politique gouvernementale aggravés par des facteurs que l’on ne discutera pas ici.
Dans le cadre de cette intervention, compte tenu de nos spécialités disciplinaires, on aimerait contribuer en discutant l’intérêt des modèles pour l’aide à la compréhension, la propagation, et l’aide à la décision en termes de stratégies d’optimisation et de contrôle du COVID 19, et leur danger potentiel s’ils sont mal utilisés ou mal interprétés malgré que les modèles soient au cœur de la science.
Il n’y a pas de science sans modèles. Un modèle conceptuel est prérequis avant de passer au formalisme. En période de crise, les informations sont très limitées, souvent erronées, mais des décisions doivent être prises et mises en œuvre en fonction des données disponibles à l’époque. Les modèles sont alors utilisés pour explorer des scénarios et les conséquences imminentes (science quick and dirty) des décisions spécifiques.
Les modèles ne sont certes pas parfaits et peuvent générer des prédictions inexactes ou très incertaines lorsque la science derrière est incertaine. Certains modèles peuvent être vraiment mauvais, produisant des prédictions inutiles et manquant de rationnel. George E. P. Box, un grand statisticien, a énoncé que « tous les modèles sont faux, mais certains sont utiles ».
Pour calculer les conséquences d’hypothèses ou scénarios, il faut un modèle. Souvent, un bon modèle conceptuel basé sur la phénoménologie suffira. La science s’articule autour de la construction de modèles conceptuels toujours meilleurs. L’interaction entre le modèle et les données est extrêmement importante et exige des va-et-vient continus avec l’expérimentation au laboratoire (hypothèse, expérience, acquisition de données, vérification, hypothèse révisée et rebelote).
La fonction la plus importante des modèles épidémiologiques est la simulation, un moyen de voir à l’avance le comportement dans un avenir proche et son interaction avec les scénarios et les choix que nous faisons à très court terme.
Les causes liées à l’augmentation de la vulnérabilité, telles la densité de la population, la surpopulation et la pauvreté,en font un terrain propice à la propagation de maladies infectieuses. La fréquence et les moyens de transports en commun augmentent aussi les fortes chances de s’y propager.
Les fortes inégalités socio-économiques, des situations de surpopulation dans certains quartiers populaires, où beaucoup de gens souffrent déjà de problèmes de santé, sans accès aux soins, peuvent aggraver la vitesse de prolifération de l’épidémie. Les experts en informatique, statisticiens et analystes de données ont tendance à essayer d’identifier les tendances d’un phénomène à partir des données du passé, en exploitant le flux numérique pour prédire le futur. Toutefois, les précisions sont toujours questionnables avec des modèles essentiellement orientés données et ignorant la phénoménologie.
Ces experts tentent d’utiliser leurs compétences en modélisation et en science des données pour donner un sens au monde qui nous entoure. Cette tendance a conduit à des progrès impressionnants et indéniables dans le domaine de l’apprentissage automatique, de l’intelligence artificielle et de la science des données durant cette dernière décennie.
Malheureusement, bien que les premiers stades de la propagation de l’épidémie soient exponentiels, de nombreux facteurs montrent que l’efficacité de l’ajustement simple des courbes en cloche ou polynomiales, doit être amélioré sur la base des connaissances thématiques et la modélisation épidémique traditionnelle. Cette approche à la statisticienne, est illustrée en empruntant l’analyse fréquentielle largement utilisée en sciences de l’hydrologie et la fiabilité des systèmes mécaniques.
L’analyse fréquentielle en hydrologie est une méthode statistique de prédiction consistant à étudier les événements passés, caractéristiques d’un processus donné (ici COVID 19), afin d’en définir les probabilités d’apparition future. Pour ce faire, un modèle fréquentiel (équation décrivant le comportement statistique du processus) doit être mis en oeuvre. Ce genre de modèle décrit la probabilité d’apparition d’un événement d’une intensité donnée.
La qualité et la représentativité des séries de données spatio-temporelles sont évidemment d’importance capitale et nécessitent un contrôle rigoureux. Divers types de modèles existent parmi lesquels on peut citer la Loi normale (ou de Gauss), Log normale, Gumbel, Frechet, Weibull, etc), et sans rentrer dans les détails, des ajustements du modèle aux observations peuvent être effectués et diverses méthodes existent pour le calcul approprié. Des tests d’adéquation sont aussi nécessaires.
Pour illustrer ce genre de méthodologie pour les données marocaines qu’on suppose fiables avant et après la déclaration de confinement le 20 Mars 2020 sur le COVID 19 (ministère de la Santé), Les distributions de Gauss et Weibull ont été appliquées et résumées dans les figures ci-après (Figures 1 à 8) :
A la lumière de ce genre de modélisation statistique des données qu’on catégorise et qualifie de modèles de type empirique, nos conclusions sont les suivantes :
• On remarque qu’avant le confinement, la loi normale de Gauss ne représente pas correctement l’évolution, et seule la loi de Weibull semble plus réaliste.
• Le pic atteindrait 2750 environ.
• On voit que l’apparition du pic, point d’inflexion de la courbe d’évolution de la pandémie, dépend du type de modèle fréquentiel choisi et se situerait entre le 23 et 28 Avril 2020 si toutes les hypothèses de continuité de confinement sont assurées, et si les données utilisées sont fiables (on n’a aucune idée sur les tests déployés ; ce qui risque de
fausser les résultats).
• Le retour à la normale est prédit dans les 3 mois environ après le 2 Mars, soit le 2 Juin 2020.
• Le taux de reproduction de base R0 en fonction du nombre de jour montre une grande dispersion des valeurs et varie entre -0,55 et 4 ; A un niveau de confiance de 95%, le R0 est estimé à 1,5 comme détaillé dans les statistiques suivantes :
Dans la deuxième partie de notre contribution, on développera l’usage de modèles de type phénoménologique. La modélisation mathématique en épidémiologie remonte aux années 19 (théorie de W. O.Kermack, A. G. McKendrick). L’idée de base repose simplement sur la division de la population en différents compartiments représentant les différents stades de l’épidémie et utilise la taille relative de chaque compartiment pour modéliser l’évolution dans le temps.
Du plus classique à 2 compartiments Susceptible-Infected model (SI) à celui à 3 compartiments Susceptible-InfectiousRecovered model (SIR) ; ainsi que d’autres variantes.
Les stratégies usuelles d’aplatissement ou d’étalement des épidémies consistent en un confinement strict ou partiel et/ou de quarantaine des populations pour tenter d’en contenir sa propagation ; mesures considérées comme impopulaires par le public en raison de leurs conséquences sociales, économiques et psychologiques. II est d’importance capitale de comprendre l’effet qu’elles ont sur l’arrêt de la propagation de l’épidémie.
Dans ce sens, nous avons élaboré le modèle SIRC
(intégrant l’effet du confinement au modèle SIR conventionnel. Il est à signaler que ces modèles dépendent étroitement de l’estimation de certains paramètres culturels, sociologiques et économiques, notamment le PIB octroyé à la santé, la mobilité nationale et internationale, la densité et la dispersion géographique de la population, le taux de pauvreté, etc.
Les résultats des simulations numériques sont très intéressants même pour des degrés de pourcentage de confinement relativement petits. Nous avons choisi de travailler sur le cas italien, compte tenu de la disponibilité relative des données sur une période suffisamment plus large (54 jours d’analyse soit du 15 Février au 8 Avril). L’exécution du modèle SIRC pour le cas de l’Italie (Figures 11-14), montre l’évolution de la pandémie pour divers degrés de confinement.
On peut d’ores et déjà conclure :
• Le pic décroit exponentiellement en fonction du degré de confinement, et prouve scientifiquement son intérêt surtout pour des capacités hospitalières insuffisantes
• L’étalement et l’aplatissement des courbes est fonction du degré de confinement et permet de diminuer la vitesse de propagation de l’épidémie et donc de différer la disponibilité des moyens hospitaliers.
En outre, avec le modèle SIR, les données statistiques du Maroc ne permettent pas de bien paramétrer ce modèle pour estimer le pic de la pandémie et son temps d’apparition. A plus long terme, ce modèle permet d’obtenir un pallier de pandémie mais à des valeurs irréalistes. Nous sommes en cours d’attente de données nouvelles afin de bien estimer les paramètres du modèle, et le calibrer pour effectuer des simulations réalistes (Figure 15).
• Un confinement strict permet de diminuer drastiquement la durée du confinement.
Cas de l’Italie
Conclusion générale
Les sciences de données à elles seules ne peuvent pas expliquer l’évolution de la pandémie du COVID 19 ; les modèles empiriques de régression ne sont pas du tout suffisants. Il est absolument nécessaire de maîtriser la phénoménologie pour approximer correctement les paramètres de modèles communément utilisés en épidémiologie. Pour les pays à capacité limitée en infrastructures sanitaires, on a pu démontrer que le confinement strict est la meilleure alternative et la plus sécuritaire pour les populations. La constitution de groupes interdisciplinaires de recherche regroupant médecins, ingénieurs, mathématiciens, modélistes, etc, est absolument nécessaire pour comprendre la nature complexe du COVID 19 et orienter les recherches vers les possibilités de solution. Les conditions de contexte et environnement régional sont aussi à prendre en compte pour des possibilités d’études de stratégies de dé-confinement progressif.
1 comment
merci pour votre texte