Éditorial de la 500ème
La deuxième vague est là. Le Premier Ministre, Jean Castex, a été clair lundi au micro de France Info en appelant les Français à ne pas se relâcher et à se mobiliser pour faire face à ce regain d'épidémie. "Nous sommes dans une deuxième vague forte" a-t-il asséné. Qu'en est-il vraiment ?
À en lire les gros titres de la presse, les chiffres sont alarmants et les experts nombreux pour les commenter. Lorsque l'on veut décrypter ces annonces en analysant les chiffres dont nous disposons, il faut consulter les bases nationales qui recoupent plusieurs jeux de données. Et le casse-tête commence.
Les données sont en libre-accès mais il faut s'armer de patience pour percer leurs secrets méthodologiques et comprendre leur signification. C'est le flou le plus complet... D'autant que les données doivent être consolidées quand la base n'est accidentellement plus alimentée au fil de l'eau. Pour le grand public, impossible de faire une courbe simple qui ait du sens.
Car, en réalité, les données statistiques ne sont pas supposées fournir un constat en temps réel. La statistique classique ne peut souffrir l'immédiateté : habituellement, la donnée brute est agrégée au travers de différents cubes de données afin de la rendre lisible. C'est un travail fastidieux qui nécessite une réflexion méthodologique et un discernement humain. Une donnée brute ne veut rien dire en soi; c'est son agrégation à d'autres qui la rend signifiante.
Ce n'est que récemment qu'on inflige à la statistique publique la nécessité de rendre des comptes sur le champ. D'être à la fois exhaustive et immédiate. Et ce n'est pas avec les jeux de données habituels (Sniiram, Atih, etc.); il s'agit bien de la création de systèmes d'information ad hoc.
Le Système d’information pour le suivi des victimes d’attentats et de situations sanitaires exceptionnelles (SI-VIC), mis en place peu après les attentats de 2015, entre en scène à partir du 14 mars, date à laquelle la France entre en stade 3 de l'épidémie. Il permet d'être la référence pour établir les décomptes quotidiens. Les autres indicateurs sont ajoutés pour affiner les bilans quotidiens.
Peu après, à partir du 12 mai, le SI-DEP supplante le SI-VIC pour les données virologiques. Il s'agit d'un autre système d'information, provisoire, alimenté par les laboratoires de biologie en ville et les hôpitaux qui enregistrent uniquement les résultats des tests PCR.
Ces deux indicateurs sont agrégés sur le site d'open data, data.gouv.fr, ou cartographiées sur le site Géodes, avec d'autres données, notamment celles relatives aux décès Covid-19, du Centre d'épidémiologie sur les causes médicales de Décès (CépiDc).
Il s'agit des principales bases permettant de dresser des bilans quotidiens. Mais il en existe bien d'autres : la base OSCOUR pour les passages aux urgences, les informations transmises en routine par SOS Médecins, par le Réseau Sentinelle, les données de l'enquête CoviPrev qui recense les comportements et la santé mentale en population générale, etc. (voir à cet effet la note de Santé publique France). Bref, on ne sait plus où donner de la tête.
Bien entendu, ces données ne sont pas parfaites. Une limite méthodologique de la base SI-DEP a été relevée par Nicolas Berrod pour Le Parisien : le vacancier infecté qui se fait dépister est comptabilisé sur son lieu de résidence principal et non sur le lieu de test... "les personnes en vacances hors de leur département et qui acquièrent l’infection dans leur lieu de vacances sont comptabilisées dans la base SI-DEP selon leur commune de résidence habituelle" précise Santé Publique France. Logique.
Sur la base SI-VIC, les décès survenus à l’hôpital sont décomptés, mais pas ceux survenus à domicile ou en maison de retraite. Ils sont ajoutés a posteriori.
Autre point qui complique la modélisation de l'évolution de l'épidémie dans le temps : la méthodologie qui a évolué depu...