Photo par Clay Banks sur Unsplash

Le coronavirus circulait déjà à Wuhan dès octobre 2019 selon l'université de Harvard

Durée de lecture : 4 mn

Une étude de la haute école de médecine de Harvard (appelé article d'Harvard par la suite) suggère que le coronavirus circulait déjà à Wuhan en octobre 2019. Les auteurs se basent sur deux sources d'informations : les images satellitaires dans la région de Wuhan et les tendances des requêtes dans le moteur de recherche Baidu qui est le Google des Chinois avec plus 66% de parts de marché parmi les autres moteurs de recherche.

La vérité des images satellites

Selon les auteurs, les images satellites montrent un taux d'occupation élevé des places de parking autour des hôpitaux de Wuhan dès octobre 2019, donc bien avant les déclarations des autorités chinoises (7 janvier 2020).

Figure 1: Images satellites montrant une occupation plus importante des parkings de l'hôpital de Tianyou à Wuhan en  octobre 2019 par rapport à l'année précédente et le mois du confinement selon l'article d'Harvard (les images du marché aux produits de la mer en dessous ont été rognées ici pour simplification)

S'il existe une différence évidente dans la figure 1, entre octobre 2019 et février 2020 (dû au confinement), la différence entre octobre 2018 et octobre 2019 semble, en tout cas sur ces deux images, moins évidente.  

La figure 2 : Trafic autour de différents hôpitaux à Wuhan entre 2018-2020 à partir d'images satellites (selon l'article d'Harvard)

La figure 2 permet d'observer le trafic autour de plusieurs hôpitaux de Wuhan avec des pics vers octobre (pour deux hôpitaux semble-t-il), mais avec une forte volatilité, qui rend la figure difficilement interprétable surtout sur une période longue.

La vérité des tendances selon Baidu

Dans le cas des tendances de Baidu, la méthode est celle plébiscitée par Covidgilance. Les auteurs ont étudié deux symptômes présents chez les patients atteints de covid-19 dès octobre 2019, comme il est possible de l'observer dans la figure 3 :

bla
Figure 3 :Tendances 2018-2020 selon Baidu du signal  "toux" et de "diarrhée" (selon l'article d'Harvard)

Les auteurs soulignent que 'cough' (la toux) est un symptôme saisonnier qu'il est difficile de prendre en compte pour justifier leur hypothèse. Cependant, il est visible que même ce symptôme saisonnier est pertinent vers janvier 2020 (ici, on regrettera le manque de précision de l'échelle des abscisses).

Les auteurs soulignent que 'diarrhea' (diarrhée) est un symptôme beaucoup plus pertinent puisque non saisonnier, ce qui est vrai. Il est aussi visible que ce signal est pertinent aussi vers janvier 2020. Cependant, l'interprétation en tant que signal faible dès octobre est possible, mais discutable. En effet, même s'il est non saisonnier pourquoi avoir choisi qu'un seul symptôme peu fréquent (selon OFSP) comme diarrhée ?  De plus d'après nos premières expériences ce signal ne semble pas le plus marqué par rapport à d'autres (en tout cas en France) :

Google Trends pour quelques symptôme du covid-19
Figure 4 : Recomposition des tendances de Google Trends relatives par rapport à leurs maximums, en France sur 5 ans (2015 à 2020) pour les sujets* "Agueusie", "Fièvre", "Toux" et "Diarrhée"**

Un zoom sur la période de la crise de janvier à fin mai permet de constater que le signal induit en France par les requêtes sur le sujet* "Diarrhée" n'est pas le plus pertinent et que le signal du sujet "Agueusie" est le plus marqué pour une même date de pic d'activité. Les deux autres signaux que sont les sujets "Toux" et "Fièvre" apparaissent aussi plus marqués que le signal "Diarrhée" et surtout la croissance forte commence une dizaine de jours avant.  

Recomposition des tendances de Google Trends relatives par rapport à leurs maximums, en France sur 4 mois (janvier à mai 2020) pour les sujets "Agueusie", "Fièvre", "Toux" et "Diarrhée"***

Conclusions

Ces remarques sur l'article de Harvard ne remettent pas en question l'approche et son intérêt, mais relativisent les conclusions et les certitudes qui pourraient en être tirées surtout en ses temps de vives tensions entre grandes puissances.

Notre comparaison est aussi limitée, puisqu'elle se fait sur un autre pays et avec un autre moteur de recherche. En effet, en webométrie, il est quasi impossible de comparer des résultats provenant d'outils différents. 

Il est regrettable ici que les données de l'étude ne soient pas disponibles, ne suivent pas les principes Open Research Data/FAIR et qu'il n'y ait pas d'autres signaux étudiés. Malheureusement, l'interface des tendances de Baidu n'existe qu'en chinois, ce qui en limite son utilisation généralisée. De plus, évidemment, nos essais sur Google Trends pour la Chine avec les mêmes sujets ne sont pas pertinents, car Google est beaucoup moins utilisé par les Chinois. 

* Sujet, dans Google Trends, indique plusieurs mots clés synonymes et leurs traductions pour un même sujet comme "douleur thoracique", "douleurs thoraciques", "douleur thorax" ou "chest pain".

** Paramètres de Google Trends pour la figure 4 : France, 5 dernières années avant le 11 juin 2020,  sur toutes les catégories, sur la recherche Web et sur les sujets, "Agueusie", "Diarrhée", "Fièvre" et "Toux".

*** Paramètres de Google Trends pour la figure 5 : France, du 1er janvier au 31 mai 2020,  sur toutes les catégories, sur la recherche Web et sur les sujets, "Agueusie", "Diarrhée", "Fièvre" et "Toux".