Allez au contenu, Allez à la navigation

Crises sanitaires et outils numériques : répondre avec efficacité pour retrouver nos libertés

3 juin 2021 : Crises sanitaires et outils numériques : répondre avec efficacité pour retrouver nos libertés ( rapport d'information )

IV. FACE AUX PROCHAINES PANDÉMIES, DES PERSPECTIVES IMMENSES ET DES QUESTIONS VERTIGINEUSES

Si le recours aux outils numériques s'est fait de façon très inégale en fonction des pays, toutes les stratégies ont un point commun : par choix politiques ou par impossibilité matérielle, elles n'exploitent en réalité qu'une très faible part des possibilités théoriques des technologies actuelles, sans même parler des possibilités des technologies à venir. À cet égard, la pandémie de Covid-19 présente une double particularité : c'est à la fois la première fois que le numérique est autant mobilisé, et sans doute la dernière fois où il le sera aussi peu.

On peut en prendre la mesure à travers l'exemple des géants du numérique, et notamment des GAFA, qui joué un rôle important dans cette crise, mais largement en deçà de leurs capacités technologiques réelles (A).

À plus long terme, les technologies numériques ouvrent des perspectives immenses pour mieux gérer les pandémies (B), mais celles-ci soulèvent en même temps des risques considérables pour les libertés individuelles (C), dont il faut dès à présent se préoccuper.

A. LES GAFA FACE AU COVID-19

Par la quantité et la diversité des données qu'ils collectent sur chacun d'entre nous, par leur maîtrise des technologies les plus avancées, et plus généralement par leur importance désormais systémique dans la vie économique et sociale, les géants du numérique se sont trouvés en position de jouer un rôle majeur dans la gestion de l'épidémie, parfois à l'égal des États, si ce n'est en position de force par rapport à eux.

Leur rôle dans le développement des technologies de contact tracing sera spécifiquement abordé dans la deuxième partie du présent rapport, à l'occasion des développements sur l'application française TousAntiCovid.

Ce sont aussi leurs services qui ont, d'abord, permis d'assurer la continuité de la vie économique et sociale, qu'il s'agisse de communiquer, de travailler, d'enseigner ou encore de faire ses courses à distance. Leur chiffre d'affaire a d'ailleurs augmenté de 19,5 % en 2020, et leur bénéfice opérationnel de 24,7 %, tandis que le reste de l'économie mondiale connaissait une crise sans précédent31(*).

Plus généralement, leur rôle s'est étendu, dans des proportions variables, dans tous les aspects de la réponse à la crise - de la recherche scientifique pure au soutien direct aux campagnes de tests et de vaccination, en passant par l'information et la lutte contre la désinformation sur les réseaux sociaux. À titre d'exemple, les développements qui suivent retiennent quelques initiatives de Google et Facebook.

Mais ces remarques s'étendent au-delà du seul cas des GAFA (Google, Apple, Facebook, Amazon), même si leur importance systémique leur confère de fait un rôle particulier. Il en va de même, et peut-être plus encore, pour les BATX (Baidu, Alibaba, Tencent, Xiami et autres) en Chine (cf. supra). On pourrait encore mentionner, par exemple, le contrat passé entre le National Health Service (NHS) britannique et la société Palantir pour exploiter grâce à l'intelligence artificielle les données relatives à la crise du Covid-19, avec toutes les questions que cela soulève en matière de souveraineté et de protection données personnelles.

1. L'exemple de Google

Les termes tapés dans le moteur de recherche de Google, associés à leur localisation géographique via l'adresse IP, constituent un indicateur assez précis de l'évolution de l'épidémie, et sont susceptibles de pallier les insuffisances des systèmes publics de surveillance épidémiologique, du reste bien plus problématiques aux États-Unis qu'en France.

Sous certaines conditions, ces résultats peuvent même avoir une valeur prédictive et servir à la modélisation épidémiologique. Lancé dès 2008 et accessible à tous, l'outil Google Flu Trends, visait ainsi à anticiper les pics grippaux grâce aux recherches des internautes sur les symptômes (fièvre, toux, etc.). Sa précision insuffisante, notamment lors de l'épidémie de H1N1 l'année suivante, avait finalement conduit Google à limiter son utilisation aux seuls chercheurs, tout en poursuivant son amélioration.

Il suffit, plus généralement, d'utiliser l'outil Google Trends pour obtenir des résultats intéressants sur la pandémie de Covid-19. En France, on trouve par exemple une corrélation forte entre les recherches portant sur la perte de goût et le nombre de personnes en réanimation, avec un décalage constant de 20 jours, faisant de recherches Google un indicateur avancé de la charge des hôpitaux.

Corrélation entre recherches Google sur la perte de goût
et nombre de personnes en réanimation en France

Source : projet « Algorithmes contre le Coronavirus », http://meteosensible.free.fr/coronavirus.html

Google publie également les données relatives à la fréquentation de certains lieux (commerces, parcs et jardins, transports en commun, etc.), à partir des données agrégées issues de produits tels que Google Maps ou de la géolocalisation des smartphones sous Android. Pour la France, ces données sont disponibles au niveau départemental sur les dix derniers jours. Ils font sans surprise apparaître une baisse de la fréquentation des commerces hors alimentation, mais aussi un passage au télétravail insuffisant au regard des recommandations gouvernementales.

Impact du Covid-19 sur les tendances de mobilité
à Paris du 12 au 23 mars 2021

Source : Google Trends, https://www.google.com/covid19/mobility/

2. L'exemple de Facebook

À l'instar de Google, Facebook a joué un rôle dans une multitude de domaines au cours de la crise sanitaire, dont on ne citera ici que quelques exemples.

Certains sont aujourd'hui des « attendus » d'un réseau social : à travers son Centre d'information sur le coronavirus32(*), Facebook met à la disposition de ses utilisateurs une série d'informations, statistiques, liens officiels et autres contacts utiles sur la pandémie. De façon plus proactive, le réseau social a créé dans certains pays des « badges » et « filtres » affichés sur le profil des utilisateurs qui se sont fait vacciner, afin d'encourager leurs « amis » à le faire, grâce à une visibilité accrue dans leur « fil d'actualité ». Diverses campagnes de lutte contre la désinformation, dont le réseau social est désormais familier, ont également été menées au sujet de l'épidémie, et plus particulièrement de la vaccination.

Une fonctionnalité, en particulier, est particulièrement intéressante pour le sujet du présent rapport : le Safety Check, qui permet depuis 2014 aux utilisateurs de se signaler comme « en sécurité » lorsqu'ils se trouvent sur le lieu d'une catastrophe naturelle ou d'origine humaine, d'un attentat terroriste ou d'une menace sanitaire.

S'agissant ensuite de la connaissance du virus et de son mode de propagation, Facebook dispose d'un atout de taille : ses deux milliards d'utilisateurs. Dans le cadre du programme Data For Good, lancé en 2017, le réseau social met ces données à disposition des universités et ONG. Dans le cadre de la crise sanitaire actuelle, les utilisateurs de Facebook peuvent ainsi être invités, via leur fil d'actualité, à participer à un sondage optionnel, conçu par les chercheurs du Delphi Research Center de la Carnegie Mellon University, dans lequel ils décrivent notamment leurs symptômes et leurs facteurs de risque. Les résultats s'avèrent globalement corrélés avec des données de dépistage officielles - et peuvent dans certains cas avoir une valeur prédictive. La carte ci-dessous, élaborée à partir des seules données de Facebook, montre les symptômes du Covid-19 en France, à l'échelle régionale.

Symptômes du Covid-19 en France
(par région, pour la semaine du 20 mai 2021)

Source : Facebook, projet Data For Good : https://dataforgood.facebook.com/covid-survey

Naturellement, les données de Facebook dépassent largement les seules données médicales fournies volontairement à l'occasion d'un sondage. Par exemple, la carte ci-dessous fait apparaître les « liens d'amitié » qui connectent les habitants d'East Village, à New York, avec les autres régions des États-Unis, à l'échelle du ZIP code (code postal). Un tel outil peut être utilisé par les épidémiologistes pour prédire les risques d'apparition ou d'aggravation de l'épidémie en fonction des lieux.

Degré de « connexion sociale » (social connectedness)
via Facebook avec East Village (New York) en mars 2020

Source : Facebook, projet Data For Good : https://about.fb.com/news/2020/04/data-for-good/

Source : Facebook, projet Data For Good

Les contacts entre des personnes situées dans différents lieux peuvent également contribuer à affiner les modèles.

La carte ci-contre (co-location map) est un exemple de visualisation de ces liens à l'échelle d'un pays entier, en l'occurrence l'Italie. En pratique, les études s'appuient naturellement sur des données plus fines que celles qui permettent de réaliser une carte à l'échelle nationale.

Des données de mobilité sont également disponibles via Facebook. Les graphiques ci-dessous font ainsi apparaître, pour chaque État brésilien, l'évolution des déplacements de la population, mesurée par le nombre d'endroits différents visités chaque jour33(*). Ces données peuvent constituer un bon indicateur du respect des mesures de confinement ou de couvre-feu (les habitants restent-ils chez eux ou se rendent-ils au contraire dans de nombreux endroits différents chaque jour ?).

Tendances de mobilité (movement range trends)
au Brésil, à l'échelle régionale

Source : Facebook, projet Data For Good : https://about.fb.com/news/2020/04/data-for-good/

3. Un rôle très en deçà des possibilités réelles et à venir

Il faut bien comprendre que les données publiées à ce jour, même si elles dépassent déjà très largement la capacité de production de n'importe quelle autorité étatique, sont très en deçà des données dont disposent réellement les GAFA, en termes de volume comme de niveau de précision.

Reprenons l'exemple de la carte des « liens d'amitié » sur Facebook entre les habitants d'East Village et le reste des États-Unis. D'une part, même dans le strict cadre de la modélisation épidémiologique, de telles données sont aujourd'hui sous-exploitées : aucun modèle actuel n'est suffisamment abouti pour en faire une exploitation systématique et en temps réel et pour les croiser avec d'autres données pertinentes (par exemple les données de mobilité), afin qu'elles puissent éclairer et appuyer la décision publique (confinements locaux, etc.). Pourtant, la possibilité existe, les algorithmes se perfectionnent, et les capacités de calcul augmentent : à terme, cette perspective n'a rien d'irréaliste techniquement.

D'autre part, et surtout, les données sont ici mises à disposition des chercheurs uniquement sous forme agrégée, ce qui est suffisant pour la modélisation, mais Facebook dispose en réalité de l'ensemble de ces données - et bien davantage encore - à une échelle individuelle, en temps réel, dans le monde entier et avec une précision de l'ordre du mètre34(*) plutôt que du code postal. Il en va de même pour les données de fréquentation des lieux et des transports collectées par Google, etc.

En recoupant ces données avec d'autres, que détiennent les mêmes entreprises, il serait donc possible de déterminer si un individu se rend au travail ou plutôt chez des amis ou de la famille, s'il exerce une profession « essentielle » lui permettant de sortir de chez lui ou non, s'il a récemment eu des conversations privées au sujet de l'organisation d'une soirée rassemblant plus de dix personnes, ou s'il a effectué des achats en vue d'une telle soirée.


* 31 Le cas d'Amazon est éloquent : en un an, ses revenus ont augmenté de 37 % (96 milliards de dollars) et ses bénéfices ont triplé (6 milliards de dollars), portés par le e-commerce, le streaming (Amazon Prime Video) et le cloud (AWS). L'entreprise a même embauché 375 000 personnes supplémentaires, pour un effectif total de 1,1 million de personnes.

* 32  https://www.facebook.com/coronavirus_info et plus généralement https://about.fb.com/?s=covid

* 33 Concrètement, la carte est divisée en parcelles carrées de dimension égale (tiles). Le nombre d'endroits visités correspond au nombre de tiles dans lesquelles l'utilisateur se rend.

* 34 Dans le détail, tout dépend du mode de connexion (fixe, GPS, Wifi, Bluetooth) et de l'autorisation donnée par l'utilisateur (géolocalisation activée ou non), étant précisé que cette dernière est souvent favorisée, puisqu'indispensable au modèle économique du réseau social.