III. - POURSUIVRE LE DÉVELOPPEMENT DE L'OPEN DATA, EN L'ASSORTISSANT DE GARANTIES PLUS SOLIDES POUR LA PROTECTION DES DONNÉES PERSONNELLES

Des travaux et des auditions qu'ils ont conduits, vos rapporteurs retiennent le constat d'une situation paradoxale.

Le cadre juridique de l' open data est relativement protecteur. Les premières données diffusées à ce stade ne paraissent pas, à de rares exceptions, présenter de danger pour la vie privée de nos concitoyens.

Pourtant, dans le même temps, le risque d'une ré-identification des données publiées existe et se trouve aggravé par la profusion de jeux de données mis en ligne par l'administration comme par les personnes privées elles-mêmes. La façon dont l'État et les collectivités territoriales conduisent l'ouverture de leurs données devrait pouvoir dissiper les inquiétudes. Il n'en est rien : le sentiment prédomine d'un défaut de pilotage ou d'accompagnement qui laisse parfois les administrations démunies face à une tâche nouvelle qu'elles ne maîtrisent pas toujours.

Ces failles ne remettent pas en cause la pertinence de l'ouverture des données publiques, mais la façon dont elle est conduite. Vos rapporteurs sont convaincus que les réponses qui y seront apportées devraient permettre de franchir une nouvelle étape dans le déploiement de l' open data (A), ce qui suppose de concevoir, en la matière, une doctrine de protection des données personnelles (B), ainsi qu'une nouvelle gouvernance (C).

A. ACCÉLÉRER LE DÉPLOIEMENT D'UN OPEN DATA RESPECTUEUX DE LA PROTECTION DES DONNÉES PERSONNELLES

À plusieurs reprises au cours des auditions, des personnes entendues ont exprimé leur crainte que la réflexion engagée par la mission d'information ne soit qu'un prétexte pour freiner le mouvement d'ouverture des données publiques.

Vos rapporteurs y voient au contraire une opportunité de pousser plus loin ce mouvement.

En effet, ils observent, en premier lieu, que si le droit français connaît, comme on l'a vu précédemment, trois concepts qui s'approchent de l' open data , la communication des documents administratifs, la diffusion publique et la réutilisation, il ne prévoit pas, à proprement parler, d'obligation pour les administrations de mettre en ligne une base de données.

Une seule obligation pèse sur l'État et les collectivités territoriales : remettre à celui qui le demande le document qu'il souhaite, s'il appartient à ceux qui peuvent lui être communiqués. Cette obligation s'accompagne d'une autorisation faite à tout un chacun de réutiliser, sous quelques exceptions, les informations publiques correspondant aux documents communicables ou celles qui ont fait l'objet d'une diffusion publique.

Dans ce cadre, les informations personnelles apparaissent comme une limite, qui interdit, sauf consentement de l'intéressé, fondement légal ou anonymisation, la communication ou la réutilisation.

Vos rapporteurs constatent, en second lieu, que plusieurs des personnes qu'ils ont entendues, ont défendu l'intérêt qui s'attacherait à la mise en ligne plus systématique par l'administration des documents ou des jeux de données qui lui sont demandés.

M. Serge Daël, président de la CADA, a ainsi souligné que cette mise en ligne réglait par définition la question de la communication individuelle du document en cause.

Les représentants des associations de réutilisateurs des données publiques, comme ceux des entreprises privées ont partagé cette analyse, saluant l'avancée que constitue la création d' Etalab , mais appelant à poursuivre encore ce mouvement.

M. Jean-Baptiste Soufron, secrétaire général du conseil national du numérique a jugé souhaitable de consacrer une obligation, pour les administrations, de mettre en ligne l'ensemble de leurs jeux de données, proposant qu'elles puissent saisir la CADA pour être autorisées à ne pas le faire pour certains fichiers.

Sans retenir cette dernière option, qui présenterait l'inconvénient de submerger la CADA de demandes de dérogations nombreuses, et priverait les autorités administratives de la responsabilité qui est la leur d'assurer la protection des données personnelles contenues dans leurs fichiers, vos rapporteurs s'accordent sur l'intérêt d'imposer une obligation de mise en ligne sous condition, respectueuse de la vie privée des administrés.

Ils proposent donc de poser le principe que l'administration est tenue de mettre en ligne progressivement toutes les jeux de données qu'elle détient - en les anonymisant si nécessaire -, qui seraient soit déjà publiés sur un autre support, soit susceptibles d'être communiqués à tout citoyen s'il en fait la demande.

Le champ des informations ainsi publiables serait donc identique à celui couvert par la législation CADA. Il exclurait donc les informations personnelles, qui devraient être occultées, ou certaines informations couvertes par le secret, mais inclurait l'ensemble des documents qui font l'objet d'une diffusion publique, ou ceux dont la communication est prévue par la loi.

Le régime de réutilisation de ces données ne serait pas modifié par rapport au droit actuel.

L'avantage d'une telle obligation serait de contraindre les administrations à envisager l'anonymisation, à des fins de publications, des bases de données qu'elles détiennent .

Cependant, afin de tenir compte des contraintes légitimes de gestion que connaissent les administrations ainsi que des risques avérés de ré-identification des informations publiées, trois tempéraments seraient apportés à cette obligation.

Le premier serait le temps laissé à l'administration pour procéder progressivement à cette mise en ligne ( cf. recommandation n° 2).

Le second serait la possibilité qui lui serait reconnue de s'opposer à la mise en ligne en raison de son coût déraisonnable ou des graves difficultés de gestion qu'elle serait susceptible d'occasionner. Il pourrait s'agir d'une impossibilité de garantir la mise à jour en temps réel des informations publiées, ou du coût disproportionné de son anonymisation, compte tenu de la modicité du bénéfice social attendu.

Enfin, dernier tempérament, ce pouvoir d'opposition pourrait aussi être mis en oeuvre si, en dépit des mesures d'anonymisation, un risque de ré-identification trop important persiste.

Recommandation n° 1

Poser le principe que l'administration est tenue de mettre en ligne progressivement, en les anonymisant si nécessaire, toutes les bases de données qu'elle détient et qui seraient susceptibles d'être communiquées à un citoyen s'il en fait la demande ou qui font l'objet d'une diffusion publique sur un autre support

L'administration ne pourrait s'y opposer qu'en raison des coûts déraisonnables de gestion que cette mise en ligne imposerait (notamment les coûts d'anonymisation éventuelle), ou du risque avéré, qu'en dépit des précautions prises, des informations personnelles puissent être ré-identifiées

La mise en oeuvre de cette obligation exigera du temps, puisqu'il faudra, le cas échéant, reconfigurer ou adapter certaines bases de données
- les nouvelles pourront, elles, être conçues, dès l'origine, dans cette perspective d'une diffusion en ligne. Vos rapporteurs jugent par conséquent nécessaire de poser le principe d'une phase transitoire pendant laquelle les administrations se conformeront progressivement à cette nouvelle obligation.

Pour être utile, cette phase transitoire doit être organisée : chaque service doit procéder, de manière plus systématique qu'aujourd'hui, à la recension des bases de données qu'il détient. La mise en ligne des jeux de données susceptibles de l'être doit être programmée, en tenant notamment compte du temps nécessaire à leur anonymisation éventuelle.

Ce chantier conduit par les administrations doit être placé sous la vigilance des citoyens : sauf exception, liées par exemple à des impératifs de sécurité publique, la liste de l'ensemble des bases de données élaborées ou détenues par chaque service doit être publiée sur le site du ministère, de l'établissement public ou de la collectivité en cause. Pour chaque base, mention devrait être portée de la date prévisible à laquelle elle sera mise en ligne, ou, si cette mise en ligne est refusée, de la raison de ce choix. Ainsi les citoyens pourront plus facilement contester devant la CADA ou le juge administratif la décision de l'administration.

Vos rapporteurs relèvent à cet égard, que d'ores et déjà, l'article 17 de la loi « CADA » fait obligation aux administrations de tenir à la disposition des usagers un répertoire des principaux documents dans lesquelles figurent les informations publiques susceptibles de faire l'objet d'une réutilisation.

Force est toutefois de constater, que peu d'administration respectent cette règle et tiennent à jour une telle liste sur leur site internet. Etalab a en principe lancé un vaste mouvement de recension. Il est absolument nécessaire de le faire aboutir.

Recommandations n os 2 et 3

Afin de permettre aux administrations de satisfaire à l'obligation précédente, mettre en place une phase transitoire, pendant laquelle elles :

- opèreraient une recension complète des jeux de données qu'elles détiennent et décideraient de leur mise en ligne ;

- publieraient un calendrier pluriannuel des mises à dispositions programmées

Imposer aux administrations d'indiquer, pour chaque jeu de données, en marge du registre publié sur leur site internet les énumérant, s'il fera ou non l'objet d'une mise en ligne et, dans ce dernier cas, la raison pour laquelle elles s'y opposent

Enfin, cette nouvelle impulsion en faveur d'un open data respectueux de la vie privée doit aussi conduire, selon vos rapporteurs, à s'interroger sur l'opportunité d'étendre prudemment les cas prévus par la loi dans lesquels la diffusion et la réutilisation de bases de données contenant des informations personnelles peuvent être autorisées, compte tenu de l'intérêt général qui s'attache à une telle diffusion.

En effet, dans certains cas, l'exigence de transparence, ou la relative innocuité d'une réutilisation de données qui font déjà l'objet d'une publication, pourraient justifier une exception à l'interdiction de principe de diffusion, avec libre réutilisation, de données personnelles.

Chaque situation appelle un examen particulier, et vos rapporteurs se sont abstenus de trancher. Mais plusieurs cas qui leur ont été soumis au cours des auditions leur semblent mériter l'attention.

Il en va ainsi de l'interdiction de réutilisation qui frappe le fichier recensant, pour chaque médecin, les avantages qu'il a reçu d'un laboratoire pharmaceutique.

Ce fichier a été instauré par un décret du 21 mai 2013 53 ( * ) , conformément à l'article 2 de la loi du 29 décembre 2011 relative au renforcement de la sécurité sanitaire du médicament et des produits de santé. Il devrait permettre à un internaute se connectant sur le site de l'assurance maladie, d'interroger la base de données pour savoir quels avantages tel professionnel de santé a reçu de telle entreprise. En revanche, les données, considérées comme personnelles, ne seraient pas réutilisables.

De la même manière, la CADA s'est opposée à la réutilisation des tarifs déclarés par les médecins, qui sont pourtant disponibles et consultables eux aussi sur le site de l'assurance maladie 54 ( * ) .

Dans un cas comme dans l'autre, de solides arguments étayent le refus de réutilisation : risque d'opposition à la collecte des renseignements de la part des intéressés, mise en jeu de leur vie privée. Il est toutefois nécessaire, sur ces sujets, comme sur d'autres, que les administrations prennent le temps de reconsidérer leur poids par rapport à l'exigence d'une plus grande transparence.

Recommandation n° 4

Le cas échéant, examiner l'opportunité d'étendre les cas, définis par la loi, dans lesquels, compte tenu de l'intérêt général qui s'y attache, des jeux de données incluant des données personnelles peuvent, par exception, être diffusés en ligne et ouverts aux réutilisations


* 53 Décret n° 2013-414 du 21 mai 2013 relatif à la transparence des avantages accordés par les entreprises produisant ou commercialisant des produits à finalité sanitaire et cosmétique destinés à l'homme.

* 54 Avis CADA, n° 20121581 du 19 avril 2012, Directeur de la CNAMTS .

Les thèmes associés à ce dossier

Page mise à jour le

Partager cette page