Jeudi 16 janvier 2014

- Présidence de M. Jean-Jacques Hyest, président. -

Audition de MM. Benoît Thieulin, président du Conseil national du numérique, Godefroy Beauvallet, vice-président, Jean-Baptiste Soufron, secrétaire général, Mme Mathilde Bras, rapporteur adjoint, et M. Dimitri Barclais, rapporteur adjoint stagiaire

M. Jean-Jacques Hyest, président. - Nous auditionnons les représentants du Conseil national du numérique, MM. Benoît Thieulin, président, Godefroy Beauvallet, vice-président, Jean-Baptiste Soufron, secrétaire général, Mme Mathilde Bras, rapporteure adjointe, et M. Dimitri Barclais, rapporteur adjoint stagiaire, pratiquement un an jour pour jour après qu'un décret du 17 janvier 2013 a réorganisé le Conseil national du numérique. Après avoir rappelé le rôle du Conseil, en particulier dans le domaine des services publics et de la vie citoyenne, nous souhaiterions que vous nous exposiez ses principaux constats et recommandations en matière de diffusion et de réutilisation des données publiques.

M. Benoît Thieulin, président du Conseil national du numérique. - Le Conseil national du numérique est une institution encore jeune, créée par le précédent Président de la République. Réinstallé début 2013 sans que son objet soit vraiment modifié, il a vocation à constituer une interface entre les décideurs publics et le monde du numérique, fonction importante dans la phase de transition du numérique que nous traversons, caractérisée par une dynamique d'innovation particulièrement forte qui soulève sans cesse de nouvelles problématiques. Alors qu'il y a peu d'interlocuteurs stables en la matière, le Conseil accompagne les décideurs publics sur ces questions. Sa composition est paritaire, originalité qui mérite d'être soulignée. La diversité d'origine de ses trente membres, issus des opérateurs numériques, de PME, d'universités, de think tanks et d'associations, qui siègent tous intuitu personae, reflète la diversité du monde du numérique et enrichit ses avis. En 2013, le Conseil a réfléchi sur la neutralité de l'internet, la fiscalité numérique, l'inclusion numérique, la neutralité des plateformes ; il s'intéressera prochainement aux données de santé. Dans plusieurs de ses avis, il a eu l'occasion de se pencher sur les problématiques d'ouverture des données, privées ou publiques. Le sujet de la fiscalité du numérique, sur lequel a travaillé Godefroy Beauvallet, s'est avéré tout particulièrement intéressant, notamment en raison de l'existence de grandes plateformes qui font de l'optimisation fiscale. Nous préconisons davantage de transparence sur la réalité de ce qu'elles paient et surtout davantage de transparence sur leur utilisation, ce qui rejoint une problématique de gouvernance ouverte que l'on retrouve à propos des données publiques dans la relation des citoyens avec les institutions publiques : nous sommes aujourd'hui dans une forme de dialectique entre cette gouvernance ouverte, qui engendre de nouveaux types de relations, et des mouvements d'amélioration de la qualité des services, parce qu'elle donne de la visibilité à la société civile sur les conditions d'engagement - et de réduction - des dépenses publiques.

Un mouvement inverse commence à émerger avec les données en masse, les big data, qui renvoie à des problématiques d'externalité et de création de nouveaux types de services et donc d'entreprises, avec en toile de fond des enjeux sensibles. La multiplication des données ouvertes, le traitement en masse et la finesse accrue des analyses, dans le contexte de l'affaire Snowden qui contribue à éveiller les consciences des citoyens, ont en effet des conséquences pour les individus. Dans un monde qui s'est fortement numérisé, il convient de trouver un nouvel équilibre, tout à la fois en poussant à la gouvernance ouverte et en assurant la protection des données personnelles et de la vie privée.

M. Godefroy Beauvallet, vice-président du Conseil national du numérique. - L'approche économique de la donnée publique doit être prise en compte, autrement dit la question de savoir qui doit payer. Il n'apparaît pas qu'il faille systématiquement rechercher le paiement par l'utilisateur, à l'utilisation. En effet, une valorisation à l'acte, par un paiement à l'utilisation, de cette externalité positive de la production des données publiques, est très malthusienne. Ainsi que le préconise le rapport Trojette, il faut passer d'une logique ex ante à une logique de liberté qui permette d'expérimenter des cadres de réemploi, approche qui percute de fonds la démarche traditionnelle des producteurs de données publiques. La puissance publique doit se donner un objectif d'activation de ces données plus qu'un objectif de valorisation de celles-ci. La démarche d'Etalab, l'opérateur essentiel dont les missions stratégiques ont été reformulées, semble d'ailleurs aller dans ce sens.

La puissance publique pourrait se donner un devoir d'innovation pour inventer de nouvelles modalités d'utilisation de ses données par les citoyens, dans le prolongement du principe de mutabilité, et explorer de nouvelles manières d'utiliser les données qu'elle produit au service des citoyens. Sinon d'autres le feront à sa place, et ce ne sera pas nécessaire au service du modèle social auquel nous sommes attachés. Dire que ces données qui servent à la décision publique sont valorisées par leur utilisation par d'autres administrations est pour le moins contestable d'un point de vue comptable.

Autour de la notion d'information publique, les textes évoquent tantôt des données publiques, tantôt des documents administratifs qu'ils regardent différemment : il y a là matière à des clarifications juridiques. Les modalités de mise à disposition des données sont également importantes : celles-ci pourraient notamment être rendues accessibles sous une forme algorithmique lorsque, comme en matière de calcul des cotisations sociales sur les fiches de paie, elles sont mises en oeuvre sous cette forme.

M. Benoît Thieulin. - Le rapport Trojette a été effectivement très apprécié par le Conseil national du numérique. Quant à la démarche d'Etalab, elle a considérablement progressé dans une approche très collaborative avec son nouveau site data.gouv.fr. La France pourrait ainsi reprendre la tête de ce mouvement d'ouverture des données.

Pionnière parmi les grands pays en 1978 dans le champ des libertés et de l'informatique avec la création de la Cnil, la France a été plus timide, la même année, en matière d'accès aux documents administratifs. Inspiré du Freedom of information Act américain de 1966, le rôle de la commission d'accès aux documents administratifs (Cada), en dépit de plusieurs révisions législatives, reste en deçà de celui de ses homologues américaines, britanniques ou européennes. La France doit changer de paradigme en la matière, à l'image du récent revirement sur la portée du silence de l'administration qui vaut désormais acceptation.

M. Jean-Jacques Hyest, président. - La portée effective de cette réforme devra être mesurée. La démarche avait déjà été tentée mais les administrations ont repris le contrôle !

M. Benoît Thieulin. - La même démarche d'inversion du principe devrait être engagée par le Parlement en matière d'accès aux données publiques : l'accès doit devenir la règle et le non accès l'exception. La France retrouvera ainsi sa position de tête dans cette nouvelle ère des gouvernances ouvertes, comme en 1978. Le Conseil supérieur du numérique s'est récemment autosaisi de l'article 13 du projet de loi de programmation militaire et a proposé une approche mesurée en appelant à une réflexion globale sur la transformation numérique en vue de réviser ces problématiques qui n'ont plus été examinées depuis la loi pour la confiance dans l'économie numérique de 2004 ; il vient de décider d'organiser une grande concertation sur la question de la transformation numérique qui met en jeu des libertés et soulève certaines questions juridiques.

La démarche doit s'inscrire à plusieurs niveaux : une nouvelle loi nationale, le projet de règlement européen sur les données personnelles que la France doit prendre l'initiative de relancer auprès de la nouvelle Commission européenne, un traité international enfin, dans la mesure où la gouvernance ouverte a un impact sur la manière dont travaillent les entreprises qui se trouvent dorénavant confrontées à des données sensibles. Si la NSA peut être victime de fuites, qu'en est-il alors pour les entreprises et les administrations ? Des initiatives ont été prises en ce sens par le Brésil et l'Allemagne, auxquelles la France pourrait apporter sa contribution.

M. Godefroy Beauvallet - L'inversion du paradigme ne constituerait pas seulement un progrès historique de l'ouverture des sociétés ; elle répondrait également à une nécessité pour la crédibilité des politiques publiques. La récente polémique sur les chiffres du chômage fournis par l'ANPE, suite aux difficultés d'un opérateur, a eu des conséquences sur la crédibilité des acteurs pris dans la controverse ; or la confiance dans la parole des autorités publiques est l'une des bases de la démocratie. Le récent débat entre le ministre de la santé et l'ambassadeur de Grande-Bretagne en France sur l'efficacité comparée des dispositifs d'assurance santé montre que le pays qui peut aligner le plus de données ouvertes, et donc vérifiables par les fast checkers, est le plus crédible. Il en va de la crédibilité extérieure de la France vis-à-vis de ses partenaires et de sa crédibilité interne vis-à-vis de ses citoyens.

M. Benoît Thieulin. - La dégradation du débat public et le scepticisme de nos concitoyens sont chaque jour repris par les commentateurs qui font valoir que les chiffres ne disent que ce qu'on leur fait dire. Il faut impérativement pouvoir disposer de données fiables et accessibles, susceptibles d'être vérifiées par des organismes indépendants, - think tank, associations, ONG -, afin de reconstruire davantage de lien, de recréer la confiance entre les représentés et les représentants, et de renforcer les bases du débat public.

M. Godefroy Beauvallet. - Ce qui est remis en cause par le numérique, c'est la fiabilité. Les institutions ne sont plus regardées comme naturellement fiables. Les grandes plateformes numériques sur lesquelles les citoyens s'expriment ainsi que les personnes qui ont des enjeux de réputation donnent une opinion agrégée, mais celle-ci n'est probablement pas suffisante. Il est indispensable de recréer de la vérifiabilité et de mettre à la disposition du public, des médias, des chercheurs et des associations, des liens hypertextes, des algorithmes, des logiciels libres et les outils de calcul des administrations. Dans le monde de la recherche par exemple, Thomas Piketty, qui veut faire bouger le débat sur la fiscalité, a dû créer un site qui permet de simuler l'impôt et qui est probablement le duplicata de celui qui existe au ministère des finances : un seul modèle ouvert et vérifiable par tous serait de loin préférable. Nous appelons à un changement de paradigme dans la conception que l'Etat a de ses données. Il y aurait tout à y gagner et le modèle serait probablement meilleur. De manière générale, les chercheurs sont très gênés par l'absence d'accès aux données publiques et, s'il y a plus de travaux de recherche économique sur les Etats-Unis, c'est parce que les données sont disponibles.

M. Benoît Thieulin. - La simple ouverture des données ne suffit pas : il faut également simplifier l'accès et la réutilisation, assurer la qualité des données et la stabilité de leur structuration. Sur ce dernier point, je signale qu'un chercheur qui a mis en place un observatoire à partir des données de l'Insee m'a indiqué constater que depuis qu'il avait connaissance de ses travaux, l'Insee modifiait ses jeux de données tous les mois, ce qui n'en facilite pas le suivi.

Il faut se préoccuper de la bonne structuration des données et des API pour que le droit d'accès aux données soit effectif. Les pouvoirs publics doivent accompagner le passage vers une économie de plateforme. Les Etats-Unis ont décliné ce concept notamment pour les données publiques -Government as a Plateform. L'Etat ne rend plus seulement des services mais devient un facilitateur, met à disposition des données et des services que d'autres utilisateurs publics ou privés se réapproprient ensuite pour réinventer un certain nombre de services. Il convient d'ouvrir la voie à une approche plus collaborative afin de permettre l'émergence de nouveaux services innovants, qui ne relèvent pas nécessairement du domaine marchand, en développant une coopération entre le secteur public et la société civile. Cette prise de conscience est à l'origine de l'évolution des ambitions et des objectifs de l'IGN qui a fait le choix stratégique majeur d'un rapprochement avec le mouvement d'Open street map. On ne peut que souhaiter la généralisation de telles démarches.

M. Jean-Jacques Hyest, président. - De nombreuses informations et données sont mal comprises, notamment en matière de justice et de sécurité, et suscitent de ce fait des polémiques permanentes. A la base, les données ne sont pas homogènes et l'on connaît la qualité des outils statistiques et informatiques de la Chancellerie !

M. Godefroy Beauvallet. - La mise en cartes des données de criminalité a été effectuée notamment aux Etats-Unis, - le crime mapping -, qui corrèle délinquance et localisation géographique. En pratique, les citoyens adoptent un niveau de zoom dans la carte qui correspond à leur sentiment d'insécurité, ce qui ne fait que le confirmer. Il est donc important que la puissance publique suive les lectures qui sont faites des données qu'elle met en ligne et contribue activement à leur interprétation, même si elle ne doit pas en avoir le monopole. Les administrations pourront ainsi progresser dans leur compréhension des attentes du public. Elles ont en effet un devoir d'information et de formation des citoyens pour ne pas servir des objectifs dommageables à la cohésion sociale.

Mme Corinne Bouchoux, rapporteure. - Comment pensez-vous que l'on puisse réduire la fracture culturelle et générationnelle entre ceux qui ont conscience des enjeux que vous venez d'évoquer et ceux qui ne comprennent même pas le sujet ? Il y a d'un côté une demande des jeunes qui maîtrisent les nouvelles technologiques et qui veulent discuter du changement de société qui se profile, - je suis sollicitée tous les jours par des associations et des classes pour intervenir-, et de l'autre, en raison peut-être de l'âge ou de la formation, toute une partie de la population qui ne voit pas l'importance du débat alors que nous sommes à un carrefour sociétal aussi fondamental que celui du choix du nucléaire effectué par la France. Comment faire en sorte que ces deux catégories de populations se rencontrent sur ce sujet majeur ?

Le public s'interroge également sur les risques inhérents à ces nouvelles technologies, préoccupations relayées par exemple hier soir à l'issue d'une conférence au Mans sur la restitution des biens spoliés à propos des risques que fait peser l'accessibilité croissante des données publiques lorsque la démocratie est en menacée.

M. Benoît Thieulin. - L'importance de l'enjeu se situe effectivement au même niveau que la question nucléaire. Le défaut de culture scientifique en France que vous relevez est récent et doit être corrigé. Dans un pays qui a une grande tradition d'ingénieurs et d'inventeurs, cette évolution est préoccupante. Or les choses peuvent être redressées : Israël a ainsi multiplié par 8 le nombre de ses ingénieurs en 15 ans grâce à une politique volontariste. De manière plus générale, on constate une forme de déconnexion de nos élites, qui ont au surplus des difficultés à se renouveler et à passer la main à des générations plus jeunes. Il est pourtant nécessaire d'introduire de la diversité dans la haute fonction publique comme dans les grandes entreprises, et de renforcer la part de la culture scientifique dans leur formation. L'opinion publique, elle, prend conscience des enjeux et, comme le montre l'affaire Snowden, pose la question de la confiance et de la durabilité de l'économie numérique. Les usages possibles des données préoccupent également la population, même si tous ne se sentent pas aujourd'hui concernés.

Le Conseil national du numérique a récemment travaillé avec Valérie Peugeot, qui est l'un de ses vice-présidents, dans le cadre de la préparation de son rapport sur l'inclusion numérique, rapport qui fera date et qui développe le concept de littératie numérique. Bernard Stiegler, qui est également membre du Conseil, dit souvent que la mutation numérique équivaut, à l'échelle de l'humanité, au passage de la culture orale à la culture écrite. D'où la notion de littératie numérique, qui pose la question des clés et des usages de la connaissance des nouveaux usages de l'information et permet de battre en brèche l'idée selon laquelle les digital natives, les générations nées avec l'économie numérique, se trouveraient parfaitement à l'aise dans ce nouvel environnement. La question de l'enseignement est déterminante à cet égard : il faut faire réfléchir les jeunes sur les conséquences que peuvent avoir leur usage au quotidien des moyens sociaux. Le président Obama est ainsi intervenu dans une vidéo destinée aux enfants des écoles pour les inciter à réfléchir sur ce qu'ils mettent en ligne et aux conséquences pour leur avenir.

Il faut par ailleurs développer la recherche en France sur ces questions afin que le monde académique français se saisisse des débats, pose des diagnostics, objective les analyses et dégage des pistes d'évolution pour nourrir un débat de qualité. Le monde du numérique, qui instille sa dimension dans tous les secteurs, ne peut pas être abordé sans la maîtrise du code. Il faut en comprendre les fondamentaux et pour cela enseigner les notions de base assez tôt dans le système éducatif français.

M. Godefroy Beauvallet. - L'essentiel des usages du numérique reste encore à inventer. Il faut donc apprendre en permanence à s'adapter et contribuer à inventer les formes du numérique ; à défaut, elles s'imposeront à nous. Il n'y a aucune fatalité : chaque fois que l'on apprend, on conquiert de la puissance d'agir. La formation  des élites publiques est à cet égard particulièrement importante. Elle pourrait notamment prendre appui sur l'Institut des hautes études scientifiques dont les travaux sont remarquables et les propositions mériteraient d'être mieux relayées. La recherche doit en effet irriguer la décision publique et les fonctionnaires de connaissance ont un devoir de participation.

L'inquiétude sur l'infaillibilité des dispositifs est forte et soulève la question de la part d'ombre nécessaire dans toute démocratie : la décision publique doit être transparente, et il faut y travailler, mais les individus ont droit à l'opacité pour eux-mêmes, ce qui est bien l'inverse du totalitarisme. Les grands régimes totalitaires, qui recherchaient la transparence des individus, ont d'ailleurs été victimes de leur opacité, qui les a conduits à des erreurs et à leur effondrement final. Au lieu de placer les données publiques sous la garde des fonctionnaires, il est préférable de les ouvrir, ce qui peut être la meilleure protection des personnes : l'introduction de nouveaux champs dans la carte nationale d'identité, - par exemple la religion -, susciterait ainsi des réactions immédiates.

M. Benoît Thieulin. - Les questions ne doivent pas être abordées de manière segmentée mais bien globale. L'articulation entre ce qui doit être ouvert et ce qu'il convient de protéger se pose aujourd'hui. Le Conseil national du numérique a examiné à cet égard l'opportunité d'un rapprochement entre la Cada et la Commission nationale de l'informatique et des libertés (Cnil), dont les problématiques sont inverses. Or c'est dans l'interstice que des données personnelles peuvent être révélées, notamment par l'analyse avec des algorithmes. Les chevauchements de compétences dans lesquels se logent les problématiques les plus inquiétantes doivent donc être examinés. C'est à tout le moins un partenariat qui doit être mis en oeuvre entre ces organismes, en liaison avec Etalab dont la nature est différente.

M. Christian Cointat. - Je suis surpris par les propos tenus sur la Cada et la proposition d'inverser la charge de la preuve en matière d'accès aux documents administratifs. En tant que membre suppléant de la Cada, j'ai toujours constaté que les analyses y étaient très fouillées et les décisions très satisfaisantes. Ma philosophie en la matière est très simple : la transparence s'arrête là où commence l'intrusion. Or ce qui est aujourd'hui au centre des préoccupations sur le numérique, c'est la protection contre l'intrusion plutôt que l'inverse. La Cada et la Cnil collaborent d'ores et déjà étroitement et dès qu'une incidence numérique est possible, l'avis de la Cnil est sollicité. Quant à l'inversion de la charge de la preuve, elle soulèvera une difficulté particulière pour les documents préparatoires. Les fonctionnaires, et j'en ai été un, doivent pouvoir travailler dans la sécurité, sans être exposés à un risque permanent de conflit, ce qui n'exclut pas bien entendu la responsabilité d'affronter les conséquences de leurs actes. Certaines demandes, notamment en matière de marchés publics pour connaître ce qu'a proposé la concurrence, ont été rejetées à bon escient car elles excèdent le droit de connaître pour se défendre et relèvent de l'espionnage. La loi de 1978 sur la Cada me paraît toujours d'actualité, elle doit simplement être modernisée. Il est par exemple anormal qu'un conseiller municipal puisse demander à accéder à des documents pour la communication desquelles un maire ne peut pas saisir la Cada au motif de sa qualité de chef d'une administration.

En matière de numérique, et j'ai été rapporteur d'un projet de loi sur la protection des données qui n'a pas été examiné par l'Assemblée nationale, le véritable problème n'est l'accès aux données pour ceux qui savent les chercher, y accéder, voire les craquer, mais la protection des données personnelles. La Cnil et la Cada, même s'il faut les moderniser, jouent un rôle remarquable en la matière et assurent efficacement la protection des citoyens tout en poussant à la transparence de l'administration. Etes-vous certains que vous ne jouez pas aux apprentis sorciers en demandant l'inversion de la règle d'accès ?

M. Benoît Thieulin. - En inversant le principe, il ne s'agit pas de généraliser la transparence. On ne peut pas pousser au hacking et il est préférable que le droit soit en accord avec la pratique.

M. Jean-Jacques Hyest, président. - Ce sont plutôt les pratiques qui doivent être en accord avec le droit !

M. Benoît Thieulin.  - Il s'agit de mettre le droit en accord avec les bonnes pratiques.

M. Christian Cointat.  - Il est nécessaire d'assurer une protection des données qui ne doivent pas être accessibles.

M. Jean-Jacques Hyest, président. - Je rappelle que d'autres travaux sont en cours au sein du Sénat sur la protection des données personnelles et la surveillance de l'internet. Notre mission travaille sur l'accès aux données publiques et leur réutilisation, donc sur l'accessibilité des données pour les spécialistes comme pour les simples citoyens. Dans ce contexte, on peut s'interroger sur les motifs qui justifient de ne pas rendre accessibles des données démographiques par exemple ou d'en changer la structuration, en assurant bien sûr la protection des données personnelles, le droit à l'oubli, le respect des prescriptions... Nous devons regarder comment faire en sorte que la transparence s'accroisse et soit effective sans alimenter des pratiques inacceptables comme le scoring des assurés sociaux.

M. Benoît Thieulin. - Tout ne doit pas être accessible, notamment les travaux préparatoires, tant que la décision qu'ils préparent n'est pas formalisée. Inverser le paradigme consiste simplement à exiger que tout refus soit motivé.

Les évolutions que connaît le monde du numérique appellent une mise à niveau des moyens et des pouvoirs de la Cada et de la Cnil, dont le travail est remarquable. La Cnil est légitimement intervenue sur le dossier médical partagé, qui soulève des problématiques complexes d'anonymisation pour certains accès, mais pas par exemple pour les médecins traitants ou les pharmaciens qui doivent pouvoir identifier les patients. Aujourd'hui ce dossier ne fonctionne pas, mais des millions de français ont dans leurs poches des dispositifs électroniques connectés qui mesurent au quotidien l'état de leur santé, leur rythme cardiaque et les distances qu'ils parcourent, autant de données qui sont stockées sur des plateformes dont vous ignorez la localisation et l'usage qui en est fait, par exemple en direction des mutuelles, alors que, dans le même temps, on sur réglemente les dispositifs sur lesquels nous avons la main. Ni la Cnil ni la Cada ne se sont saisies de ces sujets ; il faut que le législateur le fasse rapidement.

M. Jean-Jacques Hyest, président. - Je vous remercie pour l'ensemble de ces éléments. Merci également pour votre enthousiasme.

M. René Garrec. - Et votre conviction !

Audition de MM. David Gayou et Tangui Morlier, administrateurs du collectif Regards citoyens

M. Jean-Jacques Hyest, président. - Nous recevons aujourd'hui M. David Gayou, ingénieur de recherche en informatique, et M. Tangui Morlier, consultant en informatique et cofondateur du collectif Regards citoyens, tous deux administrateurs de ce même collectif.

M. David Gayou, administrateur du collectif Regards citoyens. - Regards citoyens est une association composée d'une dizaine de membres bénévoles. Elle propose notamment deux sites internet (nosdéputés.fr et nossénateurs.fr) dont le contenu est fondé sur la réutilisation de données publiques disponibles sur les sites du Sénat, de l'Assemblée nationale et du Journal officiel, à partir d'un retraitement qui nous semble intéressant et qui n'est pas proposé sur ces sites. Nous avons également travaillé sur le redécoupage des circonscriptions électorales pour les législatives. Nous souhaitions rejouer les élections de 2007 par application du nouveau découpage prévu en 2009 et 2010, afin de déterminer si celui-ci était ou non partisan - aucun élément concluant ne nous a cependant permis de trancher dans un sens ou dans l'autre.

La réutilisation des données nécessaires à ces projets n'a pas toujours été chose aisée. Alors même qu'elle n'est limitée par aucune barrière juridique ou institutionnelle, leur récupération à partir des documents mis à disposition nécessite bien souvent un travail important d'extraction (scraping) afin de les rendre exploitables, qui mobilise près de 75 % de notre temps. Le travail de récupération a été particulièrement difficile s'agissant des données électorales, et notamment des informations relatives aux adresses correspondant à chaque bureau de vote. Dans la mesure où il n'existe aucun bureau centralisant ces informations au ministère de l'intérieur, nous avons dû nous adresser directement aux 40 communes pour lesquelles nous avons rencontré des problèmes. A cette occasion, nous avons pu constater de grandes disparités entre les formats sous lesquels ces données sont conservées : dans l'idéal, un tableur est tenu par le personnel de la mairie ; dans d'autres cas, la commune utilise un logiciel ne permettant pas l'extraction des données ou les données ne sont pas disponibles dans un format ouvert (il est ainsi arrivé que les données nous soient dictées par téléphone) ; dans d'autres cas, la commune faisait preuve de mauvaise volonté ou ne nous envoyait qu'un document mal scanné interdisant toute réutilisation. Dans ce dernier cas, il a été nécessaire de recourir à l'excellente loi de 1978 et de saisir la Cada.

M. Jean-Jacques Hyest, président. - Qu'est-ce qu'un format lisible pour une machine ?

M. Tangui Morlier, administrateur du collectif Regards citoyens. - Un format lisible permet la récupération de données sans qu'une intervention humaine ne soit nécessaire pour interprétation. Un format ouvert permet à chacun, quel que soit son équipement, de lire des données : on évite ainsi la discrimination technologique. Ces deux conditions sont nécessaires à la réutilisation des données publiques.

M. David Gayou. - C'est pourquoi notre deuxième plaidoyer porte sur l'Open data : les données mises à disposition par l'administration doivent être réutilisables sans complication inutile. Nous avons identifié trois barrières qui entravent la réalisation de cet objectif : une barrière juridique, lorsqu'il faut une autorisation pour accéder à certaines données ; une barrière technique, lorsqu'un logiciel spécifique est nécessaire ; une barrière financière, dans la mesure où les licences de ces logiciels sont souvent coûteuses. A ce titre, nous saluons le travail accompli par Etalab depuis 2011, notamment dans le sens de l'ouverture des esprits, et la belle avancée que représente la mise en place du site data.gouv.fr. L'ouverture de la base de données de la Direction de l'information légale et administrative (Dila) en décembre dernier a également constitué une initiative notable.

L'Open data renvoie selon nous à la possibilité d'analyser et de comprendre les décisions publiques, selon une orientation qui peut évoluer au cours du temps : c'est pourquoi la condition de réutilisation des données est essentielle. C'est en ce sens que, dans le cadre de l'examen du projet de loi relatif à la transparence de la vie publique, nous sommes intervenus dans le débat pour défendre la publication des déclarations d'intérêt en format ouvert.

Nous pensons également que la gratuité doit être la norme en matière d'accès aux données publiques. Mettre en place une redevance sur l'information publique revient à instaurer une barrière qui en exclut les citoyens et les associations au profit des seules entreprises, qui peuvent mobiliser davantage de moyens.

M. Tangui Morlier. - La commission des lois de l'Assemblée nationale elle-même a été confrontée, lors de l'examen du projet de loi relatif à la simplification du droit, à des difficultés pour réaliser une étude statistique de la mise en oeuvre de diverses dispositions législatives et ainsi identifier celles qu'il était possible de simplifier. Il a de ce fait été nécessaire de faire appel à une entreprise américaine, la société LexisNexis. C'est en outre dans ce cadre qu'est survenu le « bug » de la suppression involontaire de dispositions applicables à la scientologie. Tout cela a suscité de nombreux fantasmes autour de la question de l'indépendance du Parlement. Cette étude n'a ensuite jamais été rendue publique, ce qui interroge quant à l'utilité de ce type d'études ; nous espérons que l'ouverture de la base de données de la Dila permettra d'ouvrir le débat à ce sujet.

M. Jean-Jacques Hyest, président. - Selon moi, la méthode de simplification qui a été mise en oeuvre n'est pas la meilleure, et c'était également le point de vue de la commission des lois du Sénat lorsque j'en étais le Président.

La simplification nécessite cependant la confrontation avec la pratique. Il existe 8 000 délits et contraventions au total dans les textes, mais 400 seulement d'entre eux sont effectivement utilisées par les magistrats. Pourquoi, dans ces conditions, continuer de créer de nouveaux délits et contraventions ?

M. Tangui Morlier. - Une base de données tenue par le Conseil d'Etat pourrait apporter des éléments intéressants sur cette question ; elle n'est cependant pas publique.

M. David Gayou. - Nous soulignons que le cadre légal et administratif actuellement en place est favorable à la libération des données. Il est également à noter que le Premier ministre s'est prononcé sur l'interdiction de nouvelles redevances ; une inscription dans la loi permettrait de pérenniser ce principe. Des marges de progrès résident dans les formats sous lesquels les données sont disponibles : en fonction de ce format, le temps que nous passons à extraire les données peut varier entre quelques minutes et plusieurs heures.

M. Tangui Morlier. - Cette question concerne également les administrations en ce qu'elle peut leur permettre de mieux structurer a priori l'organisation de leurs systèmes d'informations, dans la perspective de la publication future des données.

L'Open data peut aujourd'hui apparaître comme un sujet consensuel : des gouvernements de droite comme de gauche se sont ainsi exprimés contre les redevances. Des résistances sont cependant toujours constatées sur le terrain, qu'elles soient liées à une acculturation insuffisante des administrations à la question ou, dans une minorité de cas, à la volonté de ne pas offrir une transparence très fine aux citoyens sur certaines informations. C'est pourquoi la Cada reste nécessaire pendant encore plusieurs années : l'Open data permettra de simplifier l'accès aux données administratives, mais ne remplacera pas la Cada. En outre, l'intervention de celle-ci restera nécessaire pour les données contenant des informations personnelles, qui ne rentrent pas dans le champ de l'Open data.

Avec la loi pionnière de 1978 qui a institué la Cada, la France est devenue la deuxième grande démocratie à se doter d'une autorité assurant la transparence de la décision publique. L'architecture de ce dispositif est très bien pensée en ce qu'il privilégie la médiation au conflit, ce qui est confirmé en pratique par les statistiques disponibles sur le site de la Cada. Il faut également souligner que cette institution fonctionne très bien avec un budget réduit et seulement 12 fonctionnaires, qui disposent d'une remarquable expertise en droit public : on souhaiterait que toutes les institutions puissent fonctionner de manière aussi efficace.

Nous avons sollicité la Cada à plusieurs reprises pour connaître le détail de certaines décisions publiques. Nous nous sommes par exemple aperçus que la carte des circonscriptions française, gérée par le ministère de l'intérieur, appartient à la société informatique privée à laquelle en a été confiée la réalisation et n'est donc pas réutilisable par l'administration. L'acheteur public a ainsi vu une connaissance essentielle capturée par un acteur privé par application des règles de la commande publique : le marché, passé au début des années 2000, portait sur un logiciel et la société prestataire possède un droit sui generis sur la base de données ainsi réalisée. Ce cas d'espèce pose un problème démocratique : dans certaines villes comme Paris ou Toulouse, il est nécessaire de connaître l'adresse exacte d'une personne pour identifier son représentant au Parlement. C'est pourquoi nous travaillons avec Open street map pour reconstruire nous-mêmes une carte identique - alors que celle-ci a déjà été payée par l'acheteur public !

Mme Catherine Procaccia. - Avez-vous obtenu des détails sur cette affaire auprès du ministère de l'intérieur ? Avez-vous dû passer par la Cada pour ce faire ?

M. Tangui Morlier. - Nous avons demandé communication du marché public passé pour l'établissement de la carte. L'intervention de la Cada a permis de faire replacer notre demande en haut de la pile alors que nous n'avions pas eu de réponse dans un délai d'un mois, en raison sans doute de la durée de l'expertise interne nécessaire pour répondre à notre demande. L'efficacité du rôle de médiation de la Cada mérite vraiment d'être soulignée. Ce bon fonctionnement est d'autant plus notable qu'il perdure à l'heure où l'essentiel des problèmes porte sur des données numériques, alors que la Cada a été instituée à l'époque où prédominaient la culture du papier et l'usage du document.

S'agissant des informations liées à la vie privée, nous estimons qu'elles doivent être entièrement maîtrisées par les seules personnes concernées, ainsi que l'affirme la loi relative à la Cnil. Il existe sans doute des marges d'amélioration sur ce point. En revanche, la plus grande transparence doit être la règle quant à l'évaluation des politiques publiques et à la prise de décision publique.

Sur ce dernier point, notre expérience avec la Cnil est plutôt négative. Lorsque nous avons demandé à la Cnil des détails sur certains aspects de l'affaire du Mediator et sur la loi « Sunshine » qui en a découlé, nous avons été assez étonnés de constater que les avis rendus par cette institution viennent affaiblir la volonté du législateur. Par exemple, ce dernier avait souhaité que les informations relatives aux relations de nature commerciale entre les médecins et les laboratoires pharmaceutiques soient publiques. Il est cependant très difficile d'y accéder, car la base de données proposée par le ministère de la santé fonctionne mal. Cela tient à ce que la Cnil fait régulièrement primer la non-réutilisation des données à caractère personnel sur la transparence de la prise de décision publique.

M. David Gayou. - Cette base de données ne permet pas de faire de consultation agrégée, ce qui limite les possibilités d'analyse...

M. Tangui Morlier. - ... et qui concentre finalement l'attention sur des informations à caractère personnel ! Cette situation pose un vrai problème, puisqu'elle rend très difficile une analyse approfondie d'une affaire comme celle du Mediator. C'est pourquoi nous avons demandé à la Cnil les raisons d'une telle restriction : afin d'obtenir les détails de l'avis rendu - dont la communication est pourtant de droit dans le cadre de la transparence de la décision publique -, il nous a fallu nous adresser à la Cada, faire un battage médiatique et menacer la Cnil d'un recours devant le tribunal administratif !

Il apparaît de plus que la Cnil n'a pas joué tout son rôle dans certains cas de réutilisation de données à caractère personnel. Par exemple, les données d'immatriculation automobile de millions de Français sont vendues par le ministère de l'intérieur et réutilisées par des entreprises privées pour faire du démarchage commercial. Ces données n'entrent pas dans le champ de l'Open data, dès lors qu'elles contiennent des informations à caractère personnel. Depuis 2006, il est possible d'interdire la réutilisation de ces données, mais le stock antérieur continue d'être vendu. Qu'a fait la Cnil, dans ce cas précis, pour protéger les données personnelles des citoyens ? Voici un autre exemple : lorsque des données relatives aux revenus localisés des ménages ont été touchées par un problème informatique portant, au sein de l'Insee, sur certaines régions, le problème a été réglé par un dialogue entre l'Insee et la société civile, sans que la Cnil n'intervienne jamais. Au total, nous préférons donc l'efficacité des 12 fonctionnaires de la Cada à celle des 150 agents de la Cnil, du moins pour notre expérience d'accès aux données publiques.

M. David Gayou. - Nous souhaitons à présent aborder le sujet de la nouvelle directive européenne relative aux informations du secteur public. Celle-ci vise à imposer l'utilisation, pour la transmission de données publiques, de formats ouverts et lisibles par des machines, de façon à faciliter la réutilisation des données.

M. Tangui Morlier. - Comme nous l'avons vu avec l'exemple de la carte des circonscriptions dont le ministère de l'intérieur n'est pas propriétaire, cette évolution profitera d'ailleurs en premier lieu au fonctionnement interne des administrations publiques.

Par ailleurs, nous recommandons d'inscrire dans la loi le principe de la gratuité de la réutilisation des données publiques, d'autant qu'il est très consensuel au sein des différentes formations politiques.

Nous souhaitons en outre que la compétence de la Cada, qui porte aujourd'hui sur les documents administratifs, soit élargie aux informations publiques. A l'heure actuelle en effet, si l'on ne connaît pas l'existence ou le titre précis d'un document au sein de l'administration, on ne peut avoir accès à l'information qu'il contient via la Cada.

M. Jean-Jacques Hyest, président. - Ce ne sera pas nécessairement simple en pratique : la requête du demandeur sera-t-elle suffisamment précise pour que l'autorité identifie le document dans lequel cette information est contenue ?

M. Tangui Morlier. - Nous espérons que l'administration n'a pas pour seul objectif l'archivage de documents, mais qu'elle est capable d'organiser l'information qu'elle produit. En outre, l'expertise de la Cada en matière de médiation permettra de répondre aux problèmes qui pourront éventuellement se poser.

M. David Gayou. - Nous aimerions également voir une évolution du champ des entités sur lesquelles porte la compétence de la Cada. Celle-ci ne concerne aujourd'hui que les seuls organismes administratifs, tandis que les entités parapubliques ou semi-publiques comme la RATP en sont exclues, quand bien même elles assurent des missions de service public.

M. Christian Cointat. - Il me semble pourtant que la compétence de la Cada s'étend à tous les organes chargés d'une mission de service public.

M. Tangui Morlier. - C'est bien le cas lorsqu'il s'agit de l'accès à des documents, mais pas lorsqu'il est question de leur réutilisation. Pour faire une évaluation des politiques publiques, cela serait pourtant utile ! Certains établissements publics à caractère administratif (EPA), par le biais des redevances, les établissements publics à caractère industriel et commercial (Epic) ou encore les entreprises délégataires de service public sont donc hors du champ de la réutilisation, de même que le Parlement, pour d'autres raisons - mais ce dernier répond à ces préoccupations par ses propres moyens, en particulier à travers les outils développés par le service informatique du Sénat, qui a lancé une politique ambitieuse en matière d'Open data.

Nous aimerions enfin aborder la question des données à caractère culturel. La France, dont la culture est pourtant très largement diffusée, est en retard pour ce qui est de l'ouverture des données ou des métadonnées d'informations culturelles ou d'oeuvres du domaine public. Cette situation suscite des interrogations quant à l'avenir de la culture française.

De ce point de vue, plusieurs barrières à l'accès restent à lever. La première est celle du droit d'auteur, qu'il s'agisse de celui des consultants privés auxquels l'administration fait appel, des droits sui generis des bases de données privées que nous avons évoquées, ou de celui des fonctionnaires - une modification législative de 2006 ayant permis aux fonctionnaires de revendiquer un droit d'auteur dans certains cas. Nous attirons votre attention sur ce dernier cas, qui peut constituer une entrave forte, alors que nous considérons que le travail des fonctionnaires est d'autant plus valorisé qu'il est largement diffusé. Deux exemples peuvent illustrer cette question : les défenses du Gouvernement devant le Conseil d'Etat ; le travail des fonctionnaires du ministère de la culture établissant la description littéraire et photographique des monuments historiques. La base de données Mérimée a d'ailleurs dû être amputée de quelques données pour cette raison. La deuxième concerne les droits d'exclusivité pour la numérisation que certaines institutions publiques accordent à des entreprises privées. C'est le cas de la Bibliothèque nationale de France, qui a donné un droit exclusif de numérisation de documents qui sont pourtant dans le domaine public.

S'agissant de la Cnil, nous souhaiterions que soient homogénéisés les avis rendus au législateur sur les projets de loi et de décrets. La solution la plus simple serait de supprimer cette pratique ; on pourrait également envisager de donner cette compétence à la Cada afin d'instaurer un certain parallélisme des visions. Je souligne en passant que nous sommes contre le rapprochement de la Cada et de la Cnil, qui ne les rendrait pas nécessairement plus efficaces.

Mme Corinne Bouchoux, rapporteure. - Merci pour votre précieuse contribution à la démocratie. Si nous ne devions retenir que trois propositions parmi toutes celles que vous avez formulées, quelles devraient-elles être, d'un point de vue stratégique ?

M. Tangui Morlier. - La levée des barrières nous semble cruciale, qu'il s'agisse de la gratuité et de la mise en place de formats ouverts et non discriminants, ou de la levée des barrières marginales que représentent le droit d'auteur ou les droits d'exclusivité conférés à certaines personnes privées.

Mme Catherine Procaccia. - Avez-vous des éléments de réflexion à nous transmettre sur la mise en place de la nouvelle base informatique des services fiscaux, qui rassemble les données relatives aux transactions immobilières ?

M. Tangui Morlier. - Ce n'est pour l'instant qu'un projet de base de données, qui, malheureusement, ne sera pas réutilisable par les citoyens. Le décret en cause pose d'importantes questions juridiques, en particulier vis-à-vis des notaires qui disposent déjà d'une base dont la consultation est payante. En outre, le dossier est géré par l'exécutif et Etalab n'y est pas associé.

M. David Gayou. - Bien évidemment, la question de la protection de la vie privée se pose également.

M. Jean-Jacques Hyest, président. - En effet : si les données disponibles sont peu nombreuses, il devient facile d'identifier individuellement les transactions, les vendeurs et les acquéreurs. Il faut donc prendre des précautions pour garantir à la fois l'ouverture et la protection des droits des personnes.

M. Tangui Morlier. - La question posée est celle du non-respect du secret statistique. Le problème n'est pas de savoir si tout le monde a ou non accès à ces données ; c'est que certains acteurs privés qui y ont accès en font une utilisation non respectueuse de la vie privée. L'Open data, en ce sens, simplifierait la question en ce qu'il consiste à expurger systématiquement toutes les données personnelles avant de les proposer en consultation libre ; il permet ainsi de tracer une ligne claire entre données personnelles protégées et données libres. C'est pourquoi nous sommes contre la fusion de ces deux notions à travers la fusion de la Cnil et de la Cada. Certaines entreprises américaines entretiennent cette confusion, qui est malheureusement reprise par les institutions chargées de la protection de la vie privée.

M. Jean-Jacques Hyest, président. - Les statistiques fiscales offrent un autre exemple de la question qui nous préoccupe. Si leur granularité est trop fine, il devient possible d'identifier qui paie l'ISF dans chaque village.

M. Tangui Morlier. - L'administration, notamment Bercy, dispose d'une expertise remarquable sur ce point. Il me semble donc qu'il n'y a pas de préoccupation à avoir.

M. David Gayou. - En revanche, dès lors qu'existe une donnée, il existe toujours un risque de fuite et de diffusion, soit du fait d'un problème ou d'un piratage informatique, soit du fait d'une fuite interne.

M. Tangui Morlier. - D'où la nécessité de distinguer entre l'existence des données elles-mêmes et le processus permettant de les extraire, qui doit être respectueux du droit.

Audition de M. Mathieu Escot, chargé de mission santé à UFC-Que Choisir

M. Jean-Jacques Hyest, président. - Nous entendons à présent M. Mathieu Escot, chargé de mission santé à UFC-Que Choisir sur les difficultés rencontrées en matière d'accès aux documents administratifs et aux données publiques, la qualité de ces dernières et les conditions dans lesquelles elles peuvent être réutilisées, enfin sur les évolutions du cadre juridique, technique et institutionnel qui vous paraîtraient souhaitables en la matière.

M. Mathieu Escot, chargé de mission santé. - Mon domaine de compétence est plus particulièrement celui des questions de santé et c'est en recherchant des données à ce sujet que notre association s'est pour la première fois posée la question de l'accès aux données publiques.

Pour autant mon propos sera plus large, notre intérêt pour la mise à disposition des données publiques étant directement lié à l'exercice de nos missions. En effet, des données plus largement ouvertes faciliteraient l'information du consommateur, à travers nos différentes publications notamment, nous permettraient d'améliorer sa défense et même de créer de nouveaux services marchands ou non marchands.

C'est justement en voulant créer ces nouveaux services que nous avons rencontré des difficultés. C'est ainsi que souhaitant étudier la fracture sanitaire, l'UFC-Que Choisir a tenté d'établir une carte des implantations de cabinets médicaux corrélée au niveau des dépassements d'honoraires constatés. Il s'agissait pour nous, dans un but d'intérêt général, de créer un service gratuit à l'intention de tous les consommateurs pour leurs permettre de connaître l'offre médicale. Une telle information est en effet disponible sur le site de l'assurance maladie (Ameli-direct), mais elle n'est pas réutilisable : les consommateurs peuvent seulement interroger la base médecin par médecin.

Nous avons donc dû reconstituer la base par une procédure d'aspiration des données disponibles. Cette opération, effectuée par un prestataire, a coûté 20 000 euros, soit l'équivalent du budget annuel du pôle santé de l'association pour l'achat de prestations extérieures.

Nous avons rencontré le même type de difficultés lorsque notre association a souhaité établir une carte sur la qualité de l'eau potable. Le coût de la procédure d'aspiration des données s'est élevé à 8 000 euros.

La mise à disposition de ces informations sur notre site ne donne lieu à aucun retour sur investissement par la publicité. Elle représente un coût net pour notre association. Je souligne à cet égard que ce qui pour UFC-Que Choisir n'a été qu'un frein financier est susceptible de représenter pour d'autres acteurs une barrière infranchissable.

Plus généralement, les difficultés concrètes que nous rencontrons sont de plusieurs ordres.

En premier lieu, certaines données sont inaccessibles sous quelque forme que ce soit. La base de données existe mais elle est inaccessible. C'est ainsi que seule l'administration dispose d'informations sur la qualité de la prescription d'antibiotiques alors même qu'il serait intéressant de l'étudier dans un contexte d'antibio-résistance.

D'autres jeux de données ne sont pas directement mis à disposition. Les données brutes demeurent inaccessibles, seule est disponible une extraction faite à partir d'études particulières. Tel est le cas par exemple des données relatives à l'évolution du prix des services de téléphonie mobile, qui font l'objet d'études régulières de la part de l'Autorité de régulation des communications électroniques et des postes (Arcep). Faute de pouvoir confronter ces études avec les données brutes qui les fondent, il n'est pas possible de remettre en cause les choix méthodologiques (qui ne sont d'ailleurs pas forcément contestables) sur lesquelles elles prennent appui, ni d'analyser les données sous un autre éclairage.

Le troisième type de données mises à disposition est celui des données consultables mais non réutilisables, comme dans l'exemple précédemment évoqué de la carte des dépassements d'honoraires des médecins. Une start-up qui avait le même projet que nous mais à des fins marchandes a dû y renoncer au terme d'une action en justice.

La base de données relative aux relations entre l'industrie pharmaceutique, les médecins, les associations de patients obéira-t-elle à la même logique ? La France est en avance sur ce point puisqu'un site internet unique devrait être mis en place qui autorisera une consultation par les citoyens. Ces informations seront-elles cependant réutilisables facilement ? L'UFC-Que Choisir milite à travers le collectif Europe et médicament pour une réutilisation très large de ces données.

Le quatrième type de données utilisables est celui des données légalement consultables et réutilisables mais dans des conditions telles qu'il est presque impossible de s'en servir. Ainsi, lorsque l'on s'intéresse à la qualité du service de distribution d'électricité (fréquence des coupures, durée moyenne des coupures, investissements réalisés...), une seule donnée est mise à disposition par Electricité réseau distribution France (ERDF), celle de la durée moyenne des coupures par départements. Toutes les autres données détaillées sont certes publiques mais il revient aux communes ou aux agglomérations de les communiquer. Certaines procèdent à la mise en ligne de la totalité des données, d'autres de certaines d'entre elles seulement, et les dernières s'abstiennent de toute diffusion de ces informations. Or il impossible de relancer toutes les communes ou les agglomérations de France pour disposer d'un jeu complet de ces données.

Un autre exemple est fourni par l'étude de la qualité de l'eau (eau brute, eau potable) que nous avons engagée. Selon le cas, les informations disponibles relèvent du ministère de l'environnement (pour les eaux brutes, l'eau des fleuves notamment), du ministère de la santé (pour la qualité de l'eau potable) ou encore du ministère de l'agriculture. Cette répartition administrative ne facilite pas la tâche. En outre, si l'on s'attache plus particulièrement à la qualité de l'eau courante, on s'aperçoit que les bulletins de qualité de l'eau, qui résultent d'un seul captage, comportent des informations brutes difficilement compréhensibles sauf à être un spécialiste chevronné ; un effort de pédagogie serait nécessaire. En outre, le moteur de recherche mis en place par le ministère de la santé n'autorise pas la recherche par date alors qu'on compte parfois plus de 1 000 bulletins par an pour certaines zones. A nouveau, il est nécessaire d'aspirer les données, de les traiter et de les mettre en forme. D'une agence régionale de santé à l'autre, les pratiques de mise en ligne diffèrent, de même que la précision des données diffusées. Or il est peu pertinent de ne disposer que de relevés agrégés au niveau régional ou annuel : à ces échelles, il n'y a jamais de problèmes de qualité de l'eau. Ceux-ci apparaissent plutôt à l'échelle de la commune et à un moment donné.

M. Jean-Jacques Hyest, président. - L'information n'est-elle pas plus accessible pour l'eau distribuée ? Je suis maire et ai toujours été attentif à ce que les analyses envoyées avec la facture deux fois par an soient conformes aux normes en vigueur. Il me semblait que les informations délivrées étaient suffisamment lisibles. J'ajoute qu'il ne faut pas confondre eau brute et eau distribuée puisque la seconde a fait l'objet d'un traitement par rapport à la première.

M. Mathieu Escot. - Mon propos en effet n'était pas de dénoncer une mauvaise qualité de l'eau en France. J'insistais seulement sur les difficultés de lecture pour les citoyens et le coût de rassemblement de toutes ces données éparses.

Pour conclure sur cette question de l'ouverture des données publiques, il me semble que plusieurs points doivent être mis en avant.

Les données mises à disposition doivent être des données brutes. Ceci n'ôte toutefois aucune légitimité aux administrations pour produire elles-mêmes des études sur celles-ci, dans le cadre de leur mission d'information. L'interprétation de ces données doit toutefois être facilitée. Quant aux données elles-mêmes, elles doivent être réutilisables d'un point de vue légal et technique. Elles doivent en outre être accessibles de manière centralisée. Le site Etalab constitue une avancée à cet égard. Le jeu de données mis à disposition doit être intégral et comporter les éléments explicatifs nécessaires à la bonne compréhension des citoyens.

Enfin, l'ouverture des données publiques doit se faire de telle façon qu'elle garantisse le secret statistique et empêche toute réidentification, afin d'assurer la protection des données personnelles. L'UFC-Que Choisir ne défend pas une ouverture sans règle. En revanche, il ne faudrait pas que la question des données personnelles, qui est centrale et doit être examinée pour elle-même, serve de prétexte pour interdire tout développement de l'open data.

Sur la question de l'accès aux documents administratifs, l'expérience de l'UFC-Que Choisir est plus restreinte. Nos journalistes soulignent toutefois la nécessité de réduire, dans la mesure du possible, les délais actuels : est-il en effet nécessaire d'accorder à une administration un mois supplémentaire pour donner sa réponse après que la Commission administrative d'accès aux documents administratifs a statué ? Par ailleurs, il convient de s'assurer de l'accès concret aux documents mis à disposition : on n'a pas toujours la possibilité de faire des copies, par exemple pour des documents d'urbanisme.

Mme Corinne Bouchoux, rapporteure. - Je reviens sur la question de l'eau. L'information ne vous semble-t-elle disponible trop tardivement ? En outre, est-elle adressée à tous les intéressés : les propriétaires comme les locataires ?

M. Jean-Jacques Hyest, président. - Au moins, le gestionnaire du réseau est-il prévenu immédiatement, ce qui lui permet d'interrompre la distribution d'eau. L'incident peut toutefois durer, en particulier s'il est nécessaire de réaliser un nouveau captage - situation que j'ai connue.

M. Mathieu Escot. - Effectivement, la réaction est immédiate lorsqu'il y a un doute sur la potabilité de l'eau. L'information qui vient ensuite est très utile mais il est nécessaire de la compléter par un accès plus aisé.

Mme Gisèle Printz. - Votre association sollicite souvent les parlementaires pour poser des questions au Gouvernement. D'où viennent ces interrogations ?

M. Mathieu Escot. - Effectivement, notre action de défense des consommateurs passe par un contact direct avec les pouvoirs publics pour les sensibiliser aux sujets que nous instruisons ou aux difficultés relevées au plus près du terrain.

Mme Corinne Bouchoux, rapporteure. - Pensez-vous que la création de l'action de groupe contribuera au développement de l'accès aux informations administratives ?

M. Mathieu Escot. - Les deux sujets me paraissent distincts.

M. Jean-Jacques Hyest, président. - Merci monsieur pour votre intervention qui a notamment mis en lumière les difficultés concrètes que pose l'accès aux données publiques en matière de santé.