Allez au contenu, Allez à la navigation

Refonder le droit à l'information publique à l'heure du numérique : un enjeu citoyen, une opportunité stratégique (auditions et contributions écrites)

5 juin 2014 : Refonder le droit à l'information publique à l'heure du numérique : un enjeu citoyen, une opportunité stratégique (auditions et contributions écrites) ( rapport d'information )

N° 589

SÉNAT

SESSION ORDINAIRE DE 2013-2014

Enregistré à la Présidence du Sénat le 5 juin 2014

RAPPORT D'INFORMATION

FAIT

au nom de la mission commune d'information sur l'accès aux documents administratifs et aux données publiques (1),

Par Mme Corinne BOUCHOUX,

Sénatrice.

Tome II : Auditions et contributions écrites.

(1) Cette délégation est composée de : M Jean-Jacques Hyest, président ; Mme Corinne Bouchoux, rapporteure ; Mme Françoise Cartron, MM. Christian Cointat, Pierre-Yves Collombat, Mme Cécile Cukierman, MM. Yves Détraigne, Vincent Eblé, vice-présidents ; MM. Jean-Paul Amoudry, Philippe Bas, Mme Natacha Bouchart, MM. François-Noël Buffet, Raymond Couderc, Yves Daudigny, Claude Domeizel, Christian Favier, René Garrec, Patrice Gélard, Michel Houel, Ronan Kerdraon, Jacky Le Menn, Mme Hélène Lipietz, MM. Jean-Jacques Lozach, Jacques-Bernard Magner, Jean Louis Masson, Mmes Catherine Morin-Dessailly, Gisèle Printz, Catherine Procaccia, MM. Alain Richard, Bernard Saugey, Mmes Patricia Schillinger, Esther Sittler et M. François Vendasi.

COMPTES RENDUS DES AUDITIONS

Audition de M. Jacques CHEVALLIER, professeur émérite de droit public à l'université Panthéon-Assas (Paris II), directeur du Centre d'études
et de recherches de sciences administratives et politiques (Cersa)
(jeudi 9 janvier 2014)

M. Jean-Jacques Hyest, président. - Nous auditionnons M. Jacques Chevallier, professeur émérite de droit public à l'université Panthéon Assas (Paris II), directeur du Centre d'études et de recherches de sciences administratives et politiques (Cersa), et membre du conseil de la Fondation nationale des sciences politiques et du Comité d'histoire de l'ENA, qui nous exposera les grandes étapes de la mise en place du cadre juridique actuel de communication des documents administratifs depuis l'adoption de la loi du 17 juillet 1978.

M. Jacques Chevallier, professeur émérite de droit public à l'université Panthéon Assas (Paris II). - La loi de 1978 a constitué un tournant capital. Elle a remis en cause le principe du secret, très strict, qui fondait les relations entre l'administration et les administrés. Dans les années 1970 s'était répandue l'idée que le secret avait des effets indésirables. Le principe de libre accès, consacré en Suède depuis 1766, a gagné de nombreux pays, ainsi les Etats-Unis avec le Freedom Information Act de 1966. En 1978-79, plusieurs réformes d'importance ont été adoptées en France dans un remarquable consensus et l'optique a changé fondamentalement. L'information est devenue un droit opposable, les administrés pouvant se prévaloir des dispositions juridiques positives, recourir à la Commission d'accès aux documents administratifs (Cada) ou à la Commission nationale de l'informatique et des libertés (Cnil) et éventuellement aux tribunaux.

Une distinction essentielle s'opère entre données personnelles, qualifiées à l'époque d'informations nominatives, qui bénéficient du régime de protection de la loi du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, et les documents administratifs (on dit désormais les données publiques), pour lesquels prévaut le principe de communication instauré par la loi du 17 juillet 1978. La loi du 3 janvier 1979 élargit les possibilités de communication des archives publiques. La protection des données nominatives constitue une limite à la communication des documents administratifs.

Le régime des données personnelles a été revu en profondeur par la directive du 24 octobre 1995, modifiée en 2002, transposée par la loi du 6 août 2004 : le champ d'application de la loi a été redéfini ; l'expression « données personnelles » apparaît ; un correspondant sur les données personnelles doit être désigné dans chaque administration et dans les entreprises ; le régime de protection est renforcé. Les données personnelles doivent être traitées loyalement, à des fins déterminées, sur la base du consentement des personnes, avec un droit de rectification ; les pouvoirs de la Cnil sont accrus.

La loi du 17 juillet 1978 sur l'accès aux documents administratifs a été modifiée à plusieurs reprises. Elle reposait sur une différence fondamentale entre documents nominatifs, communicables uniquement aux intéressés, et documents non nominatifs, communicables de droit, à l'exception de secrets protégés liés à des prérogatives régaliennes ou concernant des personnes. Le dispositif coiffé par la Cada a été interprété dans un sens libéral par celle-ci comme par le juge administratif.

Les délais de procédure ont été modifiés plusieurs fois. Deux lois ont apporté des changements de fond. La loi du 12 avril 2000, dite loi DCRA, relative aux droits des citoyens dans leurs relations avec les administrations, pose un principe général de liberté d'accès aux documents administratifs et supprime la règle selon laquelle la communication n'est possible que pour les documents non nominatifs ; mais elle crée une nouvelle distinction entre documents non communicables, qui correspondent aux secrets protégés, et ceux communicables uniquement à l'intéressé. La liberté d'accès prime sur la protection de certaines informations nominatives. La Cada voit sa compétence élargie à certains fichiers ou archives publiques ou certains documents dont l'accès est régi par des lois spéciales. L'ordonnance du 6 juin 2005 accroît les possibilités de communication, introduit en application d'une directive européenne un droit à la réutilisation des données publiques, modifie le statut de la Cada qui devient une autorité administrative indépendante dotée d'un pouvoir de sanction, et institue dans chaque administration une personne responsable de l'accès aux documents.

Ainsi la liberté d'accès aux documents est érigée en principe, à l'exception de certains documents comme les avis du Conseil d'Etat ou certains actes des assemblées parlementaires. Tous ne sont pas communicables : les uns sont couverts par un secret absolu, sous réserve des dispositions de la législation sur les archives ; d'autres, couverts par un secret relatif, ne sont communicables qu'aux intéressés : documents dont la communication porterait atteinte à la vie privée, dossiers médicaux, etc. Plusieurs modalités sont prévues : consultation gratuite, diffusion par courrier électronique, délivrance d'une copie. Le silence gardé par l'administration pendant un mois est considéré comme un refus ; en cas de refus de communication, il faut saisir la Cada dans un délai de deux mois avant tout recours contentieux.

Le bilan est positif. La loi de 1978 a marqué un tournant pratique mais surtout symbolique considérable. Le rôle de la Cada est important si l'on en juge par le rapport d'activité pour 2012 : le nombre d'avis, de conseils, de renseignements du public a augmenté ; les interprétations sont majoritairement favorables aux demandeurs ; les avis sont suivis par les administrations et rarement désavoués par le juge.

Toutefois il faut nuancer. En 1978 la Cada avait été conçue comme une structure provisoire : elle devait disparaître quand le principe de communication serait entré dans les moeurs. Le nombre de saisines de la Cada suffit à montrer que la communication des documents administratifs reste l'objet d'une lutte qui rend nécessaire le maintien d'une instance de médiation. Si les administrations se sont pliées à la logique de la transparence, les pratiques restent marquées par une certaine frilosité comme plusieurs indicateurs le montrent.

A l'occasion d'une enquête réalisée pour les vingt-cinq ans de la Cada, nous avions constaté que celle-ci était saisie par un public restreint, composé d'initiés, parfois des récidivistes qui n'hésitent pas à la saisir de manière répétitive ; quant aux personnes physiques, elles souhaitent essentiellement la communication de documents à caractère personnel, afin d'étayer un éventuel recours devant le juge.

Les suites données aux avis de la Cada semblent témoigner d'un excellent suivi administratif. Toutefois, de multiples relances sont nécessaires. Certains refus proviennent d'erreurs des administrations, de retards, voire de mauvaise volonté. La persistance du contentieux montre que l'intervention du juge reste parfois nécessaire.

La loi du 15 juillet 2008 a modifié la loi du 3 janvier 1979 sur les archives. Elle a élargi son champ d'application, renforcé le système de protection des archives et de collecte, réaffirmé le principe d'imprescriptibilité. La règle de communicabilité des archives est posée mais ruinée par de nombreuses exceptions et l'instauration de procédures très complexes, avec quatre délais (vingt-cinq ans, cinquante ans, soixante-quinze ans, cent ans). Les chercheurs se plaignent et la ministre de la Culture a annoncé son souhait de modifier la loi, dont le texte avait été durci lors de la discussion parlementaire.

Quels sont les problèmes en suspens ? Tout d'abord des problèmes techniques d'importance secondaire. Le rapport de la Cada évoque ainsi les refus de communication d'une administration à une autre. Elle souhaite aussi une définition plus claire des documents des services publics industriels et commerciaux qui entrent dans le champ de la loi. De plus, il existe des superpositions : le droit au respect de la vie privée n'entraîne-t-il pas de fait la protection des données personnelles ? L'article 6 évoque le secret des procédures devant les juridictions, mais les documents juridictionnels sont déjà exclus du droit à la communication. Il faudrait mieux délimiter les secrets protégés, alors que le Conseil d'Etat, dans trois arrêts du 17 avril 2013, a adopté une définition extensive.

En outre, le rapport pour 2012 de la Cada souligne la coexistence d'un régime général et de régimes spéciaux de communication. La compétence de la Cada a été progressivement étendue à certains de ces régimes en 2005 et 2012, mais les modalités restent distinctes. Pourquoi ne pas les harmoniser, ou, du moins, mieux préciser les articulations ? N'est-il pas concevable, même si le rapport de la Cada ne va pas aussi loin, de supprimer les régimes spéciaux en posant le principe de suprématie de la loi de 1978 ?

De plus, qu'entend-on par « documents administratifs » ? L'article 1er dresse une liste longue mais non exhaustive, ce qui n'est pas satisfaisant. Les textes étrangers, notamment les directives européennes, préfèrent l'expression d'information publique. La loi de 1978, revue en 2005, distingue les documents administratifs et l'information publique, réutilisable et dont les documents administratifs constituent l'un des supports. Ne faut-il pas simplifier ?

La législation sur les archives publiques de 2008 a été fortement critiquée par les historiens et les archivistes. Les régimes sont très complexes. Un toilettage est nécessaire.

Il convient aussi d'évaluer l'effet du développement des données publiques ouvertes, open government data. L'extension des informations publiques publiées et diffusées est considérable. Certes la loi de 1978 prévoyait déjà la publication de certains documents administratifs ; mais ici la publication s'inscrit dans une démarche proactive : il s'agit d'anticiper les demandes du public par une très large publication. Ce phénomène est massif, incontournable et mondial, la charte du G8 a d'ailleurs défini certains principes. Ce développement risque de vider la question du droit d'accès aux documents administratifs d'une partie de son sens. D'ailleurs, la Cada est très peu saisie en matière de réutilisation des données publiques. Cette évolution soulève le problème de la protection du droit d'auteur et de la propriété intellectuelle, notamment des fonctionnaires.

La protection de la vie privée et des données personnelles est également menacée. Certes la loi de 1978 protège les données personnelles mais les frontières entre données publiques et personnelles deviennent poreuses. Il est déjà possible de publier des données personnelles dès lors qu'elles sont anonymisées. De même, la publication de données personnelles publicisées est parfois justifiée par exemple au nom de la transparence et de la lutte contre la corruption ou pour des raisons de santé et de recherche. La numérisation rend possible de croiser une masse considérable de données, dans le cadre de grands systèmes de données intégrés, les big data. La publication des données publiques ouvertes s'inscrit ainsi dans un mouvement plus large qui efface largement la distinction entre données publiques et données personnelles et remet en cause la notion de document administratif.

Un cadre juridique s'impose au-delà des grands principes posés par la charte du G8 : principe d'ouverture par défaut des données publiques ; engagement à publier des données d'un haut niveau de qualité, accessibles et réutilisables par tous, etc. Il faut un régime plus précis pour fixer des garde-fous. Ne conviendrait-il pas de créer une autorité unique de protection, comme dans beaucoup de pays, en fusionnant la Cada et la Cnil ? Cette question iconoclaste mérite d'être posée.

Enfin la réutilisation des données publiques à des fins commerciales, autorisée par l'ordonnance de 2005, prend une importance croissante. Le principe de gratuité a été posé en 2011. Son application se heurte à certaines résistances administratives compréhensibles car certains groupes privés sont susceptibles d'en tirer des bénéfices, tel Google qui réutilise des données cartographiques au profit de son système de géolocalisation. Le rapport Trojette de novembre 2013 prône la suppression de la plupart des redevances, notamment celle de l'Institut national de l'information géographique et forestière (IGN). L'encadrement de cette réutilisation par la voie des licences ouvertes apparaît souhaitable et un cadre juridique est nécessaire pour prévenir des dérives et des atteintes aux droits fondamentaux.

Mme Corinne Bouchoux, rapporteure. - Merci de cette description précise qui révèle le caractère titanesque du sujet. Il existe des limites à la diffusion des données publiques, juridiques ou politiques. Mais la judiciarisation de la vie quotidienne ne risque-t-elle pas de provoquer un changement de civilisation ? Comment les différents pays réagissent-ils ? Quelle sera la portée de nos lois dans ce nouveau contexte ?

L'extension de la publicité des documents administratifs ne se heurte-t-elle pas à une contrainte d'ordre pratique et à une contrainte de moyens ? Les administrations risquent de consacrer davantage de temps à communiquer qu'à administrer. Enfin, quels sont les points sur lesquels il est urgent de légiférer pour protéger les libertés ?

M. Jacques Chevallier. - Le phénomène des données publiques ouvertes constitue un raz-de-marée qui vide la problématique de l'accès aux documents administratifs d'une partie de sa pertinence. Le dispositif de 1978 était destiné à accompagner les demandes adressées à l'administration. Avec l'open government data, la démarche s'inverse. Le tournant essentiel en France est le décret du 21 février 2011 qui crée une mission Etalab. Une licence spécifique a été mise en place en octobre. L'administration ne répond plus à des demandes, elle met spontanément en ligne une série de données ; on compte 350 000 jeux de données publiques en ligne. Ainsi l'accent doit être à nouveau mis sur la protection de certaines données concernant la vie privée. Il faut des garde-fous. La question de l'accès aux documents administratifs apparaît datée historiquement. Un glissement s'est opéré progressivement de documents à informations publiques, d'informations publiques mises en ligne à données publiques ouvertes. L'édifice de 1978 devra être revu à l'aune de cette nouvelle dynamique.

Une table rase est-elle nécessaire ? Sans doute pas. Un rapprochement de la Cnil et de la Cada aiderait peut-être à mieux évaluer les données susceptibles d'être rendues accessibles au public et celles devant être jalousement protégées. Il faut revoir la dualité entre données personnelles et données publiques pour penser leur articulation. A minima, il convient de procéder à une révision des textes pour harmoniser les régimes et supprimer les doublons. Mais il sera sans doute nécessaire de revoir la législation au regard du développement des données publiques ouvertes. Dans un colloque récent sur l'open data et les données personnelles, nous avons constaté que l'émergence de l'open data modifiait la formulation du problème. En 1978, la France était en pointe, même si les Américains avaient légiféré dès 1965. Depuis, nous avons été rattrapés par l'Europe et le contexte a changé. L'intervention du G8 préfigure l'apparition d'un système mondial d'accès aux données publiques.

M. Jean-Jacques Hyest, président. - Voire aux données privées !

M. Jacques Chevallier. - En effet !

Mme Corinne Bouchoux, rapporteure. - Comment informer les personnels des administrations, fonctionnaires comme contractuels ou intérimaires, sur ce sujet ? Comment également éviter une fracture entre les initiés et les citoyens ordinaires ? Comment prévenir le risque de marchandisation possible des données publiques ? La libéralisation risque d'aboutir à la loi de la jungle, d'entraîner l'apparition de nouveaux acteurs, certes créateurs de richesses mais aux pratiques parfois douteuses.

M. Jacques Chevallier. - L'ouverture des données publiques est une lame de fond irréversible, aussi bien au niveau international que local. Aux Etats-Unis comme en France, l'initiative est venue d'abord des collectivités territoriales dans une démarche bottom-up, avant que le législateur n'intervienne. Le sujet est celui des big data : les données publiques sont intégrées à des gigantesques bases de données dont l'exploitation est susceptible de multiples utilisations commerciales, comme, par exemple, dégager des profils de consommateurs pour alimenter les profits de grands groupes mondiaux. Le rapporteur Trojette me semble léger. On comprend les réticences de l'IGN à fournir gratuitement ses données à des entreprises privées. Ces systèmes de données interconnectés constituent une menace redoutable pour les libertés. Comment la France peut-elle réagir ? Nous avons aboli les limites. C'est la directive de 2005 qui a posé le principe de réutilisation des données et les redevances initialement prévues ont été quasiment supprimées en 2011. Nous sommes entrés dans une folle logique de fuite en avant, qui supprime toutes les barrières.

Mme Catherine Procaccia. - Si l'IGN, qui est installé dans mon département, avait un statut privé, serait-il contraint de fournir ces données ? D'autre part, la fusion de la Cada et de la Cnil a-t-elle déjà été proposée dans un rapport, et le gouvernement y semble-t-il favorable ?

M. Jacques Chevallier. - Si l'IGN était privé, il conserverait ses données et les ferait fructifier ! Cet organisme public est contraint de livrer gratuitement ses données à des opérateurs privés.

La fusion de la Cada et de la Cnil, comme la fusion d'autorités administratives indépendantes, est un sujet très sensible. J'ai déjà travaillé sur la fusion de quatre AAI au sein du Défenseur des droits. Chacune a sa culture, c'est difficile. Mais la question, même iconoclaste, mérite d'être posée. La protection des données personnelles ne devrait-elle pas être traitée dans un cadre plus général ? Si les rapports sont bons entre ces autorités, des ajustements sont toujours nécessaires. Ainsi, en 1978, la notion d'informations nominatives était interprétée par la Cnil comme des informations identifiant des personnes, tandis que la Cada entendait des informations concernant des données personnelles. L'existence d'un organisme unique pour les données publiques et la protection des données personnelles est presque la règle à l'étranger.

M. Jacques-Bernard Magner. - Si je comprends bien, il s'agissait en 1978 de donner accès aux citoyens aux données qu'ils devaient pouvoir connaître ; aujourd'hui il convient de les protéger contre des dérives comme la diffusion des données personnelles au niveau mondial. Sur Facebook, les gens mettent en ligne de leur propre initiative des informations qui les concernent, et qui sont susceptibles d'être réutilisées à leur insu par d'autres grâce à l'exploitation de fichiers. Le monde est devenu un village interconnecté et certains tirent profit de l'utilisation des fichiers.

M. Jacques Chevallier. - Absolument ! Les lois de 1978 établissaient une distinction entre documents communicables et documents communicables au seul intéressé. Les personnes communiquent spontanément des informations personnelles. Notre colloque a montré que la distinction entre données publiques et données personnelles devient de plus en plus relative : il existe des données personnelles anonymisées, des données personnelles publicisées, etc. Les données personnelles mises en ligne sur les réseaux sociaux sont susceptibles d'être réutilisées dans des fichiers de big data. Ne voit-on pas d'ailleurs dans le monde politique la pratique de Twitter se développer : il y a un palmarès des hommes politiques en fonction de leur utilisation de Twitter ; les hommes politiques et les citoyens échangent par le biais de Twitter...

M. Jean-Jacques Hyest, président. - Les parlementaires feraient mieux d'écouter leurs collègues s'exprimer !

M. Jacques Chevallier. - Les débats parlementaires font ainsi intervenir les citoyens par Twitter interposé.

M. Jean-Jacques Hyest, président. - Ne confondons pas toutefois. Si certains livrent des informations sur internet ou les réseaux sociaux, il n'est pas admissible qu'un citoyen prudent voie divulguer les données le concernant et détenues par les administrations. L'accès aux immatriculations de véhicules, qui était strictement limité aux forces de police dans le cadre d'une enquête, ne l'est plus. La liste des permis de construire délivrés chaque année est affichée publiquement : avec les moyens automatisés, la portée de cette publication change. Le rapprochement entre la Cnil et la Cada a déjà été évoqué. La délégation sur les AAI présidée par Patrice Gélard avait posé la question, qui a ensuite été résolue avec le défenseur des droits.

Mme Corinne Bouchoux, rapporteure. - Nous prendrons l'attache de nos collègues pour coordonner nos conclusions.

M. Jean-Jacques Hyest, président. - Je vous remercie, monsieur le professeur : nous avons bien commencé !

Audition de MM. Serge DAËL, président, et Nicolas POLGE, rapporteur général, de la Commission d'accès aux documents administratifs (Cada)
(jeudi 9 janvier 2014)

M. Jean-Jacques Hyest, président. - La loi qui a créé en 1978 la Commission d'accès aux documents administratifs (Cada) a instauré un véritable droit d'accès aux documents administratifs. C'est le Sénat qui avait placé la Cada au centre du dispositif opérationnel de facilitation de l'accès aux documents administratifs. Nous entendons à présent son président et son rapporteur général. M. Serge Daël, président suppléant de la Cada depuis juillet 2008, en est devenu le président en décembre 2011. Il est conseiller d'Etat honoraire et a été successivement commissaire du gouvernement - ce qu'on appelle maintenant rapporteur public -, président de la cour administrative de Douai et professeur associé à Lille 2, puis président adjoint de la section du contentieux du Conseil d'Etat. Auteur d'un Contentieux administratif, chez Thémis, il a publié en 2011 des Exercices de contentieux administratif.

M. Nicolas Polge est maître des requêtes au Conseil d'Etat, qu'il a rejoint en 2009 ; il y exerce les fonctions de rapporteur public auprès de la cinquième sous-section du contentieux. Rapporteur général adjoint de la Cada à compter du 1er février 2011, et il en est le rapporteur général depuis le 1er octobre suivant.

M. Serge Daël, président de la Commission d'accès aux documents administratifs. - Le professeur Chevallier vous l'a dit, il faut, d'abord, réfléchir au caractère dual de notre système de protection des données, organisé en deux commissions : la Cnil et la Cada. Je ne suis pas favorable à leur fusion, car leurs périmètres sont distincts, et ne se recouvrent que sur la question des données à caractère personnel. Cette question est très importante, mais ne doit pas être le prisme unique à travers lequel la problématique de la transparence administrative est abordée. Les deux commissions ne s'estiment pas en concurrence, en vertu du principe d'unité de l'Etat, bien que deux divergences soient toutefois apparues entre elles. Sur les règles fixées par le code du patrimoine sur la réutilisation des données, nous avons alors laissé la Cnil faire du droit dur dans du droit mou en fixant par une délibération des délais qui auraient pu figurer dans la loi.

Distinguons l'accès aux documents administratifs, leur diffusion et leur réutilisation. L'accès est exclusivement régi par les dispositions de l'article 6 de la loi, qui définissent ce qui est secret et donc accessible par le seul intéressé. En principe, la notion de données à caractère personnel recouvre toute donnée identifiante. Une conception aussi extensive interdirait tout débat public : les noms de MM. Hollande et Sarkozy, par exemple, sont mentionnés tous les jours dans la presse, donc sur internet ; il faudrait demander leur autorisation à chaque fois... Cette notion entre en ligne de compte uniquement dans les règles de diffusion et de réutilisation. La question est alors celle de la frontière entre ce qui appartient au domaine public et le reste. Faut-il donner aux autorités administratives indépendantes compétence pour la tracer ? Les libertés publiques sont en jeu, c'est donc au législateur d'intervenir - ce serait plutôt ma position.

Qu'est-ce qu'un document administratif ? Pour les informations environnementales, le code de l'environnement, transcrivant les directives européennes, le définit comme un document détenu par une personne publique. La loi Cada, quant à elle, le définit comme une information produite ou détenue par une personne publique dans le cadre de sa mission de service public et par une personne privée chargée d'une mission de service public. Cette rédaction visait à codifier la jurisprudence antérieure de la Cada et du Conseil d'Etat, mais l'expression « dans le cadre de sa mission de service public », qui se comprend bien pour une personne privée, est plus embarrassante pour les personnes publiques, dont la quasi-totalité de l'activité est une mission de service public. La jurisprudence antérieure du Conseil d'Etat distinguait selon le régime juridique de l'activité : si celle-ci relevait du droit administratif, on avait un document administratif ; si elle était organisée sous le régime du droit privé, c'est qu'elle était concurrentielle et il n'y avait pas de raison de faire peser sur un service public industriel et commercial des charges dont ses concurrents étaient exemptés.

La solution retenue actuellement fait une synthèse entre cette jurisprudence et la doctrine de la Cada : le régime juridique de l'activité reste le critère pour les services publics industriels et commerciaux dans leurs relations avec leurs usagers et leurs agents. Pour les marchés, nous essayons de déterminer l'étroitesse du lien avec un service public - comme on faisait autrefois pour déterminer si un agent était un agent public ou non. En clarifiant les choses, le législateur réduirait l'insécurité juridique.

Qui sont les bénéficiaires de la loi Cada ? Le code de l'environnement donne actuellement compétence à la Cada sur les litiges entre personnes publiques pour l'accès à une information environnementale. La loi Cada de 1978 était conçue pour le citoyen. La Cada estime que pour cette loi, les contestations entre personnes publiques ne relèvent pas de sa compétence. Il serait possible de faire autrement, la Cada en a la capacité, mais son rôle en serait modifié : elle serait alors au service du citoyen et de celui de la démocratie.

Il me semble que la nouvelle directive sur la réutilisation sera transposée a maxima puisque les politiques actuelles vont au-delà de ses exigences. L'information publique est désormais considérée comme une matière première, et l'on escompte retrouver par l'impôt sur les sociétés ce qui sera perdu dans des redevances difficiles à gérer. La Cada est un organisme consultatif dont les avis, motivés, sont le plus souvent suivis. Voulons-nous lui donner un pouvoir de décision ?

M. Jean-Jacques Hyest, président. - Et de sanction, comme pour d'autres autorités administratives indépendantes.

M. Serge Daël. - La plupart des présidents d'AAI ne demanderaient qu'à obtenir un tel surcroît de pouvoir. Je suis un peu à contre-emploi... La seule question est pourtant de savoir si le système actuel est efficace. Il est concentré sur le coeur de métier, et peu onéreux. Nous n'avons pas les moyens de faire de la stratégie globale, mais notre système d'information est bien conçu, avec un site, une doctrine, une jurisprudence. Que nous semblions jouer petits bras ne condamne pas le système.

Il est possible de donner à la Cada un pouvoir de décision. Cela reviendrait à centraliser et à déresponsabiliser. Puis, il faudra faire exécuter les décisions prises et nous doter d'un service contentieux. Une autre solution, qui aurait ma préférence personnelle, serait de favoriser le recours, dans les cas où les avis de la Cada ne sont pas suivis, au référé administratif, qui est rarement utilisé en raison des deux conditions d'utilité et d'urgence auxquelles il est soumis. Il faudrait créer un référé communication, diffusion et réutilisation qui en serait dispensé. La Cada conserverait alors un rôle consultatif.

M. Nicolas Polge, rapporteur général de la Cada. - En tant que rapporteur général comme en tant que citoyen, je tiens vraiment à ce que les compétences de la Cada ne soient pas étendues aux conflits entre personnes publiques et à ce qu'on ne lui donne pas un pouvoir de décision en matière de réutilisation. L'administration doit être autant que possible au service des citoyens, pas des autres administrations ! Le législateur a été sage d'orienter la Cada vers le service aux citoyens. Les administrations ont les moyens de connaître les termes exacts du droit et de s'entendre à l'amiable, ou d'aller devant le juge. Prévoir une intervention de la Cada dans ces litiges ne ferait que nourrir l'activité de la machine administrative sans profit pour le citoyen.

Les conflits sur la réutilisation ont vocation à se trancher, s'ils persistent, devant le juge. Toutefois, l'introduction de la saisine obligatoire de la Cada à titre consultatif avant la saisine du juge administratif a eu un effet très positif : alors que la Cada traite 5 000 conflits chaque année, le juge administratif n'est saisi que de cinq cents recours. L'intermédiation de la Cada dégonfle le contentieux. Si elle acquérait un pouvoir de décision, cela reviendrait à une centralisation de la gestion de ces conflits, partant à un transfert de charge qui nécessiterait d'allouer des moyens supplémentaires à la Cada, sans économies ailleurs en raison de la parcellisation actuelle de la gestion des contentieux.

Lorsque l'avis de la Cada n'a pas abouti à une résolution du conflit, il faut faire en sorte que le juge statue plus rapidement. Le code de justice administrative prévoit un délai maximal de six mois qui est rarement respecté, ce qui pose problème dans les affaires les plus délicates. Mieux vaut s'attacher aux règles de procédure applicables.

M. Jean-Jacques Hyest, président. - Les conflits entre administrations, qui ne sont pas si nombreux, n'ont pas besoin de passer par la Cada...

M. Serge Daël. - Nous ne sommes pas demandeurs ! Lorsque nous sommes sollicités, nous répondons que la loi de 1978 ne nous donne pas compétence pour les traiter. Ce serait un changement de centre de gravité.

Mme Corinne Bouchoux, rapporteure. - Merci pour cette description de la situation. La Cada traite quelque cinq mille demandes par an. Quels sont les malentendus les plus fréquents ? S'agit-il de cas où l'administration devrait communiquer mais l'ignore ? De problèmes dans les marchés publics ? De contentieux dans l'accès aux listes électorales ? Les rapports annuels de la Cada révèlent qu'elle est un bon observatoire des zones de friction dans l'application de la loi. Dans ce domaine, quels sont les deux ou trois points sur lesquels le législateur devrait prioritairement se pencher ? Enfin, pouvez-vous nous expliquer le concept de vie privée des entreprises ?

M. Serge Daël. - Nous nous efforçons de ne pas dépasser le chiffre de 5 000 demandes d'avis pas an, qui correspond à nos capacités, en utilisant la régulation entre saisine officielle et simple demande de renseignements : nous recevons chaque année 6 000 demandes de renseignements par courrier et une soixantaine de demandes téléphoniques par jour. Nous ne devrions plus être saisis sur certains thèmes, sur lesquels le droit est désormais très clair : marchés publics, permis de construire et urbanisme, dossiers des fonctionnaires, dossier médical... Pourquoi le sommes-nous toujours ? Cela peut résulter de situations conflictuelles, parfois en période électorale, ou de cas où la communication des documents pose des problèmes, par exemple pour de gros marchés publics. Pour un document comme un plan local d'urbanisme intercommunal (Plui), qui n'est pas censé contenir de données nominatives, la meilleure solution est la mise en ligne.

M. Jean-Jacques Hyest, président. - Les questions ne portent plus sur la consultation du document mais sur son processus d'élaboration. Il faut donner accès aux documents préparatoires.

M. Serge Daël. - Ils deviennent communicables une fois la phase préparatoire achevée.

M. Jean-Jacques Hyest, président. - Il y a des spécialistes qui savent faire annuler tout un Plui si la moindre consultation préalable a été omise. Des associations en font parfois marché.

M. Serge Daël. - Les collectivités territoriales doivent faire attention à ne pas laisser dans ces documents de données couvertes par le secret de la vie privée. Une fois que le Plui est approuvé, tous les documents sont communicables. Cela expose, en effet, aux recours contentieux...

Les cas de mauvaise volonté sont rares. Au contraire, les maires de petites communes accomplissent souvent un travail admirable. Plus fréquents sont les cas de simple méconnaissance de la loi, ou encore de trop grand temps de réponse, parfois dû à la difficulté physique de réaliser les copies. Pour tout ce qui ne relève pas du secret de la vie privée, la mise en ligne me paraît la solution idéale : elle libère les personnels de tâches lourdes et coûteuses. Pour les secrets de l'article 6 ou les données à caractère personnel, un traitement individualisé du dossier est toujours indispensable. Il serait allégé si cette nécessité était prise en compte lors de la constitution du dossier, en distinguant ce qui sera communicable et ce qui ne le sera pas.

Mme Corinne Bouchoux, rapporteure. - Quelles demandes vous ont le plus surpris ? L'inventivité des citoyens est souvent plus forte que ce que nous pouvons prévoir...

M. Serge Daël. - On nous a par exemple demandé communication de toute une base de données, ainsi que du programme qui la structurait ! S'agit-il bien d'un document administratif ? Lorsque l'administration crée une plateforme hébergeant des données fournies par des opérateurs, la question se pose de savoir quand ces informations deviennent des informations administratives, produites ou détenues par une administration dans le cadre de sa mission de service public. Nous avons bien éclairci cette question. Il y a aussi, bien sûr, des clients d'habitude.

Nicolas Polge. - Compte tenu de l'objectif de transparence fixé par la loi du 17 juillet 1978, aucune demande raisonnablement motivée par le souci de comprendre l'action de l'administration ne me surprend. Les demandes qui semblent le plus baroques sont souvent motivées par des conflits entre individus : une des parties cherche à obtenir des informations sur l'autre. C'est notamment le cas pour des conflits intrafamiliaux, dont la violence se ressent dans le caractère insistant de la demande. En général, les informations demandées ne sont pas communicables, car elles mettent en cause la vie privée. L'intervention de la Cada a souvent un rôle apaisant dans ces affaires.

La vie privée des entreprises est une notion apparue récemment dans la jurisprudence du Conseil d'Etat. En 2013 la Haute juridiction a considéré dans une décision qu'un document relatif à l'adhésion d'une entreprise à un syndicat professionnel était couvert par le secret de la vie privée. Jusqu'alors, la notion de vie privée était appliquée aux personnes physiques. Pour les personnes morales, on utilisait la notion de secret industriel et commercial ou celle de secret des affaires qui couvrait le secret des stratégies. La Cour européenne des droits de l'homme (CEDH) avait précédé le Conseil d'Etat, en jugeant que la protection du domicile s'appliquait aux entreprises. Désormais, le respect de la vie privée prévu à l'article 6 de la loi de 1978 ne concerne pas seulement les personnes physiques mais aussi les personnes morales. S'agit-il d'une régression par rapport à la doctrine de la Cada sur la transparence ? Dans la plupart des cas, cela ne créera pas de nouveaux secrets. Certains sujets cependant pourront sans doute être couverts, qui ne l'étaient pas par le dispositif antérieur : il y aura une légère perte de transparence.

M. Serge Daël. - Pour la Cada, il y a une vie privée des entreprises, qui ne saurait toutefois être confondue avec celle des personnes privées.

M. Nicolas Polge. - Comme la Cada l'a déjà signalé, il serait bon que le législateur règle des problèmes que la jurisprudence laisse irrésolus. Le premier est l'articulation entre la loi de 1978 et l'un des plus anciens régimes spéciaux, qui avait été mis en place en 1884 pour les communes. Ce régime permet à toute personne de recevoir communication et de publier nombre de documents émanant des collectivités territoriales. Le législateur n'ayant jamais ajouté la moindre réserve à ce texte, la Cada a toujours considéré que, contrairement aux dispositions de la loi de 1978, les documents couverts par le code général des collectivités territoriales étaient systématiquement communicables. Le Conseil d'Etat l'a désavoué en 2010 dans une décision Commune de Sète, en considérant que si le législateur avait donné un droit d'accès à certains documents des collectivités territoriales, il n'avait pas pour autant entendu rendre communicables certaines mentions, en l'espèce des appréciations d'ordre individuel sur des agents publics. Les limites de ce droit d'accès ne sont toujours pas définies, ce qui place la Cada dans l'embarras. Elle a considéré que d'autres secrets devaient être pris en compte : secret médical, secret de la vie privée... Il conviendrait de clarifier l'intention du législateur.

Le deuxième concerne le code électoral et l'accès aux listes électorales. Il est primordial que les citoyens puissent vérifier qui a voté et qui en a le droit. Tout électeur peut obtenir copie intégrale de la liste électorale de toute circonscription. Or, ces listes comportent, outre les noms des électeurs, leurs dates de naissance et adresses postales. Ce sont des données sensibles, comme en témoignent les demandes qui émanent de sociétés commerciales. Le code électoral pose pourtant une limite : celui qui obtient communication de la liste doit s'engager à ne pas en faire un usage purement commercial. Mais aucune sanction n'est prévue. Tout usage autre que purement commercial est-il légitime ? Les seuls usages légitimes sont le contrôle du vote et la communication politique, - la Constitution prévoit que les partis politiques concourent à l'expression du suffrage. Or, de nombreux généalogistes utilisent ces listes. Le législateur pourrait restreindre les motifs pour lesquels il est possible d'y avoir accès, et instituer une sanction en cas de détournement de cet objectif.

M. Serge Daël. - Le code électoral ouvre une brèche énorme, puisqu'on peut prendre copie des listes. Le législateur devrait se saisir de la question du code général des collectivités territoriales (CGCT) ; nous avons parlé de la loi de 1884, mais en réalité, comme l'indique le rapport annuel du Conseil d'Etat pour 2012, cette ouverture remonte à 1789. Il y a deux types de secrets : ceux qui protègent l'État et ceux du II de l'article 6, que, contrairement à ce qu'on pourrait croire, la loi de 1978 n'a pas créés mais rappelés ; si la loi était abrogée, le secret médical ou le secret de la vie privée demeureraient. Le CGCT a-t-il entendu déroger à ces règles générales ? Les délibérations, visées initialement, ne comprennent pas de données personnelles, à la différence des pièces annexes et de la comptabilité, qui en regorgent. Au point où on en est, il n'y a plus lieu de distinguer les collectivités territoriales et les autres acteurs, à moins de faire preuve d'une suspicion particulière pour les administrations locales... L'équilibre de 1978 est bon ; les secrets qu'il protège sont les mêmes que ceux que protège la Cour de Strasbourg.

Mme Gisèle Printz. - Etes-vous souvent consultés sur l'application du droit local d'Alsace-Moselle, qui diffère sur la chasse, la sécurité sociale, les jours fériés ou les associations ?

M. Serge Daël. - Je suis en fonctions depuis 2011 et je n'en ai pas eu connaissance.

M. Nicolas Polge. - La Cada n'est pas compétente pour répondre à des questions d'interprétation du droit, mais seulement sur l'accès aux documents. Il arrive en revanche qu'elle découvre, à l'occasion de demandes, des documents qui existent uniquement dans les trois départements de l'Est.

Mme Catherine Procaccia. - Vous parlez de 5 000 saisines par an... ?

M. Serge Daël. - Nous recevons 5 000 demandes officielles - majoritairement des demandes d'avis en cas de refus de communication d'un document, ainsi que 70 demandes de conseil - mais il faut y ajouter 6 000 demandes de renseignement, sans compter les appels téléphoniques. Nous sommes souvent saisis en dehors de notre compétence, comme sur les actes notariés.

Mme Catherine Procaccia. - Une meilleure information éviterait-elle une partie de ces 6 000 demandes ? Autour de moi, alors que je vis dans un monde privilégié, personne ne connaît la Cada. Si elle était plus connue, vous seriez submergés !

M. Serge Daël. - Lorsque je parle de mon activité, je vois bien sur le visage de mes interlocuteurs que la Cada n'est pas très connue. Son site internet comporte pourtant une information très complète, le guide édité à la Documentation française il y a quelques années est encore valable à 95 %, nous publions une lettre et comptons 1 500 correspondants. Faute de moyens, nous n'organisons pas de manifestations de prestige : pas de réunion au Palais des congrès, pas de battage. C'est pour cela que nous ne coûtons pas cher. Si quelqu'un me demande un exemple de ces documents auxquels nous garantissons l'accès, je parle des documents d'un marché public passé par une collectivité, qu'un concurrent voudrait consulter - ah bon c'est consultable, me répond-on... Si les gens savaient combien de documents le sont, nous serions submergés. Je ne m'en plains pas. Nous ne multiplions pas les colloques internationaux : Nicolas Polge s'est rendu à un congrès à Berlin, c'est tout. Nous ne rendons pas visite à toutes les Prada, personnes ressources pour l'accès aux documents administratifs.

Mme Catherine Procaccia. - Tout cela se passe par internet, aujourd'hui.

M. Serge Daël. - C'est une administration rudimentaire ; mais nous obtenons un service pas idiot pour un coût pas démesuré.

Mme Catherine Procaccia. - Un nouveau service informe sur les ventes immobilières sur un territoire donné. Evaluez-vous le risque de surcharge de travail qui pourrait en découler, comme d'autres nouveautés, telles que la publication du patrimoine des élus en préfecture ou le redécoupage des cantons ?

M. Serge Daël. - Nous n'en avons pas les moyens.

M. Jean-Jacques Hyest. - Cela pourrait figurer dans l'étude d'impact...

M. Serge Daël. - Ce nouveau service est une bonne chose : les assujettis à l'ISF évalueront leur bien aisément. Il est vrai qu'auparavant, ils pouvaient pour un coût modéré procéder à une réquisition à la conservation des hypothèques. C'est de la compétence de la Cada, mais il n'y a pas de litige. Si une vente n'est pas répertoriée, cela peut être parce que le service ne prend pas en compte les opérations non représentatives, et l'usager a toujours la faculté de s'adresser à la conservation des hypothèques.

M. Jean-Jacques Hyest. - Je vous remercie. Nous aurons sans doute recours à vous de nouveau à l'avenir.

M. Serge Daël. - Nous sommes à votre entière disposition.

Audition de M. Paul HÉBERT, chef du service des affaires juridiques de la Commission nationale de l'informatique et des libertés (Cnil), et de Mme Delphine CARNEL, juriste (jeudi 9 janvier 2014)

M. Jean-Jacques Hyest, président. - Nous accueillons maintenant M. Paul Hébert, avocat spécialisé dans le droit des nouvelles technologies devenu chef du service des affaires juridiques de la Commission nationale de l'informatique et des libertés (Cnil), accompagné de Mme Delphine Carnel, juriste au sein de ce service. La question de la vie privée et des données nominatives n'est pas au coeur de nos travaux ; une mission d'information de la commission des lois examine en ce moment la problématique de l'open data et de la protection de la vie privée. Pour autant, les compétences de la Cnil et leur articulation avec celles de la Cada sont bien au centre de nos préoccupations.

M. Paul Hébert, chef du service des affaires juridiques de la Cnil. - Les missions de la Cnil - veiller au respect de la loi Informatique et libertés - revêtent deux formes : celles d'un contrôle a priori et d'un contrôle a posteriori du traitement de données à caractère personnel au sens large, puisqu'il peut s'agir de leur collecte, de leur utilisation ou de leur transmission par les réseaux. Elle n'est pas concernée en l'absence de données à caractère personnel, lorsqu'il s'agit de données économiques ou météorologiques par exemple.

Le contrôle a priori varie selon le degré de sensibilité de l'information. L'avis - régime intermédiaire - est le plus fréquent pour les données administratives : selon l'article 26 de la loi, le traitement de données intéressant la sûreté de l'Etat, la défense ou la sécurité publique est soumis à un arrêté après avis de la Cnil - il faut un décret en Conseil d'Etat pour les données à caractère sensible (religion, vie sexuelle...) ; cela inclut les téléservices comme mon.service-public.fr. L'autorisation, régime plus restrictif puisque le silence vaut alors refus, s'applique généralement à la sphère privée : biométrie, santé (chapitres IX et X de la loi), ainsi que les transferts de données hors de l'Union européenne vers des pays n'ayant pas de législation protectrice en ce domaine ; cela peut concerner des documents publics numérisés par des sociétés ayant leur siège à l'étranger.

Ces formalités sont de plus en plus simplifiées depuis 2004 : les dispenses pour les collectivités territoriales sont de plus en plus nombreuses, comme pour le matériel électoral ou les fichiers de paie ; des déclarations simplifiées ont été mises en place pour les demandes fréquentes ; sur la diffusion des archives en ligne, la Cnil a fait oeuvre de droit mou en mettant une place l'autorisation unique qui fixe un cadre et dispense les administrations de demander formellement une autorisation. Toutes ces formalités sont dématérialisées. Le correspondant Informatique et libertés, créé en 2004, est un personnage important - un service spécifique est consacré à ce réseau de 3 704 correspondants couvrant 13 000 organismes, certains, comme les huissiers et les notaires, mutualisant leurs correspondants. Il y en a de plus en plus dans la sphère publique : autour de 500. Chaque formalité s'accompagne de flux importants de demandes de conseils. La Cnil y répond, édite des guides mis en ligne, comme sur le droit d'accès ou sur la réutilisation des données publiques, en coopération avec le Conseil d'orientation de l'édition publique et de l'information administrative (Coepia). Elle rend aussi des avis sur des projets de décret ou de loi, ainsi, dernièrement, sur la transparence de la vie publique.

Le contrôle a posteriori se renforce, en contrepartie de l'allègement du contrôle a priori. La proposition de règlement européen sur la protection des données personnelles actuellement en discussion alourdirait encore les sanctions. Sur pièces et sur place selon la loi, ce contrôle est le plus souvent sur place. De 40 contrôles en 2004, principalement en Ile-de-France, la Cnil est passée à 450 contrôles sur l'ensemble du territoire national en 2012. L'article 48 bis du projet de loi sur la consommation ouvre la possibilité de faire des contrôles en ligne pour constater une violation de sécurité, par exemple : la Cnil pourrait dresser un constat probant en cas de faille dans fichier d'entreprise, par exemple.

Mme Catherine Procaccia. - Avez-vous des hackers ?

M. Paul Hébert. - Notre service de contrôle, atypique en Europe, compte, autant d'ingénieurs et d'informaticiens que de juristes. La loi Godfrain nous interdit de pirater un site, mais nous pouvons établir des constats.

Le droit d'accès tel que nous le connaissons est différent de celui de la Cada. Le droit d'accès direct est le plus utilisé. Défini à l'article 39, il s'applique aux données propres à chacun mais nécessite l'occultation des données personnelles des autres. Toute demande de copie de ces données - pour laquelle la Cnil a créé des modèles de courrier - doit être honorée dans un délai de deux mois ; elle est sinon considérée comme rejetée. Les données doivent être intelligibles, les sigles et abréviations étant au besoin explicités dans un lexique. Sur 4 800 plaintes, 555 portent sur le droit d'accès.

M. Jean-Jacques Hyest, président. - Dans quel domaine ? S'agit-il du fichier du Système de traitement des infractions constatées (Stic) ?

M. Paul Hébert. - Le Stic entre dans l'autre catégorie : le droit d'accès indirect, qui concerne les fichiers intéressant la sûreté de l'Etat, la défense et la sécurité publique - fichiers de police judiciaire, fichier Schengen, fichiers des détenus ou même fichier national des comptes bancaires et assimilés (Ficoba), tenu par la direction générale des finances publiques par exemple. Chacun a le droit de savoir s'il y est référencé, de corriger, voire de se voir communiquer - en accord avec le responsable du traitement et si elles ne mettent pas en cause la sécurité de l'Etat - les informations qui y figurent. Avec 4 305 demandes, nous assistons à une hausse de 17 % en 2013, due en grande partie à des demandes concernant le Ficoba, suite à une décision du Conseil d'Etat du 29 juin 2011.

Le droit d'accès est un sujet mineur pour la Cnil qui s'intéresse d'abord à la personne publique productrice des données, et non à leur réutilisation. Mais des problèmes d'articulation surviennent lorsque les données publiques contiennent des données personnelles, car elles entrent dans le champ de l'article 13 de la loi Cada. Une demande de consultation d'un document d'archive, par exemple, ne relève pas de la Cnil, mais du code du patrimoine et de la Cada, sauf s'il est mis en ligne ou numérisé par une entreprise : il y a alors traitement de données à caractères personnel et cela requiert l'autorisation de la Cnil si cette utilisation est faite à d'autres fins qu'historiques ou statistiques. C'est pourquoi elle a émis une recommandation qui trace un cadre pour ce cas et mis en place une autorisation unique. Dès qu'un document est sur Internet, les moteurs de recherche peuvent l'indexer, ce qui équivaut à une publication.

Il ne faut pas surestimer les difficultés techniques de ces cas. La Cnil a mené en juillet dernier un séminaire sur les enjeux de l'open data, dont le compte rendu détaillé, mis en ligne, a donné lieu à une consultation dont l'analyse vient d'être mise en ligne. Les constats ont été les suivants : les jeux de données ouverts comptent rarement d'informations à caractère personnel, et lorsque c'est le cas, elles présentent peu de risques pour les individus, quoiqu'indirectement identifiantes. En revanche, les acteurs ne sont pas très au fait de la problématique de la vie privée : ils ne savent pas ce qui est identifiable ni comment l'anonymiser. On constate même une certaine frilosité, voire une instrumentalisation de la législation de protection des données personnelles pour en mettre le moins possible en ligne. Nous manquons également d'outils didactiques et de techniques d'anonymisation. Un sous-groupe du G29, l'organisme qui regroupe la Cnil et ses homologues européens, travaille sur la question. Nous avons encore besoin de guidelines pratiques pour encadrer ce mouvement qui revêt un intérêt économique important.

Mme Delphine Carnel, juriste. - Les deux droits d'accès, à mes données ou aux données de la société dans laquelle je vis, sont complémentaires. L'obligation d'information n'est pas suffisamment respectée. L'objectif de transparence pour comprendre les prises de décisions devrait inciter à constituer des répertoires de données et à présenter les modalités pratiques pour y avoir accès. Chaque administration devrait faire un état des lieux de ses jeux de données avant de les ouvrir, ainsi pour les listes électorales. Paradoxe de la visibilité, nous ne savons pas jusqu'où aller pour rendre publiques des informations ou communicables des données personnelles qui intéressent tout un chacun, comme les contribuables qui ont intérêt à connaître les données du marché immobilier. Pour prendre un cas extrême, est-il utile de connaître jusqu'au groupe sanguin des électeurs pour contrôler la régularité d'un scrutin ?

Nous devons faire face à la massification des demandes d'accès, des données et des outils utilisés par le secteur public. Mes interlocuteurs, les responsables de traitement, sauf certains très en retard ou très en avance, sont dans une pratique empirique qui dépend de la manière dont se sont constitués leurs outils. La logique système doit être repensée, de la chaîne de production - coeur de métier de la Cnil - jusqu'à l'accessibilité ou à l'ouverture à un plus large public.

Mme Corinne Bouchoux, rapporteure. - Nous voyons bien la complémentarité et les zones de friction qui peuvent exister entre Cnil et Cada. Nous aimerions avoir des précisions sur la typologie des 555 demandes sur le droit d'accès. De mémoire, la coexistence aimable entre les deux commissions est favorisée par la présence d'un représentant de la Cnil à la Cada. Vous rencontrez-vous tous les ans ? Le professeur Jacques Chevallier posait la question d'une fusion entre les deux institutions. Qu'en pensent les responsables de la Cnil ? L'accès aux documents administratifs, c'est de la préhistoire ; la Cnil est compétente dès lors que les données sont informatisées. Avez-vous identifié des zones de friction sur lesquelles le législateur devrait se pencher ? Bientôt, il n'y aura plus de documents administratifs comme on l'entendait jadis, ce qui pourrait poser des problèmes aux juridictions administratives...

M. Jean-Jacques Hyest, président. - Ils existeront sous une autre forme : un permis de construire est un permis de construire, même s'il est regroupé dans des big data.

M. Paul Hébert. - Nous apporterons des réponses écrites sur les questions auxquelles nous ne pouvons pas répondre. Il y a une réelle collaboration entre Cnil et Cada. Deux commissaires de la première - le président Massot et M. de Givry - siègent à la seconde. Une convention de services passée dans les années 1980 et actualisée régulièrement régit nos rapports : si une plainte concernant le droit d'accès est mal aiguillée, les services la renvoient à la bonne institution.

M. Jean-Jacques Hyest, président. - Vous avez évoqué l'évolution de la législation européenne. La commission des lois du Sénat s'est inquiétée d'un éventuel affaiblissement de la protection. Qu'en pense le Groupe européen des autorités de protection dont fait partie la Cnil ?

M. Paul Hébert. - Un projet de règlement européen est en cours de discussion - je ne sais s'il aboutira très rapidement. Il modifierait considérablement l'économie du système en diminuant les formalités, mais en multipliant les missions d'accompagnement et de conseil pour aider les entreprises et les administrations à avoir une démarche par risque. Pour les fichiers les plus sensibles, les institutions de protection seront consultées. Des changements majeurs interviendraient dans la façon d'appréhender la vie privée.

Mme Delphine Carnel. - Notre outil informatique ne nous fournit pas des statistiques par type de plainte, mais il doit évoluer. Nous vous les communiquerons après les avoir extraites manuellement. Pour illustrer la collaboration entre Cada et Cnil, les recommandations de cette dernière sur les archives et leur réutilisation ont bénéficié des nombreuses réunions tenues à propos de ce qui est devenu le litige NotreFamille.com, site qui réutilise les données d'état-civil à visée généalogique pour alimenter un business model. On peut encore citer la révision de la directive sur la réutilisation des informations du secteur public, pilotée depuis 2011 par le secrétariat général aux affaires européennes avec la mission Etalab, avec qui nous collaborons. Plusieurs définitions restent en effet en suspens : qu'est-ce qu'une donnée rendue publique, quid d'une donnée fournie sur Facebook, l'affichage d'un ban de mariage sur la porte de la mairie pour garantir les droits des tiers ou faire valoir les empêchements autorise-t-il leur réutilisation pour une autre finalité ? Les présidents des deux commissions ont adressé une lettre commune au directeur d'Etalab pour avoir des réponses à cet égard. Une donnée même accessible, si elle identifie une personne reste à caractère personnel. Certes, la loi Informatique et libertés autorise de nombreuses modulations pour faire vivre l'article 13 de la loi de 1978 qui renvoie à la loi Informatique et libertés après avoir pris soin d'insérer la notion de consentement, d'anonymisation ou de régime spécifique autorisant la publication. Ces principes sont-ils spécifiques, doivent-ils être entendus étroitement ou plus largement ? Ces articulations doivent être peaufinées pour faire face à la massification des accès et des données.

M. Jean-Jacques Hyest, président. - Je vous remercie pour les précisions que vous nous avez apportées.

Audition de MM. Benoît THIEULIN, président, et Godefroy BEAUVALLET, vice-président, du Conseil national du numérique (CNnum) (jeudi 16 janvier 2014)

M. Jean-Jacques Hyest, président. - Nous auditionnons les représentants du Conseil national du numérique, MM. Benoît Thieulin, président, Godefroy Beauvallet, vice-président, Jean-Baptiste Soufron, secrétaire général, Mme Mathilde Bras, rapporteure adjointe, et M. Dimitri Barclais, rapporteur adjoint stagiaire, pratiquement un an jour pour jour après qu'un décret du 17 janvier 2013 a réorganisé le Conseil national du numérique. Après avoir rappelé le rôle du Conseil, en particulier dans le domaine des services publics et de la vie citoyenne, nous souhaiterions que vous nous exposiez ses principaux constats et recommandations en matière de diffusion et de réutilisation des données publiques.

M. Benoît Thieulin, président du Conseil national du numérique. - Le Conseil national du numérique est une institution encore jeune, créée par le précédent Président de la République. Réinstallé début 2013 sans que son objet soit vraiment modifié, il a vocation à constituer une interface entre les décideurs publics et le monde du numérique, fonction importante dans la phase de transition du numérique que nous traversons, caractérisée par une dynamique d'innovation particulièrement forte qui soulève sans cesse de nouvelles problématiques. Alors qu'il y a peu d'interlocuteurs stables en la matière, le Conseil accompagne les décideurs publics sur ces questions. Sa composition est paritaire, originalité qui mérite d'être soulignée. La diversité d'origine de ses trente membres, issus des opérateurs numériques, de PME, d'universités, de think tanks et d'associations, qui siègent tous intuitu personae, reflète la diversité du monde du numérique et enrichit ses avis. En 2013, le Conseil a réfléchi sur la neutralité de l'internet, la fiscalité numérique, l'inclusion numérique, la neutralité des plateformes ; il s'intéressera prochainement aux données de santé. Dans plusieurs de ses avis, il a eu l'occasion de se pencher sur les problématiques d'ouverture des données, privées ou publiques. Le sujet de la fiscalité du numérique, sur lequel a travaillé Godefroy Beauvallet, s'est avéré tout particulièrement intéressant, notamment en raison de l'existence de grandes plateformes qui font de l'optimisation fiscale. Nous préconisons davantage de transparence sur la réalité de ce qu'elles paient et surtout davantage de transparence sur leur utilisation, ce qui rejoint une problématique de gouvernance ouverte que l'on retrouve à propos des données publiques dans la relation des citoyens avec les institutions publiques : nous sommes aujourd'hui dans une forme de dialectique entre cette gouvernance ouverte, qui engendre de nouveaux types de relations, et des mouvements d'amélioration de la qualité des services, parce qu'elle donne de la visibilité à la société civile sur les conditions d'engagement - et de réduction - des dépenses publiques.

Un mouvement inverse commence à émerger avec les données en masse, les big data, qui renvoie à des problématiques d'externalité et de création de nouveaux types de services et donc d'entreprises, avec en toile de fond des enjeux sensibles. La multiplication des données ouvertes, le traitement en masse et la finesse accrue des analyses, dans le contexte de l'affaire Snowden qui contribue à éveiller les consciences des citoyens, ont en effet des conséquences pour les individus. Dans un monde qui s'est fortement numérisé, il convient de trouver un nouvel équilibre, tout à la fois en poussant à la gouvernance ouverte et en assurant la protection des données personnelles et de la vie privée.

M. Godefroy Beauvallet, vice-président du Conseil national du numérique. - L'approche économique de la donnée publique doit être prise en compte, autrement dit la question de savoir qui doit payer. Il n'apparaît pas qu'il faille systématiquement rechercher le paiement par l'utilisateur, à l'utilisation. En effet, une valorisation à l'acte, par un paiement à l'utilisation, de cette externalité positive de la production des données publiques, est très malthusienne. Ainsi que le préconise le rapport Trojette, il faut passer d'une logique ex ante à une logique de liberté qui permette d'expérimenter des cadres de réemploi, approche qui percute de fonds la démarche traditionnelle des producteurs de données publiques. La puissance publique doit se donner un objectif d'activation de ces données plus qu'un objectif de valorisation de celles-ci. La démarche d'Etalab, l'opérateur essentiel dont les missions stratégiques ont été reformulées, semble d'ailleurs aller dans ce sens.

La puissance publique pourrait se donner un devoir d'innovation pour inventer de nouvelles modalités d'utilisation de ses données par les citoyens, dans le prolongement du principe de mutabilité, et explorer de nouvelles manières d'utiliser les données qu'elle produit au service des citoyens. Sinon d'autres le feront à sa place, et ce ne sera pas nécessaire au service du modèle social auquel nous sommes attachés. Dire que ces données qui servent à la décision publique sont valorisées par leur utilisation par d'autres administrations est pour le moins contestable d'un point de vue comptable.

Autour de la notion d'information publique, les textes évoquent tantôt des données publiques, tantôt des documents administratifs qu'ils regardent différemment : il y a là matière à des clarifications juridiques. Les modalités de mise à disposition des données sont également importantes : celles-ci pourraient notamment être rendues accessibles sous une forme algorithmique lorsque, comme en matière de calcul des cotisations sociales sur les fiches de paie, elles sont mises en oeuvre sous cette forme.

M. Benoît Thieulin. - Le rapport Trojette a été effectivement très apprécié par le Conseil national du numérique. Quant à la démarche d'Etalab, elle a considérablement progressé dans une approche très collaborative avec son nouveau site data.gouv.fr. La France pourrait ainsi reprendre la tête de ce mouvement d'ouverture des données.

Pionnière parmi les grands pays en 1978 dans le champ des libertés et de l'informatique avec la création de la Cnil, la France a été plus timide, la même année, en matière d'accès aux documents administratifs. Inspiré du Freedom of information Act américain de 1966, le rôle de la commission d'accès aux documents administratifs (Cada), en dépit de plusieurs révisions législatives, reste en deçà de celui de ses homologues américaines, britanniques ou européennes. La France doit changer de paradigme en la matière, à l'image du récent revirement sur la portée du silence de l'administration qui vaut désormais acceptation.

M. Jean-Jacques Hyest, président. - La portée effective de cette réforme devra être mesurée. La démarche avait déjà été tentée mais les administrations ont repris le contrôle !

M. Benoît Thieulin. - La même démarche d'inversion du principe devrait être engagée par le Parlement en matière d'accès aux données publiques : l'accès doit devenir la règle et le non accès l'exception. La France retrouvera ainsi sa position de tête dans cette nouvelle ère des gouvernances ouvertes, comme en 1978. Le Conseil supérieur du numérique s'est récemment autosaisi de l'article 13 du projet de loi de programmation militaire et a proposé une approche mesurée en appelant à une réflexion globale sur la transformation numérique en vue de réviser ces problématiques qui n'ont plus été examinées depuis la loi pour la confiance dans l'économie numérique de 2004 ; il vient de décider d'organiser une grande concertation sur la question de la transformation numérique qui met en jeu des libertés et soulève certaines questions juridiques.

La démarche doit s'inscrire à plusieurs niveaux : une nouvelle loi nationale, le projet de règlement européen sur les données personnelles que la France doit prendre l'initiative de relancer auprès de la nouvelle Commission européenne, un traité international enfin, dans la mesure où la gouvernance ouverte a un impact sur la manière dont travaillent les entreprises qui se trouvent dorénavant confrontées à des données sensibles. Si la NSA peut être victime de fuites, qu'en est-il alors pour les entreprises et les administrations ? Des initiatives ont été prises en ce sens par le Brésil et l'Allemagne, auxquelles la France pourrait apporter sa contribution.

M. Godefroy Beauvallet - L'inversion du paradigme ne constituerait pas seulement un progrès historique de l'ouverture des sociétés ; elle répondrait également à une nécessité pour la crédibilité des politiques publiques. La récente polémique sur les chiffres du chômage fournis par l'ANPE, suite aux difficultés d'un opérateur, a eu des conséquences sur la crédibilité des acteurs pris dans la controverse ; or la confiance dans la parole des autorités publiques est l'une des bases de la démocratie. Le récent débat entre le ministre de la santé et l'ambassadeur de Grande-Bretagne en France sur l'efficacité comparée des dispositifs d'assurance santé montre que le pays qui peut aligner le plus de données ouvertes, et donc vérifiables par les fast checkers, est le plus crédible. Il en va de la crédibilité extérieure de la France vis-à-vis de ses partenaires et de sa crédibilité interne vis-à-vis de ses citoyens.

M. Benoît Thieulin. - La dégradation du débat public et le scepticisme de nos concitoyens sont chaque jour repris par les commentateurs qui font valoir que les chiffres ne disent que ce qu'on leur fait dire. Il faut impérativement pouvoir disposer de données fiables et accessibles, susceptibles d'être vérifiées par des organismes indépendants, - think tank, associations, ONG -, afin de reconstruire davantage de lien, de recréer la confiance entre les représentés et les représentants, et de renforcer les bases du débat public.

M. Godefroy Beauvallet. - Ce qui est remis en cause par le numérique, c'est la fiabilité. Les institutions ne sont plus regardées comme naturellement fiables. Les grandes plateformes numériques sur lesquelles les citoyens s'expriment ainsi que les personnes qui ont des enjeux de réputation donnent une opinion agrégée, mais celle-ci n'est probablement pas suffisante. Il est indispensable de recréer de la vérifiabilité et de mettre à la disposition du public, des médias, des chercheurs et des associations, des liens hypertextes, des algorithmes, des logiciels libres et les outils de calcul des administrations. Dans le monde de la recherche par exemple, Thomas Piketty, qui veut faire bouger le débat sur la fiscalité, a dû créer un site qui permet de simuler l'impôt et qui est probablement le duplicata de celui qui existe au ministère des finances : un seul modèle ouvert et vérifiable par tous serait de loin préférable. Nous appelons à un changement de paradigme dans la conception que l'Etat a de ses données. Il y aurait tout à y gagner et le modèle serait probablement meilleur. De manière générale, les chercheurs sont très gênés par l'absence d'accès aux données publiques et, s'il y a plus de travaux de recherche économique sur les Etats-Unis, c'est parce que les données sont disponibles.

M. Benoît Thieulin. - La simple ouverture des données ne suffit pas : il faut également simplifier l'accès et la réutilisation, assurer la qualité des données et la stabilité de leur structuration. Sur ce dernier point, je signale qu'un chercheur qui a mis en place un observatoire à partir des données de l'Insee m'a indiqué constater que depuis qu'il avait connaissance de ses travaux, l'Insee modifiait ses jeux de données tous les mois, ce qui n'en facilite pas le suivi.

Il faut se préoccuper de la bonne structuration des données et des API pour que le droit d'accès aux données soit effectif. Les pouvoirs publics doivent accompagner le passage vers une économie de plateforme. Les Etats-Unis ont décliné ce concept notamment pour les données publiques -Government as a Plateform. L'Etat ne rend plus seulement des services mais devient un facilitateur, met à disposition des données et des services que d'autres utilisateurs publics ou privés se réapproprient ensuite pour réinventer un certain nombre de services. Il convient d'ouvrir la voie à une approche plus collaborative afin de permettre l'émergence de nouveaux services innovants, qui ne relèvent pas nécessairement du domaine marchand, en développant une coopération entre le secteur public et la société civile. Cette prise de conscience est à l'origine de l'évolution des ambitions et des objectifs de l'IGN qui a fait le choix stratégique majeur d'un rapprochement avec le mouvement d'Open street map. On ne peut que souhaiter la généralisation de telles démarches.

M. Jean-Jacques Hyest, président. - De nombreuses informations et données sont mal comprises, notamment en matière de justice et de sécurité, et suscitent de ce fait des polémiques permanentes. A la base, les données ne sont pas homogènes et l'on connaît la qualité des outils statistiques et informatiques de la Chancellerie !

M. Godefroy Beauvallet. - La mise en cartes des données de criminalité a été effectuée notamment aux Etats-Unis, - le crime mapping -, qui corrèle délinquance et localisation géographique. En pratique, les citoyens adoptent un niveau de zoom dans la carte qui correspond à leur sentiment d'insécurité, ce qui ne fait que le confirmer. Il est donc important que la puissance publique suive les lectures qui sont faites des données qu'elle met en ligne et contribue activement à leur interprétation, même si elle ne doit pas en avoir le monopole. Les administrations pourront ainsi progresser dans leur compréhension des attentes du public. Elles ont en effet un devoir d'information et de formation des citoyens pour ne pas servir des objectifs dommageables à la cohésion sociale.

Mme Corinne Bouchoux, rapporteure. - Comment pensez-vous que l'on puisse réduire la fracture culturelle et générationnelle entre ceux qui ont conscience des enjeux que vous venez d'évoquer et ceux qui ne comprennent même pas le sujet ? Il y a d'un côté une demande des jeunes qui maîtrisent les nouvelles technologiques et qui veulent discuter du changement de société qui se profile, - je suis sollicitée tous les jours par des associations et des classes pour intervenir-, et de l'autre, en raison peut-être de l'âge ou de la formation, toute une partie de la population qui ne voit pas l'importance du débat alors que nous sommes à un carrefour sociétal aussi fondamental que celui du choix du nucléaire effectué par la France. Comment faire en sorte que ces deux catégories de populations se rencontrent sur ce sujet majeur ?

Le public s'interroge également sur les risques inhérents à ces nouvelles technologies, préoccupations relayées par exemple hier soir à l'issue d'une conférence au Mans sur la restitution des biens spoliés à propos des risques que fait peser l'accessibilité croissante des données publiques lorsque la démocratie est en menacée.

M. Benoît Thieulin. - L'importance de l'enjeu se situe effectivement au même niveau que la question nucléaire. Le défaut de culture scientifique en France que vous relevez est récent et doit être corrigé. Dans un pays qui a une grande tradition d'ingénieurs et d'inventeurs, cette évolution est préoccupante. Or les choses peuvent être redressées : Israël a ainsi multiplié par 8 le nombre de ses ingénieurs en 15 ans grâce à une politique volontariste. De manière plus générale, on constate une forme de déconnexion de nos élites, qui ont au surplus des difficultés à se renouveler et à passer la main à des générations plus jeunes. Il est pourtant nécessaire d'introduire de la diversité dans la haute fonction publique comme dans les grandes entreprises, et de renforcer la part de la culture scientifique dans leur formation. L'opinion publique, elle, prend conscience des enjeux et, comme le montre l'affaire Snowden, pose la question de la confiance et de la durabilité de l'économie numérique. Les usages possibles des données préoccupent également la population, même si tous ne se sentent pas aujourd'hui concernés.

Le Conseil national du numérique a récemment travaillé avec Valérie Peugeot, qui est l'un de ses vice-présidents, dans le cadre de la préparation de son rapport sur l'inclusion numérique, rapport qui fera date et qui développe le concept de littératie numérique. Bernard Stiegler, qui est également membre du Conseil, dit souvent que la mutation numérique équivaut, à l'échelle de l'humanité, au passage de la culture orale à la culture écrite. D'où la notion de littératie numérique, qui pose la question des clés et des usages de la connaissance des nouveaux usages de l'information et permet de battre en brèche l'idée selon laquelle les digital natives, les générations nées avec l'économie numérique, se trouveraient parfaitement à l'aise dans ce nouvel environnement. La question de l'enseignement est déterminante à cet égard : il faut faire réfléchir les jeunes sur les conséquences que peuvent avoir leur usage au quotidien des moyens sociaux. Le président Obama est ainsi intervenu dans une vidéo destinée aux enfants des écoles pour les inciter à réfléchir sur ce qu'ils mettent en ligne et aux conséquences pour leur avenir.

Il faut par ailleurs développer la recherche en France sur ces questions afin que le monde académique français se saisisse des débats, pose des diagnostics, objective les analyses et dégage des pistes d'évolution pour nourrir un débat de qualité. Le monde du numérique, qui instille sa dimension dans tous les secteurs, ne peut pas être abordé sans la maîtrise du code. Il faut en comprendre les fondamentaux et pour cela enseigner les notions de base assez tôt dans le système éducatif français.

M. Godefroy Beauvallet. - L'essentiel des usages du numérique reste encore à inventer. Il faut donc apprendre en permanence à s'adapter et contribuer à inventer les formes du numérique ; à défaut, elles s'imposeront à nous. Il n'y a aucune fatalité : chaque fois que l'on apprend, on conquiert de la puissance d'agir. La formation  des élites publiques est à cet égard particulièrement importante. Elle pourrait notamment prendre appui sur l'Institut des hautes études scientifiques dont les travaux sont remarquables et les propositions mériteraient d'être mieux relayées. La recherche doit en effet irriguer la décision publique et les fonctionnaires de connaissance ont un devoir de participation.

L'inquiétude sur l'infaillibilité des dispositifs est forte et soulève la question de la part d'ombre nécessaire dans toute démocratie : la décision publique doit être transparente, et il faut y travailler, mais les individus ont droit à l'opacité pour eux-mêmes, ce qui est bien l'inverse du totalitarisme. Les grands régimes totalitaires, qui recherchaient la transparence des individus, ont d'ailleurs été victimes de leur opacité, qui les a conduits à des erreurs et à leur effondrement final. Au lieu de placer les données publiques sous la garde des fonctionnaires, il est préférable de les ouvrir, ce qui peut être la meilleure protection des personnes : l'introduction de nouveaux champs dans la carte nationale d'identité, - par exemple la religion -, susciterait ainsi des réactions immédiates.

M. Benoît Thieulin. - Les questions ne doivent pas être abordées de manière segmentée mais bien globale. L'articulation entre ce qui doit être ouvert et ce qu'il convient de protéger se pose aujourd'hui. Le Conseil national du numérique a examiné à cet égard l'opportunité d'un rapprochement entre la Cada et la Commission nationale de l'informatique et des libertés (Cnil), dont les problématiques sont inverses. Or c'est dans l'interstice que des données personnelles peuvent être révélées, notamment par l'analyse avec des algorithmes. Les chevauchements de compétences dans lesquels se logent les problématiques les plus inquiétantes doivent donc être examinés. C'est à tout le moins un partenariat qui doit être mis en oeuvre entre ces organismes, en liaison avec Etalab dont la nature est différente.

M. Christian Cointat. - Je suis surpris par les propos tenus sur la Cada et la proposition d'inverser la charge de la preuve en matière d'accès aux documents administratifs. En tant que membre suppléant de la Cada, j'ai toujours constaté que les analyses y étaient très fouillées et les décisions très satisfaisantes. Ma philosophie en la matière est très simple : la transparence s'arrête là où commence l'intrusion. Or ce qui est aujourd'hui au centre des préoccupations sur le numérique, c'est la protection contre l'intrusion plutôt que l'inverse. La Cada et la Cnil collaborent d'ores et déjà étroitement et dès qu'une incidence numérique est possible, l'avis de la Cnil est sollicité. Quant à l'inversion de la charge de la preuve, elle soulèvera une difficulté particulière pour les documents préparatoires. Les fonctionnaires, et j'en ai été un, doivent pouvoir travailler dans la sécurité, sans être exposés à un risque permanent de conflit, ce qui n'exclut pas bien entendu la responsabilité d'affronter les conséquences de leurs actes. Certaines demandes, notamment en matière de marchés publics pour connaître ce qu'a proposé la concurrence, ont été rejetées à bon escient car elles excèdent le droit de connaître pour se défendre et relèvent de l'espionnage. La loi de 1978 sur la Cada me paraît toujours d'actualité, elle doit simplement être modernisée. Il est par exemple anormal qu'un conseiller municipal puisse demander à accéder à des documents pour la communication desquelles un maire ne peut pas saisir la Cada au motif de sa qualité de chef d'une administration.

En matière de numérique, et j'ai été rapporteur d'un projet de loi sur la protection des données qui n'a pas été examiné par l'Assemblée nationale, le véritable problème n'est l'accès aux données pour ceux qui savent les chercher, y accéder, voire les craquer, mais la protection des données personnelles. La Cnil et la Cada, même s'il faut les moderniser, jouent un rôle remarquable en la matière et assurent efficacement la protection des citoyens tout en poussant à la transparence de l'administration. Etes-vous certains que vous ne jouez pas aux apprentis sorciers en demandant l'inversion de la règle d'accès ?

M. Benoît Thieulin. - En inversant le principe, il ne s'agit pas de généraliser la transparence. On ne peut pas pousser au hacking et il est préférable que le droit soit en accord avec la pratique.

M. Jean-Jacques Hyest, président. - Ce sont plutôt les pratiques qui doivent être en accord avec le droit !

M. Benoît Thieulin.  - Il s'agit de mettre le droit en accord avec les bonnes pratiques.

M. Christian Cointat.  - Il est nécessaire d'assurer une protection des données qui ne doivent pas être accessibles.

M. Jean-Jacques Hyest, président. - Je rappelle que d'autres travaux sont en cours au sein du Sénat sur la protection des données personnelles et la surveillance de l'internet. Notre mission travaille sur l'accès aux données publiques et leur réutilisation, donc sur l'accessibilité des données pour les spécialistes comme pour les simples citoyens. Dans ce contexte, on peut s'interroger sur les motifs qui justifient de ne pas rendre accessibles des données démographiques par exemple ou d'en changer la structuration, en assurant bien sûr la protection des données personnelles, le droit à l'oubli, le respect des prescriptions... Nous devons regarder comment faire en sorte que la transparence s'accroisse et soit effective sans alimenter des pratiques inacceptables comme le scoring des assurés sociaux.

M. Benoît Thieulin. - Tout ne doit pas être accessible, notamment les travaux préparatoires, tant que la décision qu'ils préparent n'est pas formalisée. Inverser le paradigme consiste simplement à exiger que tout refus soit motivé.

Les évolutions que connaît le monde du numérique appellent une mise à niveau des moyens et des pouvoirs de la Cada et de la Cnil, dont le travail est remarquable. La Cnil est légitimement intervenue sur le dossier médical partagé, qui soulève des problématiques complexes d'anonymisation pour certains accès, mais pas par exemple pour les médecins traitants ou les pharmaciens qui doivent pouvoir identifier les patients. Aujourd'hui ce dossier ne fonctionne pas, mais des millions de français ont dans leurs poches des dispositifs électroniques connectés qui mesurent au quotidien l'état de leur santé, leur rythme cardiaque et les distances qu'ils parcourent, autant de données qui sont stockées sur des plateformes dont vous ignorez la localisation et l'usage qui en est fait, par exemple en direction des mutuelles, alors que, dans le même temps, on sur réglemente les dispositifs sur lesquels nous avons la main. Ni la Cnil ni la Cada ne se sont saisies de ces sujets ; il faut que le législateur le fasse rapidement.

M. Jean-Jacques Hyest, président. - Je vous remercie pour l'ensemble de ces éléments. Merci également pour votre enthousiasme.

M. René Garrec. - Et votre conviction !

Audition de MM. David GAYOU, ingénieur de recherche en informatique, et Tangui MORLIER, consultant en informatique, cofondateur, administrateurs du collectif Regards citoyens (jeudi 16 janvier 2014)

M. Jean-Jacques Hyest, président. - Nous recevons aujourd'hui M. David Gayou, ingénieur de recherche en informatique, et M. Tangui Morlier, consultant en informatique et cofondateur du collectif Regards citoyens, tous deux administrateurs de ce même collectif.

M. David Gayou, administrateur du collectif Regards citoyens. - Regards citoyens est une association composée d'une dizaine de membres bénévoles. Elle propose notamment deux sites internet (nosdéputés.fr et nossénateurs.fr) dont le contenu est fondé sur la réutilisation de données publiques disponibles sur les sites du Sénat, de l'Assemblée nationale et du Journal officiel, à partir d'un retraitement qui nous semble intéressant et qui n'est pas proposé sur ces sites. Nous avons également travaillé sur le redécoupage des circonscriptions électorales pour les législatives. Nous souhaitions rejouer les élections de 2007 par application du nouveau découpage prévu en 2009 et 2010, afin de déterminer si celui-ci était ou non partisan - aucun élément concluant ne nous a cependant permis de trancher dans un sens ou dans l'autre.

La réutilisation des données nécessaires à ces projets n'a pas toujours été chose aisée. Alors même qu'elle n'est limitée par aucune barrière juridique ou institutionnelle, leur récupération à partir des documents mis à disposition nécessite bien souvent un travail important d'extraction (scraping) afin de les rendre exploitables, qui mobilise près de 75 % de notre temps. Le travail de récupération a été particulièrement difficile s'agissant des données électorales, et notamment des informations relatives aux adresses correspondant à chaque bureau de vote. Dans la mesure où il n'existe aucun bureau centralisant ces informations au ministère de l'intérieur, nous avons dû nous adresser directement aux 40 communes pour lesquelles nous avons rencontré des problèmes. A cette occasion, nous avons pu constater de grandes disparités entre les formats sous lesquels ces données sont conservées : dans l'idéal, un tableur est tenu par le personnel de la mairie ; dans d'autres cas, la commune utilise un logiciel ne permettant pas l'extraction des données ou les données ne sont pas disponibles dans un format ouvert (il est ainsi arrivé que les données nous soient dictées par téléphone) ; dans d'autres cas, la commune faisait preuve de mauvaise volonté ou ne nous envoyait qu'un document mal scanné interdisant toute réutilisation. Dans ce dernier cas, il a été nécessaire de recourir à l'excellente loi de 1978 et de saisir la Cada.

M. Jean-Jacques Hyest, président. - Qu'est-ce qu'un format lisible pour une machine ?

M. Tangui Morlier, administrateur du collectif Regards citoyens. - Un format lisible permet la récupération de données sans qu'une intervention humaine ne soit nécessaire pour interprétation. Un format ouvert permet à chacun, quel que soit son équipement, de lire des données : on évite ainsi la discrimination technologique. Ces deux conditions sont nécessaires à la réutilisation des données publiques.

M. David Gayou. - C'est pourquoi notre deuxième plaidoyer porte sur l'Open data : les données mises à disposition par l'administration doivent être réutilisables sans complication inutile. Nous avons identifié trois barrières qui entravent la réalisation de cet objectif : une barrière juridique, lorsqu'il faut une autorisation pour accéder à certaines données ; une barrière technique, lorsqu'un logiciel spécifique est nécessaire ; une barrière financière, dans la mesure où les licences de ces logiciels sont souvent coûteuses. A ce titre, nous saluons le travail accompli par Etalab depuis 2011, notamment dans le sens de l'ouverture des esprits, et la belle avancée que représente la mise en place du site data.gouv.fr. L'ouverture de la base de données de la Direction de l'information légale et administrative (Dila) en décembre dernier a également constitué une initiative notable.

L'open data renvoie selon nous à la possibilité d'analyser et de comprendre les décisions publiques, selon une orientation qui peut évoluer au cours du temps : c'est pourquoi la condition de réutilisation des données est essentielle. C'est en ce sens que, dans le cadre de l'examen du projet de loi relatif à la transparence de la vie publique, nous sommes intervenus dans le débat pour défendre la publication des déclarations d'intérêt en format ouvert.

Nous pensons également que la gratuité doit être la norme en matière d'accès aux données publiques. Mettre en place une redevance sur l'information publique revient à instaurer une barrière qui en exclut les citoyens et les associations au profit des seules entreprises, qui peuvent mobiliser davantage de moyens.

M. Tangui Morlier. - La commission des lois de l'Assemblée nationale elle-même a été confrontée, lors de l'examen du projet de loi relatif à la simplification du droit, à des difficultés pour réaliser une étude statistique de la mise en oeuvre de diverses dispositions législatives et ainsi identifier celles qu'il était possible de simplifier. Il a de ce fait été nécessaire de faire appel à une entreprise américaine, la société LexisNexis. C'est en outre dans ce cadre qu'est survenu le « bug » de la suppression involontaire de dispositions applicables à la scientologie. Tout cela a suscité de nombreux fantasmes autour de la question de l'indépendance du Parlement. Cette étude n'a ensuite jamais été rendue publique, ce qui interroge quant à l'utilité de ce type d'études ; nous espérons que l'ouverture de la base de données de la Dila permettra d'ouvrir le débat à ce sujet.

M. Jean-Jacques Hyest, président. - Selon moi, la méthode de simplification qui a été mise en oeuvre n'est pas la meilleure, et c'était également le point de vue de la commission des lois du Sénat lorsque j'en étais le Président.

La simplification nécessite cependant la confrontation avec la pratique. Il existe 8 000 délits et contraventions au total dans les textes, mais 400 seulement d'entre eux sont effectivement utilisées par les magistrats. Pourquoi, dans ces conditions, continuer de créer de nouveaux délits et contraventions ?

M. Tangui Morlier. - Une base de données tenue par le Conseil d'Etat pourrait apporter des éléments intéressants sur cette question ; elle n'est cependant pas publique.

M. David Gayou. - Nous soulignons que le cadre légal et administratif actuellement en place est favorable à la libération des données. Il est également à noter que le Premier ministre s'est prononcé sur l'interdiction de nouvelles redevances ; une inscription dans la loi permettrait de pérenniser ce principe. Des marges de progrès résident dans les formats sous lesquels les données sont disponibles : en fonction de ce format, le temps que nous passons à extraire les données peut varier entre quelques minutes et plusieurs heures.

M. Tangui Morlier. - Cette question concerne également les administrations en ce qu'elle peut leur permettre de mieux structurer a priori l'organisation de leurs systèmes d'informations, dans la perspective de la publication future des données.

L'open data peut aujourd'hui apparaître comme un sujet consensuel : des gouvernements de droite comme de gauche se sont ainsi exprimés contre les redevances. Des résistances sont cependant toujours constatées sur le terrain, qu'elles soient liées à une acculturation insuffisante des administrations à la question ou, dans une minorité de cas, à la volonté de ne pas offrir une transparence très fine aux citoyens sur certaines informations. C'est pourquoi la Cada reste nécessaire pendant encore plusieurs années : l'open data permettra de simplifier l'accès aux données administratives, mais ne remplacera pas la Cada. En outre, l'intervention de celle-ci restera nécessaire pour les données contenant des informations personnelles, qui ne rentrent pas dans le champ de l'open data.

Avec la loi pionnière de 1978 qui a institué la Cada, la France est devenue la deuxième grande démocratie à se doter d'une autorité assurant la transparence de la décision publique. L'architecture de ce dispositif est très bien pensée en ce qu'il privilégie la médiation au conflit, ce qui est confirmé en pratique par les statistiques disponibles sur le site de la Cada. Il faut également souligner que cette institution fonctionne très bien avec un budget réduit et seulement 12 fonctionnaires, qui disposent d'une remarquable expertise en droit public : on souhaiterait que toutes les institutions puissent fonctionner de manière aussi efficace.

Nous avons sollicité la Cada à plusieurs reprises pour connaître le détail de certaines décisions publiques. Nous nous sommes par exemple aperçus que la carte des circonscriptions française, gérée par le ministère de l'intérieur, appartient à la société informatique privée à laquelle en a été confiée la réalisation et n'est donc pas réutilisable par l'administration. L'acheteur public a ainsi vu une connaissance essentielle capturée par un acteur privé par application des règles de la commande publique : le marché, passé au début des années 2000, portait sur un logiciel et la société prestataire possède un droit sui generis sur la base de données ainsi réalisée. Ce cas d'espèce pose un problème démocratique : dans certaines villes comme Paris ou Toulouse, il est nécessaire de connaître l'adresse exacte d'une personne pour identifier son représentant au Parlement. C'est pourquoi nous travaillons avec Open street map pour reconstruire nous-mêmes une carte identique - alors que celle-ci a déjà été payée par l'acheteur public !

Mme Catherine Procaccia. - Avez-vous obtenu des détails sur cette affaire auprès du ministère de l'intérieur ? Avez-vous dû passer par la Cada pour ce faire ?

M. Tangui Morlier. - Nous avons demandé communication du marché public passé pour l'établissement de la carte. L'intervention de la Cada a permis de faire replacer notre demande en haut de la pile alors que nous n'avions pas eu de réponse dans un délai d'un mois, en raison sans doute de la durée de l'expertise interne nécessaire pour répondre à notre demande. L'efficacité du rôle de médiation de la Cada mérite vraiment d'être soulignée. Ce bon fonctionnement est d'autant plus notable qu'il perdure à l'heure où l'essentiel des problèmes porte sur des données numériques, alors que la Cada a été instituée à l'époque où prédominaient la culture du papier et l'usage du document.

S'agissant des informations liées à la vie privée, nous estimons qu'elles doivent être entièrement maîtrisées par les seules personnes concernées, ainsi que l'affirme la loi relative à la Cnil. Il existe sans doute des marges d'amélioration sur ce point. En revanche, la plus grande transparence doit être la règle quant à l'évaluation des politiques publiques et à la prise de décision publique.

Sur ce dernier point, notre expérience avec la Cnil est plutôt négative. Lorsque nous avons demandé à la Cnil des détails sur certains aspects de l'affaire du Mediator et sur la loi « Sunshine » qui en a découlé, nous avons été assez étonnés de constater que les avis rendus par cette institution viennent affaiblir la volonté du législateur. Par exemple, ce dernier avait souhaité que les informations relatives aux relations de nature commerciale entre les médecins et les laboratoires pharmaceutiques soient publiques. Il est cependant très difficile d'y accéder, car la base de données proposée par le ministère de la santé fonctionne mal. Cela tient à ce que la Cnil fait régulièrement primer la non-réutilisation des données à caractère personnel sur la transparence de la prise de décision publique.

M. David Gayou. - Cette base de données ne permet pas de faire de consultation agrégée, ce qui limite les possibilités d'analyse...

M. Tangui Morlier. - ... et qui concentre finalement l'attention sur des informations à caractère personnel ! Cette situation pose un vrai problème, puisqu'elle rend très difficile une analyse approfondie d'une affaire comme celle du Mediator. C'est pourquoi nous avons demandé à la Cnil les raisons d'une telle restriction : afin d'obtenir les détails de l'avis rendu - dont la communication est pourtant de droit dans le cadre de la transparence de la décision publique -, il nous a fallu nous adresser à la Cada, faire un battage médiatique et menacer la Cnil d'un recours devant le tribunal administratif !

Il apparaît de plus que la Cnil n'a pas joué tout son rôle dans certains cas de réutilisation de données à caractère personnel. Par exemple, les données d'immatriculation automobile de millions de Français sont vendues par le ministère de l'intérieur et réutilisées par des entreprises privées pour faire du démarchage commercial. Ces données n'entrent pas dans le champ de l'Open data, dès lors qu'elles contiennent des informations à caractère personnel. Depuis 2006, il est possible d'interdire la réutilisation de ces données, mais le stock antérieur continue d'être vendu. Qu'a fait la Cnil, dans ce cas précis, pour protéger les données personnelles des citoyens ? Voici un autre exemple : lorsque des données relatives aux revenus localisés des ménages ont été touchées par un problème informatique portant, au sein de l'Insee, sur certaines régions, le problème a été réglé par un dialogue entre l'Insee et la société civile, sans que la Cnil n'intervienne jamais. Au total, nous préférons donc l'efficacité des douze fonctionnaires de la Cada à celle des 150 agents de la Cnil, du moins pour notre expérience d'accès aux données publiques.

M. David Gayou. - Nous souhaitons à présent aborder le sujet de la nouvelle directive européenne relative aux informations du secteur public. Celle-ci vise à imposer l'utilisation, pour la transmission de données publiques, de formats ouverts et lisibles par des machines, de façon à faciliter la réutilisation des données.

M. Tangui Morlier. - Comme nous l'avons vu avec l'exemple de la carte des circonscriptions dont le ministère de l'intérieur n'est pas propriétaire, cette évolution profitera d'ailleurs en premier lieu au fonctionnement interne des administrations publiques.

Par ailleurs, nous recommandons d'inscrire dans la loi le principe de la gratuité de la réutilisation des données publiques, d'autant qu'il est très consensuel au sein des différentes formations politiques.

Nous souhaitons en outre que la compétence de la Cada, qui porte aujourd'hui sur les documents administratifs, soit élargie aux informations publiques. A l'heure actuelle en effet, si l'on ne connaît pas l'existence ou le titre précis d'un document au sein de l'administration, on ne peut avoir accès à l'information qu'il contient via la Cada.

M. Jean-Jacques Hyest, président. - Ce ne sera pas nécessairement simple en pratique : la requête du demandeur sera-t-elle suffisamment précise pour que l'autorité identifie le document dans lequel cette information est contenue ?

M. Tangui Morlier. - Nous espérons que l'administration n'a pas pour seul objectif l'archivage de documents, mais qu'elle est capable d'organiser l'information qu'elle produit. En outre, l'expertise de la Cada en matière de médiation permettra de répondre aux problèmes qui pourront éventuellement se poser.

M. David Gayou. - Nous aimerions également voir une évolution du champ des entités sur lesquelles porte la compétence de la Cada. Celle-ci ne concerne aujourd'hui que les seuls organismes administratifs, tandis que les entités parapubliques ou semi-publiques comme la RATP en sont exclues, quand bien même elles assurent des missions de service public.

M. Christian Cointat. - Il me semble pourtant que la compétence de la Cada s'étend à tous les organes chargés d'une mission de service public.

M. Tangui Morlier. - C'est bien le cas lorsqu'il s'agit de l'accès à des documents, mais pas lorsqu'il est question de leur réutilisation. Pour faire une évaluation des politiques publiques, cela serait pourtant utile ! Certains établissements publics à caractère administratif (EPA), par le biais des redevances, les établissements publics à caractère industriel et commercial (Epic) ou encore les entreprises délégataires de service public sont donc hors du champ de la réutilisation, de même que le Parlement, pour d'autres raisons - mais ce dernier répond à ces préoccupations par ses propres moyens, en particulier à travers les outils développés par le service informatique du Sénat, qui a lancé une politique ambitieuse en matière d'open data.

Nous aimerions enfin aborder la question des données à caractère culturel. La France, dont la culture est pourtant très largement diffusée, est en retard pour ce qui est de l'ouverture des données ou des métadonnées d'informations culturelles ou d'oeuvres du domaine public. Cette situation suscite des interrogations quant à l'avenir de la culture française.

De ce point de vue, plusieurs barrières à l'accès restent à lever. La première est celle du droit d'auteur, qu'il s'agisse de celui des consultants privés auxquels l'administration fait appel, des droits sui generis des bases de données privées que nous avons évoquées, ou de celui des fonctionnaires - une modification législative de 2006 ayant permis aux fonctionnaires de revendiquer un droit d'auteur dans certains cas. Nous attirons votre attention sur ce dernier cas, qui peut constituer une entrave forte, alors que nous considérons que le travail des fonctionnaires est d'autant plus valorisé qu'il est largement diffusé. Deux exemples peuvent illustrer cette question : les défenses du Gouvernement devant le Conseil d'Etat ; le travail des fonctionnaires du ministère de la culture établissant la description littéraire et photographique des monuments historiques. La base de données Mérimée a d'ailleurs dû être amputée de quelques données pour cette raison. La deuxième concerne les droits d'exclusivité pour la numérisation que certaines institutions publiques accordent à des entreprises privées. C'est le cas de la Bibliothèque nationale de France, qui a donné un droit exclusif de numérisation de documents qui sont pourtant dans le domaine public.

S'agissant de la Cnil, nous souhaiterions que soient homogénéisés les avis rendus au législateur sur les projets de loi et de décrets. La solution la plus simple serait de supprimer cette pratique ; on pourrait également envisager de donner cette compétence à la Cada afin d'instaurer un certain parallélisme des visions. Je souligne en passant que nous sommes contre le rapprochement de la Cada et de la Cnil, qui ne les rendrait pas nécessairement plus efficaces.

Mme Corinne Bouchoux, rapporteure. - Merci pour votre précieuse contribution à la démocratie. Si nous ne devions retenir que trois propositions parmi toutes celles que vous avez formulées, quelles devraient-elles être, d'un point de vue stratégique ?

M. Tangui Morlier. - La levée des barrières nous semble cruciale, qu'il s'agisse de la gratuité et de la mise en place de formats ouverts et non discriminants, ou de la levée des barrières marginales que représentent le droit d'auteur ou les droits d'exclusivité conférés à certaines personnes privées.

Mme Catherine Procaccia. - Avez-vous des éléments de réflexion à nous transmettre sur la mise en place de la nouvelle base informatique des services fiscaux, qui rassemble les données relatives aux transactions immobilières ?

M. Tangui Morlier. - Ce n'est pour l'instant qu'un projet de base de données, qui, malheureusement, ne sera pas réutilisable par les citoyens. Le décret en cause pose d'importantes questions juridiques, en particulier vis-à-vis des notaires qui disposent déjà d'une base dont la consultation est payante. En outre, le dossier est géré par l'exécutif et Etalab n'y est pas associé.

M. David Gayou. - Bien évidemment, la question de la protection de la vie privée se pose également.

M. Jean-Jacques Hyest, président. - En effet : si les données disponibles sont peu nombreuses, il devient facile d'identifier individuellement les transactions, les vendeurs et les acquéreurs. Il faut donc prendre des précautions pour garantir à la fois l'ouverture et la protection des droits des personnes.

M. Tangui Morlier. - La question posée est celle du non-respect du secret statistique. Le problème n'est pas de savoir si tout le monde a ou non accès à ces données ; c'est que certains acteurs privés qui y ont accès en font une utilisation non respectueuse de la vie privée. L'open data, en ce sens, simplifierait la question en ce qu'il consiste à expurger systématiquement toutes les données personnelles avant de les proposer en consultation libre ; il permet ainsi de tracer une ligne claire entre données personnelles protégées et données libres. C'est pourquoi nous sommes contre la fusion de ces deux notions à travers la fusion de la Cnil et de la Cada. Certaines entreprises américaines entretiennent cette confusion, qui est malheureusement reprise par les institutions chargées de la protection de la vie privée.

M. Jean-Jacques Hyest, président. - Les statistiques fiscales offrent un autre exemple de la question qui nous préoccupe. Si leur granularité est trop fine, il devient possible d'identifier qui paie l'ISF dans chaque village.

M. Tangui Morlier. - L'administration, notamment Bercy, dispose d'une expertise remarquable sur ce point. Il me semble donc qu'il n'y a pas de préoccupation à avoir.

M. David Gayou. - En revanche, dès lors qu'existe une donnée, il existe toujours un risque de fuite et de diffusion, soit du fait d'un problème ou d'un piratage informatique, soit du fait d'une fuite interne.

M. Tangui Morlier. - D'où la nécessité de distinguer entre l'existence des données elles-mêmes et le processus permettant de les extraire, qui doit être respectueux du droit.

Audition de M. Mathieu ESCOT, chargé de mission santé à UFC-Que Choisir (jeudi 16 janvier 2014)

M. Jean-Jacques Hyest, président. - Nous entendons à présent M. Mathieu Escot, chargé de mission santé à UFC-Que Choisir sur les difficultés rencontrées en matière d'accès aux documents administratifs et aux données publiques, la ur qualité et les conditions dans lesquelles elles peuvent être réutilisées, enfin sur les évolutions qui vous paraîtraient souhaitables en la matière, .Evolution du cadre juridique tech et instit.

M. Mathieu Escot, chargé de mission santé. - Mon domaine de compétence est plus particulièrement celui des questions de santé et c'est en recherchant des données à ce sujet que notre association s'est pour la première fois posée la question de l'accès aux données publiques.

Pour autant mon propos sera plus large, notre intérêt pour la mise à disposition des données publiques étant directement lié à l'exercice de nos missions. En effet, des données plus largement ouvertes faciliteraient l'information du consommateur, à travers nos différentes publications notamment, nous permettraient d'améliorer sa défense et même de créer de nouveaux services marchands ou non marchands.

C'est justement en voulant créer ces nouveaux services que nous avons rencontré des difficultés. C'est ainsi que souhaitant étudier la fracture sanitaire, l'UFC-Que Choisir a tenté d'établir une carte des implantations de cabinets médicaux corrélée au niveau des dépassements d'honoraires constatés. Il s'agissait pour nous, dans un but d'intérêt général, de créer un service gratuit à l'intention de tous les consommateurs pour leurs permettre de connaître l'offre médicale. Une telle information est en effet disponible sur le site de l'assurance maladie (Ameli-direct), mais elle n'est pas réutilisable : les consommateurs peuvent seulement interroger la base médecin par médecin.

Nous avons donc dû reconstituer la base par une procédure d'aspiration des données disponibles. Cette opération, effectuée par un prestataire, a coûté 20 000 euros, soit l'équivalent du budget annuel du pôle santé de l'association pour l'achat de prestations extérieures.

Nous avons rencontré le même type de difficultés lorsque notre association a souhaité établir une carte sur la qualité de l'eau potable. Le coût de la procédure d'aspiration des données s'est élevé à 8 000 euros.

La mise à disposition de ces informations sur notre site ne donne lieu à aucun retour sur investissement par la publicité. Elle représente un coût net pour notre association. Je souligne à cet égard que ce qui pour UFC-Que Choisir n'a été qu'un frein financier est susceptible de représenter pour d'autres acteurs une barrière infranchissable.

Plus généralement, les difficultés concrètes que nous rencontrons sont de plusieurs ordres.

En premier lieu, certaines données sont inaccessibles sous quelque forme que ce soit. La base de données existe mais elle est inaccessible. C'est ainsi que seule l'administration dispose d'informations sur la qualité de la prescription d'antibiotiques alors même qu'il serait intéressant de l'étudier dans un contexte d'antibiorésistance.

D'autres jeux de données ne sont pas directement mis à disposition. Les données brutes demeurent inaccessibles, seule est disponible une extraction faite à partir d'études particulières. Tel est le cas par exemple des données relatives à l'évolution du prix des services de téléphonie mobile, qui font l'objet d'études régulières de la part de l'Autorité de régulation des communications électroniques et des postes (Arcep). Faute de pouvoir confronter ces études avec les données brutes qui les fondent, il n'est pas possible de remettre en cause les choix méthodologiques (qui ne sont d'ailleurs pas forcément contestables) sur lesquelles elles prennent appui, ni d'analyser les données sous un autre éclairage.

Le troisième type de données mises à disposition est celui des données consultables mais non réutilisables, comme dans l'exemple précédemment évoqué de la carte des dépassements d'honoraires des médecins. Une start-up qui avait le même projet que nous mais à des fins marchandes a dû y renoncer au terme d'une action en justice.

La base de données relative aux relations entre l'industrie pharmaceutique, les médecins, les associations de patients obéira-t-elle à la même logique ? La France est en avance sur ce point puisqu'un site internet unique devrait être mis en place qui autorisera une consultation par les citoyens. Ces informations seront-elles cependant réutilisables facilement ? L'UFC-Que Choisir milite à travers le collectif Europe et médicaments pour une réutilisation très large de ces données.

Le quatrième type de données utilisables est celui des données légalement consultables et réutilisables mais dans des conditions telles qu'il est presque impossible de s'en servir. Ainsi, lorsque l'on s'intéresse à la qualité du service de distribution d'électricité (fréquence des coupures, durée moyenne des coupures, investissements réalisés...), une seule donnée est mise à disposition par Electricité réseau distribution France (ERDF), celle de la durée moyenne des coupures par départements. Toutes les autres données détaillées sont certes publiques mais il revient aux communes ou aux agglomérations de les communiquer. Certaines procèdent à la mise en ligne de la totalité des données, d'autres de certaines d'entre elles seulement, et les dernières s'abstiennent de toute diffusion de ces informations. Or il impossible de relancer toutes les communes ou les agglomérations de France pour disposer d'un jeu complet de ces données.

Un autre exemple est fourni par l'étude de la qualité de l'eau (eau brute, eau potable) que nous avons engagée. Selon le cas, les informations disponibles relèvent du ministère de l'environnement (pour les eaux brutes, l'eau des fleuves notamment), du ministère de la santé (pour la qualité de l'eau potable) ou encore du ministère de l'agriculture. Cette répartition administrative ne facilite pas la tâche. En outre, si l'on s'attache plus particulièrement à la qualité de l'eau courante, on s'aperçoit que les bulletins de qualité de l'eau, qui résultent d'un seul captage, comportent des informations brutes difficilement compréhensibles sauf à être un spécialiste chevronné ; un effort de pédagogie serait nécessaire. En outre, le moteur de recherche mis en place par le ministère de la santé n'autorise pas la recherche par date alors qu'on compte parfois plus de 1 000 bulletins par an pour certaines zones. A nouveau, il est nécessaire d'aspirer les données, de les traiter et de les mettre en forme. D'une agence régionale de santé à l'autre, les pratiques de mise en ligne diffèrent, de même que la précision des données diffusées. Or il est peu pertinent de ne disposer que de relevés agrégés au niveau régional ou annuel : à ces échelles, il n'y a jamais de problèmes de qualité de l'eau. Ceux-ci apparaissent plutôt à l'échelle de la commune et à un moment donné.

M. Jean-Jacques Hyest, président. - L'information n'est-elle pas plus accessible pour l'eau distribuée ? Je suis maire et ai toujours été attentif à ce que les analyses envoyées avec la facture deux fois par an soient conformes aux normes en vigueur. Il me semblait que les informations délivrées étaient suffisamment lisibles. J'ajoute qu'il ne faut pas confondre eau brute et eau distribuée puisque la seconde a fait l'objet d'un traitement par rapport à la première.

M. Mathieu Escot. - Mon propos en effet n'était pas de dénoncer une mauvaise qualité de l'eau en France. J'insistais seulement sur les difficultés de lecture pour les citoyens et le coût de rassemblement de toutes ces données éparses.

Pour conclure sur cette question de l'ouverture des données publiques, il me semble que plusieurs points doivent être mis en avant.

Les données mises à disposition doivent être des données brutes. Ceci n'ôte toutefois aucune légitimité aux administrations pour produire elles-mêmes des études sur celles-ci, dans le cadre de leur mission d'information. L'interprétation de ces données doit toutefois être facilitée. Quant aux données elles-mêmes, elles doivent être réutilisables d'un point de vue légal et technique. Elles doivent en outre être accessibles de manière centralisée. Le site Etalab constitue une avancée à cet égard. Le jeu de données mis à disposition doit être intégral et comporter les éléments explicatifs nécessaires à la bonne compréhension des citoyens.

Enfin, l'ouverture des données publiques doit se faire de telle façon qu'elle garantisse le secret statistique et empêche toute réidentification, afin d'assurer la protection des données personnelles. L'UFC-Que Choisir ne défend pas une ouverture sans règle. En revanche, il ne faudrait pas que la question des données personnelles, qui est centrale et doit être examinée pour elle-même, serve de prétexte pour interdire tout développement de l'open data.

Sur la question de l'accès aux documents administratifs, l'expérience de l'UFC-Que Choisir est plus restreinte. Nos journalistes soulignent toutefois la nécessité de réduire, dans la mesure du possible, les délais actuels : est-il en effet nécessaire d'accorder à une administration un mois supplémentaire pour donner sa réponse après que la Commission administrative d'accès aux documents administratifs a statué ? Par ailleurs, il convient de s'assurer de l'accès concret aux documents mis à disposition : on n'a pas toujours la possibilité de faire des copies, par exemple pour des documents d'urbanisme.

Mme Corinne Bouchoux, rapporteure. - Je reviens sur la question de l'eau. L'information ne vous semble-t-elle disponible trop tardivement ? En outre, est-elle adressée à tous les intéressés : les propriétaires comme les locataires ?

M. Jean-Jacques Hyest, président. - Au moins, le gestionnaire du réseau est-il prévenu immédiatement, ce qui lui permet d'interrompre la distribution d'eau. L'incident peut toutefois durer, en particulier s'il est nécessaire de réaliser un nouveau captage - situation que j'ai connue.

M. Mathieu Escot. - Effectivement, la réaction est immédiate lorsqu'il y a un doute sur la potabilité de l'eau. L'information qui vient ensuite est très utile mais il est nécessaire de la compléter par un accès plus aisé.

Mme Gisèle Printz. - Votre association sollicite souvent les parlementaires pour poser des questions au Gouvernement. D'où viennent ces interrogations ?

M. Mathieu Escot. - Effectivement, notre action de défense des consommateurs passe par un contact direct avec les pouvoirs publics pour les sensibiliser aux sujets que nous instruisons ou aux difficultés relevées au plus près du terrain.

Mme Corinne Bouchoux, rapporteure. - Pensez-vous que la création de l'action de groupe contribuera au développement de l'accès aux informations administratives ?

M. Mathieu Escot. - Les deux sujets me paraissent distincts.

M. Jean-Jacques Hyest, président. - Merci monsieur pour votre intervention qui a notamment mis en lumière les difficultés concrètes que pose l'accès aux données publiques en matière de santé.

Table ronde « protection de l'environnement » : Me Alexandre FARO, avocat, MM. Marc CENDRIER, administrateur, chargé de la formation, de l'association Robin des toits, Raphaël ROMI, doyen honoraire de la faculté de droit de Nantes, directeur du master 2 de droit de l'environnement et du développement durable (jeudi 23 janvier 2014)

M. Christian Cointat, président. - Nous poursuivons aujourd'hui les auditions qui s'inscrivent dans le premier volet de notre démarche : identifier les difficultés rencontrées par différents publics en matière d'accès aux documents administratifs et d'ouverture des données publiques et leurs attentes.

M. Alexandre Faro, avocat, et M. Marc Cendrier, membre cofondateur de l'association Robin des Toits, exposeront leur expérience concrète en matière d'accès aux documents administratifs et aux données publiques environnementales. Ils détailleront les conditions d'accès aux documents administratifs auprès des différentes administrations, les motifs de refus invoqués, l'efficacité de l'intervention de la Cada et du juge administratif ; puis ils traiteront de l'accessibilité des données publiques et de leur réutilisation.

Le professeur Romi réagira et nous rappellera les règles particulières d'accès aux données environnementales dans le cadre notamment des procédures spécifiques d'information et de consultation des citoyens en matière environnementale, et les problématiques qu'elles soulèvent.

Nous pourrons ensuite examiner les améliorations qu'il est possible d'apporter au cadre technique, juridique et institutionnel existant.

La France, qui a joué un rôle novateur en matière d'accès aux documents administratifs, avec la création de la Cada, est également en avance dans le domaine de l'environnement. Il nous faut dresser un bilan pour faire évoluer le système.

M. Alexandre Faro, avocat. - Bien que Greenpeace France soit l'un de mes clients, je m'exprimerai non pas en tant que son représentant, mais pour vous livrer mon expérience d'avocat indépendant spécialisé en droit environnemental. C'est une matière que je pratique depuis vingt ans, essentiellement au service d'associations pour la défense de l'environnement, pour des raisons d'éthique plus que par engagement militant.

Quand on parle d'accès aux documents détenus par l'administration, on n'entend pas seulement ceux qu'elle produit, mais également ceux que peuvent lui fournir les entreprises, des documents commerciaux par exemple. L'accès est assez large. Son enjeu, lorsqu'il s'agit de documents concernant l'environnement, est double : assurant une meilleure compréhension de l'impact des politiques publiques ou de certaines activités sur l'environnement, il fournit également à plus court terme des éléments dans une optique contentieuse ou précontentieuse.

Bien que la défense de l'environnement soit une urgence planétaire dont nous convenons tous, le temps ne joue pas dans le premier cas comme dans le second : la notion de délai d'accès aux informations revêt alors une importance particulière. Par exemple, pour représenter une association de riverains qui contesterait la légalité d'un permis de construire, au nom de la loi Littoral, j'aurai besoin d'accéder au dossier de l'autorisation de construire (dossier déposé en mairie ou administrations consultées, conditions de délivrance) et cela, dans le délai de recours de deux mois. Que faire si le maire qui détient ces informations refuse de les communiquer ? La loi de 1978 prévoit une saisine de la Cada, mais le délai pour obtenir la réponse du maire nous met déjà en défaut par rapport à celui de la procédure. De plus, l'avis de la Cada ne lie pas vraiment l'administration. Dans les petites communes, où les maires ont parfois une interprétation particulière du droit, un élu récalcitrant peut refuser de le suivre. Il faut alors saisir le tribunal administratif compétent. En 2011, un rapport de la Cada a évalué à 17 mois le délai moyen de jugement en pareil cas. Beaucoup d'eau aura alors coulé sous les ponts ! Le contentieux principal apparaîtra comme un combat d'arrière-garde. La maison sera déjà construite et il faudra obtenir sa destruction. S'il s'agit d'un ouvrage public, même mal planté, il sera trop tard pour le détruire.

Il y a une problématique particulière de l'urgence. Comment améliorer le système pour obtenir un accès légitime quand la jurisprudence est établie ? On pourrait imaginer un référé spécifique. En effet, un référé libertés existe quand on veut prendre une décision dans les 48 heures - l'affaire Dieudonné l'a montré -, mais il n'est pas plus adapté au cas qui nous intéresse que les référés suspension ou mesures utiles.

Vous indiquiez, monsieur le président, que le droit d'accès aux données administratives en matière environnementale était renforcé par rapport au droit commun. Le code de l'environnement prévoit des règles particulières. Nous pouvons dire merci au droit européen. La convention d'Aarhus prône l'accès le plus large possible aux documents. Une série d'articles de loi y contribuent. L'article L. 124-4 du code de l'environnement prévoit un test de préjudice : quand l'administration oppose un secret quelconque pour refuser l'accès à un document, ce refus peut être contesté devant la Cada et les juridictions, après qu'a été effectué ce test de préjudice. L'arbitrage s'opère en mettant en balance l'intérêt de la protection de l'environnement et l'intérêt général justifiant le refus, qui peut être économique ou autre. Je ne crois pas que ce texte ait réellement été mis en oeuvre. La jurisprudence ne témoigne pas d'une application concrète du dispositif - vous pourriez interroger les praticiens sur le sujet.

Une autre piste de réflexion a été ouverte après la catastrophe de 2001 parce que l'affaire AZF a secoué l'opinion publique. La circulaire du 18 octobre 2007 a demandé à l'administration détentrice de l'information gouvernementale (les actuelles Dreal) de rendre publiques sans demande préalable des informations relatives à leur mission d'inspection des installations classées. En prévoyant la mise en ligne des informations détenues par les Dreal, notamment celles concernant les manquements aux prescriptions préfectorales, la circulaire organisait pour la première fois un accès à des informations au jour le jour.

Cette très bonne initiative allait dans l'intérêt des associations de riverains et de la protection de l'environnement. Le hic est qu'une circulaire n'a pas vocation règlementaire et qu'elle est appliquée de manière variable par les Dreal, certaines informations étant publiées en ligne, d'autres non, sans cohérence d'ensemble. Il faudrait règlementer cela et, puisqu'un tel système peut fonctionner, ne serait-il pas judicieux d'élargir l'accès du public à une série de documents numérisés ?

Le nucléaire est un domaine particulier du droit environnemental ; il a sa propre police administrative. L'installation nucléaire de base (INB) a été façonnée dans le temps pour servir une politique industrielle dont le souci était de créer des centrales rapidement pour s'affranchir d'une dépendance aux hydrocarbures Le développement l'emportait sur la protection environnementale. Un retour progressif à des considérations environnementales est amorcé, sans qu'il y ait encore d'exigence suffisante en termes d'accès à l'information environnementale.

Par exemple, l'implantation d'une carrière, d'une centrale thermique ou d'un barrage hydroélectrique sera soumise au débat public et fera l'objet d'une enquête publique - autant de moments d'accès aux documents concernant le site. Une autorisation administrative sera donnée pour un certain temps, puis la question de la validité de l'installation se reposera. Les centrales nucléaires construites dans les années 70 sont aujourd'hui en fin de cycle, leur durée de vie indicative étant de 30 ans. Pour certaines d'entre elles, des autorisations de prolongement ont été données sans aucun débat public. La décision a été prise par l'Autorité de sûreté nucléaire sur des critères éminemment techniques. Ne pourrait-on pas rapprocher le droit des installations nucléaires de base de celui des sites classés ? Cela ménagerait la possibilité de rendez-vous et d'accès aux documents.

La loi de 2006 sur la transparence et la sécurité en matière nucléaire (TSN) garantit l'accès à un certain nombre d'informations sur la sûreté nucléaire, mais il y a peu d'informations sur la sécurité nucléaire, même si le sujet intéresse les associations de protection de l'environnement. Si un accident technologique survient, un accès aux documents est prévu, mais pour un acte de malveillance ou de terrorisme ou un risque de prolifération, le public n'est pas informé. Sortir du nucléaire a publié une étude sur les risques en cas d'impact causé par la chute d'un avion sur une centrale. Cette information étant classée secret défense, la personne soupçonnée d'avoir divulgué les conclusions de l'étude est poursuivie devant le tribunal correctionnel. Quelle est l'étendue de l'accès à l'information environnementale ? La plus large possible, répond la convention d'Aarus.

Un autre enjeu plus complexe, car il touche au pouvoir, tient à la fabrication de l'information environnementale et à la compilation des données disponibles dans notre pays. L'Institut français de l'environnement (Ifen) compilait les données sur l'environnement et créait des indicateurs environnementaux sur les dégradations ou la biomasse disponible par exemple ; tous les quatre ans, il publiait un rapport d'étape qui dressait un bilan de l'état de la France. Pour des raisons politiques, il a été supprimé en 2004. Ce modèle d'outil utile à de bonnes décisions politiques laissait dans sa gouvernance une large place aux usagers et à la société civile. L'Ifen a été remplacé par un Service de l'observation et des statistiques (SOeS) qui subit une tutelle plus directe du ministère de l'économie.

Les associations naturalistes, comme par exemple celles pour la protection des oiseaux, sont des partenaires utiles dans la fabrication de l'information. Leurs bénévoles effectuent avec dévouement des comptages année après année. Pour des raisons budgétaires, elles dépendent souvent des soutiens publics. La diminution progressive de leurs moyens leur a fait adopter des réflexes conservateurs : elles captent l'information et la gardent comme dernière arme de négociation pour l'échanger contre des subventions. On est ainsi entré dans un système peu vertueux d'échange et de partage de l'information.

Enfin, l'accès à l'information environnementale est également facilité par ce qu'on appelait jadis les comités locaux d'information et de concertation (Clic), devenus commissions locales d'information et de surveillance (Clis), et, depuis le décret du 7 février 2012, commissions de suivi des sites (CSS). Elles ont été créées autour des grands sites industriels qui présentent un danger d'émissions pour l'environnement, et des risques sanitaires et technologiques. Elles ouvrent l'accès aux informations détenues par les industriels. Il ne s'agit pas d'organismes participatifs, leur vocation est informative.

Ces organismes informatifs subissent l'effet pervers de la gouvernance à plusieurs qui, depuis le Grenelle de l'environnement, dilue un sujet pourtant bien géré auparavant par ceux qui s'y intéressaient spontanément. Ils sont divisés en cinq collèges, répartis entre les représentants de l'Etat, les collectivités territoriales, assez peu présentes, les exploitants, les salariés, les riverains et les associations de protection de l'environnement. Ces deux derniers groupes partagent un siège, ce qui est un facteur de trouble inutile. Pourquoi ne pas créer deux sièges, l'un pour les riverains, l'autre pour les associations ? Le seul enjeu est celui de l'information. Rendons cet accès le plus large possible.

M. Christian Cointat, président. - Nous sommes tous en train de nous battre contre le réchauffement climatique ? Dans cette salle, oui mais ce n'est pas tout à fait le cas de manière générale...

J'ai bien noté vos propositions : la question des délais, l'application de tous les textes existants, la mise en cohérence des mises en ligne, le traitement des installations nucléaires comme les installations classées pour la protection de l'environnement, l'échange d'informations entre les différents acteurs, l'accès de toutes les parties intéressées aux commissions consultatives.

Avant d'être sénateur, j'ai été fonctionnaire international. Un comité des fonctionnaires internationaux avait été créé qui réunissait une trentaine de participants dont aucun n'était fonctionnaire international ! C'est une tradition dans notre pays qu'il n'y ait qu'un siège pour plusieurs personnes.

Je donne maintenant la parole à M. Cendrier : nous sommes les Robins des lois et il est le Robin des toits.

M. Marc Cendrier, membre de l'association Robin des Toits. - Il est intéressant qu'une institution aussi noble que le Sénat prête attention à de dangereux réfractaires... L'objet de l'association Robin des Toits est d'identifier et de faire connaître les conséquences sur la population de l'action d'un groupe technologique, celui de la téléphonie mobile. Au sein de cette association, je suis chargé de l'information scientifique.

Les opérateurs se considèrent comme au-dessus des textes règlementaires ou légaux du pays où ils exercent leur activité. Leur désinvolture intégrale est encouragée par l'absence totale de sanction face à leurs comportements illégaux. Les riverains ont l'impression d'être en face d'un secteur intouchable.

Mon premier souhait pour apporter un réconfort à la population serait que les gouvernants prennent deux décisions de principe. Il existe un accord, plusieurs fois modifié, entre l'Association des maires de France et les représentants des opérateurs. Ce texte d'intention n'a pas de caractère contraignant. Pour autant il conviendrait de rendre pleinement obligatoire l'une des dispositions de cet accord : l'organisation d'une réunion d'information de la population avant l'installation ou la modification d'installation d'émetteurs électromagnétiques. En cas de manquement à cette obligation, l'installation devrait être mise hors service ou démontée. Pour qu'une telle réunion soit efficace, elle ne doit pas se limiter aux notables ; son accès doit être ouvert à l'ensemble de la population et les riverains doivent pouvoir y être assistés par des personnes compétentes. Elle devra en outre être annoncée publiquement suffisamment à l'avance et préparée matériellement (taille de la salle, micros...).

Une telle décision modifierait considérablement l'ambiance générale. Aujourd'hui, l'image publique des opérateurs est de plus en plus négative, voire catastrophique : la grande majorité de la population les considèrent comme des hors-la-loi qui bénéficient de la protection de la plupart des organismes de l'Etat.

D'un point de vue technique, les opérateurs, qui se sentent mal venus à peu près partout à peu près tout le temps, augmentent les modalités de clandestinité de leur activité. Il est très difficile d'obtenir des résultats et des précisions. Or les informations qui définissent les principales caractéristiques techniques des émetteurs permettent à la population de mesurer les intensités des émissions techniques auxquelles elle est soumise.

Les émissions de ce groupe technologique ont une unité générale de structure physique. Grâce à celle-ci, on peut évaluer les risques des émissions pour la santé, car leur toxicité est pratiquement avérée. Trois formes d'informations définissent la teneur de ces risques. Il s'agit d'abord d'identifier le nombre d'émetteurs, qu'ils s'agissent d'antennes-relais ou autres, et leur bande de fréquence, c'est-à-dire le nombre de vibrations par seconde, exprimée en hertz. Les bandes de fréquence ont en effet un niveau d'effet variable sur les organismes vivants. Certaines antennes-relais n'ont qu'une seule fréquence d'émission, d'autres deux ou trois. Il est nécessaire d'avoir une information réelle et complète sur les fréquences.

Le deuxième type d'information concerne la puissance des émetteurs. Elle est parfois donnée sous une forme incompréhensible. Elle doit être fournie en watts, de façon complète et pas seulement normative. En effet, si leurs chevaux réels correspondaient à leur puissance fiscale, les automobiles n'iraient ni très vite, ni très loin : les chiffres normatifs ne définissent pas une puissance réelle. Dans la téléphonie mobile, lorsque les émetteurs fonctionnent avec gains, c'est-à-dire au maximum de leurs possibilités, leur puissance varie de 30 à 40 watts si l'on en croit les opérateurs qui parlent en puissance normative, soit l'équivalent de 1 600 à 1 800 watts en puissance réelle.

Nous demandons enfin que les opérateurs communiquent le rayon de cellule, c'est-à-dire la zone couverte par chaque antenne relais. Ces trois informations cruciales suffisent à déterminer quelle est la situation technique et quelles sont les protections que peut demander la population.

Ces propositions rétabliraient une confiance entre les décideurs et la population, dont les craintes sont désormais fondées sur des documents officiels. Pas moins de 3 000 travaux scientifiques internationaux ont étudié les effets sur la santé de ces émissions. Ils établissent un lien avec certaines pathologies et certaines perturbations. Le Gouvernement n'en tient pas compte. Un rapport de synthèse du groupe Bioinitiative, composé de douze experts internationaux indépendants a synthétisé ces différentes études en classant les effets sanitaires des champs électromagnétiques en fonction des pathologies provoquées. Leur travail est reconnu. Ceux qui contestent la toxicité de ces champs sont souvent en situation de conflit d'intérêts et leur parcours professionnel fait planer un doute sur leur indépendance.

Ces risques commencent à faire l'objet d'une certaine reconnaissance officielle, même si ce n'est pas encore le cas en France. Dans sa résolution 1815, votée à la quasi-unanimité, le Conseil de l'Europe, s'appuyant sur le rapport Bioinitiative, reconnaît les risques pour la santé et demande aux gouvernements européens de modifier leur réglementation pour fixer la valeur limite d'exposition (VLE) à 0,6 volt par mètre. L'Organisation mondiale de la santé a classé la téléphonie mobile dans le groupe 2B, qui comprend les activités potentiellement cancérigènes pour l'homme. En Italie, enfin, la Cour Suprême a jugé sans ambiguïté que la téléphonie mobile était source de cancer.

Lors d'une émission de télévision, le responsable d'un opérateur de téléphonie mobile belge a invité les jeunes consommateurs à la prudence. Les journalistes ont ensuite découvert que le patron de cette compagnie utilisait exclusivement depuis trois ans un téléphone filaire et que tout réseau wifi avait été supprimé au siège de cet opérateur.

Les effets biologiques de la téléphonie mobile ne sont plus de l'ordre de la rumeur, ils sont confirmés par des sources de plus en plus nombreuses. Les citoyens ont raison de demander des informations précises avant les installations. Les plus importantes doivent être totalement publiques.

M. Christian Cointat, président. - Vos conclusions font froid dans le dos ! Je retiens qu'il faut améliorer l'information préalable, disposer de données fiables et compréhensibles sur les antennes-relais et les émetteurs, fixer les seuils d'exposition à des niveaux compatibles avec la santé des citoyens.

M. Marc Cendrier. - La population et les associations ne sont pas les seules à demander des informations et des modifications réglementaires. Différentes autorités officielles font de même. Espérons que le Gouvernement français sortira du déni de l'évidence.

M. Raphël Romi, directeur du M2 droit de l'environnement et du développement durable de l'Université de Nantes. - En matière d'environnement, les difficultés d'accès aux informations sont au nombre de sept. Tout d'abord, lorsque l'on saisit l'administration pour obtenir communication d'un document, il faut en moyenne attendre deux ans quand l'autorité est récalcitrante. Ce délai rend inopérant le droit à la communication des informations publiques. Pourquoi ne pas profiter du mouvement de simplification du droit pour mettre en place un référé communication, en contournant la Cada ? Il remplacerait le référé mesures utiles, peu efficace.

Deuxièmement, les demandes d'informations se heurtent souvent au secret industriel et commercial que leur opposent les autorités administratives et les pouvoirs publics. Le bilan coût et avantage est peu utilisé. Il faut le perfectionner. Le juge, et non l'administration, pourrait se voir confier le soin de décider, à la demande de l'administration, si les informations demandées relèvent du secret industriel ou commercial. Nous disposerions ainsi à la fois d'une définition espèce par espèce ainsi qu'une incitation pour le juge à utiliser cette capacité.

Ensuite, le régime d'accès aux informations d'ordre environnemental n'est pas homogène. La circulaire de 2007, qui a été une bonne initiative, ne s'applique pas à toutes les autorités mentionnées par la loi de 1978. Utilisons la procédure de simplification pour améliorer légèrement sa rédaction, en faire le texte de référence et élargir son champ d'application à toutes les autorités mentionnées dans la loi de 1978.

Il convient aussi de rapprocher le droit applicable aux installations nucléaires de base de celui des installations classées pour la protection de l'environnement (ICPE) : la totalité des dispositions applicables en matière d'environnement pour les informations s'appliquerait sans doute au domaine du nucléaire. Homogénéisation, encore, pour les modes de livraison technique des données en définissant dans la future loi sur l'environnement deux standards : elles doivent être lisibles et complètes.

La disparition de l'Ifen a constitué un désastre en matière de communication d'informations. A défaut d'un établissement public, pourquoi ne pas créer une autorité indépendante chargée de livrer régulièrement des données actuellement dispersées entre différentes administrations.

Les CSS sont composés de cinq collèges. Il ne coûterait rien de scinder le cinquième collège pour assurer une représentation des associations et garantir leur droit à l'accès aux informations sans préjudice du droit d'accès des riverains. De même, ces commissions doivent disposer d'un budget autonome et avoir accès aux déclarations d'intérêts des experts auxquels elles ont recours qui, de manière assez surprenante, ne sont pas considérées comme communicables...

M. Marc Cendrier. - Lorsqu'il y en a...

M. Raphël Romi. - En effet ! Attention, en outre, à la régression que constituerait la généralisation des décisions administratives implicites dans le cadre du processus de simplification du droit. Celles-ci riment avec absence de communication des dossiers ou difficultés d'accès accrues. Il est essentiel que les décisions en matière d'environnement figurent parmi les dérogations envisagées.

Enfin, l'utilisation par la justice administrative des informations environnementales. Quand il statue sur une déclaration d'utilité publique, le juge ne prend en considération que les informations connues au moment de la déclaration, sans tenir compte des données disponibles au moment du jugement ni des évolutions. C'est un non-sens absolu. Il faut que juge administratif statue au vu des données au jour du jugement.

Le droit à l'information en matière d'environnement bénéficie d'un régime renforcé ; en dépit des difficultés, le bilan est satisfaisant. Pourquoi ne pas le généraliser, en particulier pour les documents préparatoires ? C'est une affaire de volonté. Malheureusement la Cour de justice de l'Union européenne n'aide pas. Depuis un malencontreux arrêt du 14 novembre 2013 les informations versées par un Etat à l'appui de sa défense devant la Commission dans la procédure précontentieuse ne sont pas communiquées à la partie requérante. L'essentiel est de renforcer l'égalité des armes entre les citoyens et les porteurs de projets. La communication doit être le principe et le public associé véritablement à l'élaboration des décisions. L'accès au juge doit être facilité. La convention d'Aarhus lie accès à l'information et participation.

Pourquoi enfin le juge administratif est-il compétent en la matière ? Le droit à l'information ne constitue-t-il pas l'un des droits fondamentaux ? La Constitution ne confie-t-elle pas au juge judiciaire leur protection ? Compétence doit lui être reconnue ; de nouveaux équilibres se mettront naturellement en place et certaines absurdités cesseront. Un juge capable de statuer en fonction des informations disponibles au moment de la décision, favorise un fonctionnement opaque de l'administration. Finissons-en avec cette incongruité constitutionnelle ou le droit d'accès aux documents administratifs restera un leurre.

Mme Corinne Bouchoux, rapporteure. - Votre dernière proposition est la plus originale. Assimilant le droit d'accès aux documents administratifs à un droit fondamental, vous suggérez de rendre le juge judiciaire compétent, comme en matière de voie de fait. Culturellement, est-ce envisageable en France ? En outre, est-ce réaliste compte tenu de l'encombrement de la justice judiciaire ?

M. Alexandre Faro. - Le droit international et la convention d'Aarhus ne font pas obstacle à cette évolution, qui serait en outre conforme à la Constitution. Le choix opéré en 1978 a été politique. Le juge judiciaire dispose des outils pour trancher, c'est l'article 145 du code de procédure civile, d'usage très courant, en vertu duquel, avant même le début d'un contentieux, une partie peut réclamer la communication d'un document utile à la manifestation de la vérité. Une simple modification de la loi suffirait à rendre le juge judiciaire compétent pour garantir l'accès aux documents administratifs.

M. Raphël Romi. - Le garantir !

M. Alexandre Faro. - Faudrait-il conserver une saisine pour avis préalable de la Cada ? Cela me paraît inutile, car cette saisine crée un délai supplémentaire ; le juge judiciaire est capable de statuer en cas d'urgence.

M. Raphël Romi. - Pourquoi ne pas envisager deux voies d'accès ? Un régime d'urgence sans consultation de la Cada et un régime de droit commun pour l'accès à des données liées à des décisions publiques sans qu'il y ait un contentieux. Le bilan de la Cada est positif, elle pourrait parfaitement être compétente pour ces procédures qui requièrent une phase de d'instruction. N'engorgeons pas le juge judiciaire. Il suffit simplement de créer un nouveau référé « communication ».

Mme Corinne Bouchoux, rapporteure. - En tant qu'usagers de ce droit, vous n'envisagez pas l'apparition de milliers de contentieux supplémentaires devant les tribunaux judiciaires ?

M. Alexandre Faro. - Non, au contraire ! Le juge judiciaire est familier de ces procédures qu'il pratique depuis longtemps. Ses décisions seront plus facilement mises en oeuvre. La culture du secret de l'administration rend difficile l'accès à certaines informations. Ainsi, il est impossible d'obtenir communication du dossier, prévu par les textes, constitué par une centrale thermique à l'appui d'une demande d'autorisation d'implantation. L'exploitant refuse. Vous saisissez la Cada qui indique que le document est communicable sous réserve des informations couvertes par le secret industriel et commercial. Finalement vous obtenez un document où l'administration a biffé de nombreuses informations, comme le chiffre d'affaires pourtant disponible sur Infogreffe... Vous devez donc déranger un juge pour savoir combien d'heures par an la centrale fonctionnera, information environnementale essentielle cachée au nom du secret industriel et commercial. Le juge judiciaire s'affranchira de ces obstacles.

M. Raphël Romi. - Il s'agit de troquer trois recours contre un seul : on demanderait directement au juge judiciaire, qui aura le dossier sous les yeux, de déterminer l'étendue du secret industriel et commercial. Il est à même de réaliser un bilan coûts et avantages, de manière plus satisfaisante que ne le fait l'administration.

M. Christian Cointat, président. - Cette hypothèse est intéressante en cas de contentieux. Mais la plupart des avis sont suivis d'effets. S'adresser au juge judiciaire aggraverait l'engorgement des tribunaux, sans pour autant simplifier les relations avec l'administration au quotidien. Pourquoi ne pas élargir les compétences de la Cada, pour éviter les conflits, en renforçant le caractère exécutoire de ses avis ? En cas de conflit, le juge judiciaire serait compétent avec l'arme du référé car la rapidité, effectivement, est essentielle.

M. Alexandre Faro. - Il faut distinguer le tout-venant et le conflit. La saisine du juge judiciaire pour obtenir communication d'un document s'inscrit dans une perspective précontentieuse et constitue une procédure lourde. Dans cette démarche conservatoire, les frais irrépétibles ne sont pas récupérés, même si le plaignant obtient gain de cause car la partie qui succombe n'est pas condamnée à les payer. Renforçons la Cada et le poids de ses avis. Le juge judiciaire deviendrait juge du conflit et de l'urgence, sans saisine préalable de la Cada.

M. Raphël Romi. - Il faudrait attribuer à la Cada un pouvoir d'injonction, voire un pouvoir d'astreinte, et lui donner compétence pour déterminer ce qui, dans les documents demandés, relève du secret industriel et commercial.

M. Christian Cointat, président. - Je partage votre avis, il faut ajuster le rôle de la Cada. Un conseiller municipal a un droit d'accès à certains documents, pas le maire parce qu'il préside un exécutif et qu'il est à la tête d'une administration...

Mme Corinne Bouchoux, rapporteure. - L'an dernier, dans un arrêt passé inaperçu, le Conseil d'Etat a reconnu une vie privée aux entreprises. Quelles en sont les conséquences pour le droit d'accès à l'information ? Cette décision a paru anodine, or les retombées peuvent en être très importantes, notamment en ce qui concerne l'accès aux documents administratifs, notamment en matière environnemental. Je ne comprends pas que les médias ne s'en soient pas émus.

M. Alexandre Faro. - Depuis longtemps, les entreprises cherchent à se voir reconnaître des droits humains équivalents à ceux des personnes physiques. Lorsque Greenpeace a pastiché les logos de grandes sociétés, celles-ci ont invoqué le droit à l'image, en s'appuyant sur l'article 9 du code civil, comme un particulier. Le juge heureusement a refusé leur raisonnement. La décision du Conseil d'Etat marque un recul, qui vient après d'autres. Lorsque Greenpeace mène des opérations dans des centrales nucléaires, qui sont en France juridiquement classées comme domicile et non comme propriété privée, l'entreprise porte plainte en invoquant la violation de domicile, délit qui fait pourtant partie des atteintes aux personnes. Ce basculement vers une protection de la vie privée des entreprises nuit à la communication des informations. Je suis d'accord avec Mme Bouchoux, je ne comprends pas que l'on n'ait pas plus parlé de cette inflexion.

M. Raphël Romi. - Dans la 8e édition de mon manuel de droit de l'environnement, je taille des croupières à cette décision du Conseil d'Etat ! Quoi qu'il en soit, l'article L. 124-1 du code de l'environnement consacre le droit d'accès aux informations détenues par des personnes publiques, qui dès lors ne relèvent pas du droit à la vie privée des entreprises. Le droit évolue par cycles. La tendance est à considérer que les entreprises doivent bénéficier de droits protecteurs, qui les mettent à égalité avec les Etats. Si les négociations transatlantiques aboutissent, si le pacte est conclu, des entreprises seront fondées à contester le droit des Etats à mettre en place des régulations sanitaires. Le Canada en a fait l'amère expérience après avoir signé l'Alena. Les entreprises bénéficient de plus en plus des mêmes droits que des personnes civiles pour se protéger. Inversement, lorsqu'elles font de la publicité mensongère, elles s'exposent à des procès sur les mêmes fondements que ceux applicables aux personnes physiques. Cela marche aussi dans ce sens ! Le cadre fixé par la loi de 1978 et la convention d'Aarhus est équilibré. Le préserver est un choix politique. Il vaut mieux qu'un régime inspiré du droit anglo-saxon où le juge décide ce qui est communicable sans garantie d'un droit d'accès. Certes, les autorités politiques peuvent décider de limiter le champ des informations communiquées au public : il appartient alors aux citoyens, aux élections suivantes, de trancher.

Mme Corinne Bouchoux, rapporteure. - Y aurait-il ou non un intérêt à transposer au droit commun le régime applicable pour l'environnement ? Doit-on en attendre un nivellement ou au contraire un gain pour la démocratie ?

M. Raphël Romi. - L'expérience dans le domaine du droit de l'environnement montre que l'extension du droit de communication des documents préparatoires ne poserait aucune difficulté.

M. Christian Cointat, président. - D'où l'importance de la Cada !

M. Raphël Romi. - Absolument. Rien ne justifie de privilégier les droits fondamentaux liés à l'environnement par rapport aux autres droits fondamentaux. Ainsi les décisions qui concernent l'économie gagneront en légitimité si les citoyens n'ont pas le sentiment qu'on leur cache des éléments. Il faut bien sûr préserver l'efficacité de l'action des administrations et des entreprises. Mais toute avancée démocratique favorise la cohésion nationale. Autrement dit, la réponse est dans la question.

M. Alexandre Faro. - Le droit de l'environnement, né dans les années 1970, est jeune mais joue un rôle de locomotive. A Stockholm en 1972, le premier Sommet de la terre a consacré le droit à vivre dans un environnement sain comme un droit humain ; or peu de droits humains ont été créés depuis la Révolution française. Mais les avancées doivent bénéficier à l'ensemble du droit, il n'y a pas de chasse gardée pour le droit de l'environnement !

M. Christian Cointat, président. - Monsieur Cendrier, saisissez-vous régulièrement la Cada pour obtenir une information complète et significative ? Les opérateurs sont tenus de la fournir. Autre question, chacun souhaite posséder un téléphone mobile, avec du réseau partout, mais personne ne souhaite l'installation d'antennes-relais sur son toit. Comment surmonter cette contradiction ?

M. Marc Cendrier. - Notre association saisit rarement la Cada, mais elle accompagne souvent les riverains qui la saisissent. La Cada est souvent saisie en cas de difficultés de diffusion des informations par les autorités communales, rarement pour obtenir des informations des opérateurs. Nous incitons les riverains à faire en sorte que les autorités communales demandent aux opérateurs la transmission des données. En effet, le maire a une obligation de protection, obligation morale souvent méconnue. Quand une population est menacée, l'inaction d'un maire constitue une infraction. Nous cherchons à ce que le maire s'adresse officiellement à la direction régionale de l'opérateur en cause pour obtenir une garantie écrite d'innocuité sanitaire, que ne peuvent produire les opérateurs sans rencontrer des problèmes avec leurs assureurs... En effet, en 2000, après avoir consulté un comité d'experts, la Lloyd's, la plus grande compagnie de réassurance au monde, a cessé de couvrir les risques sanitaires liés à la téléphonie mobile. Les autres réassureurs ont suivi. Malheureusement le rapport de ce comité d'experts n'est pas public...

Le maire peut aussi demander aux opérateurs un engagement de respecter la valeur limite d'exposition fixée à 0,6 volt par mètre. Cette démarche est efficace. Soit les opérateurs renoncent, soit ils préfèrent déplacer leurs antennes. Grâce ce devoir de protection, le maire est fondé à s'opposer à la mise en service, voire à ordonner le débranchement des installations.

M. René Garrec. - Donner un pouvoir d'injonction à une autorité hors du champ administratif me gêne toujours. Comme me gênent les demandes d'habilitation à légiférer par ordonnances, surtout lorsqu'elles touchent au code civil.

L'apparition d'un droit souple - le Conseil d'Etat a même fait un rapport sur le sujet - me perturbe. C'est un droit issu de la jurisprudence, non de la loi. Nous nous bornons, comme législateurs, à courir après pour le valider ou le corriger à la marge. Le droit de l'environnement est privilégié, ses praticiens l'ont rendu moteur. Je ne crois pas cependant qu'il faille appliquer ses principes dans tous les domaines. J'ai été le rapporteur des procédures d'urgence ; nous voulions que le juge administratif puisse répondre aussi vite que le juge judiciaire en cas d'urgence. Pouvez-vous préciser, maître, ce que vous pensez des quatre procédures d'urgence qui existent désormais devant le juge administratif ?

M. Alexandre Faro. - Hélas, le constat que nous faisons est que les procédures d'urgence devant les juridictions administratives ne sont pas adaptées à l'exigence de communication des documents administratifs. Tandis que le juge judiciaire peut user de l'article 145 du code de procédure civile, le juge administratif doit se contenter du référé libertés, inadapté, et du référé mesures utiles, très rarement employé. Pour l'avoir vainement essayé, je peux vous dire qu'il ne fonctionne pas. Le juge naturel pour ordonner la communication de documents est le juge judiciaire. Que le juge administratif soit compétent, pourquoi pas - ce n'est pas l'option que je défends - mais alors il faudrait créer un référé spécifique.

M. Raphaël Romi. - Le référé mesures utiles est né de bonnes intentions mais les effets n'ont pas été à la hauteur... Moi aussi j'ai essayé de l'utiliser. Or le juge administratif estime que la demande n'est recevable que si elle ne contrarie pas une décision administrative. Il adopte une interprétation très rigoureuse car il protège l'administration, conformément à sa vocation.

M. René Garrec. - Il la condamne parfois.

M. Raphaël Romi. - Si dans le domaine pénal des installations classées pour la protection de l'environnement, le juge judiciaire déploie toute la panoplie à sa disposition, ce n'est pas le cas du juge administratif. C'est un constat, après trente ans de pratique. Je plaide contre ma paroisse en renvoyant au juge judiciaire : je suis professeur de droit public !

Nous proposons dix mesures : sept spécifiquement dans le domaine de l'environnement et trois plus générales. Si les sept premières seulement sont mises en oeuvre, comme le problème de la santé est de plus en plus lié à l'environnement, les trois dernières (sauf peut-être la dernière) finiront par passer d'abord dans la culture juridique, puis dans les textes ; c'est en effet une pratique parlementaire, et notamment dans cette vieille et sage maison, de s'inspirer de la doctrine. De plus en plus de problèmes économiques sont également directement liés à des problèmes de santé ou d'environnement. La simplification a été dans le sens d'une régression ; il faut la faire évoluer dans le sens d'une meilleure garantie des droits fondamentaux.

M. Christian Cointat, président. - Tous dans cette salle considèrent que la simplification doit être une amélioration. Sinon elle n'en vaut pas la peine ! Je vous remercie.

Audition de M. Serge BLISKO, président de la Mission interministérielle de vigilance et de lutte contre les dérives sectaires (Miviludes) (jeudi 23 janvier 2014)

M. Christian Cointat, président. - Nous accueillons maintenant M. Serge Blisko, médecin, président du conseil de surveillance de l'hôpital Sainte-Anne et président de la Mission interministérielle de vigilance et de lutte contre les dérives sectaires (Miviludes).

M. Serge Blisko, président de la Mission interministérielle de vigilance et de lutte contre les dérives sectaires. - Je vous remercie de nous solliciter. Organisme unique en Europe et peut-être dans le monde, la Miviludes a été créée par le décret du 28 novembre 2002 sous le gouvernement Raffarin et placée auprès du Premier ministre, mais elle résulte d'une initiative parlementaire : autrefois Mission interministérielle de lutte contre les sectes (Mils), elle avait participé au mouvement de prise de conscience du Parlement qui avait abouti à la loi About-Picard. Son action a été soutenue par les pouvoirs publics quelle que soit leur orientation politique - et j'en remercie les parlementaires. Il y a un consensus français à ce sujet, au nom de la protection des victimes et de l'ordre public. La mission ne prend en compte que les actes et comportements contraires aux lois et règlements, portant atteinte aux droits fondamentaux de la personne ou troublant l'ordre public, et ne se mêle pas de doctrine. C'est un garde-fou important. Elle collabore étroitement avec le bureau des cultes du ministère de l'Intérieur. Ses trois missions essentielles sont d'abord l'observation et l'analyse du phénomène sectaire à travers ses agissements attentatoires aux droits de l'homme. Ensuite, la coordination de l'action préventive et répressive des pouvoirs publics, mais pas directement la répression : si nous comptons un commandant de police et un capitaine de gendarmerie dans nos rangs, ils n'ont aucun rôle d'enquête et auditionnent non les auteurs, mais les victimes - ou plus souvent, leurs proches. C'est enfin l'information du public sur les risques et l'aide aux victimes, en collaboration avec les grandes associations. Nous sommes en contact quotidien avec la police et la gendarmerie, les collectivités territoriales, la magistrature, qui nous sollicitent sinon comme experts, du moins comme sachants.

Sous l'autorité d'un président, son équipe permanente dirigée par un secrétaire général est composée de conseillers mis à disposition par les ministères concernés. Loin d'être un organisme tentaculaire, elle ne compte que douze agents, contre quinze dans l'effectif théorique. Elle profite des infrastructures de Matignon : locaux rue Vaneau et secrétariat. Elle est dirigée par un comité exécutif de pilotage opérationnel représentant les directions d'administration centrale concernées et un conseil d'orientation de trente membres à vocation plus philosophique, ouvert à la société civile. Au plan local, chaque département doit, selon le décret, tenir une réunion par an, sous la codirection du préfet et du ou des procureurs de la République qui s'informent mutuellement, invitent les responsables des associations et au besoin l'union des maires du département. Les grandes administrations ont mis en place des correspondants régionaux, au niveau des académies pour l'éducation nationale, ou dans les ARS.

Nous travaillons beaucoup avec les commissions d'enquête parlementaires, comme celle créée ici en 2012 dont les conclusions ont été rendues en avril 2013, qui a défriché un domaine longtemps mis sous le boisseau, les dérives sectaires dans le domaine de la santé. Elle a su distinguer avec finesse les cas courants qui ne nous concernent pas - et dont le ministère de la santé devrait s'occuper... - et les véritables dérives sectaires, qui ont des conséquences graves, refus d'opérations et de chimiothérapies, au bénéfice de produits qui ne soignent pas, voire accélèrent la maladie. Les responsables sont souvent inattaquables, le lien de cause à effet entre absence de traitement ou traitement parallèle étant souvent difficile à établir. Dans un ordre voisin, la psychothérapie déviante est difficile à appréhender. Des gens sans scrupules profitent de cette emprise constante bien décrite par Freud, le transfert, et abusent des personnes dans tous les sens du terme, dans des dérives destructrices qui aboutissent parfois à des tentatives de suicide ou à des décompensations psychiatriques.

Nous devons répondre à 3 000 requêtes par an, soit une dizaine par jour, la plupart par courrier électronique. Nous devons y répondre de manière formalisée, par une lettre à en-tête, avec signature manuscrite, ce qui entraîne un grand volume de papier - paradoxe lorsqu'il s'agit d'un mail de trois lignes. Nous devons nous astreindre à une certaine langue de bois, nos lettres pouvant être exploitées. De gens nous testent, demandant notre avis sur tel mouvement. Nous répondons qu'il ne nous a pas été signalé, mais que cela ne signifie pas qu'il soit inoffensif... Devant une telle lettre, les vraies victimes se demandent peut-être si cette administration qui a mis un mois à répondre ne se moque pas d'elles. Aussi nous privilégions les contacts téléphoniques. Lorsque nous percevons une détresse, lorsque la personne lance manifestement un cri d'alarme, nous la joignons par téléphone, lui proposons un rendez-vous. L'entretien est conduit par les représentants de la police et de la gendarmerie. Ils doivent éviter l'instrumentalisation, par exemple en cas de séparation, signaler des gens pris dans des systèmes d'extorsion financière, orienter la victime vers un parcours judiciaire, suggérer une mise sous tutelle, etc. Nous sommes parfois saisis par des institutions publiques - mairies, conseils généraux - et recevons aussi des témoignages.

Nous gérons donc une masse de renseignements sensibles de personnes dont nous devons protéger l'anonymat : témoignages, certificats médicaux ou psychiatriques, relevés bancaires. Les victimes sont comparables à celles des violences conjugales ou périconjugales, qu'on ne peut pas traiter comme les autres victimes à cause de leur rapport particulier avec l'auteur des violences. Elles voudraient que cela s'arrange, restent sous l'emprise de l'autre. Dans certains procès, comme à Lisieux, la justice hésite entre qualifier certains de victimes ou de complices. Certains ne portent pas plainte, ou la retirent. Enfin, nous procédons à des signalements, dans le cadre de l'article 40 du code de procédure pénale, mais pas systématiquement.

Voici quelques exemples de personnes qui nous contactent : une jeune femme rejetée par son ami qui a adhéré à la Nouvelle Acropole, une victime de Michaël Aïvanhov qui dénonce les violences sexuelles subies par les mineurs et les jeunes adultes, une victime de Galacteus, alias Iso Zen, qui ne veut pas que d'autres soient piégés, un enfant de Témoins de Jéhovah victime d'abus sexuels à l'adolescence et témoignant pour que ses parents comprennent les torts qu'ils ont causé, un mari décrivant les séances d'hypnose à laquelle sa femme se soumettait durant toute la nuit, pour finalement s'enfuir avec son thérapeute. Un ex-adepte des Témoins de Jéhovah nous demande de ne pas dévoiler son nom pour conserver les liens ténus qu'il conserve avec les membres de sa famille toujours adeptes.

Voici cinq exemples de livres de témoignage récemment parus : Moi, ancien légionnaire du Christ, de Xavier Léger ; Cinq ans de cauchemar, d'Eric et Julie Martin, sur le Parc d'accueil ; Nous n'étions pas armés de Christine de Védrines, sur l'affaire connue des reclus de Monflanquin ; Le silence et la honte, de Solveig Ely sur le mouvement catholique des Béatitudes ; De l'enfer à l'endroit, de Myriam Declair, ancienne adepte de la Famille de Dieu, anciennement les Enfants de Dieu, ce groupe post-soixante-huitard d'apparence sympathique mais qui en réalité constituait un enfermement atroce autour d'un gourou.

Nous sommes attentifs au respect de la loi du 16 juillet 1978 et son article 6 en particulier, qui fait la liste des exceptions à la règle de communicabilité. Nous sommes très critiqués par les mouvements sectaires, bien sûr, mais heureusement cette loi protège les victimes et non les mouvements sectaires. J'y insiste, nous ne les jugeons jamais sur la doctrine. En France, il y a 200 adorateurs de l'oignon, mouvement de gens charmants, que ses membres peuvent quitter quand ils veulent, et qui nous a demandé de certifier qu'ils n'étaient pas une secte. Il y a une infinité de convictions et de croyances.

Nous ne communiquons jamais de données nominatives, bien sûr, mais nous masquons aussi la ville d'origine, les circonstances précises, les dates... Car les mouvements sectaires disposent de quasi-services de renseignements, voire de barbouzes. Nous refusons de communiquer toute donnée relevant du secret médical et du secret de la vie privée.

La Cada considère les documents que nous recevons comme des documents administratifs au sens de l'article 1er de la loi, ce que nous comprenons. Nous sommes bombardés de demandes par les mouvements, qui changent de nom : la Scientologie devient Ethique et liberté ou le Comité citoyen pour les droits de l'homme, qui se fait une spécialité des visites dans les hôpitaux psychiatriques. Les Témoins de Jéhovah deviennent les Comités de liaison hospitaliers, qui pénètrent dans des hôpitaux ou des établissements médico-sociaux hébergeant des personnes âgées ou handicapées pour les convertir.

Nous répondons favorablement aux demandes de communication de documents pourvu qu'ils ne mettent pas en cause l'identité des personnes : articles de presse, décisions de justice, publications de chercheurs. Nous avons parfois des demandes étranges : en 2013, une demande d'Ethique et liberté à propos de quatre réunions du conseil d'orientation de la Miviludes en 2011 auxquelles participait Mme Picard, présidente de l'Union nationale des associations de défense des familles et de l'individu victimes de sectes (Unadfi). Nous avons alerté cette dernière et communiqué les comptes rendus demandés en occultant les données personnelles, y compris les noms des fonctionnaires présents non à titre personnel, mais en tant que représentants de leur administration. La mairie de Bordeaux, ayant organisé un colloque à la demande de maître Picotin, nous a signalé une demande de communication... Bref, nous faisons face à une véritable guérilla administrative.

La transparence administrative est une avancée démocratique. Même si les demandes des lobbies n'ont pas d'autre vocation que de gêner notre action, la loi de 1978 est équilibrée et nous convient très bien.

Mme Corinne Bouchoux, rapporteure. - Une question difficile : est-il toujours possible de faire la différence entre une église reconnue, enregistrée comme telle au bureau des cultes, et un mouvement sectaire ?

M. Serge Blisko. - Nous travaillons avec le bureau des cultes mais aussi avec les églises elles-mêmes. Le Conseil national des évangéliques de France s'est doté d'un observatoire national des dérives sectaires évangéliques, dirigé par le pasteur Anjou ; la conférence des évêques de France a réorganisé son bureau des dérives sectaires, dirigé par soeur Chantal-Marie Sorlin, une ancienne juge d'instruction, juge à l'officialité de Dijon ; l'Union bouddhiste de France nous signale tel ou tel groupe. La dérive sectaire se repère très vite et ce sont bien souvent les adeptes eux-mêmes qui donnent l'alarme : l'autorégulation fonctionne.

M. Jean-Jacques Hyest. - Que dire des dérives sectaires dans le monde de l'Islam, et de ces jeunes qui partent au Jihad à l'étranger - par centaines selon le ministre de l'Intérieur ?

M. Serge Blisko. - En lanceurs d'alerte, nous avons vu monter le phénomène en deux ans. Cependant, les départs à l'étranger de jeunes gens ne relèvent pas de nous. En revanche, des familles, musulmanes ou non, nous signalent des cas de jeunes filles qui s'enferment progressivement dans une conception très étroite de la religion musulmane. C'est un problème délicat, chacun étant libre de sa pratique religieuse : tant que la loi n'est pas transgressée, nous ne pouvons rien faire.

M. Christian Cointat, président. - Je vous remercie.

Audition de Mmes Mathilde MATHIEU, journaliste chargée des enquêtes politiques, et Martine ORANGE, journaliste affaires économiques, et M. Jérôme HOURDEAUX, journaliste actualité du web, à Médiapart (mercredi 29 janvier 2014)

M. Jean-Jacques Hyest, président. - Cette audition est ouverte au public et à la presse et fera l'objet d'un compte rendu publié. Notre mission, constituée à l'initiative du groupe écologiste, examine les progrès réalisés et les difficultés rencontrées dans l'accès aux documents administratifs et aux données publiques, dont Médiapart est un utilisateur important dans le cadre de ses enquêtes. Quelles sont vos appréciations, expériences, attentes et suggestions à cet égard ?

Mme Mathilde Mathieu, journaliste à Médiapart. - Je suis les coulisses et le financement de la vie politique, le train de vie des élus. Mon expérience concerne la commission des comptes de campagnes, avec laquelle nous sommes en contentieux devant le tribunal administratif, au sujet des comptes de Nicolas Sarkozy et de Jean-Marie Le Pen en 2007. Nous avons décidé, à Médiapart, d'analyser systématiquement le détail des comptes (factures, notes de frais, etc.) de tous les candidats à l'élection présidentielle. Confrontée à nos demandes, la commission a dû recruter du personnel, créer une jurisprudence, qui a évolué en fonction des incohérences que nous avons relevées. Nous avons également demandé à avoir accès aux documents relatifs à la phase d'instruction de la commission, essentiellement des échanges de courriers entre celle-ci et les trésoriers de campagne. La commission ayant refusé notre demande de communication, estimant qu'il ne s'agit pas de documents administratifs, nous nous sommes adressés à la Cada, qui a donné un avis favorable dans le délai d'un mois. La commission a néanmoins maintenu son refus. Nous avons donc saisi le tribunal administratif, lequel doit statuer ce vendredi 31 janvier. Au cas où il ferait droit à notre demande, je ne doute pas que la commission interjettera appel. A part de grands médias nationaux, qui peut payer des frais d'avocats et suivre une procédure longue pour contester les décisions de refus de communication de documents administratifs ? Un site local indépendant comme Montpellier journal n'en a pas les moyens et doit donc s'en tenir aux avis de la Cada qui, une fois sur deux, ne sont pas suivis par l'administration !

M. Jean-Jacques Hyest, président. - Il est plus difficile de les faire respecter par une autorité administrative indépendante, comme la commission des comptes de campagne, que par une administration. Je ne suis pas sûr que la proportion que vous citez soit exacte...

Mme Mathilde Mathieu. - Il faut tenir compte des non-réponses. Après la campagne présidentielle de 2012, la commission a rejeté le compte de campagne de Nicolas Sarkozy. Pour informer les citoyens, nous avons demandé communication de sa décision, bien avant que le Conseil constitutionnel se prononce. Elle ne s'est exécutée qu'après. Là aussi, la Cada avait rendu un avis favorable à Médiapart. Nous estimons que la commission des comptes de campagnes a abusé de son pouvoir en prétendant que ces informations pourraient être mal interprétées et influencer la décision du Conseil constitutionnel. Nous pensons que le droit d'informer les citoyens doit prévaloir.

M. Jean-Jacques Hyest, président. - C'est comme si un tribunal de grande instance refusait de publier sa décision au motif qu'elle pourrait influencer la cour d'appel...

Mme Mathilde Mathieu. - En effet. Une autre expérience concerne la lisibilité des données publiées en matière d'environnement. Celles qui relatent les émissions de CO2 des entreprises françaises sont toutes publiques, mais elles sont publiées usine par usine. Non agrégées, elles en deviennent illisibles. Un polytechnicien a passé des semaines à Médiapart pour élaborer un logiciel permettant de les consolider, entreprise par entreprise, afin que nous puissions établir une liste de celles qui polluent le plus. Il semble anormal que ce travail ne soit pas simplifié, comme si l'administration souhaitait que ces données soient le moins lisibles possible.

M. Jean-Jacques Hyest, président. - Il serait effectivement intéressant de disposer de données regroupées par bassin, la vallée de la Seine par exemple, où sont concentrées des industries pétrolières et pétrochimiques.

Mme Martine Orange, journaliste à Médiapart. - Je m'intéresse aux données statistiques et de prévisions dans le domaine économique et financier. Or nous constatons que la fiabilité des chiffres publiés baisse de manière spectaculaire. Les méthodologies changent, les séries statistiques sont rompues, de telle sorte qu'il devient difficile d'obtenir des séries cohérentes, comparables sur longue période. Même pour des données classiques, concernant le chômage, l'emploi, l'activité économique, les chiffres ont perdu en fiabilité. Des séries brutes sont présentées, d'où il faut extraire les chiffres pertinents.

Sur le médicament, domaine où Médiapart a beaucoup enquêté, avec le scandale du Médiator, l'agence de santé publie des chiffres depuis 2010. Nous n'avons rien avant cette date, ce qui empêche par exemple de reconstituer l'évolution des prix des médicaments.

Bercy est une administration à part. L'élaboration d'un budget suppose des précisions, des évaluations. Obtenir une note de la direction de la prévision tient maintenant du scoop ! Il est très difficile d'accéder aux évaluations du ministère du budget ou du ministère de l'économie et des finances, qui devraient normalement faire partie du débat public, parce qu'elles fondent des décisions aussi importantes que des hausses d'impôts, par exemple.

Parfois, le ministre annonce qu'il commande un rapport sur telle ou telle question, ainsi Pierre Moscovici, en décembre 2012, sur les PPP (partenariats public-privé), dont la Cour des comptes venait de souligner les dérives. Un an après, j'ai demandé ce qu'il en était et l'on m'a répondu que cela ne me regardait pas. C'est dommage : il serait intéressant de connaître ce que Bercy reprend des analyses de la Cour des comptes.

Le secret fiscal, compréhensible pour les particuliers, l'est moins pour les entreprises. Ainsi, en 2010 ou 2011, la commission des finances de l'Assemblée nationale a demandé au conseil des prélèvements obligatoires un rapport sur des niches fiscales bénéficiant aux entreprises, dont le bénéfice mondial consolidé, qui a été supprimé depuis. A l'époque huit à dix entreprises seulement en bénéficiaient. Impossible de savoir lesquelles, en vertu du secret fiscal, pour une niche de 600 millions d'euros, alors même que les entreprises sont tenues de divulguer des informations fiscales dans leur rapport annuel et plus encore sur le site de la SEC (Securities Exchange Commission) aux Etats-Unis. C'est ainsi que j'appris que Total et Vivendi en bénéficiaient. Pourquoi invoquer le secret fiscal, qui n'existe pas pour les entreprises ? Ainsi Renault, dont l'État est actionnaire, se félicite-t-elle dans son rapport annuel que son taux de fiscalité soit de 8 % seulement. Il serait intéressant de comprendre comment elle arrive à ce taux. On ne saisit même pas la Cada, quand le secret fiscal est invoqué, puisque l'on sait que l'avis sera négatif.

Tout rescrit fiscal accordé à une entreprise ou à un particulier fait jurisprudence. Or je vous mets au défi de trouver sur le site de Bercy l'endroit où les rescrits sont confinés. Seulement la moitié d'entre eux sont publiés et la plupart sont illisibles. Le jour où le groupe Lagardère a vendu toutes ses participations dans EADS, il a bénéficié d'un rescrit, l'exemptant de l'impôt sur les plus-values. Je n'ai jamais pu obtenir ce rescrit, portant sur 800 à 900 millions d'euros. Là encore, le secret fiscal pose problème.

M. Jérôme Hourdeaux, journaliste à Médiapart. - Mon expérience concerne internet et les marchés publics. Je n'ai saisi qu'une fois la Cada, hier, afin d'obtenir communication du contrat dit « open bar » liant le ministère de la défense à Microsoft, conclu en 2009 pour l'équipement d'une partie du parc informatique du ministère. Ce contrat a donné lieu à polémique sur la souveraineté nationale, l'indépendance numérique. Dès 2009, la presse a révélé les négociations entre Microsoft et le ministère de la défense ; l'April (Association pour la promotion et la défense du logiciel libre) a saisi la Cada pour demander une copie du contrat. Elle l'obtint rapidement... toutes les parties intéressantes du document étant noircies. Il a fallu quatre ans de combat des associations et des journalistes pour obtenir le document, qui a fuité par des sources extérieures à la Cada. Rien ne relevait du secret défense dans ce contrat. Mais comment fut-il signé ? Il y eut des notes internes, très défavorables, un rapport d'experts, très critique, la commission consultative des marchés publics (CCMP) a donné un avis favorable mais très critique. Ces documents n'ont finalement été publiés qu'en octobre 2013, soit quatre ans après la signature du contrat, au moment de son renouvellement. Je m'y suis intéressé en septembre 2013, à l'occasion de ce renouvellement. J'ai demandé communication du contrat à la Dicod (Délégation à l'information et à la communication de la défense), qui a refusé de me répondre, avant de m'informer la veille de la publication de mon article qu'elle ne me le communiquerait pas et que la CCMP était saisie du renouvellement du contrat. Cela au bout d'un mois. Pour saisir la Cada, il faut identifier les documents et les services émetteurs, chose complexe en l'occurrence, car depuis, la CCMP a été supprimée. J'ai appris après moult courriels, appels téléphoniques et relances que le document est en possession du service interne de documentation et d'informatique et que je dois m'adresser au ministère de la défense, lequel en a publié une version noircie. Bref, on est reparti pour quatre ans ! Le rythme magazine de Médiapart permet de consacrer de longs mois à de telles enquêtes, ce qui est exclu lorsque l'on travaille, comme je le fis au Nouvel Observateur, pour des sites où prime l'actualité quotidienne.

M. Jean-Jacques Hyest, président. - Il existe des notes internes, préparatoires, qui n'ont pas vocation à être publiées.

Mme Martine Orange. - Bien sûr, mais il en va différemment quand une annonce est faite, quand le ministre déclare qu'il fera le point sur le sujet, quand un contrat est signé... Voyez l'émotion suscitée par le contrat Ecomouv', qui n'est pas publié au nom du secret industriel et commercial, alors qu'il engage l'Etat pour onze ans et demi.

M. Jean-Jacques Hyest, président. - Certains marchés de la défense relèvent du secret défense...

M. Jérôme Hourdeaux. - En l'espèce, ce n'est pas le cas. Le secret commercial a été invoqué, alors que rien, à ma connaissance, ne le justifie. C'est l'aspect polémique du dossier qui a gêné le ministère de la défense, une note se référant à la polémique médiatique.

Mme Mathilde Mathieu. - Sur le secret défense, nous avons constaté un jeu de dupes : un juge qui veut déclassifier des documents en fait la demande au ministre, lequel transmet à la commission consultative du secret de la défense nationale, dont il suit l'avis ou pas. In fine, c'est lui qui décide, ce que nous estimons, à Médiapart, contraire à la séparation des pouvoirs. Il faudrait faire bouger les lignes sur ce sujet.

M. Jean-Jacques Hyest, président. - Nous ne l'avions pas envisagé a priori. C'est un sujet en soi. Le ministre suit généralement l'avis de la commission.

Mme Mathilde Mathieu. - Mais c'est l'administration qui décide ce qu'elle transmet ou pas à la commission.

M. Jean-Jacques Hyest, président. - C'est un peu schématique... Quid des données publiques ? Il existe des ruptures, en matière de sécurité, par exemple lorsque la gendarmerie change de logiciel. Vous avez évoqué le domaine de l'emploi...

Mme Martine Orange. - Les données sont devenues quasiment illisibles...

M. Jean-Jacques Hyest, président. - Cela n'a-t-il pas toujours été le cas ?

Mme Martine Orange. - Le degré de complexité, de non-fiabilité atteint est considérable. On ne fait pas de bonne politique sans chiffres fiables.

Mme Corinne Bouchoux, rapporteure. - Comment comparez-vous la situation de la France par rapport à celle d'autres pays ? Avez-vous des suggestions utiles du point de vue démocratique ?

M. Jérôme Hourdeaux. - Outre le Freedom of Information Act aux Etats-Unis, dans le système européen, les procédures du type Cada sont réservées au règlement des conflits, la communication est la règle et a lieu en amont. Du côté européen, le site AsktheEU.org regroupe les demandes adressées aux institutions européennes et les réponses sont publiées pour éviter la multiplication des demandes identiques. La Cada est conçue comme une institution destinée à nous aider en cas de conflit avec les administrations.

Mme Mathilde Mathieu. - La question essentielle est la suivante : que pouvez-vous proposer pour que l'administration suive les avis de la Cada ? Le recours au tribunal administratif n'est pas jouable pour la plupart des journalistes...

M. Jean-Jacques Hyest, président. - D'autant que vous vivez au rythme de l'actualité...

Mme Martine Orange. - J'appelle de mes voeux un changement de culture de la part de Bercy.

M. Jean-Jacques Hyest, président. - Le savoir, c'est le pouvoir...

M. Jérôme Hourdeaux. - Souvent, on nous répond : « je n'ai pas à vous le dire... ». La logique qui prévaut, à rebours de l'esprit de la loi de 1978, consiste à considérer tout document non publié comme inaccessible.

M. Jean-Jacques Hyest, président. - De la part de tous les services ?

M. Jérôme Hourdeaux. - Certains services de presse sont plus efficaces que d'autres...

Mme Martine Orange. - Cela dépend des sujets. Il est parfois plus difficile d'obtenir des informations des collectivités locales que de l'Etat...

M. Jean-Jacques Hyest, président. - Sur l'urbanisme ?

Mme Martine Orange. - Par exemple, sur certains appels d'offres ou décisions du conseil municipal...

M. Jean-Jacques Hyest, président. - Elles sont publiques !

Mme Mathilde Mathieu. - Le problème est toujours le même : que faire face à un refus illégal ? Saisir la Cada...Et que faire si l'administration ne suit pas son avis ?

M. Jérôme Hourdeaux. - Sur le contrat qui fait l'objet de mon enquête, la Disic (Direction interministérielle des systèmes d'information et à la communication) a refusé de me communiquer deux avis qu'elle a rendus concernant les ministères de la santé et des affaires sociales, au motif que ses avis ne sont pas publics. Qui en décide ? Je vais faire une demande écrite...

M. Jean-Jacques Hyest, président. - Les réunions des conseils municipaux sont publiques...

Mme Mathilde Mathieu. - Il peut y avoir des travaux préparatoires...

Mme Hélène Lipietz. - L'information des conseillers municipaux eux-mêmes n'est pas toujours au point, puisqu'ils sont parfois obligés de saisir eux-mêmes la Cada... Et ils ne savent que ce que le maire veut bien leur dire !

M. Jean-Jacques Hyest, président. - Même pour l'achat d'une tondeuse à gazon, je passe devant le conseil municipal.

Audition de M. Rémi NOYON, journaliste à Rue 89 (mercredi 29 janvier 2014)

M. Rémi Noyon, journaliste à Rue89. - Je m'intéresse aux données publiques et à leur utilisation. Rue89 a été créée en 2007, comme pure player, employant aujourd'hui une trentaine de personnes, dont 19 sont titulaires de la carte de presse. Cet environnement numérique nous amène naturellement à pratiquer la visualisation de données issues de diverses sources. Ce sont des journalistes qui travaillent ces données et non pas des développeurs. Il importe donc pour nous que ces données soient « propres », lisibles par une machine, sans discontinuité et présentées de façon aisément compréhensibles. Ayant déterminé un angle, nous collectons des données, dans l'idéal déjà disponibles sur data.gouv.fr, afin d'y sélectionner celles que nous publierons. Ce site mis en place par Etalab en 2011 réunit les données de diverses administrations et collectivités. Depuis sa refonte l'an dernier, il est devenu une véritable plateforme collaborative. De nouvelles séries sont arrivées, qui étaient payantes auparavant. Avec l'open data, on passe d'une logique de demande à une logique d'offre. Il m'arrive de croiser des données publiées sur le site pour faire émerger de nouvelles idées.

Auparavant, les données accessibles paraissaient volontairement tronçonnées, comme pour en gonfler le volume. Un effort de clarification, de simplification, de regroupement des données a été heureusement accompli. Les résultats des élections municipales de 2008 sont encore ventilés par le ministère de l'intérieur entre communes de plus de 3500 habitants et communes de moins de 3500 habitants, ces dernières étant encore subdivisées en deux groupes. Il serait utile de regrouper l'ensemble.

A l'inverse, il y a sur le site des interfaces très bien faites, à développer, comme la base de données macroéconomiques de l'Insee ou la base de données d'économie de la santé de l'Irdes (Institut de recherche et documentation en économie de la santé), qui nous permettent de cocher les données qui nous intéressent pour les analyser par thèmes ou zones géographiques.

Le format des données importe particulièrement aux non-informaticiens que nous sommes. Sur la réserve parlementaire, un professeur de mathématiques du Lot-et-Garonne, M. Hervé Lebreton, a obtenu du tribunal administratif, après avoir dans un premier temps saisi la Cada, que le ministère de l'intérieur lui communique les données. Lui fut transmis un fichier au format pdf de 1038 pages qu'il a dû, avec son association « Regards citoyens », ressaisir manuellement pour le trier par commune, par parlementaire, etc, afin de transmettre un fichier tableur au format csv aux journalistes. Sur le site data.gouv.fr, les fichiers des réserves parlementaires 2011 et 2012 sont encore au format pdf. Nous avons dû rajouter à la main l'appartenance aux groupes politiques, aux circonscriptions des Parlementaires, afin de traiter les données géographiquement. Il existe beaucoup d'exemples semblables.

Les données relatives aux cadeaux faits aux médecins par les fabricants de médicaments sont publiques mais elles sont inexploitables : il s'agit de fichiers pdf qu'il faut ouvrir un par un et qu'il est donc difficile de compiler.

Les nomenclatures de fichiers posent aussi des problèmes. Ainsi, le fichier des accidents corporels sur la route, mis à jour tous les deux ans par le ministère de l'intérieur, figure sur data.gouv.fr mais les intitulés des colonnes sont abscons, et nécessitent de consulter une nomenclature : 0 pour un vélo, 1 pour une voiture... Il semble aisé de rendre ce fichier plus lisible, quoique cela supposerait de former tous les policiers qui y saisissent les données. Autre exemple : le ministère de l'intérieur n'a pas mis en ligne le découpage des circonscriptions. Or, pour faire des cartes lors des élections, nous avons besoin d'un fonds de carte qui ne soit pas une image mais un support interactif. Heureusement, des initiatives comme OpenStreetMap ont constitué un tel support.

Certaines bases de données devraient être immédiatement disponibles en ligne : je pense aux résultats des élections, aux données économiques essentielles... Les données publiées sur les élections sont peu commodes à exploiter : il y a une ligne par commune, ce qui rend difficile d'extraire, par exemple, les résultats d'une liste donnée dans un département. Un meilleur dialogue avec les services concernés devrait résoudre ce problème, en leur faisant mieux comprendre nos besoins. Le ministère de la culture est celui qui publie le moins de données. Certes, il communique les chiffres de la fréquentation des musées et des centres culturels. Mais il ne nous informe guère sur le patrimoine des musées. Or, il serait intéressant de disposer, par exemple, de toutes les métadonnées sur chaque tableau. Il n'est que de suivre l'exemple donné par le mobilier national.

Pour résumer, il faudrait que les différentes collectivités territoriales s'appliquent à diffuser les données dans un format ouvert et lisible par des machines, en respectant le référentiel général d'interopérabilité. Saisir la Cada suppose de connaître le document exact auquel on souhaite avoir accès, ce qui n'est pas toujours le cas. Les données économiques les plus importantes devraient être spécialement accessibles en ligne. Il faudrait aussi - mais cela dépasse peut-être le cadre de votre mission - que dans les cas où la loi contraint les entreprises à publier des données, comme c'est le cas pour la pratique des cadeaux faits aux médecins, cette publication soit faite sous une forme lisible.

Mme Corinne Bouchoux, rapporteure. - Merci pour ce panorama. Que savez-vous de la nouvelle formation des jeunes journalistes ? Je crois que les plus anciens utilisent les documents administratifs auxquels ils peuvent avoir accès plutôt comme illustration de leurs enquêtes, quand les plus jeunes ont une méthode différente : ils se plongent d'emblée dans les données pour y chercher un sujet à traiter.

M. Rémi Noyon. - Oui. Par exemple, un journaliste a collecté les données du ministère de la jeunesse et des sports sur le nombre d'inscrits, dans chaque commune, pour chaque sport, afin de dessiner une carte de France des sports les plus pratiqués. Ce type d'idée vient lorsque l'on découvre quelles données sont disponibles. La formation fait une part de plus en plus grande au numérique, avec des cours d'utilisation des données dispensés par des développeurs. Mais si l'utilisation élémentaire de ce type d'outils s'acquiert vite, leur maîtrise approfondie réclame une formation beaucoup plus longue que les deux ans que nous passons en école. Certains apprennent ensuite par la pratique. Quant à la démarche intellectuelle, elle peut partir des données quand celles-ci sont disponibles, ou y conduire, selon le type de sujet.

M. Jean-Jacques Hyest, président. - Vous avez évoqué le traitement par le ministère de l'intérieur des données relatives aux élections. Il évoluera.

M. Rémi Noyon. - Les données sur les élections de 2001 et de 2008 ne sont pas structurées pour une utilisation efficace. Un journaliste travaillant à La Croix, Laurent de Boissieu, a créé un site intitulé France Politique, qui expose ces données. Les journalistes s'y réfèrent désormais plus volontiers qu'au site du ministère de l'intérieur !

Mme Hélène Lipietz. - J'essayais, en vous écoutant, de rechercher des données sur mon ordinateur. Je constate que certains sites sont difficilement lisibles ! Ainsi, le site data.gouv.fr propose la liste des monuments protégés. Mais comment y accéder ? Mystère !

M. Rémi Noyon. - Il y a plusieurs formats de fichiers sur ce site : les fichiers en .doc ou .pdf ne sont pas des tableurs. Les fichiers de tableurs peuvent être en deux formats : en .xls ou en .csv, ce qui est préférable car c'est un format compatible avec les logiciels libres. Certaines données sont parfois présentées sous différents formats, ce qui reflète un bel effort de simplification. J'imagine que dans le cas de la réserve parlementaire, le ministère de l'intérieur a fait preuve de mauvaise volonté...

M. Jean-Jacques Hyest, président. - Mais non !

Mme Corinne Bouchoux, rapporteure. - Les journalistes que nous avons auditionnés à l'instant nous ont expliqué qu'ils suivaient la stratégie, coûteuse, du recours à la Cada et aux tribunaux administratifs. Rue89 a fait un autre choix. Est-ce pour des raisons financières ? Ou s'agit-il d'un parti pris méthodologique, qui consiste à privilégier le témoignage oral et les investigations ?

M. Rémi Noyon. - Rue89 est un site participatif qui fait une large place aux témoignages de ses lecteurs. Une demande à la Cada met du temps à aboutir. Le rythme des médias, surtout sur internet, est incompatible avec de tels délais. Par exemple, sur l'utilisation de la réserve parlementaire en 2011 et 2012, les informations sont arrivées à un moment où l'intérêt pour la question s'était refroidi.

Mme Corinne Bouchoux, rapporteure. - Comment vous prémunissez-vous contre les erreurs matérielles lorsque vous utilisez des fichiers volumineux ? J'ai entendu parler d'un cas où un décalage d'une ligne avait entièrement faussé un travail sur des données pourtant exactes. Avez-vous une procédure de vérification ?

M. Rémi Noyon. - Plusieurs cas de figure sont possibles. Par exemple, avec le géo-référencement, un logiciel peut vous induire en erreur lorsque le nom d'une ville est mal orthographié : Bourges sans « s », « Mans » pour « Le Mans »... Ainsi, lors d'une enquête sur la pauvreté dans les cent plus grandes villes de France, je me suis aperçu que le nom de certaines villes, comme Saint-Denis, pouvait poser problème au logiciel, qui hésite entre l'Ile-de-France ou La Réunion ! Data.gouv.fr permet de signaler des erreurs. La meilleure parade est de disposer de données référencées avec le plus de précision possible, par exemple avec les codes de l'Insee. Certains ajouts inutiles dans la désignation des départements perturbent, à l'inverse, les recherches. Lorsque nous publions une carte, nous y ajoutons toujours un onglet grâce auquel les lecteurs peuvent nous signaler d'éventuelles erreurs.

M. Jean-Jacques Hyest, président. - Il faut que le Gouvernement harmonise ces fichiers. Si les fichiers ne sont pas homogènes, comment faire des comparaisons ?

M. Rémi Noyon. - Si vous voulez croiser deux fichiers ville par ville, et que l'un a des données pour « Le Mans » et l'autre pour « Mans », la machine n'y arrivera pas !

M. Jean-Jacques Hyest, président. - Je suis maire d'une commune qui s'appelle La Madeleine-sur-Loing, et est tantôt référencée à « Madeleine », tantôt à « La Madeleine », sans qu'on sache pourquoi.

Mme Corinne Bouchoux, rapporteure. - Est-il vrai que les informations sur les DOM manquent souvent dans les bases de données ?

M. Jean-Jacques Hyest, président. - Sur les COM, aussi...

M. Rémi Noyon. - Souvent, les fichiers indiquent qu'ils ne traitent que la France métropolitaine. Parfois, des fichiers séparés les complètent pour l'outre-mer. Certains fichiers comportent aussi les données sur les DOM. Nous sommes vigilants, bien sûr.

Mme Corinne Bouchoux, rapporteure. - Si vous avez des propositions à formuler, n'hésitez pas à nous les adresser.

M. Jean-Jacques Hyest, président. - Merci.

Audition de MM. Edouard PERRIN et Paul MOREIRA, journalistes à Premières lignes (mercredi 29 janvier 2014)

M. Jean-Jacques Hyest, président. - Nous recevons M. Edouard Perrin, journaliste à Premières lignes, qui produit Cash investigation, grand reporter dont les reportages ont été diffusés, entre autres, dans Complément d'enquête et Envoyé spécial, ainsi que M. Paul Moreira, également grand reporter et journaliste d'investigation. Messieurs, votre métier vous conduisant à solliciter régulièrement les administrations publiques pour obtenir des informations, vous êtes des témoins et des acteurs de l'accès aux documents administratifs et aux données publiques. Je vous propose donc de nous faire partager votre expérience en la matière, en France comme aux Etats-Unis où vous avez passé une partie de votre carrière avec le Freedom of information Act. Vous nous indiquerez également quelles seraient les améliorations susceptibles d'être apportées à la situation actuelle.

M. Paul Moreira, journaliste. - En 2004, avec une quinzaine de journalistes, nous avions lancé une pétition intitulée « Liberté d'informer, pour un accès plus libre à l'information » - qui a recueilli plus de 6 000 signatures - pour l'adoption d'un Freedom of information Act à la française. Nous avons organisé un colloque sur le sujet à l'Assemblée nationale, avec notamment des personnalités comme Corinne Lepage, François Loncle, Harlem Désir, William Bourdon et rédigé une proposition de loi qui, entre autres choses, prévoit qu'en cas de refus de communiquer, l'administration devra apporter la preuve concrète que le document tombe sous le coup d'une exemption prévue par la loi.

Notre combat, comme citoyens autant que journalistes, vient de ce que nous avons vu le droit d'information dans d'autres grandes démocraties, en particulier aux Etats-Unis, en Grande-Bretagne et en Suède : l'accès aux informations administratives y est très fluide, les administrations publient en très grand nombre les procès-verbaux de leurs réunions internes, il y est naturel de se faire communiquer des pièces d'un dossier d'instruction et, en Suède, jusqu'à la note de frais d'un ministre - par exemple l'addition du restaurant où il a déjeuné la semaine précédente. Pourquoi est-ce possible en Grande-Bretagne, en Suède, et pas en France ? Les législations de ces pays ne sont pas toujours très anciennes : la Grande-Bretagne a rénové ses règles en 2004 - et la démocratie ne s'est pas effondrée du fait de la plus grande transparence administrative. Nous avons rencontré une forte opposition, y compris parmi les journalistes - je pense en particulier à Laurent Joffrin, qui s'inquiète d'une « dictature de la transparence », une expression que je ne comprends pas bien s'agissant d'actes publics et non pas privés, la protection de la vie privée étant bien sûr un droit fondamental dans nos sociétés, y compris pour les personnalités publiques.

M. Jean-Jacques Hyest, président. - Mais il y a aussi le secret de l'instruction, qu'en faites-vous ?

M. Paul Moreira. - Existe-t-il seulement dans notre système actuel ? Chacun sait que non : les fuites sont organisées, ce qui revient à manipuler le secret de l'instruction, toujours au profit d'une partie. Le système américain est plus clair : le procureur rend publiques des pièces et répond aux questions.

M. Jean-Jacques Hyest, président. - Ce qui n'empêche pas, du reste, des manipulations...

M. Paul Moreira. - Certainement, comme dans toute organisation humaine, il ne faut pas être naïf. Cependant, la transparence me paraît plus équilibrée que la fausse opacité...

Pendant la guerre du Golfe, le gouvernement américain imposait un blocus sur toute information relative aux soldats américains blessés ou tués, jusqu'à ce qu'une photo soit publiée, représentant une cinquantaine de cercueils enveloppés du drapeau américain. D'où venait cette photo ? De l'armée, et c'était un universitaire américain qui en avait obtenu la publicité à l'issue d'une bataille juridique, en fondant sa demande sur le Freedom of information Act - avec des délais d'instruction très rapides, c'est aussi une différence d'avec la situation française où des droits peuvent être reconnus, mais avec des conditions de réalisation qui leur enlèvent quasiment toute effectivité.

Notre but, avec cette pétition, c'était donc d'abord de montrer les bienfaits de la liberté d'informer, pour la démocratie elle-même, et d'identifier les points de blocage en France. C'est l'historien Antoine Prost, membre de la commission d'accès aux documents administratifs (Cada), qui me semble avoir donné une explication de ces blocages, lors du colloque du vingt-cinquième anniversaire de la Cada. A propos des demandes de communication de pièces administratives, il indique que « l'avis est généralement négatif quand les dossiers demandés mettent en cause des tiers encore vivants. Le cas n'est pas rare pour les dossiers relatifs à l'Occupation ou à la guerre d'Algérie : permettre d'identifier l'auteur d'une dénonciation qui a envoyé quelqu'un en camp de concentration, ou le chef d'un commando qui a commis plusieurs assassinats n'est pas envisageable si le demandeur est la victime ou l'un de ses descendants, sauf si l'on peut anonymiser toutes les indications relatives aux tiers en sorte qu'ils ne puissent être identifiés, ce qui retire à la communication beaucoup de son intérêt ». C'est énoncer là le mécanisme d'occultation à l'oeuvre au sein même de la Cada : le document n'est pas communicable dès que le nom d'un fonctionnaire vivant y apparaît, ou si le fonctionnaire a des descendants. Avec une telle approche, on comprend comment fonctionne le refoulement historique de l'Occupation ou de la guerre d'Algérie.

En 1997, deux archivistes de la Ville de Paris, Brigitte Lainé et Philippe Grand, avaient transmis une liste des Algériens jetés à la Seine le 17 octobre 1961 à l'association « Au nom de la mémoire », présidée par David Assouline qui la rend aussitôt publique : cette liste dénombrait des dizaines de morts, alors que selon la version officielle, celle du préfet de police au moment des faits, Maurice Papon, il n'y avait eu que deux Algériens morts le 17 octobre 1961. A l'automne 1997, Maurice Papon comparait devant la cour d'assises de la Gironde pour crimes contre l'humanité pendant la Seconde Guerre mondiale ; le 17 octobre 1961 est évoqué, des voix s'élèvent dans l'opinion pour demander un accès aux archives. Le Premier ministre, Lionel Jospin, et sa ministre de la Culture, Catherine Trautmann, vont dans le sens de l'ouverture et c'est en se réclamant d'eux que Philippe Grand et Brigitte Lainé, contre l'avis de leur hiérarchie, communiquent la liste qu'ils ont trouvée dans les archives de la Ville de Paris. L'affaire fait grand bruit, la liste est un véritable scoop... mais les deux archivistes sont sévèrement sanctionnés, littéralement mis au placard dans leur activité.

En 2007, l'association européenne Access Info, écrit une lettre au Conseil de l'Europe en s'alarmant du caractère restrictif de la Convention européenne sur l'accès aux documents administratifs. Dans Le Nouvel Observateur du 24 octobre 2007, Michel Rocard explique pourquoi il signe cette lettre : « parce que je crois à la transparence, (...) et je crois qu'une restriction de ce droit comporte des dangers ».

Depuis 2007, notre campagne est quelque peu suspendue et notre site, dormant. J'ai réalisé cependant à l'époque un documentaire pédagogique pour présenter, sous forme de saynètes, des situations précises d'accès aux documents administratifs en France et en Suède : le contraste est flagrant et parle de lui-même. En France, la relation entre les citoyens et l'Etat reste marquée par l'évidence de l'opacité.

M. Jean-Jacques Hyest, président. - L'institution de la Cada, cependant, a constitué une révolution, n'est-ce pas votre sentiment ? Et ne pensez-vous pas que la transparence passe après la protection des données personnelles ?

M. Paul Moreira. - Nous parlons de documents administratifs, pas de données personnelles.

M. Jean-Jacques Hyest, président. - Mais les documents administratifs comportent parfois des données personnelles.

M. Paul Moreira. - Oui, par exemple la liste des Algériens morts le 17 octobre 1961 comporte le nom des policiers qui les ont repêchés, mais cela ne paraît pas un motif suffisant pour interdire sa publication - or la Cada donne un avis négatif dès qu'apparaît le nom d'un fonctionnaire et que sa révélation peut le mettre dans l'embarras... Comparez avec la situation américaine où, par exemple, ont été déclassifiées les minutes des échanges entre le président Nixon et le secrétaire d'Etat Kissinger dans les années 1970, où le président reconnaît qu'il y a bien un génocide au Timor-Oriental - un tiers de la population y a été massacré - mais que cela ne compromet pas le soutien américain à l'Indonésie... Aux Etats-Unis, on peut obtenir un tel document pourtant très compromettant pour l'ancien président puisqu'il fait apparaître qu'il a cautionné un génocide.

M. Jean-Jacques Hyest, président. - Effectivement, les documents de l'opération Turquoise, au Rwanda, sont autrement plus difficiles à obtenir...

M. Paul Moreira. - C'est certain, la déclassification n'est que de surface... Aux Etats-Unis, il y a des restrictions, liées à la sûreté de l'Etat en particulier, mais les décisions de l'administration sont contestables en justice et c'est un juge qui tranche, pas l'administration elle-même...

M. Edouard Perrin, journaliste. - J'ai commencé ma carrière de journaliste aux Etats-Unis, entre 1997 et 2001 et j'avoue avoir subi plus qu'un choc culturel en rentrant en France. Outre-Atlantique, l'accès aux archives est un véritable service : la National Security Archive, c'est-à-dire les archives de la sécurité nationale, à l'université George Washington, met par exemple à disposition du public toutes les archives déclassifiées concernant la sécurité nationale, l'équipe y est très compétente et très active - une avocate a ainsi pu obtenir, grâce à ce service, que des documents relatifs à Guantanamo soient progressivement révélés et les passages caviardés fortement réduits.

Aux Etats-Unis, la communication des documents est un droit et c'est à l'administration de prouver qu'ils sont classifiés - tandis qu'en France, malgré la loi de 1978, l'administration cherche toujours à savoir pourquoi vous demandez un document et ne vous le communique que dans les cas qu'elle juge acceptables, le tout dans des délais qui sont peu compatibles avec ceux de l'enquête journalistique.

Pour Complément d'enquête, par exemple, j'avais cherché à obtenir l'analyse financière produite par le concessionnaire de l'autoroute A65 qui fait partie du dossier et qui, en principe, est communicable. Il s'agissait du segment Pau-Langon, chantier remporté par Eiffage, des associations s'y opposaient, une étude du ministère de l'équipement montrait que le trafic risquait d'être faible, insuffisant pour assurer la rentabilité. Le ministère de l'environnement m'a d'abord répondu que cette analyse financière était publique, puisqu'elle était sur site web de la société concessionnaire ; vérification faite, le document rendu public n'était qu'une synthèse très courte ; la Cada m'a fait la même réponse, se contentant de la synthèse sur le site ; un huissier a constaté que l'analyse financière n'était pas accessible mais seulement une synthèse ; j'ai persisté, appelant toutes les semaines le ministère et le concessionnaire pour réclamer l'analyse financière. Je ne l'ai jamais obtenue et, surtout, anecdote significative, mon interlocutrice au ministère m'a un jour littéralement ri au nez, en m'affirmant que jamais on ne me la communiquerait. J'ai un peu l'esprit de suite et j'ai suivi le dossier - bien au-delà du reportage, qui a dû se contenter de la synthèse... - et vous savez probablement comme moi ce qu'il en est : la situation de l'A65 est alarmante, faute de trafic suffisant, le déficit s'élève à 35 millions d'euros en octobre 2013, au point que l'Etat risque de devoir recapitaliser... aux frais du contribuable.

J'ai pris cet exemple pour bien souligner que l'accès à l'information n'est pas une marotte de journaliste, c'est un véritable outil de contrôle des deniers publics. Le dossier d'intention de l'A65 disposait que le concessionnaire devait rendre publique l'analyse financière, il n'en a rien été et c'est le contribuable qui en fait les frais.

M. Jean-Jacques Hyest, président. - C'est étonnant, si le concessionnaire s'est engagé à communiquer et que l'analyse financière existe, c'est une obligation !

M. Edouard Perrin. - Oui, mais les choses ne se passent pas comme ça dans les faits. Pourquoi ? Parce que l'opacité fait partie de la culture administrative française et parce que les journalistes ont intégré ce fait, ils s'y sont adaptés et passent par d'autres voies que la demande officielle.

Autre exemple de Complément d'enquête. Il y a quelques années, des fauteuils vendus par Conforama, fabriqués en Chine, avaient causé des brûlures ; l'affaire était devenue européenne, parce qu'en Grande-Bretagne, grâce à la class action, des consommateurs s'étaient retournés rapidement contre le vendeur, qui avait rappelé tous les fauteuils concernés ; or, en France, l'alerte européenne a été bloquée par la direction générale de la concurrence, de la consommation et de la répression des fraudes (DGCCRF), qui est restée dans la légalité en ne faisant rien - mais, en off, un responsable de cette direction a reconnu qu'on ne ferait rien chez nous, pour ne pas déranger les entreprises françaises.

Le secret des affaires est un sérieux obstacle à l'information, systématiquement avancé dès qu'une entreprise est en jeu. Voyez les partenariats public-privé (PPP), par exemple celui passé avec Ecomouv pour l'écotaxe : les premières auditions de la commission d'enquête sénatoriale n'apportent strictement rien de nouveau - parce qu'à chaque fois, les partenaires se réfugient derrière le secret des affaires, qui est contractuellement établi. En particulier, toutes les informations financières figurent dans les annexes et dans les contrats d'assurance, sont inaccessibles au public jusqu'à la fin du contrat, donc pas avant 30 ou 40 ans... La puissance publique est engagée pour des décennies, mais le citoyen ne peut pas savoir à quel niveau, ni connaître les clauses particulières en cas de défaut ou de rupture, c'est très inquiétant...

Le Conseil d'Etat, dans un arrêt d'avril dernier qui est passé inaperçu, a confirmé cette évolution inquiétante en imposant le respect de « la vie privée des entreprises », en se fondant sur le fait que la loi de 1978, qui mentionne la vie privée, vise aussi les personnes morales, et pas seulement celles des personnes physiques. Qu'est-ce que cela signifie, la vie privée des entreprises ? Est-ce que ce sera désormais le paravent pour dissimuler tous les actes des entreprises ? Ce n'est pas raisonnable, nous avons besoin de dispositifs qui garantissent l'information, sans que celle-ci tourne systématiquement au psychodrame... On nous oppose le risque d'une « dictature de la transparence » ; ce que je vois plutôt, c'est une tyrannie de l'opacité...

M. Jean-Jacques Hyest, président. - Nous en prenons acte...

Mme Corinne Bouchoux, rapporteure. - Il est vrai que ce concept de vie privée des entreprises surprend et inquiète. Ne faudrait-il pas essayer la voie judiciaire pour faire constater l'entrave à l'accès à l'information, un peu sur le modèle de la voie de fait ? Ensuite, les difficultés incessantes que vous font les administrations françaises n'ont-elles pas un caractère décourageant ?

M. Edouard Perrin. - Effectivement, il faut de la persévérance et de la patience pour arriver à quelque chose. Lors du scandale britannique sur les indemnités parlementaires, j'ai commencé à enquêter pour Complément d'enquête sur le système français ; mais j'ai buté d'emblée sur le forfait : l'indemnité étant forfaitaire, il n'y pas de notes de frais ; on ne sait rien et on ne saura rien de son usage... En Grande-Bretagne, du reste, le scandale est parti de ce que les parlementaires ont tenté de s'exonérer de la loi qu'ils venaient de voter ; les parlementaires ont commencé par refuser de communiquer leurs notes de frais, puis par accepter de les transmettre à condition qu'elles soient anonymisées ; et c'est parce qu'ils trouvaient ce comportement scandaleux que deux soldats qui procédaient à cet exercice, ont recopié les informations pour les livrer ensuite à la presse...

M. Paul Moreira. - Je crois que nous sommes à un tournant. Une période est révolue : celle où l'administration pouvait conserver au secret des informations qui étaient sur papier. Aujourd'hui, à l'ère numérique, les informations circulent et il se trouvera toujours des « voleurs de feu », comme Edward Snowden, qui informeront leurs concitoyens parce qu'ils ne supporteront pas le mensonge. La rétention administrative va continuer, mais je crois que le nombre de lanceurs d'alerte augmentera - il y a 350 000 employés à la National Security Agency, comment imaginer qu'aucun ne se rebelle face au mensonge ? Le courage est contagieux... Mieux vaut donc garantir la transparence, tout en la régulant.

Quant au concept de vie privée des entreprises, il s'inspire du statut américain de l'entreprise américaine, par exemple, peut porter plainte pour diffamation, comme une personne physique.

M. Jean-Jacques Hyest, président. - Pour que le recours au juge judiciaire soit possible en matière d'accès aux documents administratifs, il faudrait que le législateur lui donne compétence en la matière, c'est un préalable nécessaire. On sait aussi que si le juge judiciaire est le gardien des libertés publiques, le juge administratif, et d'abord le Conseil d'Etat, joue un rôle important en la matière...

Je suis circonspect sur la notion de vie privée des entreprises : quelle est son étendue ?

M. Paul Moreira. - Une entreprise a-t-elle une vie privée ? Ce n'est pas une personne !

M. Jean-Jacques Hyest, président. - C'est une personne morale ! Elle peut avoir des secrets, certainement, en particulier commerciaux, et il est naturel de les protéger. Mais les relations entre les entreprises et les pouvoirs publics sont d'une autre nature. Les marchés publics sont censés être transparents, nous avons voté suffisamment de textes sur le sujet pour assurer cette transparence. Le public n'a pas à entrer dans le conseil de surveillance d'une société, mais il a le droit de connaître les conditions dans lesquelles l'Etat accorde une concession à une entreprise : les textes sont précis, les entreprises candidates doivent produire des dossiers substantiels et l'analyse financière doit y figurer.

M. Edouard Perrin. - Sous couvert de secret commercial, le contrat d'un PPP renvoie en annexe à la structure financière même de l'opération, avec obligation - sévèrement sanctionnée - du secret jusqu'à la fin du contrat.

Mme Corinne Bouchoux, rapporteure. - D'après ce que j'en ai lu, le Conseil d'Etat, avec le concept de vie privée des entreprises, était motivé par la protection des entreprises françaises, que ce serait quasiment une mesure de patriotisme économique...

M. Jean-Jacques Hyest, président. - Messieurs, merci pour votre témoignage.

Audition de M. Pierre FALGA, journaliste à L'Express (mercredi 29 janvier 2014)

M. Jean-Jacques Hyest, président. - Nous auditionnons M. Pierre Falga, journaliste chargé des enquêtes statistiques à l'Express, qui établit régulièrement des classements à partir de données socio-économiques, par exemple le palmarès des lycées, des hôpitaux, ou encore la comparaison de l'attractivité des territoires. Vous utilisez de très nombreuses données publiques, quelle est votre analyse de leur accessibilité ?

M. Pierre Falga, journaliste. - Pour être ancien dans le métier, je peux témoigner qu'un changement est intervenu ces dernières années : désormais, l'administration entend nos demandes, même si elle n'y répond pas toujours favorablement, loin s'en faut. Ensuite, travaillant avec tous les ministères producteurs de données statistiques - en particulier pour comparer l'attractivité des territoires -, je dirais que le principal facteur de qualité de l'information est, tout simplement, la participation de l'Insee à l'établissement des statistiques. L'Insee est le premier fournisseur de statistiques et un gage de qualité, même si les données ne sont pas toujours faciles à trouver sur son site. Je l'ai constaté en particulier pour l'établissement des données fiscales territorialisées : Bercy communiquait des données quasiment inutilisables et c'est seulement quand le travail a été confié à l'Insee, que la comparaison des « richesses fiscales » a pu être établie - avec le succès que l'on sait puisqu'elle est devenue un critère d'allocation des ressources de l'Etat.

Ce qui fâche, en revanche, c'est de voir le ministère de l'intérieur communiquer l'état 4001 de la délinquance... sous forme de fichier pdf. Les données de sécurité les plus fines territorialement sont publiées sur un pdf de 400 pages, par circonscriptions de sécurité publique et compagnies de gendarmerie départementale. Il faut donc reprendre toutes les données... Ensuite, curieusement, le ministère refuse de communiquer la carte du rattachement des communes aux compagnies de gendarmerie et aux circonscriptions de sécurité, ce qui est pourtant nécessaire pour comparer le taux d'atteinte aux biens et aux personnes par commune.

M. Jean-Jacques Hyest, président. - Cette carte est pourtant publique !

M. Pierre Falga. - En principe, elle l'est, mais en pratique, le ministère vous oppose régulièrement que des changements sont en cours, que la carte sera prochainement actualisée... C'est vrai surtout pour les gendarmes. Il m'a fallu intervenir auprès du cabinet du ministère de l'intérieur pour obtenir le tableau Excel des communes de France et de leur rattachement aux circonscriptions... le jour même ! Je n'ai pas saisi, ni même pensé à saisir la Cada, cela prend du temps et les délais de réponse dépassent largement ceux de nos enquêtes...

Autre exemple très parlant, le logement social, en particulier la proportion de logements sociaux par commune. Sous le précédent gouvernement, le directeur de cabinet, M. Lambert, m'avait refusé les statistiques complètes du logement social par commune : pour quelqu'un qui sert un gouvernement opposé à l'article 55 de la loi SRU, cela se conçoit, même s'il y a beaucoup à dire ; mais c'est ce même M. Lambert qui, redevenu haut fonctionnaire, continue de bloquer la communication de ces statistiques, alors que le Gouvernement a changé de côté ! La statistique est tout à fait disponible, dans un fichier spécifique en raison de la définition particulière retenue par la loi, puisqu'elle a été établie, justement pour contrôler l'application de l'article 55 de la loi SRU...

M. Jean-Jacques Hyest, président. - Les communes savent parfaitement quel est leur taux de logements sociaux, les chiffres sont publics...

M. Pierre Falga. - Peut-être, mais il faudrait alors enquêter auprès des 3 000 à 4 000 communes soumises à cette loi, c'est impossible en pratique...

Mêmes difficultés pour le cumul des mandats et l'indemnité des élus : les informations existent, disséminées dans les archives des assemblées délibérantes, mais l'absence de traitement de l'information empêche toute analyse. J'ai enquêté sur les indemnités des élus locaux : pour savoir leur montant, il faut se reporter au procès-verbal de la première réunion de l'assemblée délibérante, l'information ne figure nulle part ailleurs ! Cela empêche toute enquête nationale...

Mme Hélène Lipietz. - Les informations existent, mais elles sont touffues, comme si trop d'informations tuait l'information. Ne faudrait-il pas une approche normative de la question ?

M. Pierre Falga. - Oui, et paradoxalement, Internet n'arrange pas toujours les choses : dès lors qu'une information figure sur un site, même à une place improbable, l'institution estime avoir rempli son devoir d'information. Les intercommunalités - il y en a 2 560 - devraient avoir obligation d'indiquer clairement les noms de leurs élus, la composition de leur bureau, ainsi que les rémunérations de chacun, au lieu qu'on nous renvoie à la première réunion de l'assemblée délibérante...

M. Jean-Jacques Hyest, président. - Pour les offices HLM, le mandat est obligatoirement gratuit...

M. Pierre Falga. - C'est vrai, mais pas pour les sociétés d'économie mixte (SEM) d'aménagement... Mon enquête m'a montré une grande diversité de pratiques, mais aussi une très grande opacité de l'ensemble. Certains sites d'intercommunalités n'indiquent même pas le nom des conseillers communautaires ni la composition du bureau !

M. Jean-Jacques Hyest, président. - C'est vrai que le contrôle exercé par les préfectures se contente de vérifier la légalité de la délibération : il suffit que l'assemblée délibérante, lors de sa première réunion, ait indiqué le nom des élus, formé son bureau, et décidé des rémunérations... Il n'y a aucune obligation d'informer davantage, ni d'agréger ces informations qui ne sont pas centralisées. Pour le logement social, c'est autre chose, puisque la statistique existe par commune...

M. Pierre Falga. - Autre exemple : le nombre d'assujettis à l'ISF par commune. Les données figurant dans le tableau communiqué par Bercy est soumis à deux conditions cumulatives : y figurent seulement les communes de plus de 20 000 habitants qui comptent au moins 50 assujettis. Pour quelles raisons de tels seuils ? S'agit-il de préserver l'anonymat des assujettis ? Mais la Commission nationale de l'informatique et des libertés (Cnil) tolère déjà la publication de statistiques bien plus fines, dans d'autres cas, au-delà de 20 individus. En fait, la combinaison de ces deux critères empêche tout travail sérieux à l'échelle nationale, car nombre de communes de moins de 20 000 habitants comptent plus que 50 assujettis à l'ISF... Bercy et l'Equipement emploient beaucoup de statisticiens mais sont les administrations qui mettent le plus de barrières.

Des difficultés, ensuite, tiennent à la complexité même des données. C'est le cas avec les chiffres du chômage, où les décalages de chiffres entre le ministère - la direction de l'animation de la recherche, des études et des statistiques (Dares) - et Pôle emploi tiennent aux définitions même du chômage, ce qui pose d'ailleurs la question de la formation des journalistes. Le taux de chômage par commune, par exemple, n'a guère de signification, puisque nombre d'actifs n'habitent pas la commune où ils travaillent. Ce qui a du sens, c'est le taux de chômage par bassins d'emploi, mais cela n'empêche pas la presse de débattre du taux de chômage de telle ou telle commune...

Etalab est une très belle initiative. Pour informer correctement le public, il faut hiérarchiser les jeux de données et les mettre en scène. En l'état, il est très difficile de s'y retrouver parmi les très nombreux jeux de données disponibles. On le voit pour des villes comme Paris, avec son site Parisdata, qui fournit un nombre très important, trop important de données - jusqu'au nombre de chacune des espèces d'arbres... -, au risque de noyer les informations les plus significatives. Il est très difficile de s'y retrouver au milieu de toutes ces données.

M. Jean-Jacques Hyest, président. - Le classement est essentiel, comme dans une bibliothèque ou un service d'archives...

M. Pierre Falga. - Oui, mais l'organisation est difficile à mettre en place ; il n'est pas évident d'élaborer une classification.

Mme Corinne Bouchoux, rapporteure. - Le dénombrement des espèces d'arbres est utile pour mesurer l'évolution de la biodiversité, mais aussi en matière de pollution et d'impact sur la santé humaine : on a ainsi démontré que la coupe des arbres avait une incidence sur les allergies aux pollens, ce qui a conduit à une expérimentation à Versailles et à Angers, évoquée récemment au Sénat dans le cadre de « Plantes et cités ».

M. Jean-Jacques Hyest, président. - Etes-vous favorable à une évolution législative comme les intervenants précédents ? D'où peut venir le changement des comportements administratifs ?

M. Pierre Falga. - Je crois qu'aucune loi ne fera changer le comportement de ceux qui ne le veulent pas. Dans des ministères et certaines collectivités publiques, on considère bien souvent que la publicité s'arrête à Internet : ce qui est public est sur Internet, ce qui n'est pas en ligne n'a pas à être communiqué. On ne vous rit plus au nez lorsque vous demandez de l'information, mais on ne vous en donne pas davantage pour autant. Il y a, dans la diffusion de l'information, un enjeu évident de pouvoir.

L'administration, parfois, ne veut pas agir. Prenez, par exemple, la mesure de la pollution atmosphérique : nous n'avons plus d'indice global depuis 2011, parce que le système de mesure, désormais confié à Institut national de l'environnement industriel et des risques (Ineris), est en cours de redéfinition. L'Ineris « réfléchit » depuis trois ans, sans qu'il se passe rien, c'est ahurissant.

Je crois donc, pour finir, que la loi ne peut pas tout - voyez ce qui se passe actuellement avec le cumul des mandats.

M. Jean-Jacques Hyest, président. - Vaste sujet ! Je vous remercie pour votre participation.

Audition conjointe du Collectif interassociatif sur la santé (Ciss) représenté par Mme Danièle DESCLERC-DULAC, vice-présidente, représentante du collectif à l'institut des données de santé (IDS), et du Collectif Initiative transparence santé représenté par MM. Patrick GUERIN et Yann AUBE, président et directeur associé de Celtipharm, Jean de KERVASDOUÉ, économiste, titulaire de la chaire d'économie et de gestion des services de santé au Conservatoire national des arts et métiers (Cnam), Thomas LAURENCEAU, rédacteur en chef de la revue 60 millions de consommateurs, MM. Erwan LE FUR, journaliste, et Didier SICARD, président d'honneur du Comité consultatif national d'éthique (CCNE), président du comité d'expert de l'Institut des données de santé (IDS) (jeudi 6 février 2014)

M. Jean-Jacques Hyest, président. - Notre mission a pour objectif de définir les diverses attentes en matière d'accès aux documents administratifs et d'ouverture des données publiques. Nos auditions ce matin aborderont les demandes en matière de données publiques de santé, le positionnement des entreprises et les demandes en matière de données publiques culturelles. Mme Danièle Desclerc-Dulac, qui représente le Collectif interassociatif sur la santé (Ciss) à l'Institut des données de santé (IDS), et plusieurs membres du Collectif Initiative transparence santé (ITS) - MM. Patrick Guérin, Yann Aube, Thomas Laurenceau, Erwan Le Fur, Didier Sicard et Jean de Kervasdoué - nous présenteront leur expérience de l'accès aux données publiques de santé, en détaillant la pertinence des données disponibles, les difficultés rencontrées, la qualité des données et les possibilités de leur réutilisation. Comment faire évoluer le cadre juridique, technique et institutionnel pour « créer les conditions d'un accès plus ouvert aux données de santé », comme annoncé par Mme Marisol Touraine, ministre des affaires sociales et de la santé ?

M. Jean de Kervasdoué, économiste, titulaire de la chaire d'économie et de gestion des services de santé au Conservatoire national des arts et métiers - Permettez-moi tout d'abord de vous exposer la raison pour laquelle nous demandons l'accès aux données de santé. Si cette raison est simple, les solutions qui permettraient d'y répondre ne le sont pas.

Chaque année, jusqu'à 700 000 articles médicaux sont publiés dans les revues à comité de lecture, et la déontologie médicale voudrait que les médecins aient tout lu. Les connaissances médicales doublent actuellement tous les trois ans. La classification commune des actes médicaux recense 8 000 actes, dont 1 000 actes de biologie. Dans la pharmacopée française figurent 8 000 médicaments : dans cette masse, les médecins peuvent tout prescrire, sans pouvoir tout connaître. Un médecin généraliste connaît entre 200 et 300 médicaments, un spécialiste une trentaine, et ces médicaments ne sont bien entendu pas les mêmes selon les médecins. On relève que les prescriptions ne correspondent pas forcément à l'état morbide de la population : actuellement, en France, aucun lien ne peut être établi entre les prescriptions de médicaments cardiaques et les pathologies cardiaques recensées, avec des variations géographiques sensibles. De ce fait, le traitement d'un patient peut sensiblement varier selon le lieu où il est pris en charge.

Dans le monde entier, on laisse l'industrie pharmaceutique décider de ce sur quoi portera la recherche, des molécules qui seront développées, et du suivi des médicaments après leur mise sur le marché. Bien entendu, ces décisions sont davantage motivées par des raisons économiques que par l'état morbide de la population. La règlementation française elle-même s'intéresse à l'efficacité des molécules avant leur mise sur le marché, mais pas à leurs usages en aval. De même que des instruments bien accordés ne suffisent pas pour produire une belle musique, le recours à une thérapeutique efficace ne garantit pas le bon traitement d'un patient.

L'accès aux données de santé permettra de révéler les incroyables variations des pratiques cliniques et pointera l'usage de certains médicaments douteux ou dangereux. Par exemple, la pilule Diane 35 a été interdite par le ministère de la santé, puis remise sur le marché après décision contraire des autorités européennes. S'il est clair qu'elle a été trop prescrite, elle reste néanmoins le moins mauvais médicament, dans la plupart des cas, pour les jeunes filles souffrant d'acné. Tout est question d'usage.

M. Didier Sicard, président d'honneur du Comité consultatif national d'éthique, président du comité d'experts de l'IDS. - La France est le pays qui a connu le plus grand nombre de crises sanitaires, en partie liées aux médicaments. Xavier Bertrand a eu une belle initiative en créant un Institut des données de santé (IDS). L'accès à ces données est indispensable pour que les stratégies de santé publique puissent être fondées sur du réel, et non pas seulement sur une science parfois prompte aux théories imaginaires. La France est l'un des seuls pays où aucune étude n'est menée après l'autorisation de mise sur le marché (AMM) ! Par exemple, le plan cancer a été relancé par le Président de la République il y a quelques jours : fort bien. Mais les données de santé sont indispensables pour évaluer des chimiothérapies de plus en plus complexes quant à leur morbidité et à leur mortalité éventuelle. Or elles sont inaccessibles.

Cet institut est une petite structure, qui a fourni un travail considérable depuis six ans. Il occupe un petit local à Charenton, il est presqu'oublié du monde et reçoit peu de financements. Il fédère des associations, face au mastodonte qu'est l'assurance maladie, qui gère de fait le plus grand ensemble de données de santé au monde sans en faire grand-chose. En refusant l'accès aux données de santé rendues anonymes, l'Etat prive les acteurs de la santé d'informations précieuses. Il est très surprenant que les agences régionales de santé (ARS), responsables des stratégies régionales, n'aient obtenu l'accès aux données de santé que depuis quelques semaines. Leur mission consiste pourtant aussi à évaluer l'incidence ou la prévalence de l'alcoolisme dans telle ou telle région, à repérer si tel médicament donne lieu à une mortalité inquiétante, etc. Vue de l'étranger, la France gaspille sa richesse à élaborer des stratégies en décalage avec la réalité.

L'IDS tente de faire en sorte que puissent communiquer entre eux les mutuelles, l'assurance maladie, les collectifs d'associations. Améliorer l'accès aux données de santé anonymisées susciterait des travaux d'intelligence et ouvrirait des pistes de réflexion aujourd'hui interdites. La réunion au sein d'une même instance de la gestion et de la gouvernance des données me paraît une erreur.

La transpiration des données individuelles est l'argument constamment avancé pour empêcher cet accès ; mais c'est un faux problème. Transmettre aux chercheurs des données de santé anonymisées, avec une charte d'engagement à ne pas les divulguer à d'autres fins, ne me paraît pas poser de problème. Une politique de la santé qui n'est pas fondée sur les données de santé, c'est une tragédie économique et une tragédie de la connaissance - y compris la connaissance du service rendu par chaque médicament.

Nous plaidons pour que l'IDS soit responsable en la matière, un médiateur, intervenant en toute transparence. La motivation de nos demandes n'est pas une curiosité malsaine, mais la curiosité du bien commun. En exploitant nos données communes, nous pourrons établir la politique de santé fondée sur du réel qui fait défaut depuis 70 ans.

Mme Danièle Desclerc-Dulac, vice-présidente du Collectif interassociatif sur la santé (Ciss), représentante du Ciss à l'IDS. - Au sein du collectif, nous avons le privilège, par rapport à nos partenaires associatifs, d'avoir accès aux données non nominatives. Je considère que ce privilège doit être étendu aux autres associations, car nous ne sommes pas les seuls à représenter la société civile. A la dernière réunion du bureau de l'IDS, nous avons reçu une demande d'accès émanant... de l'Institut national de la santé et de la recherche médicale (Inserm) ! Comment comprendre que cet institut, dont le rôle éminent dans la santé publique est reconnu, n'ait pas accès aux données au même titre que la Haute Autorité de santé (HAS), par exemple ? Nous avons formé un voeu - pieux ? - pour qu'il obtienne gain de cause. Aujourd'hui, il est techniquement possible d'accéder aux données dans le respect le plus total de la vie privée, grâce à la protection de l'anonymat. La violation des principes légaux et le mésusage de ces données, du reste, font l'objet de sanctions pénales.

Si nous nous battons pour que d'autres aient également accès aux données de santé, c'est que même un collectif n'a pas tous les moyens et les compétences nécessaires pour exploiter les informations. Seul un travail coordonné entre les acteurs peut déboucher sur de véritables études de santé publique. La ministre de la santé a fait du renforcement de la démocratie sanitaire au travers des associations le troisième levier de sa stratégie nationale de santé. Les associations de la société civile, notamment celles qui ont un agrément de santé et qui siègent dans les instances représentatives des organismes de santé, ne pourront jouer tout leur rôle (défini par la loi du 4 mars 2002) que si l'accès aux données anonymes est débloqué.

Nous siégeons dans les ARS. Elles sont les piliers d'un système de santé en prise avec la médecine d'aujourd'hui, avec les attentes des assurés et avec le souci général de sécurité. C'est une bonne chose qu'elles aient enfin obtenu l'accès aux données anonymes.

M. Jean de Kervasdoué. - J'aimerais ajouter trois remarques factuelles à cette présentation. Tout d'abord, nous disposons actuellement de données hospitalières retraçant 17 millions de séjours, qui nous renseignent précisément sur la demande et l'activité hospitalières. Ensuite, un de mes élèves a analysé l'AMM de onze molécules anti-cancer, dans quatre pays, la France, le Royaume-Uni, l'Australie et la Nouvelle-Zélande : pas une de ces molécules ne reçoit partout la même appréciation ! C'est l'usage qui démontre le service rendu d'un médicament. Enfin, on a recensé en France 14 millions d'ordonnances comprenant dix médicaments ou plus, soit 3,6 millions d'interactions médicamenteuses possibles. Cela dépasse l'esprit humain. Le plus incroyable est que les grand-mères survivent... à moins peut-être, précisément qu'elles ne prennent pas tous ces médicaments.

M. Patrick Guérin, président de Celtipharm. - Je suis entrepreneur, je dirige une société de statistiques dans le domaine du médicament, créée en 2000. Nous sommes fournisseurs et société conseil de l'Agence nationale de sécurité du médicament et des produits de santé (ANSM). Nous sommes spécialisés dans le traitement des données en temps réel. Nous intervenons en cas de crise sanitaire - celle de l'offre des pilules contraceptives, par exemple. Souvent, le traitement des données en temps réel aurait permis d'éviter la crise.

Il y a cinq ans, nous avons eu le projet de traiter une partie du flux de données qui arrive à l'assurance maladie en le rendant anonyme puis en le traitant très rapidement pour pouvoir donner un signal en temps réel aux autorités sanitaires ou aux industriels responsables. Autorisé par la Cnil à l'unanimité le 8 septembre 2011, ce projet a ensuite été bloqué par l'assurance maladie et la direction de la sécurité sociale (DSS). Les autorités sanitaires, et notamment la direction générale de la santé (DGS), aimeraient pourtant disposer d'un tel outil, qui aurait par exemple pu permettre de détecter les usages de Diane 35 ou du Victrelis, le médicament contre l'hépatite C, dénoncé lundi dernier. Aucune raison technique ne justifie le blocage du projet, la Cnil vérifiant que l'anonymat des données est préservé tout au long du processus, et s'assurant en particulier que des croisements d'informations ne puissent aboutir à une réidentification.

Je suis effaré par la pauvreté des informations dont disposent les autorités sanitaires et la représentation parlementaire. C'est sur une unique source, les données de l'assurance maladie après traitement, que reposent entièrement les études qui déterminent les décisions de santé publique. Or ce système ne fonctionne pas. Le rapport Bégaud-Costagliola, remis à la ministre de la santé le 16 septembre dernier, estime entre 10 000 et 30 000 le nombre de décès annuels par accidents médicamenteux. Ses auteurs jugent qu'une priorité est de savoir en temps réel qui prescrit quoi à qui, tout en préservant l'anonymat. Cet objectif peut être atteint très facilement.

Il y a eu plusieurs occasions ratées de retirer le Mediator du marché. Le 29 novembre 2005, par exemple, la Commission nationale de pharmacovigilance a eu des remontées concernant la dangerosité du médicament. Or elle s'est basée sur un chiffre erroné, parce qu'affecté par un biais statistique et élaboré à partir d'une seule source, pour décider de maintenir Mediator sur le marché.

M. Erwan Le Fur, journaliste. - J'anime l'organisation du collectif Initiative transparence santé. Nous avons récemment demandé à la Cnam l'accès aux données concernant le Mediator. Nous voulions mener une étude prospective au niveau des départements pour montrer dans quelle mesure le Mediator avait été remboursé alors qu'il était prescrit dans la grande majorité des cas en dehors de ses indications, pour ses effets anorexigènes. Cette demande légitime est restée sans réponse, l'assurance maladie objectant finalement que la publicité de ces informations nuirait à la procédure judiciaire en cours. La Commission d'accès aux documents administratifs (Cada) a balayé cet argument et donné un avis favorable à notre demande. Depuis, l'assurance maladie se mure dans le silence et nous sommes contraints de saisir le tribunal administratif. Ces informations appartiennent pourtant aux Français !

M. Thomas Laurenceau, rédacteur en chef de la revue 60 millions de consommateurs. - Cela fait consensus : nous disposons en France d'une mine d'informations qui permettrait de mieux orienter la politique de santé. La société civile dans son ensemble devrait avoir le droit d'accéder aux données de santé. Le blocage vient de ce qu'un certain nombre d'informations peuvent être gênantes. Il nous a fallu un an de bataille et une vingtaine de lettres recommandées avant d'obtenir des données dans une enquête sur les dépassements d'honoraires à l'hôpital. Je suis heureux d'avoir ainsi contribué à leur limitation. De même, lorsque nous avons repéré que certains dentistes ne respectaient pas certains articles de la convention dentaire de 2006, il y eu beaucoup de mécontents, mais cela a fait avancer les choses.

Notre objectif n'est pas seulement de dénoncer. Nous avons fait une demande officielle d'accès aux données de santé pour travailler sur des sujets tels que l'accès aux soins, les restes à charge pour les patients, les inégalités territoriales, les mésusages des médicaments. Cette demande a été approuvée par le bureau de l'IDS, mais le ministère de la santé a fait valoir un droit de veto, temporaire nous dit-on. Nous remplissons pourtant une mission de service public d'information ; or l'accès aux données nous est refusé sans raison valable.

M. Yann Aube, directeur associé de Celtipharm. - L'expérience montre que travailler à partir d'une seule source de données peut produire un chiffre biaisé. Il est indispensable de multiplier les expertises et de travailler en temps réel afin d'éviter, au moins en partie, ces 10 000 à 30 000 morts évoquées tout à l'heure. Nous aurions d'ores et déjà les moyens de le faire car les problèmes sanitaires sont identifiables rapidement dans l'évolution des données.

M. Didier Sicard. - Deux médicaments sont utilisés dans le traitement de la dégénérescence maculaire rétinienne : l'un coûte 1 100 euros, l'autre 50 euros. Pour savoir lequel est le plus efficace, il faut pouvoir les évaluer et les données de santé pourraient nous offrir une réponse claire. Le Baclofène est un médicament remboursé ; il est utilisé pour traiter l'alcoolisme sans qu'on ait d'évaluation précise de son efficacité. Les données de santé apporteraient de la connaissance, de l'intelligence pour débattre du réel. Elles ne perturbent pas l'intimité des citoyens. Au contraire, ceux-ci, collectivement, réclament d'y avoir accès. La peur d'ouvrir l'accès aux données camoufle une autre angoisse, celle de mécontenter les lobbies. Si le ministère de la santé protège la Cnam, le bien public est mis à mal. C'est un cache-misère, non une marque de respect envers les citoyens.

M. Jean de Kervasdoué. - Les Français n'ont pas conscience qu'ils travaillent toute leur vie, pendant tout le mois de janvier, pour payer leur seule cotisation à l'assurance maladie. Il faut aussi réaliser que si nous consommions le même taux de médicaments que les Danois, les Finlandais ou les Suédois, nous dépenserions 300 euros de moins par an et par habitant, soit 19,5 milliards d'euros. En dépensant 5 ou 10 milliards de moins en médicaments, les Français se porteraient aussi bien, sinon mieux.

Mme Danièle Desclerc-Dulac. - Actuellement, les données auxquelles nous avons accès ne permettent pas d'examiner le comportement des professionnels de santé et des assurés sociaux. Les bases de données de l'assurance maladie et des organismes complémentaires pourraient contribuer à la mise en place d'un système de protection sociale digne de ce nom quant à la qualité des soins dispensés. Les patients ont déjà des outils pour être acteurs de leur santé, ameli.fr, par exemple ; cependant, ils ne sont pas toujours au courant de l'existence de ce site, et les données que l'on y trouve ne sont pas toujours exploitables. La possibilité doit nous être donnée de devenir un levier de la démocratie sanitaire pour favoriser une diffusion pédagogique de l'information. Bien des choses restent à faire, notamment pour prévenir les dérives. Dans les maisons de retraite et les établissements d'hébergement pour personnes âgées dépendantes (Ehpad), on dénombre de nombreuses pathologies iatrogènes résultant de prescriptions dispersées. Des études pourraient être faites sur ce point qui montreraient la nécessité d'agir.

Mme la ministre a voulu la mise en place d'un programme pour les personnes âgées en perte d'autonomie : cela nécessitera de mettre enfin en place un dossier médical, comportant un certain nombre de données - bien que cela n'entre pas directement dans le champ d'étude de ce jour.

M. Jean-Jacques Hyest, président. - Le dossier médical était une bonne idée, pour éviter de répéter des examens déjà effectués. Il n'a pourtant pas fonctionné.

M. Jean de Kervasdoué. - Tous les pays ont abandonné l'idée du dossier médical. Le Royaume-Uni a déboursé 15 milliards d'euros pour son dossier pharmaceutique, sans succès. Le dossier médical fait partie de ces idées zombies, qui renaissent de temps à autre. En France, le dossier médical a pu fonctionner dans les centres de lutte contre le cancer, car ils étaient dirigés par un médecin qui l'exigeait de ses collègues. Sans chef, pas de dossier médical.

Mme Danièle Desclerc-Dulac. - Des directives très claires sont effectivement indispensables. Mais on aurait pu mener une expérimentation reposant sur des médecins volontaires. Reste aussi à savoir ce que l'on met dans ce fameux volet médical de synthèse. Je ne crois pas qu'il faille en abandonner l'idée. Il serait très utile pour soigner certaines maladies chroniques, les personnes âgées, etc.

M. Patrick Guérin. - Il existe déjà une infrastructure qui fonctionne aujourd'hui pour l'ensemble de la population française : c'est le flux électronique Sésame Vitale, qui a été financé par de l'argent public. Il est possible de rendre ce flux anonyme par un processus contrôlé par la Cnil. Il pourrait offrir un traitement temps réel de certaines données à partir d'un échantillon. Je songe par exemple au suivi de certains médicaments marqueurs de pathologies comme la gastroentérite ou la grippe. Une étude des disparités régionales dans la consommation des médicaments pourrait permettre de concentrer l'effort d'information sur certaines zones. Quel agriculteur cultiverait un champ en se référant à des données météorologiques datant d'il y a deux jours ? Un système de santé qui ne repose pas sur une information en temps réel revient à gaspiller l'argent, les énergies, et même les vies.

M. Erwan Le Fur. - Les opposants à l'ouverture de l'accès aux données de santé sont très souvent ceux qui y ont déjà accès. Ils refusent le partage avec la société civile. Face à cette situation, deux solutions s'offrent à nous, journalistes. Soit le parcours lent, comme nous l'avons fait sur les dépassements d'honoraires à l'hôpital : demande aux ARS, saisine de la Cada après refus des ARS, puis saisine de la Cnam ; soit l'aspiration des données sur le site ameli.fr, comme l'ont fait récemment Que Choisir  et Le Monde. Mais cela coûte 20 000 euros au moins, les journalistes préfèrent donc attendre que M. Van Roekeghem soit bien disposé...

M. Jean-Jacques Hyest, président. - Les enjeux de l'accès aux données sont donc nombreux, de la sécurité sanitaire aux problèmes économiques. L'anonymat est fondamental, car la protection des données personnelles est menacée en permanence.

M. Didier Sicard. - Deux mésusages de données doivent être distingués : l'usage frauduleux et assuranciel des données, qui suppose la rupture de la confidentialité, et le mésusage de données que l'on refuse d'exploiter. La France a choisi de s'intéresser uniquement au risque de la rupture de confidentialité. Aux Etats-Unis, le traitement des informations en temps réel a évité des désastres sanitaires, celui de la molécule Vioxx par exemple. Par la centralisation des données, qui lui fournit une base d'une richesse considérable, la France devrait être le pays le plus réactif pour ce type d'alertes. Cette rigueur conservatrice de la protection des données nuit au bien public.

M. Jean de Kervasdoué. - J'aimerais ajouter quelques commentaires sur la notion de secret. Tout d'abord, il faut réaliser que les protections ne sont jamais complètement efficaces : quelqu'un a forcément la clé de l'armoire à clés. La meilleure protection est juridique, et non pas technique : c'est celle qu'offrent les tribunaux, et je suis partisan de peines lourdes en cas de mésusage. Ensuite, en province, dont je suis originaire, il n'est pas besoin de l'informatique pour savoir si Mme Dupont ou Le Guen sont malades : il suffit de le leur demander ou, si elles ne veulent pas répondre, le demander à leur voisine. La protection des données de santé concerne au plus 3 000 ou 4 000 responsables politiques et économiques en France, et il me paraît justifié que l'on efface les traces informatiques de leurs données de santé. Mais il ne s'agit pas d'appliquer la même logique à l'ensemble de la population. Enfin, ne nous le cachons pas, historiquement, le secret médical a surtout servi aux médecins pour éviter tout contrôle extérieur sur leurs pratiques cliniques. Mais le secret médical, c'est le secret du malade, pas du médecin.

M. Thomas Laurenceau. - Actuellement, le système d'accès aux données individuelles est déjà très contrôlé et verrouillé. Il se bloque dès que des requêtes successives révèlent une recherche sur des données personnelles. L'argument de la protection de la vie privée n'est donc pas recevable.

M. Jean-Jacques Hyest, président. - Certains médecins prescrivent plus que d'autres. L'assurance maladie a tout intérêt à savoir pourquoi !

M. Didier Sicard. - Encore faudrait-il qu'elle en tire les conséquences. Notre pays vit dans une peur de la connaissance du réel qui me semble archaïque. Que je sache, l'accès aux données de santé n'a engendré de drame public dans aucun pays occidental. Il n'y a eu aucun procès en cette matière aux Etats-Unis, en Grande-Bretagne, alors qu'il y a eu des affaires dans d'autres secteurs, Snowden étant la dernière en date. Nous avons des épidémiologistes de grande qualité, nous leur coupons les bras. Comment travailler sans données ? Cet accès reste le privilège de quelques-uns.

M. Jean de Kervasdoué. - Ajoutons que nous avons coupé les ailes aux médecins-conseils de l'assurance maladie également : ils ont accès à ces données mais ne peuvent pas les utiliser, car la convention médicale de 2004 a sanctuarisé la liberté de prescription. Un médecin-conseil du Sud-Ouest me disait que sur 370 médecins qu'il suivait, l'un prescrivait 0,1 % de génériques, l'autre 70 %, mais qu'il ne pouvait rien faire. La Cnam fait des études sur l'intéressement, l'hospitalisation de jour, le diabète... C'est peine perdue, puisque les conséquences ne peuvent pas en être tirées. Depuis 1928, la liberté de prescription est absolue : c'est cela qu'il faut faire évoluer, pour tenir compte du monde dans lequel nous vivons et des données que nous pouvons étudier.

Mme Corinne Bouchoux, rapporteure. - Merci pour votre témoignage éclairant. Cette mission commune d'information a été constituée à l'initiative du groupe écologiste, qui est très attentif aux problématiques que vous avez soulevées : nous considérons qu'elles sont au coeur d'un certain nombre de problèmes économiques, sociaux et moraux de notre époque. Vous avez décrit avec pédagogie une situation assez apocalyptique. Nous essayons de tirer une photographie de la situation, avant de formuler des propositions. Si vous aviez chacun trois propositions à faire, quelles seraient-elles ? Que pensez-vous du système américain d'accès aux informations ?

M. Jean-Jacques Hyest, président. - Notre mission porte à la fois sur l'accès aux documents administratifs et sur l'ouverture des données qui devraient être publiques - avec toutes garanties de protection des données individuelles, bien sûr. L'Insee collecte de nombreuses données individuelles lors des recensements, je le constate en tant que maire : logement, revenu... Cela montre que celles-ci peuvent être exploitées et protégées tout à la fois.

M. Patrick Guérin. - Ma première proposition serait que ceux qui bloquent le partage des données en assument la responsabilité, car un tel blocage se traduit par des pertes de chances. Ces données anonymes sont un bien collectif. Elles doivent être partagées, dans le respect de l'anonymat garanti par la Cnil, qui est l'une des institutions les plus en pointe dans son domaine, au niveau mondial.

Mme Danièle Desclerc-Dulac. - Il faut ouvrir l'accès aux données relatives à l'activité médicale, qui restent trop opaques. Il faut ensuite clarifier les conditions d'accès à ces données (qui peut accéder aux données, et pour quelles finalités ?). Il faut enfin s'assurer qu'il soit impossible d'identifier, à partir des données, les personnes concernées. La réidentification par croisement des informations est un faux problème, les mécanismes de blocage sont permanents...

Arrêtons de penser qu'il faut créer une nouvelle structure ! En dix ans, l'IDS a évolué et résolu plusieurs problèmes. Ce qu'il faudrait, c'est élargir son périmètre et lui confier un pouvoir de décision.

M. Jean-Jacques Hyest, président. - Ainsi que des moyens, peut-être ? Nous entendrons les responsables de l'IDS.

M. Didier Sicard. - Il faut donner à l'IDS les moyens qui ont été prévus lorsqu'il a été créé. Prenez donc le métro jusqu'à Charenton-Ecoles et venez visiter, dans un HLM, les deux petites salles de 45 mètres carrés, où travaillent une secrétaire, un directeur et deux chargés de mission qui constituent l'IDS. Ces moyens ne correspondent pas à ce qui a été prévu par la loi, et ne sont pas à la hauteur des enjeux.

Mettons un terme à la rivalité entre la Cnam et les mutuelles dans l'accès aux connaissances : celles-ci doivent être partagées au service du bien public.

Enfin, les données ne doivent pas être hébergées par l'instance qui est chargée de leur gouvernance. Faisons confiance à l'intelligence des Français, qui pourront s'emparer des données brutes de santé pour produire de la connaissance, plutôt que d'instaurer des barrières juridiques.

M. Yann Aube. - L'utilisation en temps réel de l'infrastructure du GIE Sesame-Vitale, c'est-à-dire du flux de données entre les officines et l'assurance maladie, est essentielle pour la recherche en santé publique et le développement de signaux d'alerte. Il faut l'ouvrir aux organismes autorisés par la Cnil.

M. Thomas Laurenceau. - Il faut donner à l'IDS les moyens d'accomplir les missions qui lui ont été confiées. Il serait regrettable qu'il disparaisse. Attention à la vision moralisatrice de l'accès aux données : les collectifs d'association seraient les bons utilisateurs, les entreprises les méchants. Ce n'est pas si simple : chacun peut participer à l'exploitation des données de santé.

M. Erwan Le Fur. - Nous militons pour un accès sans restriction aux données réunies lors de la consommation de soins par les Français. Les pouvoirs publics doivent cesser d'avoir peur des citoyens et de la société civile : l'administration n'est pas omnisciente, ce n'est pas à elle de décider à la place des autres ce qu'il faut faire de ces données. L'expérience montre qu'elle les utilise peu. Les pouvoirs publics doivent engager une discussion sur la mise en place d'une gouvernance raisonnable, sans en passer, comme ils le font, par des commissions au fonctionnement opaque. Enfin, le secret médical n'est pas le secret du médecin : si l'anonymat du patient doit être toujours respecté, il n'en va pas de même, à notre avis, de celui du médecin.

M. Jean de Kervasdoué. - Dans le cadre de la réglementation en vigueur - et sous le contrôle de la Cnil - il faudrait confier à l'IDS la gestion des flux de données produits par les hôpitaux et par les caisses d'assurance maladie, afin que ces données soient accessibles en permanence. Des peines doivent être prévues pour tout usage qui ne serait pas conforme aux règles éthiques en la matière. J'ai présidé pendant 13 ans la formation « santé-protection sociale » du Conseil national de l'information statistique (Cnis), et j'ai été frappé par la sous-utilisation, par les caisses d'assurance maladie comme par l'Etat, des données déjà disponibles. L'Etat devrait publier une analyse fine des variations territoriales de prise en charge, car c'est là que se situe la véritable inégalité. J'ai récemment travaillé avec M. Gérard Larcher à des suggestions sur la réforme de la sécurité sociale. L'appareil administratif de l'assurance maladie est mort : depuis la loi de 2000 de Mme Aubry, ce n'est plus le travail qui permet l'affiliation, mais la résidence légale sur le territoire. Donc, depuis le 1er janvier 2001, tout le monde est remboursé de la même façon, mais nous conservons l'appareil complexe qui date de 1945 et près de 100 000 personnes sont employées à vérifier des droits que nous avons tous ! Il faudrait simplifier ce système.

Je ne connais pas la loi américaine que vous évoquez, mais le système de santé américain public - car Medicare et Medicaid s'apparentent à notre système de sécurité sociale - comme privé sous-traite massivement à des entreprises l'examen des prescriptions. Ainsi l'entreprise Medco, dont le chiffre d'affaires avoisine les 60 milliards de dollars, vérifie le bien-fondé des prescriptions, téléphone aux médecins pour en discuter avec eux : dans ce pays libéral, le secret de la prescription n'est donc pas protégé !

M. Jean-Jacques Hyest, président. - Merci.

Audition de la Mutualité française, représentée par MM. Emmanuel ROUX, directeur général, Christophe LAPIERRE, directeur du département systèmes d'information de santé et Mathieu COUSINEAU, responsable du pôle métiers assurance à la direction de la santé
(jeudi 6 février 2014)

M. Jean-Jacques Hyest, président. - Le thème de notre mission commune d'information, créée à la demande du groupe écologiste et dont le rapporteur est Mme Bouchoux, est l'accès aux documents administratifs, qui incluent les données de santé. La Mutualité possède de nombreuses données dans le domaine de la santé. Comment les rendre disponibles ? Quels sont vos rapports sur ce point avec l'assurance maladie ?

M. Emmanuel Roux, directeur général de la Mutualité française. - Merci pour votre accueil. Voilà des années que la Mutualité française se préoccupe de ce sujet important. Nous avions fait en 2003 des propositions pour faire évoluer le système de santé, dont l'une avait abouti à la création de l'institut des données de santé (IDS). Nous en sommes membres. Nous intervenons à la fois comme principal représentant des organismes complémentaires d'assurance maladie, et comme acteur de santé qui a toujours défendu l'organisation du système de soins en parcours. Nous estimons indispensable de disposer de plus d'informations, y compris sur les comportements des professionnels de santé, sur les variations de la dépense d'un territoire à l'autre, sur les structures de l'offre. Il ne s'agit pas seulement d'une question financière.

Les expérimentations Babusiaux ont été lancées pour sortir du modèle de payeur aveugle. L'assurance maladie obligatoire et les complémentaires devraient travailler ensemble, puisque ces dernières ont pris une part considérable dans les remboursements de soins courants. Nous devons construire des démarches coordonnées de gestion du risque, même s'il faut pour cela surmonter des blocages : c'est l'avenir de la régulation du système de santé qui est en jeu. Nous nous associons à la pétition lancée l'an dernier pour demander la libération des données de santé. Mais il faut clarifier ce débat, et ne pas confondre données de santé, données médicales individuelles, médico-administratives, statistiques, relatives à l'exercice des professions de santé, relatives aux tarifs...

Le partage des données de santé n'a pas le même sens selon la finalité qu'on lui assigne. Pour nous, il s'agit d'abord d'éclairer la dépense de santé, à la fois comme assureur - pour connaître les risques que nous assurons - et comme acteur du système de santé - pour comprendre les attentes des assurés sociaux et les déterminants de la dépense afin notamment de définir nos politiques de prévention, auxquelles nous consacrons d'importants moyens. Nous avons aussi besoin de disposer d'éléments sur la qualité des soins pour affiner nos conventionnements avec les professionnels de santé et améliorer l'orientation et les parcours de soins. En ce sens, le dispositif « priorité santé mutualiste » apporte aux adhérents des mutuelles des informations pour les aider à s'orienter dans le système de santé. Cela requiert le partage des données avec ceux qui les produisent.

L'organisation de ce partage est actuellement le point faible de notre système, comme l'a montré un récent rapport de l'Igas - qui n'analyse cependant pas en profondeur les questions de gouvernance. La confusion règne sur l'accès aux données du Système national d'information interrégimes d'assurance maladie (Sniiram), par exemple dans les relations entre l'assurance maladie et les ARS. Qui doit être le régulateur, et qui l'opérateur, dans ce système ? L'apport de l'IDS mériterait d'être évalué. Il faut également clarifier le rôle de l'assurance maladie obligatoire : à nos yeux, le cumul des rôles de producteur de données et de régulateur est malsain.

M. Mathieu Cousineau, responsable du pôle métiers assurance à la direction de la santé, Mutualité française. - La représentation de la société civile à l'IDS a fait émerger des besoins et des utilisations différents de ceux définis par le Sniiram ou le Programme de médicalisation des systèmes d'information (PMSI), et a révélé quelques défauts du système. L'IDS a donc mis en place des comités d'utilisateurs sur chaque base de données, afin de recueillir leur avis pour améliorer la qualité des systèmes. C'est cela, l'esprit open data : les utilisateurs font progresser le système. Une expérimentation dénommée Monaco - Méthode, outils, normes pour l'acquisition de données complémentaires et obligatoires - a consisté à mettre en commun des informations en provenance de trois sources : données de l'assurance maladie obligatoire, de l'assurance maladie complémentaire et informations sur l'état de santé et la situation socio-économique des personnes produites par l'Institut de recherche et documentation en économie de la santé (Irdes). Cela nous a notamment donné une vision du reste à charge après complémentaire santé et de la situation économique des patients, sur laquelle le seul Sniiram ne nous renseigne pas.

M. Christophe Lapierre, directeur du département des systèmes d'information de santé, Mutualité française. - Le problème de la confidentialité et de la sécurité se pose évidemment. Le débat intervient à un moment où le point de vue a changé sur la protection des données à caractère personnel. La loi de 1978 avait pour objectif la protection de la vie personnelle. La problématique s'est déplacée de la protection des données à leur marchandisation et au contrôle de leur utilisation. Le règlement européen à venir procède de cette nouvelle logique : car les utilisateurs publient désormais eux-mêmes des données qu'ils décident de partager, et dont l'utilisation nourrit un secteur économique considérable. Les revendications autour de l'open data peuvent donc sembler dangereuses : jusqu'où partager ? Comment protéger ? Des conflits nouveaux surgiront. Les données médicales personnelles, quant à elles, ne relèvent évidemment pas de l'open data. Les données médicales personnelles doivent être protégées et rendues irréversiblement anonymes. Cela requiert des moyens, une gouvernance... Sans un minimum de contrôle, les données médicales ne peuvent pas être publiées.

S'agissant de la gouvernance, le rapport de l'Igas s'est focalisé sur le Sniiram. L'une des recommandations a été de confier au ministère le soin de décider des accès permanents au système d'information pour les institutions placées sous son contrôle. On part de loin ! La Cnam se comporte en propriétaire du Sniiram : il y a un vrai problème de gouvernance. Quel est le rôle de l'Etat ? Quel est le rôle de son opérateur ? Celui-ci a eu le mérite d'installer pour son usage propre le système d'information, qui est l'un des plus gros entrepôts de données européens et qui est très difficile à gérer. Il n'est donc pas étonnant que, lorsque des usagers réclament l'utilisation de ces données pour d'autres fins, la Cnam s'y refuse au motif que son travail n'est pas de faire de la pharmacovigilance ou de l'épidémiologie. Elle n'en a sans doute ni les moyens, ni l'expertise.

Il n'en reste pas moins nécessaire d'organiser l'exploitation de ce gisement de données. Il est curieux de voir que l'ouverture de cette base à la Haute Autorité de santé (HAS) et à l'Agence nationale de sécurité du médicament (ANSM) date seulement de l'été dernier... Pourquoi les organismes de recherche publics ont-ils encore tant de mal à y accéder ? L'organisation de l'exploitation de ces données à des fins publiques doit être améliorée, c'est le rôle de l'Etat. Nous avons regretté que l'Igas ne propose pas une évolution de l'IDS, qui est une bonne courroie de transmission, puisqu'il apporte à la Cnam l'expertise qui lui manque et la capacité à contrôler la diffusion de l'information. Mais cet institut manque de moyens.

Mme Corinne Bouchoux, rapporteure. - Merci pour votre témoignage éclairant. Nous essayons de faire une photographie de la situation avant de formuler des propositions. Si vous aviez chacun deux propositions à faire, quelles seraient-elles ?

M. Jean-Jacques Hyest, président. - Nous avons noté que vous ne souhaitiez pas que le ministère se charge de la gouvernance.

M. Christophe Lapierre. - Pas seulement, en tous cas. Il aura du reste besoin de l'ensemble des acteurs pour organiser l'exploitation des données.

M. Jean-Jacques Hyest, président. - Le rapport propose de créer encore un Haut Conseil... Nous passons notre temps à supprimer des institutions, et on en crée d'autres aussitôt.

M. Christophe Lapierre. - Entre la création d'un conseil et l'installation du Sniiram au ministère, je ne vois pas comment le problème sera résolu... Il faut avant tout s'interroger sur l'organisation de la gouvernance.

M. Emmanuel Roux. - En la matière, l'Etat doit être régulateur. La préconisation que nous pourrions faire déborde le seul cadre des données de santé : c'est plus largement la gouvernance du système de santé qui est en cause. Il est difficile d'appréhender le rôle exact que les pouvoirs publics entendent donner à la Cnam. Depuis une dizaine d'années, les relations contractuelles entre l'Etat et l'assurance maladie ont évolué pour donner à celle-ci un rôle véritable d'opérateur de santé, dépassant son coeur de métier historique et allant de la prévention au contrôle de la dépense. Mais jamais cette évolution n'a fait l'objet d'un débat public. La création des ARS, qui témoignent de la volonté d'instaurer un pilotage territorial des politiques de santé, aurait pu être l'occasion de ce débat. La problématique de l'accès aux données de santé illustre bien la nécessité de repenser le statut et le rôle de l'assurance maladie : la confusion de l'opérateur et du régulateur est malsaine.

Nous avons été très étonnés des initiatives prises récemment pour marginaliser, voire supprimer l'IDS. Il a été question, notamment, de créer un « GIP Médicament » qui l'aurait vidé de sa substance. Pourquoi refuser des moyens à l'IDS ? Pourquoi refuser d'en faire un pivot dans la régulation et le partage de l'accès aux données de santé ? C'est une des voies que l'Igas n'a pas assez explorées.

M. Mathieu Cousineau. - La représentation de la société civile est la source régulière des alertes sanitaires en France. Elle est aussi une sentinelle face à tout risque de dérive dans l'utilisation des données. Voici deux exemples de problèmes dans l'exploitation des données : les tarifs moyens des médecins sont disponibles sur Ameli.fr, mais non transmissibles ni utilisables facilement ; les informations sur la qualité et les tarifs des soins à l'hôpital (résultat des accréditations...) sont éparses et leur forme ne permet pas de procéder à une consolidation. Du coup, elles ne sont pas simples d'accès pour le grand public.

M. Emmanuel Roux. - L'actualité m'amène à aborder le thème des dépassements d'honoraires. La loi de financement de la sécurité sociale pose le principe des contrats solidaires et responsables, qui peuvent limiter la prise en charge des dépassements d'honoraires. Les organismes complémentaires ont besoin d'une vision claire sur ce phénomène. L'avenant 8 prévoit la création d'un observatoire. Pourtant, aujourd'hui, nous sommes dépendants du bon vouloir de la Cnam pour obtenir des données sur les dépassements, par spécialité et par territoire. Nous avançons à l'aveugle : on nous sollicite pour des financements, mais il faut attendre le bon vouloir de l'assurance maladie pour obtenir des informations. C'est cela qui doit changer. La cohérence des politiques publiques en dépend.

Mme Catherine Procaccia. - Vous pouvez pourtant construire des statistiques à partir des informations qui vous parviennent de votre base d'assurés ? Ne vous suffisent-elles pas ?

M. Mathieu Cousineau. - Nous ne connaissons que ce que nous remboursons, et nous ne connaissons pas par exemple le secteur conventionnel des médecins.

Mme Catherine Procaccia. - Vous pouvez le connaître à partir des tarifs.

M. Mathieu Cousineau. - Oui, à condition que les intéressés respectent leurs engagements : nous n'avons donc pas le moyen de le contrôler. Nous aurons par ailleurs besoin d'informations sur les engagements pris dans le cadre du contrat d'accès aux soins. Sur les spécialités médicales, l'information est également limitée.

M. Christophe Lapierre. - Il est temps de clarifier la notion de données de santé, souvent confondue, à dessein, avec celle de données personnelles. Il y a là une instrumentalisation.

J'insiste enfin sur le fait que si nous allons vers l'open data - et nous y allons - l'ensemble des acteurs, et notamment la puissance publique, auront besoin d'une contre-expertise ; il doit se donner les moyens d'exploiter lui-même ces bases et de diligenter des contre-expertises. Sinon, l'ouverture sera plus contre-productive que fructueuse. C'est un point qu'a bien identifié le rapport de l'Igas.

M. Jean-Jacques Hyest, président. - Je vous remercie.

Audition conjointe du Mouvement des entreprises de France (Medef) et de la Confédération générale des petites et moyennes entreprises (CGPME), représentés par MM. Christian POYAU, vice-président du comité « Transformation numérique », Pascal MALINGUE, responsable de la commission Open Data de l'Association française des éditeurs de logiciels et solutions internet (Afdel), pour le Medef, et M. Frédéric GRIVOT, vice-président de la CGPME (jeudi 6 février 2014)

M. Jean-Jacques Hyest, président. - Nous accueillons pour le Medef MM. Christian Poyau, vice-président du comité transformation numérique, et Pascal Malingue, responsable de la commission open data de l'association française des éditeurs de logiciels et solutions internet (Afdel), accompagnés de Mmes Emilie Dumerain et Ophélie Dujarric, chargées de mission ; ainsi que, pour la CGPME, MM. Frédéric Grivot, vice-président, accompagné de Lionel Vignaud, juriste. Je vous remercie d'avoir accepté le principe d'une audition conjointe. L'accès aux documents administratifs concerne les entreprises en tant qu'usagers, en tant qu'entités contrôlées, en tant que partenaires, par exemple dans les marchés publics, et en tant que bénéficiaires, puisque l'ouverture peut favoriser le développement de leurs activités. Nous souhaiterions vous entendre sur les difficultés que vous rencontrez, la qualité de l'information publique aujourd'hui disponible, la pertinence de l'offre de données, les conditions juridiques, techniques et financières de leur réutilisation. Par ailleurs, la protection des données des entreprises par le secret industriel et commercial prévu par l'article 6 de la loi de 1978 est-elle satisfaisante ? Vous nous indiquerez enfin les améliorations à apporter ?

M. Christian Poyau, vice-président du comité Transformation numérique du Medef. - Je suis entrepreneur, fondateur et dirigeant de Micropole, une entreprise du secteur numérique. L'open data a connu un développement important depuis 2010 avec la montée en puissance des technologies Internet, ce qui a deux conséquences majeures : la transparence, qui nourrit le débat démocratique grâce à des données chiffrées, et l'émergence dans l'économie de nouveaux business models. Une étude européenne prévoit que ce secteur atteindra un poids de 30 à 40 milliards d'euros. Il est difficile de faire des comparaisons avec d'autres pays : il n'y a pas pour le moment de success story - ce n'est pas un constat d'échec, car le développement de ce secteur est très récent. Nous constatons des freins. Si la France a été pionnière dans la protection des données personnelles avec la loi de 1978, la mise à disposition des données publiques n'a commencé que récemment. Or certaines de ces données sont incomplètes, pas toujours mises à jour, publiées dans des délais trop longs ou aléatoires, et dans des formats techniquement fermés.

M. Jean-Jacques Hyest, président. - Expliquez-moi cela...

M. Christian Poyau. - Il y a beaucoup de formats des données et l'on constate une trop faible interopérabilité des données entre elles. Par ailleurs, elles sont parfois payantes. Nous manquons de gouvernance et de structuration - nous ne sommes pas pour autant favorables à la création d'une nouvelle structure : Etalab est l'acteur tout indiqué.

M. Frédéric Grivot, vice-président de la CGPME. - Rappelons tout d'abord que la CGPME est une confédération qui rassemble 250 fédérations et une représentation territoriale à laquelle adhèrent un très grand nombre d'entreprises de moins de 250 salariés, ayant un chiffre d'affaires inférieur à 50 millions d'euros : autant vous dire que la plupart de nos adhérents - commerçants, artisans, autant qu'industriels ou professions de services - n'ont pas une appétence immédiate pour ces sujets.

Une politique économique structurée a besoin de s'appuyer sur des statistiques, parfois immédiates et parfois nécessitant un traitement, jusqu'à un ou deux ans : notre travail avec l'Union professionnelle artisanale (UPA) et le Medef sur un document consacré à la compétitivité a mis en évidence qu'il était difficile de se mettre d'accord sur les outils statistiques permettant de comparer la situation française et celle d'autres pays, tant il est compliqué de dresser un tableau qui ne surreprésente pas un secteur par rapport aux autres, enjeu statistique s'il en est.

M. Jean-Jacques Hyest, président. - Eh oui !

M. Frédéric Grivot. - Une entreprise ne peut utiliser les données mensuelles relatives au commerce extérieur, par exemple, si elle n'a pas d'explications sur les agrégats utilisés et la manière dont les données ont été extraites. Les entreprises à faibles effectifs peuvent aussi avoir des difficultés à trouver l'information. Les données sont très éparpillées ; l'Etat pourrait faire oeuvre de pédagogie pour faire connaître certaines sources de données ; nous remarquons aussi que les statistiques publiques ne sont pas toujours cohérentes entre elles...

Les chefs d'entreprises patrimoniales ont aussi besoin de protéger le secret des procédés, de la fiscalité et de leur stratégie commerciale. Certaines PME disparaissent parce qu'une puissance étrangère les rachète afin de tuer dans l'oeuf un nouveau procédé, une source de concurrence, identifiés grâce aux informations divulguées.

Il y a enfin un travail à faire sur l'ouverture des licences, sujet sur lequel la CGPME a engagé une réflexion.

M. Pascal Malingue, responsable de la commission Open data de l'Association française des éditeurs de logiciels et solutions internet. - Des précisions sur la position du Medef. Les données sont incomplètes car les initiatives d'open data lancées depuis fin de 2010 ont été le fait de multiples fournisseurs - Etalab, mais aussi les collectivités territoriales - qui ont publié des données hétérogènes, ce qui complique l'industrialisation de leur collecte par les entreprises qui souhaitent les exploiter. Des exemples de ce manque de granularité : la publication par l'Agence du médicament de listes de médicaments sans notice d'utilisation, ou celle par des collectivités territoriales de la localisation des arrêts d'autobus ou de train sans horaires ni fréquence de passage - cela en limite l'intérêt !

Les fournisseurs de données ont la main sur la fréquence de mise à jour ou le délai de mise à disposition, ce qui engendre une hétérogénéité certaine. Même des acteurs comme la Direction générale des finances publiques (DGFiP) publient les données avec 18 ou 24 mois de délai : l'exploitation qui peut en être faite perd de son potentiel.

M. Jean-Jacques Hyest, président. - Même chose pour les statistiques de l'Insee : le recensement est désormais continu, mais la publication est décalée. Nous avons dû réfléchir sur le Grand Paris à partir de données datant de 2010-2011 : en 2014, c'est dommage !

M. Pascal Malingue. - Des données ouvertes peuvent être fermées par une publication sous le format PDF, à partir duquel la collecte et l'exploitation d'informations sont difficiles. En tant que représentant des éditeurs de logiciels, je constate que les données publiques communiquées sont souvent peu structurées, très brutes. L'exemple le plus connu d'absence d'interopérabilité entre les données fournies par différents producteurs concerne les codes postaux et les codes Insee, pour lesquels il faut toujours prévoir une transcodification. Des données financières plus structurées permettent d'être plus efficace dans leur interprétation et leur réutilisation. Enfin, nous avons référencé 13 administrations qui fournissent 96 jeux de données payantes. Si cette redevance représente pour certaines d'entre elles une part très faible de leurs recettes, elle peut être dissuasive pour des utilisateurs et remettre en cause la pertinence de leur business model. Nous recommandons d'avancer plus vite vers la mise à disposition gratuite des données quand la redevance est anecdotique pour l'organisme public.

M. Jean-Jacques Hyest, président. - La direction de modernisation de l'Etat se préoccupe d'interopérabilité depuis 2006 ; cela progresse-t-il pour les données fournies par l'Etat ou par d'autres opérateurs ?

M. Pascal Malingue. - Globalement, cela va dans le bon sens. Mais les initiatives open data très volontaristes de certaines collectivités territoriales...

M. Jean-Jacques Hyest, président. - Certaines communiquent beaucoup sur la question, alors que la réalité est parfois moins reluisante.

M. Pascal Malingue. - Nous constatons un manque de gouvernance qui les inciterait à diffuser les mêmes natures de données, avec le même niveau de détail.

M. Christian Poyau. - Etalab pourrait jouer un rôle moteur en la matière en étant plus incitatif et en donnant des grandes lignes.

Mme Corinne Bouchoux, rapporteure. - Les entreprises grandes et petites ont besoin des données publiques pour vivre et se développer. Que pensez-vous du nouveau concept créé par le Conseil d'Etat en 2013 de vie privée des entreprises, que la Cada prendra en compte. Vous avez été très en faveur de ce concept : ne craignez-vous pas que cette notion dérive jusqu'à celle de vie privée des administrations, qui pourrait inciter ces dernières à refermer ce qu'on voulait ouvrir ?

M. Frédéric Grivot. - La CGPME connaît des débats internes sur cette question : s'agit-il avec la vie privée dans le milieu entrepreneurial du secret à maintenir sur les procédés techniques, sur les données fiscales, sur la stratégie commerciale, ou bien plus précisément du secret sur les données nominatives qu'une entreprise est amenée à gérer ? Si demain je dois publier le nom de l'unique ingénieur chimiste que j'emploie dans mon entreprise de parfums, et qui valide la qualité des produits, je risque de me le faire voler ; combien de temps mettrai-je à en retrouver un ? Je lui ai défendu de donner la photocopie de sa carte d'identité, y compris au ministère des affaires étrangères pour les exportations, de peur que n'importe qui se substitue à lui.

J'ai participé par ailleurs à la commission Jurgensen : si vous saviez le temps que nous avons mis pour dresser la liste de toutes les aides aux entreprises !

Mme Catherine Procaccia. - Ce n'est pas étonnant.

M. Frédéric Grivot. - La mise en place du crédit d'impôt pour la compétitivité et l'emploi (Cice) a ainsi été prise en compte dans le calcul du coût du travail, alors que dans les faits, il n'aura d'incidence qu'à partir de 2014. De même, la comparaison avec la fiscalité danoise, si elle se fait ligne à ligne, est défavorable à la France, en particulier pour les entreprises.

Mme Catherine Procaccia. - La proposition de loi de reconquête de l'économie réelle que nous examinons porte-t-elle atteinte à la vie privée des entreprises ?

M. Frédéric Grivot. - Nous sommes totalement défavorables à l'obligation de communiquer à l'avance de données de cette nature au personnel dans une entreprise patrimoniale ; cela tuerait dans l'oeuf toute possibilité de cession. Dès le lendemain, le banquier coupera les vivres, les fournisseurs s'inquièteront, les clients s'interrogeront sur le repreneur...

M. Christian Poyau. - J'ai réalisé une vingtaine d'acquisitions d'entreprises en France et à l'étranger ; au-delà de la dimension financière et industrielle, ces opérations ont une dimension humaine, tant il est vrai, dans mon secteur en particulier, que la valeur d'une société tient à ses collaborateurs. En tant qu'entrepreneur de terrain, je peux témoigner que cela pourrait être extrêmement dommageable, comme le souligne la CGPME. Plus largement, la vie privée des entreprises, qui peut concerner les locaux ou le droit à l'image, est une notion récente, vaste et complexe. Le Medef a changé récemment de président et des travaux sont en cours sur le sujet. Nous n'avons pas encore de position définitive sur ce point.

M. Jean-Jacques Hyest, président. - Cette notion n'est pas encore précisément définie.

M. Christian Poyau. - Dans un monde où la compétition est de plus en plus forte, chacun accède à de nombreuses informations avec Internet ; sans parler des récentes affaires d'intelligence économique...

M. Jean-Jacques Hyest, président. - ...qui confine à l'espionnage.

M. Frédéric Grivot. - Un concurrent que j'ai rencontré récemment refuse que l'on prenne des photos de son atelier, car cela donnerait des informations sur les machines utilisées, partant sur le cadencement.

M. Christian Poyau. - Le comité de transformation numérique dont je suis le vice-président et qui a été créé il y a trois mois, n'est pas un comité de branche, il a vocation à présenter à toutes les entreprises le levier de performance que cette innovation peut représenter, dans un secteur où la France est pionnière, comme j'ai pu en avoir la preuve en accompagnant Fleur Pellerin et Pierre Gattaz au Consumer Electronics Show de Las Vegas. Voici nos trois propositions : travailler sur des critères de qualité des données (régularité, délai, format) ; créer un référentiel de données afin de les classer, dont la responsabilité de l'élaboration pourrait être confiée à Etalab ; supprimer la redevance quand elle constitue une partie minime des ressources de l'établissement - en l'autorisant bien sûr pour Météo France et l'IGN, dont elle assure le financement.

M. Jean-Jacques Hyest, président. - D'autant plus que ces ressources génèrent d'autres activités.

M. Christian Poyau. - Enfin, expérimenter tout cela dans une région pour avancer plus vite, sous l'impulsion d'Etalab. En outre, nous avons créé un groupe de travail sur les big data.

M. Frédéric Grivot. - Je vous adresserai par écrit les propositions de la CGPME que j'ai évoquées dans mon propos introductif.

M. Jean-Jacques Hyest, président. - Je vous remercie.

Audition du Collectif Savoirscom1 représenté par MM. Silvère MERCIER, bibliothécaire chargé de la médiation et des innovations numériques à la bibliothèque publique d'information du Centre Pompidou, cofondateur de SavoirsCom1, Pier-Carl LANGLAIS, administrateur de la Wikipédia francophone, et Thomas FOURMEUX, assistant multimédia au sein des bibliothèques d'Aulnay-sous-bois (jeudi 6 février 2014)

M. Jean-Jacques Hyest, président. - Nous accueillons maintenant des membres du collectif SavoirsCom1, MM. Silvère Mercier, bibliothécaire au Centre Pompidou, Pier-Carl Langlais, administrateur de la version francophone de Wikipedia, et Thomas Fourmeux, assistant multimédia aux bibliothèques municipales d'Aulnay-sous-Bois, à propos des données culturelles, qui peuvent être des données statistiques des institutions culturelles, des métadonnées ou des images et documents numérisés. Pourriez-vous nous indiquer quelle appréciation vous portez sur la situation actuelle d'ouverture de ces données et nous indiquer les évolutions nécessaires, notamment dans la perspective de leur intégration dans le droit commun prévue par la directive de 2013 ?

M. Silvère Mercier, bibliothécaire au Centre Pompidou. - Les cent membres du collectif SavoirsCom1, créé en 2012, s'intéressent aux biens communs de la connaissance : numériques ou tangibles. Ces biens n'appartiennent à personne et appartiennent à tous ; ils sont généralement préservés par une communauté qui en assure la gouvernance. Un exemple fameux en est Wikipedia, organisme ni public ni privé qui se développe et s'épanouit au bénéfice de tous.

Notre manifeste met en avant dix points pour que les règles de fonctionnement de notre société permettent l'épanouissement de ces biens communs : un accès ouvert aux données de la recherche ; la diffusion des ressources pédagogiques ; l'existence de tiers lieux, tels que les bibliothèques ; les licences de libre diffusion, qui expriment les conditions d'une gouvernance de l'information et permettent de rendre publiques des règles de fonctionnement ; le refus des verrous numériques ou DRM ; le partage non marchand et l'investissement dans la création, sans séparer les deux grâce à la contribution créative, par exemple.

Pour nous, le domaine public, le patrimoine commun, est vivant, ainsi que nous l'avons dit dernièrement à l'Assemblée nationale lors d'une journée d'étude. Nous sommes opposés aux enclosures qui menacent ces biens communs, ces appropriations indues. Nous souhaitons moins une opposition entre public et privé qu'une saine articulation entre ces deux mondes, pour éviter le copyfraud, l'apposition de droits restreignant l'appropriabilité des données et leur circulation. La directive, parce qu'elle pose certains problèmes à cet égard, appelle une transposition habile.

Les données culturelles sont des informations publiques issues d'un document élaboré ou détenues par l'administration, non soumises à un droit de propriété intellectuelle et ne comportant pas d'information à caractère personnel. La définition du caractère culturel n'est pas claire, loin s'en faut. La définition de la loi de 1978 part des auteurs ou détenteurs, qui doivent être des établissements, organismes ou services culturels, termes dont une mission juridique auprès du Conseil d'Etat a souligné la portée particulièrement large et ne correspondant pas à des structures nettement définies. C'est ce caractère flou qui gêne. Les données bibliographiques, par exemple, sont des métadonnées sur des objets culturels. Dans un monde où les catalogues sont des outils commerciaux au service d'entreprises privées, il faut qu'elles soient libérées. On peut citer également des données statistiques, de recherche, des études du ministère de la culture, l'emplacement des bibliothèques et des musées, des données numérisées, grâce auxquelles les établissements culturels pratiquent largement le copyfraud.

La libération de ces données a d'abord un but économique. Ainsi l'application mobile CultureClic rend-elle lisibles sur un téléphone des données patrimoniales libres issues notamment de la Bibliothèque nationale de France, enrichissant l'appréhension d'un bâtiment en temps réel ; à partir d'un téléphone mobile. Téléchargée plus de 450 000 fois, elle est lauréate du portail Proxima mobile, projet porté par une entreprise privée. L'enjeu est également celui de l'efficience des politiques publiques, en posant aux acteurs publics des questions de format de données et d'interopérabilité. C'est en effet un enjeu très important pour l'efficience des politiques publiques.

Or les données culturelles bénéficient d'un régime dérogatoire. L'article 11 de la loi de 1978 laisse le droit aux institutions culturelles de fixer les conditions de leur ouverture. Il faut combattre cette exception qui n'a pas de raison d'être. Quoique souvent avancé, l'argument de la défense de la propriété intellectuelle est irrecevable, puisqu'il entre en contradiction avec la définition même de ces données, libres de droit. Ce régime est extraordinairement dangereux : le contentieux opposant les services d'archives et l'entreprise privée NotreFamille.com a mis en évidence le pouvoir limité de l'administration, tenue de respecter l'obligation d'ouverture des données publiques face à une entreprise qui voulait s'approprier des données publiques. Nous risquons une balkanisation des archives municipales : Hervé Lemoine, directeur des Archives de France, a récemment souhaité dans la Revue française de généalogie que le projet de loi patrimoine prévu fin 2014 établisse un régime dérogatoire pour les archives. Pourquoi ce traitement particulier ? Pourquoi le maintien de redevances, pourtant dénoncées par Etalab et par plusieurs rapports ?

Certains rapports émanant du ministère de la culture marquent une évolution intéressante de la position officielle. C'est le cas, depuis l'adoption de la directive de juillet 2013, du rapport Trojette, du guide Data Culture rédigé par Camille Domange, qui appelle à normaliser l'ouverture des données culturelles, comme, dès juin 2012, d'une position du Conseil national du numérique. On peut aussi citer la feuille de route open data du Gouvernement, ou l'opération Automne numérique du ministère de la culture en faveur des licences libres. Or ces évolutions significatives risquent d'être freinées par la directive qui ralentira ce mouvement.

Si le régime dérogatoire est maintenu, le risque est grand d'un retard considérable de la France. La situation est hétérogène : la Bibliothèque nationale de France ouvre ses métadonnées, mais, invoquant un raisonnement juridique douteux, impose un copyfraud sur des documents du domaine public, sous prétexte qu'ils sont numérisés. Europeana a développé les licences CC-Zéro qui garantissent la domanialité publique des contenus diffusés. La Norvège souhaite numériser l'ensemble de ses fonds culturels d'ici 2035. Les Archives nationales des Pays-Bas figurent sur Flickr, service de partage de photos et filiale de Yahoo, bel exemple d'alliance public-privé puisqu'elle garantit que les données restent un bien commun. Le Museum d'Amsterdam a également libéré ses données sous CC-Zéro.

L'ouverture des données culturelles publiques ne doit pas être une option, mais une véritable politique publique. Pourquoi les données culturelles seraient-elles protégées alors que l'IGN ou Météo-France devraient trouver de nouveaux modèles économiques, de nouvelles ressources propres, tout comme la Réunion des musées nationaux (RMN) ?

L'ouverture doit être soumise à une clause de partage à l'identique ou share alike, ce dépassement de la frontière obsolète entre commercial et non commercial, qui n'impose qu'une seule chose : que ce qui a été libéré le reste, avec les enrichissements éventuellement apportés par des tiers. C'est, avec le logiciel libre, la racine d'une évolution majeure de la société de l'information. Les collectivités territoriales libérant leurs données utilisent majoritairement la licence Open database license (ODbL) qui comprend cette clause, contrairement à la licence ouverte proposée par l'Etat.

Thomas Fourmeux, assistant multimédia aux bibliothèques municipales d'Aulnay-sous-Bois. - Exposé à des tentatives d'enclosures, le domaine public n'est pas consacré positivement : les oeuvres s'y retrouvent une fois que les droits patrimoniaux ont expiré. Nous le défendons parce qu'il constitue une ressource alimentant les biens communs de la connaissance susceptible d'être appropriée par chacun d'entre nous pour constituer ses propres connaissances. Nous rejoignons le comité des sages qui, dans son rapport, affirmait que les institutions culturelles devaient faciliter le plus possible l'accès à la réutilisation des oeuvres du domaine public ayant fait l'objet d'une numérisation. Cela, au-delà des frontières nationales, au bénéfice de tous les citoyens de l'Union européenne, ce qui entre en contradiction avec les pratiques de la Bibliothèque nationale de France, par exemple.

Selon la charte d'Europeana, un domaine public sain et prospère est essentiel au bien-être social et économique de la société, et sa numérisation ne crée pas de nouveaux droits, contrairement à ce que prétendent certains. L'article 27 de la Déclaration universelle des droits de l'homme affirme que toute personne a le droit de prendre part librement à la vie culturelle de la communauté, de jouir des arts et de participer au progrès scientifique et aux bienfaits qui en résultent. Le numérique, en élargissant cette capacité, donne tout son sens au domaine public, auquel il facilite l'accès.

En prévoyant l'octroi d'exclusivités dans le cadre de partenariats public-privé, la directive rendrait inaccessible à l'ensemble des citoyens une partie du domaine public numérisé. La Bibliothèque nationale de France a ainsi passé des accords avec des partenaires privés afin de numériser plusieurs dizaines de milliers de documents relevant du domaine public. Cet accord est pour nous un acte de copyfraud, puisque le partenaire privé bénéficiera d'une exclusivité pendant dix ans sur ces oeuvres numérisées.

Mme Hélène Lipietz. - Pour prendre de l'avance.

M. Thomas Fourmeux. - Nous avons dénoncé ces accords devant la commission des affaires culturelles de l'Assemblée nationale. Nous avons saisi la Cada pour avoir accès à ces accords mais leur communication a été caviardée dans ses éléments les plus importants. Un des articles de la loi de 1978 interdit les exclusivités dans le cadre d'accords entre public et privé : pour contourner cette loi, la Bibliothèque nationale de France a créé une filiale BnF-Partenariats, ce qui est particulièrement alarmant. Elle est pourtant capable d'initiatives favorables à l'ouverture des données, comme l'ouverture des notices bibliographiques qui représente un enjeu majeur pour le web sémantique. La contradiction de ces pratiques confine à la schizophrénie. En tout cas, la première va à l'encontre des missions générales du ministère de la culture, en particulier la démocratisation culturelle et la transmission des savoirs. Nous réclamons donc l'abrogation du régime dérogatoire auquel sont soumises les données publiques culturelles.

M. Pier-Carl Langlais, administrateur de la version francophone de Wikipedia. - Certaines des dispositions de la directive européenne de juillet 2013 contredisent la politique d'ouverture des données publiques menée par l'Etat. Aussi faut-il assurer sa transposition de manière créative. La directive se présente comme une mise à jour de celle de 2003. Elle promeut deux principes : le plafonnement progressif des redevances au coût marginal pour les institutions déjà concernées par la directive de 2003 et l'élargissement du périmètre original à certaines institutions culturelles : les bibliothèques, les archives, les musées et les bibliothèques universitaires. A partir de ce socle a minima, les Etats sont libres d'aller plus loin. C'est ce qu'a fait la France, qui s'est lancée depuis juillet 2013 dans une politique d'open data plus ambitieuse, renouant avec la tradition républicaine de publicité des affaires de l'Etat.

La directive complexifie le dispositif mis en place par la loi de 1978 qui organise, autour d'un régime général, un régime spécifique défini par l'article 11 pour les institutions culturelles et scientifiques. Le considérant 23 y ajoute un régime intermédiaire, à destination de certains établissements culturels, et défini par la faculté de maintenir des redevances au-delà du coût marginal. Ce troisième régime, présenté comme destiné à ne pas entraver le développement de ces institutions, est peu justifié, et contribue à couper la culture en deux, en excluant le théâtre et le cinéma, au motif qu'ils relèvent du spectacle vivant. Une telle disjonction va à l'encontre de la politique de normalisation engagée par la France et dont témoignent le rapport de Camille Domange ou encore le projet du Joconde Lab.

La recherche ne figure nulle part dans la nouvelle directive. C'est paradoxal, car c'est là que les transformations liées à l'utilisation des open data sont les plus tangibles. La directive recommande explicitement d'exclure les établissements de recherche de son champ d'application. Il y a là une occasion manquée alors qu'il y a un mouvement fort en faveur de l'ouverture des données scientifiques et des métadonnées scientifiques...

M. Jean-Jacques Hyest, président. - Tout n'est pas culturel. Il est normal qu'il y ait un régime particulier pour certains aspects de la recherche.

M. Pier-Carl Langeais - Il n'y a pas de raison de faire une exception pour la culture ou la recherche, et il faudrait une normalisation générale. Le récent mouvement en faveur de l'ouverture des données scientifiques s'est traduit dans la législation de certains pays européens : une loi sur le libre accès aux données scientifiques a été actée en Allemagne, l'Irlande et le Royaume-Uni ont également intégré ce mouvement d'open data scientifique.

M. Jean-Jacques Hyest, président. - Vous devriez nuancer vos propos sur la recherche. Il y a la propriété intellectuelle, les brevets... Il s'agit de tout ce qui est public, hors droits d'auteur. Il y a aussi ce qui concerne les archives : certaines ne sont pas communicables.

M. Silvère Mercier. - Le champ dont nous parlons est très bien défini. Il ne s'agit pas de tout ouvrir, mais d'ouvrir dans un régime général. Nous voulons inciter à une ouverture vertueuse, où une entreprise privée ne pourrait pas venir aspirer les données pour s'en attribuer l'exclusivité, comme cela a été le cas dans les accords de la Bibliothèque nationale de France. La commission des affaires culturelles de l'Assemblée nationale a d'ailleurs interrogé le président de cet établissement public après notre audition.

M. Pier-Carl Langeais. - Mon propos portait sur la loi de 1978. Il s'agissait de remettre en cause son article 11 dans un souci de normalisation. La licence prévue par la directive ne reconnaît pas le partage à l'identique (considérant 26). Or une fois qu'une donnée a été libérée, elle ne doit plus pouvoir être privatisée.

La directive ne tient pas compte du statut particulier des données : si l'on peut protéger la structure d'ensemble d'une base de données, les données individuelles restent libres, parce qu'elles ne répondent pas au critère d'originalité qui définit les oeuvres intellectuelles. Au demeurant, comment garantir la liberté d'expression affirmée par la Déclaration des droits de l'homme si l'on commence à privatiser l'information ?

M. Jean-Jacques Hyest, président. - Ce n'est pas tout à fait le sens de la Déclaration des droits de l'homme.

M. Pier-Carl Langlais. - L'Unesco a assez bien défini ce prérequis : toute information publiquement accessible est librement réutilisable. Il conviendrait que la loi acte ce principe parce que certains éditeurs scientifiques comme Elsevier s'efforcent d'imposer l'idée d'un droit d'auteur sur les données. Il est nécessaire d'éviter ce risque d'enclosure.

M. Jean-Jacques Hyest, président. - L'Institut national de l'audiovisuel (INA) numérise tout son fonds, l'un des plus beaux du monde, pour en assurer la pérennité. Vous paraît-il normal qu'il tire en partie ses ressources de redevances ?

M. Silvère Mercier. - Il serait normal que l'intégralité de ses données soit librement accessible et que son modèle économique repose sur la vente de services associés à celles-ci. Que des documentaires soient abandonnés en raison du montant de ces redevances est contraire à la mission de cet organisme. Or ce qui devrait appartenir à tous n'est disponible que pour ceux qui ont les ressources financières pour y accéder. Il est extrêmement important de déplacer cette barrière financière en faisant plutôt payer des services comme le format, la qualité, le traitement des données. Voilà précisément ce qu'a proposé la Bibliothèque nationale de France en ouvrant ses métadonnées bibliographiques parce qu'elles ne dégageaient pas beaucoup de ressources propres.

M. Thomas Fourmeux. - Les documents produits par l'ORTF ont été financés par l'argent du contribuable.

M. Jean-Jacques Hyest, président. - La conservation a un coût.

M. Thomas Fourmeux. - Les services associés dégageront d'autres ressources.

M. Pier-Carl Langlais. - L'écosystème a changé. L'Etat peut en partie délocaliser la conservation auprès de communautés libres.

M. Thomas Fourmeux. - Voilà ce que fait le ministère de la culture avec JocondeLab : 300 000 oeuvres y sont accessibles avec des métadonnées grâce aux contributions des internautes, et réutilisables de manière à enrichir les données culturelles et à favoriser leur réutilisation.

M. Silvère Mercier. - Nous nous opposons fortement à la suggestion du Medef de maintenir les redevances quand elles représentent une part importante des ressources des organismes. Absolument contraire à une saine concurrence, cette position n'a d'autre objectif que de gêner l'arrivée de nouveaux compétiteurs sur le marché et un obstacle à la construction d'un nouvel écosystème. Il s'agit bel et bien de maintenir le monopole de fait de ceux qui ont les moyens d'acquitter une redevance. On l'a bien vu avec Légifrance : qui empêchait l'ouverture, sinon des entreprises comme Dalloz qui vendent très cher des bases de données juridiques aux bibliothèques ?

M. Pier-Carl Langlais. - L'exception prévue par la directive pour ce qui est commercial pourrait conduire à des dérives tant sur les données des sociétés qui dépendent à la fois du public et du privé, que pour la recherche. La notion de vie privée est susceptible de faire obstacle à celle-ci.

Mme Corinne Bouchoux, rapporteure. - Le contraste entre les auditions était intéressant. Avez-vous des préconisations concrètes à formuler ? Nous pourrions les intégrer à notre rapport si elles font consensus - chez nous également, tout est question d'équilibre.

M. Silvère Mercier. - Sans attendre le document écrit que nous vous ferons parvenir, j'insiste sur l'urgence qu'il y a à revoir l'article 11 de la loi de 1978 qui prévoit ce régime dérogatoire. Le texte sur le patrimoine en sera-t-il l'occasion ? Il est extrêmement important de définir positivement le domaine public. La proposition de loi d'Isabelle Attard tend à affirmer que ce qui est dans le domaine public doit y rester : cela empêcherait des enclosures.

M. Jean-Jacques Hyest, président. - Le domaine public culturel ?

M. Silvère Mercier. - Les oeuvres, l'information. Les idées sont de libre parcours, les données doivent également l'être. Il importe de transposer de manière créative la directive qui est à notre avis déjà obsolète. Enfin, sachons conforter le mouvement engagé par les collectivités territoriales qui ont majoritairement retenu des clauses de partage à l'identique, là où l'Etat a préféré la licence ouverte, sans aucune contrepartie. Nous voulons en effet enclencher un cercle vertueux.

M. Jean-Jacques Hyest, président. - Je vous remercie.

La semaine prochaine : analyse sociologique de l'utilisation des données publiques puis un éditeur de jeux de données et le dirigeant d'une plateforme qui permet le partage des données et leur structuration.

Audition de MM. Sylvain PARASIE, maître de conférences en sociologie à l'université Paris-Est, et Eric DAGIRAL, maître de conférences en sociologie à l'université Paris-Descartes (jeudi 13 février 2014)

M. Christian Cointat, président. - Nous accueillons tout d'abord deux sociologues, MM. Sylvain Parasie, maître de conférences en sociologie à l'université Paris-Est et Eric Dagiral, maître de conférences en sociologie à l'université Paris-Descartes qui ont enquêté sur l'utilisation des données publiques en France et aux Etats-Unis.

Notre mission souhaite mieux comprendre la situation actuelle d'accès aux documents administratifs et aux données publiques, identifier et analyser les attentes, pour aller peut-être plus loin que ce qui existe aujourd'hui.

M. Sylvain Parasie, maître de conférences en sociologie à l'université Paris-Est. - Merci de nous offrir cette occasion de présenter les résultats de nos travaux de recherche sur l'utilisation citoyenne des données publiques par les journalistes, les associations et le monde militant, ainsi que les usagers de l'administration, fondés sur des enquêtes que nous avons réalisées en France et aux Etats-Unis.

M. Christian Cointat, président. - Ce qui nous intéresse est très concret. Quels documents les intéressent ? Lesquels sont faciles à obtenir ? Est-il aisé de réutiliser des données ?

M. Sylvain Parasie. - Notre réflexion de sociologue a tout d'abord porté sur les journalistes. Aux Etats-Unis, l'utilisation des données publiques est ancienne dans le journalisme ; elle remonte aux années 1970. En France, le phénomène est plus récent. Le journalisme d'enquête s'appuie sur les données publiques pour révéler l'existence de problèmes publics qui ne sont pas traités, ou déceler des crises, qui concernent l'environnement, la santé, en procédant à une analyse censément plus objective. Aux Etats-Unis prospère également un journalisme local de services, très consommateur de données publiques, friand de données locales concrètes sur les transports, la voirie, le crime, les pollutions, etc. En France, le journalisme d'enquête s'appuie sur une tradition plus littéraire, sur des données plus qualitatives. Les journalistes locaux de la presse quotidienne régionale travaillent de plus en plus comme les journalistes américains, rassemblant parfois sur un même site Internet des données disparates sur une ville pour informer les électeurs. Ainsi les pages multimédias hyperlocales de La Voix du Nord qui ont précisément pour objet d'éclairer le débat des municipales, en rassemblant des données locales, données démographiques, les taux d'emploi, des données fiscales.

Aux Etats-Unis, les données mises en ligne sont très précises, à l'adresse près, dans une rue donnée, pour la criminalité, et concernent aussi les maisons de retraite, les hôpitaux, l'éducation, - la performance des écoles -, l'environnement depuis le mitan des années 1990. Les citoyens ont accès aux données sur la pollution, l'emploi, la criminalité, les transports, la voirie, l'entretien urbain, les canalisations, les graffitis retirés par les services de la mairie, etc... Ces données locales relèvent de niveaux administratifs différents. Elles sont en pleine expansion. Elles proviennent de sources administratives variées. Non seulement les journalistes les recoupent, mais aussi créent des informations nouvelles.

Les associations jouent traditionnellement un rôle fort aux Etats-Unis. La France n'a pas cette tradition d'observatoires citoyens indépendants, comme le Center for responsive politics, mais l'accès aux données est une préoccupation de longue date pour une grande partie du monde associatif, qu'il s'agisse de s'informer sur l'action de l'administration, de dresser un bilan de l'action des élus, d'assurer la transparence de la vie politique, ou encore pour être en mesure d'intervenir finement dans le champ social. Les acteurs du numérique se sont greffés sur ce mouvement. Les attentes sont variées. Certaines associations, comme à Chicago, visent à rapprocher les élus des citoyens, en montrant l'action concrète quotidienne d'une municipalité. Les associations qui interviennent dans le domaine social ont besoin de données pour définir précisément une population cible. Ainsi, une militante du Nord-Pas-de-Calais me confiait que, pour développer l'emploi féminin dans les quartiers, les données agrégées au niveau régional étaient peu utiles. Des associations spécialisées cherchent des informations techniques très précises pour un enjeu militant, comme celles qui étudient la qualité de l'air à Paris et les problématiques de santé qui en découlent.

Trois grandes préoccupations se retrouvent aux Etats-Unis comme en France : obtenir des données granulaires, c'est-à-dire fines et adaptées à l'échelle des problèmes locaux, parfois celle d'une rue ou du quartier ; obtenir des données compréhensibles, au-delà du filtre constitué par les catégories juridiques ou administratives qui conditionnent le recueil de ces données, pour éviter notamment les erreurs d'interprétation ; obtenir des données au format ouvert, susceptibles d'être croisées alors qu'elles proviennent de diverses sources, et de sortir ainsi de la logique de silo pour les réutiliser.

M. Eric Dagiral, maître de conférences en sociologie à l'université Paris-Descartes. - L'open data dans l'administration se développe. Des expérimentations s'étendent aux données personnelles. En France, par exemple, la fondation Internet nouvelle génération développe le projet « Mes infos ». L'idée est que les données personnelles que les administrations s'approprient soient ouvertes aux personnes concernées pour leur permettre de mieux comprendre par exemple leurs dépenses d'énergie, de santé, leur charge fiscale, dans un souci de transparence à l'égard des citoyens, qui restent maîtres de leur vie privée : il ne s'agit pas de rendre ces données personnelles accessibles à tous !

Depuis le milieu des années 2000, l'administration française a évolué : les contribuables peuvent accéder en ligne à leur dossier fiscal sur une période de trois ans. Ces données sont présentées sous forme de fac-similé des formulaires administratifs « papier ». Certains souhaiteraient un autre format pour pouvoir faire des recoupements, réutiliser les jeux de données pour analyser leur consommation d'énergie par exemple. Plus que l'accès, se pose donc la question de la restitution des données. Certes, tous les citoyens n'expriment pas ce souhait spontanément et la majorité considère l'accès aux données avant tout comme une possibilité de meilleure compréhension de celles-ci. L'enjeu de l'accès à l'information administrative est indissociable de celui de la simplification du langage administratif. L'ouverture des données ne concerne donc pas seulement des collectifs constitués mais également des particuliers.

M. Sylvain Parasie. - Quelle est l'utilisation concrète des données ? Les journalistes indiquent que l'obtention des données publiques ne modifie pas radicalement leur travail : les données ne font pas l'article ! Les règles de vérification et de croisement des informations restent pertinentes. La mise en pratique est souvent complexe. Les données n'ont pas été produites d'abord pour le journaliste, un travail de déchiffrement est donc nécessaire car les catégories employées sont celles de l'administration. Là où on s'attendait à un journalisme de reproduction, on découvre ainsi un journalisme d'enquête qui exige des ressources humaines et techniques importantes.

Souvent des acteurs intermédiaires spécialisés, qui ont souvent partie liée avec les observatoires citoyens, se chargent de recouper les données. Aux Etats-Unis, ces observatoires mettent en forme, vérifient, mettent les données en perspective, par exemple les données électorales ou relatives au financement politique ; ils fournissent une expertise sur ces données, les mettent en perspective. En France, la culture politique est différente, mais le collectif « Regard citoyens » par exemple fait un travail similaire, laborieux, neutre et coûteux de pédagogie notamment auprès des journalistes. Le rôle de ces acteurs spécialisés, intermédiaires, de ces expertises citoyennes est déterminant pour que ces données ne restent pas lettre morte - ou soient utilisées à mauvais escient. L'utilisation des données réclame des investissements et des démarches actives d'explicitation. C'est ainsi que des partenariats se nouent entre acteurs intermédiaires, journalistes et scientifiques, par exemple pour l'exploitation des données environnementales.

Quels sont les impacts de ces mouvements ? N'attendons pas de l'ouverture des données publiques des effets radicaux, massifs, immédiats, du jour au lendemain. Beaucoup de données sont publiques mais peu sont utilisées. Il faut distinguer l'accès aux données et la culture politique : la mise à disposition ne modifie pas immédiatement la culture politique française dans le sens d'une transparence sur le modèle américain. Mais l'ouverture sert à renforcer l'expertise citoyenne et contribue à susciter de nouvelles attentes, par exemple dans le domaine de la santé, et à éveiller les consciences. Dès lors que les citoyens ont accès aux données sur l'environnement, ils s'en préoccupent davantage. Tous les citoyens ne sont pas également touchés par ce mouvement mais les données locales, celles sur lesquelles les citoyens pensent avoir prise, les intéressent tout particulièrement. Les citoyens sont souvent défiants à l'égard des institutions politiques, mais ils s'intéressent aux enjeux locaux. Sans doute l'ouverture des données publiques aura-t-elle un effet positif à cet égard.

S'agissant de la vie politique ou parlementaire, des acteurs comme senateurs.fr ou Regards citoyens, en fournissant des informations précises et concrètes, contribuent à nourrir le débat public, pour dépasser l'antiparlementarisme sur des questions telles que le clientélisme ou l'absentéisme. Ils concourent à mieux faire connaître le travail concret des parlementaires. Cela permet également aux élus de réfléchir à la communication sur leur activité.

M. Eric Dagiral. - Servicepublic.fr, en devenant Monservicepublic.fr, en personnalisant les informations fournies, offre de nouveaux services personnalisés aux usagers qui se connectent. L'accès à des données plus précises n'est pas un simple enjeu de transparence, mais répond à une logique de service. Et plus les administrés découvrent ce que sait l'administration et comment elle le sait, plus ils s'étonnent qu'elle ne leur présente pas davantage leurs droits. La même réflexion vaut pour les services fournis par les banques en ligne. Les nouveaux usages développent des attentes vis-à-vis de l'administration.

M. Christian Cointat, président. - Y a-t-il des données indisponibles en France ? Y a-t-il les mêmes failles aux Etats-Unis ?

M. Sylvain Parasie. - La situation est différente entre la France et les Etats-Unis. En France, certains acteurs se plaignent des difficultés d'accès aux données fiscales. Aux Etats-Unis, les données criminelles sont très largement diffusées par les municipalités qui ont d'importantes prérogatives en matière de police, ce qui en fait un enjeu politique local majeur. En France, les chiffres de la criminalité sont disponibles à un niveau très agrégé, pas au niveau local - à quel niveau faut-il les rendre disponibles : la commune, parfois le quartier dans les grandes villes ? Cela mérite évidemment débat, négociation entre les acteurs concernés.

M. Eric Dagiral. - Lors de nos enquêtes, on nous explique avoir eu accès aux informations, mais ne pas avoir pu les exploiter, faute de disposer des documents à l'échelle souhaitée, car ils ont été élaborés pour répondre à un usage administratif bien défini.

Mme Corinne Bouchoux, rapporteure. - Nous clôturons ce matin notre démarche d'analyse des demandes d'information engagée depuis plusieurs semaines, avant d'étudier l'offre. La demande sociale d'information explose. La commission d'accès aux documents administratifs (Cada) est confrontée à cette inflation. Comment articuler la transparence et la sécurité, face aux risques de malveillance ou de mésusage de certaines données, concernant, par exemple, des biens communs comme l'eau ? Quid également de la vie privée si la transparence est totale ? Par ailleurs, quels débouchés politiques ? En Allemagne, il y a quelques années, de jeunes hackers liés à des militants politiques sont entrés dans les parlements régionaux, en prônant l'accès direct à tout, discours audible par une fraction de la population qui ne comprend plus les limitations. Dans un contexte de forte contrainte sur les finances publiques, l'accès aux données publiques n'offre-t-il pas l'occasion de mettre en place des budgets plus participatifs, au plus près des citoyens, les associant aux choix budgétaires locaux ?

M. Sylvain Parasie. - Développement des usages et réflexion sur les limites vont de pair. Aux Etats-Unis, le respect de la vie privée est au coeur des réflexions des journalistes, même s'ils ont accès à des données judiciaires ou concernant les transactions immobilières, qui nous surprennent en France. Ainsi, ces données mentionnent l'ethnicité des victimes de crimes : des applications pour smartphones existent précisant les risques quartier par quartier, que certains se refusent à utiliser pour des raisons éthiques, pendant que d'autres n'hésitent pas.

Il est difficile de penser les mésusages, dès lors que les usages ne sont pas anticipés ou anticipables. Les premiers usages sont le fait d'associations ou de collectifs organisés, attentifs aux risques. Toutes les informations ne sont heureusement pas utilisables à des fins criminelles. Nous n'avons pas évoqué les usages liés au marketing. Il faut que les acteurs concernés, notamment les journalistes, en débattent. Une des limites, c'est le voyeurisme. Aux Etats-Unis, il n'est pas choquant de connaître les revenus de son voisin.

M. Eric Dagiral. - Nos recherches explorent les changements et les innovations liés aux technologies. Les acteurs sont enthousiastes, pleins d'attentes et de projets. La vie privée, le respect de la privacy sont, par construction, fondés sur un paradoxe. Les citoyens souhaitent avoir accès aux données, à de nouveaux services, tout en s'inquiétant des risques de divulgation. Ils revendiquent aussi le droit à l'oubli.

M. Alain Richard. - J'ai été, alors dans l'opposition, l'un des auteurs de la loi de 1978 qui sera bientôt codifiée dans un code des relations entre l'administration et le public. Les résultats, que vous présentez, me rassurent sur la robustesse de cette législation qui résultait déjà à l'époque d'une démarche comparative. Trois principes la guidaient, qui ont été affinés par la Cada et qui valent encore : le droit d'accès sans limite à ses données personnelles ; leur protection à l'égard d'autrui ; la protection du travail en cours de l'autorité publique.

Quiconque le souhaite a accès à l'ensemble des données personnelles le concernant détenues par l'administration. La limitation fiscale des trois ans est une protection, opposable également à l'intéressé aussi : le droit à l'oubli est fondamental.

Dans la commune de 24 000 habitants dont je suis maire, le revenu moyen par habitant est bien inférieur à la moyenne nationale mais il y a une quarantaine de redevables de l'ISF. Je sais bien que certains voudraient savoir qui ! A quelques kilomètres, se trouve une commune de 1 000 habitants, qui n'en compte peut-être qu'un. L'Insee, dont l'expertise est mondialement reconnue, sait faire la différence entre données statistiques et données individuelles. La police me transmet chaque semaine une liste des faits notables, moins d'une dizaine en général. Avec l'adresse, il serait facile de mettre des noms ! Il est donc bon que ces données ne soient pas publiées.

L'administration n'a pas à faire le travail du consommateur des données. A celui qui veut les exploiter de s'informer sur leur structure, leur signification. L'administration ne saurait être un conseilleur individualisé. Elle se fonde sur deux principes : l'Etat de droit, - l'administration détient des données dans le cadre légal de son action -, et le service public, qui détermine les missions pour lesquelles l'administration détient ces données. L'utilisation actuelle des données est équilibrée. Ne cédons pas aux caprices.

Les exploitants de données ont en fait une activité commerciale : soyons lucides, c'est un business ! Certaines associations, en tant que lanceurs d'alerte, ont intérêt à n'exploiter que celles qui font sensation, on le voit bien aux Etats-Unis : proclamer de bonnes nouvelles ferait chuter les dons !

M. Sylvain Parasie. - Ces acteurs s'engagent souvent à restituer l'ensemble des données aux citoyens et à respecter un principe de neutralité. Leur démarche ne relève pas toujours du sensationnalisme ou de l'intérêt.

Les données fiscales, budgétaires, financières sont particulièrement sensibles dans le contexte économique actuel. Savoir combien de communes ont contracté des emprunts toxiques est intéressant : certains journalistes ont obtenu cette information par Dexia. Il eût été utile, pour le débat public, qu'elle fût disponible publiquement.

M. Alain Richard. - Tous les budgets communaux de France comprennent en annexe la liste des emprunts souscrits. Bien sûr, les exploiter réclame du travail.

M. Eric Dagiral. - Il n'est pas toujours simple, pour beaucoup de gens, de comprendre les tenants et aboutissants du système. L'analyse et la présentation des données sont un véritable enjeu.

M. Christian Cointat, président. - Merci.

Audition de M. François BANCILHON, président directeur général de Data Publica (jeudi 13 février 2014)

M. Christian Cointat, président. - Nous accueillons M. François Bancilhon, président directeur général de Data Publica.

Ingénieur de formation, vous avez mené une double carrière, dans la recherche académique et dans l'industrie. Vous avez créé et dirigé plusieurs entreprises entre la France et les Etats-Unis, avant de fonder Data Publica en 2011, une société du monde de l'open data et du big data, qui développe des jeux de données à la demande pour ses clients.

Pourriez-vous nous exposer l'activité de votre société et son positionnement dans l'écosystème de l'ouverture des données publiques, nous décrire votre expérience de la réutilisation des données publiques, puis nous indiquer l'appréciation que vous portez sur les données disponibles et les conditions de leur réutilisation ?

Enfin, au vu de cette expérience et de votre connaissance de la situation aux Etats-Unis, quelles recommandations formuleriez-vous ?

M. François Bancilhon, président directeur général de Data Publica. - Nous fournissons à nos clients les données dont ils ont besoin, à partir de sources diverses. Celles-ci sont produites automatiquement. Elles concernent, par exemple, les annonces d'appels d'offres publiques françaises publiées au bulletin officiel d'annonces des marchés publics (BOAMP) - il en paraît 2 000 par jour, provenant de 8 000 sources, mais aussi les bornes de recharges électriques pour automobiles, pour un constructeur...Nous sommes une jeune start-up française.

Nous identifions les sources (open data, données publiques, privées, celles de nos clients, par exemple, réseaux sociaux, médias) pour en extraire automatiquement, dans le respect du cadre légal, les données par aspiration (scraping), ou en parcourant les sites (crawl). Puis nous les structurons pour livrer à nos clients un jeu de données propres par flux ou en visualisation.

Nous sommes cofondateurs des Data Tuesday, événement réunissant une fois par mois les acteurs de la donnée. Il y a différents métiers : éditeurs de données publiques (Insee, Dila, Etatlab), production, repérage des données, analyse, fournisseurs d'outils logiciels, notamment d'infrastructures d'hébergement, visualisation, utilisateurs, clients... Cet écosystème est riche et est en cours de formation et de développement.

Nous avons réalisé le premier annuaire des données publiques françaises, avant même la création d'Etalab, avec lequel nous collaborons aujourd'hui. Nous lui fournissons de la donnée. Je participe d'ailleurs au groupe d'experts mis en place par Henri Verdier.

Il y a des acteurs comparables aux Etats-Unis, au Royaume-Uni, en Italie, en Chine...Ce métier est en développement, partout où un intermédiaire est nécessaire pour accéder aux données : le concept de place de marché, testé notamment pas Microsoft, ne fonctionne pas. Les essais de vente de données bon marché à grande échelle par carte de crédit sur le web ont échoué partout jusqu'à présent : la donnée est trop complexe et son coût trop élevé pour ce type d'utilisation.

Nous avons par exemple produit un tableau de bord de l'emploi agrégeant les données de tous les bassins d'emplois en France, pour un cabinet de conseil, un tableau de bord de l'immobilier à destination des notaires, un tableau de bord des 36 000 communes de France comportant des données sociodémographiques pour un autre client...

La qualité des données est généralement mauvaise, surtout chez nos clients. Les données publiques sont souvent de meilleure qualité que les données privées, ce qui est logique car elles sont regardées. L'Insee a des données fabuleuses.

Pour nous, la qualité n'est pas un problème, puisqu'une partie de notre métier est justement de produire des données de bonne qualité à partir de données de qualité variable. Il y a en effet une pénurie de données de qualité. Nous sommes une start-up de dix personnes. Les prix prohibitifs de certaines données (de l'Insee et de la Dila notamment) constituent, à nos yeux, une barrière à l'entrée protégeant les Cegedim, Altarès et LexisNexis, qui sont les taxis de la donnée : nous sommes les VTC (voitures de tourisme avec chauffeur) !

Nous souhaiterions donc que davantage de données brutes soient ouvertes, afin d'enclencher une dynamique, qui en améliore la qualité et en diminue le prix. A cet égard, le rapport Trojette va dans le bon sens.

Comme citoyen, je milite pour que la carte scolaire soit disponible : pourquoi ne l'est-elle pas ? Il est seulement possible de savoir à quel lycée votre adresse est rattachée.

Mme Catherine Procaccia. - Bonne question !

M. François Bancilhon. - S'il y a des problèmes techniques, ils sont solubles ! ERDF est terrorisée par l'ouverture de « ses » données. Pourtant, celles-ci appartiennent aux Français, que vous représentez.

Les fichiers Sirene de l'Insee et Infogreffe sont accessibles moyennant redevance, ce qui n'est pas normal. Je forme le voeu qu'elle soit supprimée un jour. Infogreffe inflige aux entreprises une double peine : elles payent pour y inscrire des informations que les autres devront payer pour obtenir !

Les données constituent un enjeu stratégique d'indépendance et de souveraineté nationale. Or la meilleure connaissance des données françaises est détenue par des acteurs américains comme Google, Amazon, LinkedIn, et autres. LinkedIn, par exemple, possède 7 millions de curriculum vitae de Français. Que d'informations critiques sur les parcours, les emplois, les tendances de notre société !

Pendant ce temps, chez nous, la Commission nationale de l'informatique et des libertés (Cnil), telle la ligne Maginot, vérifie avec acharnement que personne ne puisse construire chez nous une telle base de données, alors que tous nos efforts devraient tendre vers la restauration de notre souveraineté sur nos données.

M. Christian Cointat, président. - Merci.

Mme Corinne Bouchoux, rapporteure. - Votre témoignage est très éclairant sur les opportunités offertes en matière de retraitement des données.

En principe, en dehors de Paris, la carte scolaire est accessible sur les sites des ex-inspections académiques. Elle ne relève pas du secret défense ! Vous pouvez l'obtenir sur demande écrite, sinon, saisissez la Cada !

M. François Bancilhon. - Si je rentre mon adresse, on m'indique quel lycée correspond. Mais je n'ai pas accès à la carte globale du ressort de chaque établissement. C'est celle-ci qui m'intéresse. Elle existe, sinon l'opération que je viens d'indiquer ne serait pas possible, mais n'est pas accessible.

Mme Corinne Bouchoux, rapporteure. - Quelles sont les trois avancées concrètes qu'il faudrait accomplir par rapport à la loi de 1978 qui ouvre en théorie mais limite parfois ?

M. François Bancilhon. - Le mécanisme écrit du recours à la Cada est trop lourd et long. Il n'est pas du tout « 2.0 » ! Plutôt « - 1 » ! La loi prévoit que les données publiques sont disponibles par défaut : qu'elles le soient ! En France, les entreprises publient leur chiffre d'affaires, pas dans les pays anglo-saxons, en tout cas pour les sociétés fermées. Pourquoi, dès lors, ne pas supprimer les redevances Insee et Siren et le mécanisme kafkaïen de refacturation mis en place par l'Insee pour la refacturation ? Cela ouvrirait le marché à des acteurs innovants et favoriserait opportunément le développement économique de notre pays.

Je reviens sur la Cnil et le principe de finalité. Partout dans le monde, il faut arbitrer entre transparence et protection de la vie privée, qui sont deux aspirations légitimes.

Sur certains points, comme la géolocalisation des boîtes aux lettres de La Poste - qui n'est toujours pas publique ! - il n'y a pas vraiment de conflit. Sur d'autres, c'est plus complexe. Notre culture protège d'abord la vie privée. Les Anglo-saxons donnent la priorité à la transparence. Aux Etats-Unis, le credit-rating d'un individu, sa capacité d'emprunt, est public, ce qui serait impensable et illégal en France.

Chez nous, le principe de finalité protège la vie privée, exigeant de celui qui recueille des données qu'il déclare préalablement quel usage il entend en faire. Aux yeux du mouvement open data, du big data, ce principe de finalité est insupportable. L'important est que les données soient disponibles. Cette disponibilité stimule la créativité et l'économie, à l'image des hackathons (marathons créatifs) : ils partent des données pour inventer des usages nouveaux ; c'est donc l'inverse du principe de finalité.

Le projet « X-Data » auquel nous participons illustre cette nouvelle perspective : il s'agit de démontrer que le croisement de données de sources diverses (Orange, EDF, La Poste, Veolia...) est en lui-même fécond. Mais réunir ces données est très difficile en France. Pendant ce temps-là, Google rachète Nest et saura bientôt la température exacte qui règne chez vous...

Mme Catherine Procaccia. - Souhaiteriez-vous que l'on puisse exploiter les données de LinkedIn en France ?

M. François Bancilhon. - Nous devons retrouver la mainmise sur nos données, nous les réapproprier : c'est un enjeu de souveraineté et la capacité à analyser l'efficacité de notre système de formation. Faut-il créer un concurrent à LinkedIn ? Je ne sais. C'est le pari de Viadeo. Il y a sûrement une solution à construire. La valorisation boursière de LinkedIn est liée à la qualité des données qu'il propose.

M. Yves Détraigne. - Vos propos m'inquiètent : au nom de la fluidité de l'économie, faut-il cesser de protéger la vie privée ? Que pensez-vous de la notion de droit à l'oubli ? Est-il nécessaire, et techniquement possible, de faire disparaître une donnée qui porte préjudice à quelqu'un ?

M. François Bancilhon. - Distinguons les personnes publiques au sens large, - les dirigeants de sociétés en font partie -, et les personnes privées. Les contraintes de transparence sont plus fortes sur les premières. Pour autant, le droit à l'oubli est une bonne chose.

Ce qui importe, c'est la connaissance globale, statistique, des usagers. C'est cette masse d'informations agrégées qui fait la valeur de Facebook, LinkedIn et autres. Les connaissances de Google sont immenses : il peut organiser jusqu'à nos rendez-vous. Mais disposer d'informations est utile. La remontée des données est essentielle. La canicule de 2003 a mis du temps à être détectée par le ministère de la santé parce que l'information n'a pas été rendue assez rapidement disponible. Il a fallu plusieurs semaines pour que soient centralisées les données sur le nombre de morts. La Cnil ne protège rien : Google sait tout sur nous ! Il y a une réflexion à engager dans ce monde qui a changé : comment être efficace économiquement tout en protégeant la vie privée ?

M. Christian Cointat, président. - Vous critiquez la loi sur la Cnil : selon vous, elle n'empêche rien mais entrave des projets utiles ?

M. François Bancilhon. - C'est une ligne Maginot, je le répète...

Mme Corinne Bouchoux, rapporteure. - Certains d'entre nous estiment que la loi de 1978 ne doit pas être remise en cause. D'autres pensent que la société a changé. Quelles pistes proposez-vous en termes d'évolution du cadre légal ? Votre réponse peut ne pas être immédiate. Pour l'instant, nous dressons un état des lieux.

M. Christian Cointat, président. - Nous avons accompli un grand progrès en 1978. Il faut en faire un nouveau aujourd'hui ! Merci.

Audition de M. Jean-Marc LAZARD, président directeur général d'OpenDataSoft (jeudi 13 février 2014)

M. Christian Cointat, président. - Nous allons maintenant entendre M. Jean-Marc Lazard, président directeur général d'OpenDataSoft.

Monsieur Lazard, vous avez été responsable de projets innovants dans l'industrie agroalimentaire et la grande distribution, puis directeur des projets stratégiques d'Exalead, au sein du groupe Dassault Systèmes, avant de proposer une plateforme sur le cloud, dont vous allez nous parler.

Quelle est en effet l'activité d'OpenDataSoft et son modèle économique ? Comment celui-ci s'inscrit-il dans l'écosystème de l'ouverture des données publiques ?

Pouvez-vous nous décrire votre expérience en matière de réutilisation de données publiques au service de vos clients, les difficultés rencontrées ? Quelle appréciation très concrète portez-vous sur les données accessibles, les conditions de leur réutilisation, et les améliorations qui pourraient être apportées ?

Nous souhaitons revoir la loi de 1978 pour tenir compte de l'évolution des modèles sociaux, économiques et techniques.

M. Jean-Marc Lazard, président directeur général d'OpenDataSoft. - J'ai fondé OpenDataSoft il y a deux ans. Nous concevons des logiciels pour les producteurs de données et pour leurs utilisateurs. Nous mettons à leur disposition une plateforme sur le cloud, comportant nos solutions de traitement, ce qui présente des avantages en termes de rapidité de disponibilité et de coûts.

Nous offrons la possibilité sur ce portail de se connecter aux données de toutes natures qui existent déjà. Parmi nos clients figurent des collectivités locales (comme le conseil général du Pas-de-Calais, la région Ile-de-France, la ville de Paris) et des entreprises publiques (comme EDF ou la RATP) ou privées, des producteurs de données ou des utilisateurs.

Le modèle économique repose sur la réalité de l'usage des données : l'investissement de départ est faible, nous nous contentons de libérer les données. Les producteurs de données se servent de notre plateforme pour mettre en oeuvre leur démarche d'open data. Parfois, les filtres développés sont le support de nouveaux services, de nouvelles applications. Leurs utilisateurs finaux y trouvent des données qui les concernent et d'autres avec lesquelles elles peuvent les croiser. Les premiers utilisateurs sont les collectivités publiques : nos solutions facilitent la circulation interne de l'information, ce qui améliore le service au public et leur permet d'alimenter des portails comportant notamment de la visualisation. Il est préférable que ces données soient fournies dans leur état initial, ce qui permet de recueillir les commentaires des utilisateurs. Les entreprises quant à elles peuvent croiser leurs propres données et des données publiques pour offrir de nouveaux services, comme par exemple Veolia pour la qualité de l'eau.

L'open data fait partie de tout un écosystème. Que deviennent les innovations qu'il génère ? Un matériau est mis à disposition. Des entrepreneurs l'exploitent. Mais leur projet n'est pas toujours durable, car il n'aboutit pas forcément à un modèle économique viable. Pour cela, il faudrait que la puissance publique achète ce type de services. Sans cela, seuls les plus gros acteurs surnageront. Notre modèle est donc différent de celui qui existe dans les pays anglo-saxons. Qu'attendent nos clients ? Un département, comme les Alpes de Haute-Provence, par exemple, souhaitera développer l'attractivité touristique de son territoire.

L'open data est un élément de rupture. On passe d'une culture fondée sur la comptabilisation des visiteurs du site web du département à une refondation de l'activité pour mieux collecter les données auprès des différents acteurs (gites, ...), les faire remonter plus rapidement, mieux les rendre accessibles et développer l'attractivité du territoire auprès du public. Le retour sur investissement est acquis en six mois. Le coût de promotion et de gestion des données est divisé par quatre, ce qui permet de redéployer les ressources. L'un des principaux enjeux de l'open data est de rendre plus efficace l'action publique et de réduire les dépenses, en laissant le soin aux acteurs qui recueillent les données de dégager des ressources qui peuvent vous être utiles.

Les utilisateurs de données utilisent nos solutions pour collecter des données, parfois disponibles dans des formats techniques peu accessibles - comme celles qui concernent les sous-sols - afin de développer de nouveaux usages. En effet, de nombreux organismes produisent des données, mais dans des conditions techniques qui en restreignent le potentiel. D'où notre rôle de pivot.

La réglementation évolue, mais reste à clarifier. Etalab a joué un rôle important dans la libération des données. Des cadres réglementaires devraient encore évoluer. Les perspectives sur les coûts de l'accès à l'open data sont prometteuses, ces coûts n'étant d'ailleurs pas un frein lorsqu'ils sont peu élevés. En revanche, il serait bon que le cadre juridique évolue, afin de favoriser l'achat de services auprès de petites sociétés prestataires françaises lors des marchés publics.

Le coût d'entrée est faible et les technologies requises sont simples. Des démarches volontaristes sont en cours. Il reste néanmoins encore beaucoup à faire pour libérer les données et les rendre interopérables. Une préférence donnée aux start-ups serait décisive, pour éviter de réinventer la roue à chaque fois, comme cela se fait actuellement dans une vingtaine d'endroits en France. Cela serait favorable à l'emploi et au développement économique.

Aux Etats-Unis, une agence est chargée d'évaluer les dépenses et investissements de recherche et développement, ainsi que leurs effets concrets sur l'économie, grâce à l'open data et à un effort de normalisation en amont des données. En France, - chaque acteur, le CNRS, l'Inria ... -, publie ses propres données.

En France, ces données sont techniquement illisibles, chaque organisme publiant ses données sous des formats spécifiques, avec des granularités différentes, ce qui ne le rend pas interopérable. Le législateur serait fondé à fixer précisément les modalités d'établissement et de diffusion des données fournies par les organismes publics, ce qui permettrait, par exemple, de tracer toutes les dépenses publiques. En Grande-Bretagne, toutes les grandes villes font établir un tableau de bord d'efficacité, établi à partir des données existantes, permettant une auto-évaluation. A cet égard, l'Europe continentale et le monde anglo-saxon ne fonctionnent pas de la même manière.

Mme Corinne Bouchoux, rapporteure. - L'information, c'est le pouvoir. Les élus ont-ils conscience des enjeux liés à la publication des données, au partage des données et de la connaissance ? N'y a -t-il pas une pédagogie à faire pour débloquer cette filière ?

M. Jean-Marc Lazard. - Je croise peu d'élus, c'est un signe. Je traite surtout avec les directeurs des services ou les responsables informatiques des collectivités. Un effort de pédagogie est assurément nécessaire. Avec l'open data, on passe des services publics au service au public et les usages des données échappent de fait aux pouvoirs publics. La gouvernance de ces plateformes de partage de données, sur lesquelles les usages se modèlent, est un enjeu essentiel.

Mme Catherine Procaccia. - Selon vous le coût est faible. Mais quid des moyens humains ?

M. Jean-Marc Lazard. - L'open data est peu couteux en effet et facteur d'économies. Il est vrai que le coût humain est sous-estimé dans les collectivités, qui confient la mise en oeuvre de la démarche à du personnel qui est déjà en charge d'autre chose. Cela dit, le plus souvent, une seule personne dédiée suffirait.

Mme Corinne Bouchoux, rapporteure. - Faudrait-il un Wikileaks à l'échelle territoriale pour que les élus prennent conscience des enjeux ? Y aurait-il une solution plus pédagogique ?

M. Jean-Marc Lazard. - Cela constituerait un électrochoc, et ce n'est pas qu'un scénario hypothétique. Il peut avoir lieu à tout moment. La meilleure pédagogie est de regarder territoire par territoire et par filières.

Je suis surpris que l'open data ne soit pas un objet de débats sur le terrain dans cette période préélectorale. Les enjeux économiques sur le tourisme, l'agriculture et d'autres filières du développement local sont en effet considérables. Il en va aussi de la capacité des institutions publiques et décentralisées à rendre compte de leur action dans les territoires pour offrir de meilleurs services aux citoyens.

M. Christian Cointat, président. - Merci.

Audition de M. Samuel-Frédéric SERVIÈRE, responsable des études budgétaires et fiscales à la Fondation pour la recherche sur les administrations et les politiques publiques (iFRAP) (jeudi 13 février 2014)

M. Christian Cointat, président. - Nous entendons à présent M. Samuel-Frédéric Servière, responsable des études budgétaires et fiscales à la fondation iFRAP, fondation pour la recherche sur les administrations et les politiques publiques. Quelle est votre expérience en matière d'accès aux documents administratifs et aux données publiques pour mener à bien des travaux de recherche et d'analyse ? Quelles difficultés rencontrez-vous ?

M. Samuel-Frédéric Servière, responsable des études budgétaires et fiscales à la fondation iFRAP, fondation pour la recherche sur les administrations et les politiques publiques. - L'iFRAP est une fondation reconnue d'utilité publique depuis 2009, fondée en 1985, qui analyse les politiques publiques et promeut la création d'entreprises.

Je suis chargé des questions fiscales et m'occupe de l'open data depuis 2009. Nous avons publié en 2011 une étude sur la question, intitulée Omerta ou Open data ?, qui a mis en évidence les difficultés posées par l'application de la loi de 1978, et notamment par les limitations qu'elle contient. Nous nous apprêtons à publier une étude portant sur les communes de plus de 100 000 habitants, pour laquelle nous nous sommes heurtés, à nouveau, à des difficultés d'application de cette loi, au regard de l'accès aux documents administratifs plus que de l'open data stricto sensu.

M. Christian Cointat, président. - Soyez précis : la rapporteure et moi-même, nous siégeons à la Cada.

M. Samuel-Frédéric Servière. - Par exemple, nous n'avons trouvé en ligne qu'un seul bilan social, celui de la ville de Nantes, alors que ce document doit être établi et communiqué. Nous en avons reçu quelques autres après relances, mais certaines collectivités ne nous l'ont pas adressé.

M. Christian Cointat, président. - Avez-vous saisi la Cada ?

M. Samuel-Frédéric Servière. - Vu le délai de publication de notre étude, nous n'aurions pas eu les documents à temps. Mais pour obtenir des éléments sociaux détenus par les caisses d'allocations familiales (Caf), pour une autre étude, il nous a suffi de relancer la Caisse nationale d'assurance maladie (Cnam) en évoquant un recours à la Cada.

Dans le cadre d'une révision de la loi de 1978, nous souhaiterions que soit refondée la doctrine sur l'open data et l'accès aux documents administratifs, afin qu'elle devienne celle du gouvernement ouvert. Il faut que les administrations publiques qui ne relèvent pas des exceptions de la loi de 1978 mettent en ligne spontanément et systématiquement les informations.

Il conviendrait aussi de réexaminer les exceptions de l'article 6 de la loi de 1978. L'administration en fait parfois une interprétation trop stricte. Ainsi, les documents préparatoires à une décision, non communicables lorsqu'elle n'est pas rendue, devraient être spontanément rendus accessibles.

M. Christian Cointat, président. - Dès qu'une décision est rendue, l'ensemble est communicable.

M. Samuel-Frédéric Servière. - Distinguons ouverture et accessibilité. Les conclusions des rapporteurs publics du Conseil d'Etat ne sont pas systématiquement communicables. C'est dommage, puisqu'elles participent de manière importante de la réflexion doctrinale. Pourquoi le Conseil d'Etat n'est-il pas pionnier dans la libération de ces données, qui seraient aisées à publier ? Les avis du Conseil d'Etat rendus dans le cadre de sa mission de conseil du gouvernement, qui ne portent pas sur des secrets protégés, devraient être, eux aussi, publiables, dans un souci de bonne transparence.

M. Christian Cointat, président. - Le Parlement a la même revendication !

M. Samuel-Frédéric Servière. - Il paraît qu'ils circulent néanmoins parfois, en violation de la loi. Un ancien administrateur civil a même récemment pris délibérément le risque d'en publier un sur son site personnel. Il est donc possible de les rendre libérables.

Il faudrait par ailleurs réexaminer la communicabilité des données produites par les établissements publics industriels et commerciaux (Epic), qui n'est pas autorisée, au nom du secret commercial, même lorsque ces établissements étaient auparavant des établissements publics à caractère administratif (Epa). Aucune distinction n'est faite selon la nature des informations produites. Cherchant à analyser l'exécution du budget de voies navigables de France (VNF), établissement en situation de monopole, donc sans concurrence possible, nous nous sommes ainsi heurtés à un refus.

Réfléchissons aussi à l'ouverture de réseaux comme Quetelet, qui rassemble des données statistiques anonymisées aux fins de recherche scientifique, mais qui est réservé en pratique à la seule recherche publique. Pour y accéder, il faut montrer patte blanche auprès du Conseil national de l'information statistique (Cnis). Pourquoi les données, à condition bien sûr qu'elles soient d'une granularité adaptée, ne sont-elles pas accessibles à des organismes de recherche privés comme le nôtre, pour améliorer l'information citoyenne ?

Les évaluations budgétaires et fiscales sont le domaine réservé de la direction du budget et de celle de la législation fiscale, qui s'opposent parfois à la Cour des comptes. Pourquoi ne pas ouvrir le cercle des évaluations à des tiers, ce qui améliorerait le chiffrage des mesures ? D'autres modèles seraient bienvenus : de la contestation sortiront des évaluations plus précises.

Nous souhaiterions que la Cada soit dotée de compétences supplémentaires, puisse s'autosaisir et réaliser des audits de service auprès des administrations pour vérifier que le gouvernement ouvert que nous appelons de nos voeux est effectif. Elle pourrait, par exemple, vérifier que les jeux de données libérés le sont sous un format adéquat pour permettre leur réutilisation ou que le principe de redondance dans leur référencement est bien mis en oeuvre.

Elle devrait pouvoir aussi prononcer des astreintes et des injonctions : le recours à la justice administrative allonge, alourdit les procédures et les coûts. Elle serait ainsi allégée d'une partie des contentieux, qui risquent de se multiplier.

Une charte des données publiques et de leur réutilisation devrait être élaborée et respectée, posant un certain nombre de principes, dont celui de l'agenda, par lequel les administrations communiqueraient un calendrier prévisionnel de la libération des données, comme le fait déjà l'Insee, ou encore celui de la permanence des méthodes utilisées au cours du temps - il en va de la fiabilité des données publiques. Pour mesurer l'absentéisme dans les bilans sociaux, l'exploitation des données a été compliquée par l'archaïsme des méthodes employées par certaines communes pour recueillir ces données, recourant à un formulaire qui ne devrait plus avoir cours depuis 1998 ! Autre exemple : les ETPT, « équivalents temps plein travaillés » des administrations centrales ne peuvent être comparés avec des ETP, « équivalents temps plein » recensés par les collectivités territoriales et les opérateurs. L'Insee utilise encore un autre code (EQTP) ! La direction du budget a heureusement harmonisé la méthode de calcul au sein de l'Etat, mais l'inspection générale des finances, dans son rapport sur la révision générale des politiques publiques (RGPP), avait dénoncé cette incohérence statistique.

Il serait enfin intéressant de créer un site « Légilocal »  pour rassembler la multitude de données produites par les collectivités territoriales. Il existe déjà des initiatives en ce sens, comme celle de la région Ile-de-France.

M. Christian Cointat, président. - Vous souhaitez, en quelque sorte, renverser la charge de la preuve, afin que tous les documents administratifs soient non seulement publics, mais publiés.

M. Samuel-Frédéric Servière. - Notre approche n'est pas si fondamentaliste ! Il convient de procéder par étapes. Nous pouvons imaginer des vagues de publications successives, qui commenceraient par les documents les plus significatifs. Actuellement, retrouver le budget d'un service donné dans un bloc d'informations budgétaires, rassemblées par politiques publiques depuis la loi organique relative aux lois de finances (Lolf) de 2001, est plus difficile qu'avec l'ordonnance de 1959, qui collait aux structures administratives.

Il importe qu'une donnée pertinente, dont la diffusion est commencée, a été validée et qui continue d'être collectée, continue d'être diffusée dans le temps, afin d'être suivie et de faciliter les comparaisons.

Un principe de diffusion par défaut serait utile : un report de la diffusion d'un document entrant dans le champ de la loi de 1978, décidé par la puissance publique, ne doit être possible que pour une durée limitée, éventuellement reconductible, mais pas indéfiniment.

Nous devons rendre les citoyens solidaires de la gestion des deniers publics pour traverser au mieux la période difficile qui s'annonce. Tel est bien l'enjeu essentiel de l'accès aux données publiques. En matière de bonne gestion, peu importe le bord politique. Certaines questions de politique publique gagneraient à être dépolitisées et évaluées sereinement, au regard de critères objectifs et appréciables par les citoyens, dans l'intérêt du bien public.

M. Christian Cointat, président. -Si la Cada acquiert le pouvoir de sanction, elle devra changer de structure et de taille, se doter de moyens, de personnel, d'un budget.

M. Samuel-Frédéric Servière. - Nous en sommes conscients. Nous l'assumons. Cela contribuera à enrichir le débat public, à approfondir la démocratie et à favoriser l'activité économique. L'accès aux données, c'est le civisme de demain.

Mme Corinne Bouchoux, rapporteure. - Nous sommes à un tournant de notre mission : après avoir auditionné les demandeurs d'une libération des données, nous devons aussi prendre en compte l'avis de ceux qui pensent que la loi de 1978 ne doit pas être bouleversée. Quelle est la méthode la plus appropriée ? Comment le Parlement doit-il se saisir de la question ? Faut-il une loi ? On nous a dit que nous étions encore à l'époque des calèches, alors que les automobiles circulent partout. Si nous n'instaurons pas un code de la route, nous allons au-devant de certaines difficultés...

M. Samuel-Frédéric Servière. - Nous sommes favorables à une nouvelle loi. Cela afficherait une volonté de progrès et clarifierait la situation. La MAP doit intégrer cette problématique. Ecrire une charte est intéressant ; il faut aussi changer le statut juridique de la Cada, assumons-le ! Les Etats-Unis, le Royaume-Uni, l'Australie, le Canada ne nous ont pas attendus pour s'intéresser à l'open data. Les rapports des organismes d'inspection et de contrôle, comme notre Cour des comptes, sont incomplets si les données correspondantes ne sont pas publiées. Le Canada applique de longue date la doctrine du gouvernement ouvert, en publiant systématiquement les rapports d'inspection.

Même si la loi renforce la Cada, c'est la pratique qui sera déterminante. Rendre accessibles les données publiques dans des formes utilisables sera bénéfique. Cela développera tout un écosystème, qui commence à voir le jour, autour de start-ups qui lancent des portails, des plateformes, comme dataville.fr, oeuvre de Sooyoos, collectent des données et les mettent à disposition. Ces structurateurs facturent leurs prestations, mais des acteurs non commerciaux émergent aussi, comme notre partenaire Odis (observatoire de décideurs de l'industrie et des services), association à but non lucratif, surtout active dans le Nord, qui publie un palmarès des communes les mieux gérées, grâce au point de vue des directeurs financiers des collectivités, élaboré à partir d'une matrice qu'elle a conçue et leur a envoyée.

L'open data est riche de potentialités et approfondira la démocratie : nous confronterons ces données avec notre perspective centrée sur les citoyens. Les pays où les informations sur la délinquance, les problèmes de société ou les services publics sont publiques et utilisables sont plus solidaires.

Mme Catherine Procaccia. - Pour que l'open data fonctionne, faut-il imposer des contraintes ?

M. Samuel-Frédéric Servière. - Il faut des contraintes à tous les niveaux, « macro » comme « micro ». Le recours au juge administratif ne doit pas être la seule solution. Au niveau « micro »,  il faut définir des standards d'édition et de diffusion, sinon les documents sont inexploitables : Word, Excel, ou CSV ...

A une étape ultérieure, il faut articuler l'organisation intelligente des données et leur publication. Sinon, les sociétés iront à l'étranger pour utiliser les données. L'enjeu est aussi d'intéresser les citoyens à ces données. En renforçant leur expertise, en leur livrant les faits, les contraintes et les possibles, on lutte contre le populisme.

M. Christian Cointat, président. - Encore faut-il que les données soient compréhensibles !

M. Samuel-Frédéric Servière. - Les associations peuvent les retraiter. Ne pas comprendre, ce peut être ne pas utiliser ou mésuser. Le mésusage est possible ; mais, c'est l'avantage de la mise en ligne, il sera vite corrigé.

M. Christian Cointat, président. - Merci d'avoir enrichi notre réflexion.

Audition de M. Xavier PATIER, directeur de la Direction de l'information légale et administrative (Dila) (jeudi 20 février 2014)

M. Jean-Jacques Hyest, président. - Nous ouvrons le deuxième volet de nos auditions en nous penchant à présent sur l'offre des administrations et sur les réponses apportées aux attentes des usagers. Nous allons tout d'abord entendre le directeur de la direction de l'information légale et administrative (Dila), M. Xavier Patier, haut fonctionnaire que sa carrière a conduit à la chambre régionale des comptes et dans plusieurs cabinets, à Chambord et dans le secteur de l'édition privée. Plus inhabituel, il est l'auteur de nombreux ouvrages littéraires.

La Dila occupe une position centrale dans le dispositif de diffusion légale d'information administrative et d'édition publique. Nous souhaitons que vous nous présentiez ses missions, outils et moyens, l'analyse des attentes du public et les réponses que la Dila propose, les partenariats qu'elle a développés, notamment avec les éditeurs juridiques, et enfin l'évolution de son modèle économique.

M. Xavier Patier, directeur de la Dila. - La diffusion des données publiques est au coeur de notre activité, c'est notre métier. Nous ne sommes pas une administration qui produit de la donnée pour son usage pour l'ouvrir ensuite éventuellement à d'autres. Les données que nous traitons sont dès l'origine destinées à être mises à la disposition du public. Le vers de Victor Hugo s'impose, même si l'on est loin de l'amour maternel : « Chacun en a sa part et tous l'ont tout entier ». La consommation de l'information par l'un ne prive pas les autres. « Nul n'est censé ignorer la loi », énonce le code civil. Cette mission qui consiste à porter la loi à la connaissance de tous, a vu évoluer ses moyens au cours de l'histoire : crieurs publics, tambours, affichage, pigeons voyageurs à une certaine époque, internet ou radio, tout a été essayé. Jusqu'à un temps récent, cet accès à la loi n'était pas gratuit et le Journal officiel était payant. Nul n'était censé avoir gratuitement accès à la loi. Actuellement, la consultation du site Légifrance est gratuite, c'est une nouveauté.

Un décret de 2010 a redéfini les missions de la Dila et fusionné la Documentation française et le Journal officiel. Une première mission est la diffusion légale - loi, norme ou règlement - que nous assurons par le biais du Journal officiel et de Légifrance. Deuxième mission : nous diffusons l'information administrative, grâce au site service public.fr, plébiscité, puisqu'il a enregistré 207 millions de visiteurs l'an dernier, et par le biais du 3939, service téléphonique de renseignement administratif. Dans le cadre de notre mission de transparence économique, nous publions les annonces des marchés publics, les annonces civiles et commerciales - plus de 2 millions par an - et des annonces concernant la vie associative. Enfin, nous participons au débat public, en publiant les débats du Parlement, mais aussi des revues et des ouvrages expliquant les politiques publiques - ce sont les publications de la Documentation française. Crémieux-Brilhac, pour décrire la stratégie éditoriale formulée à la Libération, disait que ces publications devaient faire la synthèse et poser la problématique du sujet. Nous continuons à suivre ce principe, en traitant par exemple la question de l'exploitation des gaz de schiste sans défendre aucune thèse. Ainsi définies, nos quatre missions sont un continuum, visant toutes à faire progresser la démocratie et l'Etat de droit par la connaissance : les citoyens sont intelligents, on ne leur en dira jamais trop.

Nous exploitons tous les supports, papier ou moyens dématérialisés. La tradition de la Dila est d'avoir toujours une longueur d'avance. La Gazette, en 1631, fut le premier périodique français imprimé ! Nous avons été les premiers à ouvrir l'accès légal aux citoyens, grâce au Journal officiel électronique, disponible sur minitel, au 3615 Joel. Actuellement, nous sommes en avance dans le développement des applications mobiles destinées à faciliter la diffusion de l'information légale et administrative.

La Dila est financée par le biais d'un budget annexe de l'Etat. Nous devons équilibrer les dépenses et les recettes et dégager un excédent d'exploitation. De ce point de vue, notre métier est de vendre des données. Récemment, nous sommes parvenus à prendre le tournant de la dématérialisation de la diffusion des données sans faire baisser notre chiffre d'affaires. Cela tient à la mise en place d'une stratégie consistant non plus à vendre des annonces publiques, mais un service - hotline, alertes thématiques,... - qui facilite la mise en relation de l'entrepreneur et de l'acheteur.

Pour mesurer l'efficacité des services que nous rendons, nous observons les pratiques des gens. Les abonnés au Journal officiel dans sa version papier sont tombés de 60 000 en 2000 à moins de 3 000 en 2014. Mais, dans le même temps, le nombre d'abonnés au sommaire électronique n'a cessé d'augmenter et dépasse désormais 70 000. Le site de Légifrance a enregistré 97 millions de visiteurs l'an dernier, soit plus de visites que de Français ! Un vrai phénomène de société ! Jules César disait que la Gaule était un pays d'avocats... Le site service public.fr a enregistré l'an dernier 207 millions de visites, soit une fréquentation en hausse de 35 %. Il est devenu un réflexe de la vie quotidienne pour effectuer nombre de démarches - changement d'adresse lors d'un déménagement, inscription des enfants à l'école, enregistrement de l'achat d'une voiture. Les enquêtes de satisfaction sont bonnes : plus de 90 % des utilisateurs de Service public se déclarent satisfaits. Des appels mystères externalisés ont été passés sur 3939 pour contrôler la qualité de la réponse apportée. Nous avons également rappelé certains usagers, pour qu'ils nous disent à froid, quinze jours après, si les renseignements fournis leur avaient été utiles. Ces contrôles ont tous donné de très bons résultats.

Les pratiques témoignent d'une fracture générationnelle plus que d'une fracture numérique. Les moins de 30 ans consultent internet non plus sur un ordinateur fixe, mais sur leur téléphone mobile. Ils naviguent sur des réseaux sociaux plutôt que sur des sites. Nous nous sommes adaptés à ces comportements nouveaux, en ouvrant nos propres comptes Twitter et Facebook, dans lesquels nous publions des alertes renvoyant aux sites de Légifrance ou de la Documentation française. Le nombre de nos suiveurs sur ces comptes reste modeste - 50 000 environ - mais nous sommes très souvent retwittés sur des sujets qui n'ont pourtant rien d'alléchant.

La Dila se nourrit des partenariats qu'elle a naturellement noués, en tant qu'administration rattachée aux services du Premier ministre, comme éditeur de documents provenant des différentes administrations, à travers la marque de La Documentation française, et comme dernier maillon dans l'édition des travaux du Parlement et des règlements ministériels. Nous avons également mis en place des partenariats avec les collectivités territoriales, grâce à un système de comarquage qui permet de mettre en lien le site service public.fr et celui d'une petite commune. Lorsqu'ils doivent effectuer une démarche sur le site de leur commune, les utilisateurs sont renvoyés à l'ensemble des fiches relatives au sujet sur le site service public.fr, à partir duquel, en retour, ils peuvent trouver jusqu'aux horaires d'ouverture de leur mairie mis à jour par la mairie elle-même. Toutes les collectivités territoriales ne sont pas comarquées, mais nous nous efforçons de développer ce système car pour nos concitoyens, la caisse d'allocations familiales, le conseil général, la commune ou l'Etat forment un tout administratif ; notre site a vocation à être le plus englobant possible.

Nos bases de données intéressent les éditeurs juridiques, qu'il s'agisse de la jurisprudence, des conventions collectives, de données économiques, des annonces de marché public ou des annonces civiles et commerciales. Jusqu'à présent, notre politique de licence a consisté à céder l'intégralité de ces bases de données à des rediffuseurs pour un prix modique. Nous n'avions pas prévu de licence gratuite, car la relation commerciale a la vertu de pousser à l'excellence du service. Le rediffuseur qui a payé est fondé à avoir un interlocuteur au téléphone et des fichiers au format Xml. A partir du mois prochain néanmoins, sur décision du comité interministériel pour la modernisation de l'action publique (Cimap), nos bases de données seront disponibles gratuitement, en open data, mais sous licence avec un certain nombre d'engagements des rediffuseurs, afin notamment de protéger les données à caractère personnel. Nos données jurisprudentielles sont en principe toutes anonymisées. Sauf accident, aucune donnée personnelle n'est mise en ligne ni n'apparaît dans les bases que nous rendons diffusables.

Même si l'accès à nos données est ouvert gratuitement, nous voudrions continuer à offrir des services marchands aux rediffuseurs de données, sous la forme d'une offre premium incluant une assistance technique, un système d'alertes, une hotline et peut-être un label Légifrance ou Dila dans la réutilisation. L'Etat doit valoriser ses données. C'est un débat que le passage à l'open data relance. Les plus gros éditeurs ne souhaitent toutefois pas que nous en fassions trop. En fait, l'Etat n'a pas cessé d'améliorer le service, sans pour autant nuire aux éditeurs.

Le modèle économique de la Dila est tout à fait original mais s'apparente à celui des groupes multimédias qui possèdent des journaux gratuits, comme Metro ou 20 minutes. Notre chiffre d'affaires est d'environ 200 millions d'euros hors taxe. Il est constitué à plus de 80 %, 90 % par les bénéfices tirés d'un type particulier de publicité, celle des annonces des marchés publics et des annonces civiles et commerciales, auxquels s'ajoute la vente de produits déficitaires, comme le Journal officiel en version papier dont le coût de production est devenu très supérieur au prix de vente. Les fortes marges que nous faisons sur la publicité financent le développement de services gratuits comme le renseignement administratif par téléphone, qui ne sont pas financés par l'impôt. Les publications de la Documentation française sont également déficitaires. Les tirages sont souvent marginaux - une revue sur la politique européenne ne se vend pas à des millions d'exemplaires - mais ces publications sont nécessaires, car aucun autre éditeur privé ne voudrait les assumer.

La vente de nos données aux diffuseurs aurait pu constituer une ressource nouvelle, à laquelle nous renonçons dès lors qu'est mis en place un système d'open data gratuit. Une autre ressource pourrait être l'ouverture de nos sites à la publicité commerciale. La prudence s'impose néanmoins, car on ne peut barioler un site comme service public de publicité commerciale. Puisqu'elle dispose de capacités de stockage importantes, la Dila pourrait offrir un service d'hébergement aux systèmes d'information des administrations. Nous y travaillons avec la direction interministérielle des systèmes d'information et de communication (Disic), au profit d'autres administrations. Nous avons commencé à proposer des services de formation en ligne ou e-learning. Nous ne sommes pas capables cependant d'imaginer un avenir sans annonces commerciales et de marchés publics. Notre souci n'est pas de gagner de l'argent, mais de gagner de l'argent pour financer nos services gratuits. La Dila possède une forte légitimité comme fournisseur d'informations - Légifrance est « le plus court chemin entre la loi et vous ». Les utilisateurs veulent davantage et nous leur apportons, de plus en plus, des solutions, à partir d'outils comme les téléphones portables, solution qui sont offertes mais qui ont un coût d'exploitation qu'il faut financer. Il nous faut être très offensifs pour défendre notre modèle mais nous sommes très à l'aise avec la démarche d'open data telle qu'elle s'est décidée sous la conduite de la mission Etalab avec laquelle nous sommes en contact permanent.

Mme Corinne Bouchoux, rapporteure. - Nous vous remercions pour cet exposé clair, précis et exhaustif. Le rapporteur spécial pour votre budget annexe, notre collègue Philippe Dominati, regrettait que la Dila, au lieu d'augmenter ses tarifs, ne cherche pas à augmenter son chiffre d'affaires sur les activités concurrentielles ; il déplorait que 80 % des recettes proviennent d'activités où la Dila est en situation de monopole. Ne craignez-vous pas que cette situation de monopole puisse être un jour revisitée ? Pourriez-vous préciser les pistes les plus innovantes pour que votre direction accroisse ses recettes ? Etes-vous totalement libre du choix de vos publications ? Enfin, envisagez-vous de publier dans une version papier ou sous un format électronique le répertoire des oeuvres spoliées tel qu'il a été stabilisé en 1954 ? Cette question un peu particulière a également été posée au ministère des affaires étrangères et au ministère de la culture.

M. Xavier Patier. - Je suis tout acquis au programme de M. Dominati, le seul problème, c'est que le secteur marchand ne nous laissera pas faire ! Nous ne sommes d'ailleurs pas un établissement public à caractère industriel et commercial (Epic) et nous sommes très surveillés. Dire que 80 % de nos recettes viennent de notre situation de monopole n'est pas très fidèle à la réalité. Nous n'avons pas le monopole des annonces de marchés publics inférieurs aux seuils des marchés européens, le journal Le Moniteur ou la presse quotidienne régionale sont des concurrents directs. Notre combat est d'abord commercial. En 2011, nous avons dématérialisé le Bulletin des marchés publics, sans perte, avant un changement complet de la philosophie de la tarification. Auparavant, les annonces de marchés publics étaient facturées à la ligne. Nous avons mis en place un forfait dématérialisé et nous avons endossé de nouvelles fonctions d'entremetteur entre l'acheteur et l'entreprise : une application mobile donnant accès à des alertes à partir de mots-clefs permet au couvreur-zingueur de Dordogne d'accéder depuis son téléphone mobile à une liste d'appels d'offres. Actuellement, nous comptons plus de 40 000 abonnés à ce service, essentiellement des PME. Une telle initiative contribue à nous assurer des parts de marché. D'autres idées de relais de croissance existent, à des degrés de maturation inégaux. Le principe général est d'améliorer le service car l'Etat ne peut pas se borner à diffuser le droit brut. Déjà en 1840, Le Moniteur commentait la loi.

Le Journal officiel fait l'objet d'un travail de mise en forme peu connu, mais important, sur la typographie, notamment. La Documentation française publie 400 nouveautés par an, y compris les revues. Aucun système centralisé de validation n'existe. Notre liberté éditoriale est totale, mais c'est une liberté consciente. Une de mes fonctions est d'être directeur de publication des revues éditées par la Documentation française. Un comité bimestriel sur la stratégie éditoriale valide les axes de nos choix éditoriaux. Nos responsables de publication font le reste. Cette liberté s'exerce aussi sur notre site Vie Publique où l'on explique la politique en train de se faire. Ce site a enregistré 10 millions d'entrées. Nous devons faire preuve de discernement pour réaliser la synthèse et la problématique - j'en reviens à la formule de Crémieux-Brilhac - ce qui nous permet d'être présents sur des sujets d'actualité en toute impartialité. Nous sommes les éditeurs de l'Etat, pas du Gouvernement.

Je prends note de votre question sur la réédition du répertoire des oeuvres spoliées.

M. Jean-Jacques Hyest, président. - Vous avez dit que le Journal officiel dans sa version papier ne comptait plus que 3 000 abonnés. Son coût de production au numéro doit être extraordinaire !

M. Xavier Patier. - Le Journal officiel suit le modèle économique d'un journal papier. Un abonnement coûte 340 euros par an, pour 302 numéros, soit 6 numéros par semaine. C'est très inférieur au prix de revient du journal. Le dispositif d'impression a été calibré pour que la loi de finances - soit plus de 500 pages - soit publiée dans les 24 heures, avant le 31 décembre. En effet, en l'état du droit, pour que la loi soit opposable, elle doit être publiée en version papier et en ligne. Hormis ce cas particulier, pendant le reste de l'année, nous pouvons prendre d'autres charges ; nous imprimons par exemple pour la délégation de la sécurité routière, la préfecture de police, le ministère de l'intérieur. Dans les trois ans à venir, il est prévu que nous arrêtions de publier le Journal officiel en version papier. Cela ne nous fera pas faire d'économies, mais nous conduira à réorganiser notre imprimerie. Au lieu d'impression sur papier 45 grammes à l'encre noire, nous publierons sur du papier feuille, en couleurs, des revues ou des documents.

Mme Corinne Bouchoux, rapporteure. - Quel est votre point de vue sur la loi de 1978 ? Les auditions précédentes ont montré qu'elle était pour certains un outil précieux qu'il n'y a pas lieu de modifier, tandis que d'autres souhaitaient qu'elle évolue.

M. Xavier Patier. - Parlez-vous de la loi sur la Commission nationale de l'informatique et des libertés (Cnil) ou de celle relative à la commission d'accès aux documents administratifs (Cada) ?

Mme Corinne Bouchoux, rapporteure. - Il est vrai que ces deux lois sont imbriquées !

M. Xavier Patier. - La Cada est antérieure à l'ère internet. Elle devait contribuer à transformer la culture de l'administration. Au départ, elle devait être provisoire. L'idée qui a présidé à sa création est qu'il y a un plus grand pouvoir à donner des informations plutôt qu'à les dissimuler. La Cada a souvent été utilisée dans un cadre individuel, dans une logique de contentieux. Rien à voir avec l'open data ! La Cnil contribue à la protection des données personnelles. Nous n'avons jamais suscité une saisine de la Cada, car nous n'avons jamais refusé de communiquer un document.

Nous constatons la montée parallèle de deux exigences contraires, la protection des données personnelles et la généralisation de l'open data. La Dila détient des données personnelles, qu'elle rend anonymes ; cette transformation est complexe et très coûteuse. La transposition de la directive de juin 2013 pourrait être l'occasion d'ouvrir un chantier législatif, dans le prolongement de la réflexion menée par Etalab au sein du conseil d'orientation de l'édition publique et de l'information administrative (Coepia) sur les scénarios de transposition possibles.

M. Jean-Jacques Hyest, président. - Je vous remercie.

Audition de M. Michel PINAULT, président du Conseil d'orientation de l'édition publique et de l'information administrative (Coepia) (jeudi 20 février 2014)

M. Jean-Jacques Hyest, président. - Nous accueillons M. Michel Pinault, président du conseil d'orientation de l'édition publique et de l'information administrative (Coepia) qu'accompagnent MM. Olivier Garnier et Eric Gristi, respectivement secrétaire et secrétaire-adjoint du Coepia. Après une longue carrière au Conseil d'Etat, où vous avez présidé jusqu'à récemment la section de l'administration, interrompue par une douzaine d'années à l'UAP puis chez AXA, vous présidez le Coepia depuis un an. Pourriez-vous nous rappeler les missions du conseil, les enjeux de la publication des documents administratifs et de l'ouverture des données publiques ; nous décrire la situation en la matière, notamment la cartographie des sites de l'administration et de ses bases de données, la qualité des contenus et les politiques de réutilisation, l'état et la standardisation des référentiels ? Pensez-vous qu'il est répondu aux attentes des citoyens et des entreprises et que les objectifs fixés par le Gouvernement, le G8 et la directive de 2013 sont atteints ? Quelles seraient vos recommandations, notamment en matière de priorité, de rationalisation et de mutualisation?

M. Michel Pinault, président du Coepia. - Le Coepia est un organisme original. Il ne fait pas partie de l'administration active et n'est pas un opérateur comme la Dila ou le Service d'information du Gouvernement (SIG). C'est un forum où se rencontrent administrations, grands opérateurs publics et représentants du secteur privé. Il a été créé à la suite de la publication des circulaires Jospin destinées à pacifier les relations entre éditeurs publics et privés. Il comprend plusieurs formations, une formation plénière réunie deux fois par an et, à l'initiative du président, trois formations spécialisées : l'une travaille sur l'information administrative des usagers, la deuxième sur la réutilisation des données publiques, la troisième, que je préside, traite de la politique de publication des administrations. Des groupes de travail sont constitués au sein de chaque formation. Autre originalité du Coepia : il fonctionne sur la base du volontariat. Participent à nos travaux ceux qui y sont intéressés et qui sont à même de contribuer à nos discussions...il nous faut donc être attractifs ! Cette méthode favorise les échanges de bonnes pratiques et de réflexions. Nous essayons d'identifier les faiblesses françaises en matière d'information administrative et formulons des recommandations. Nous n'avons aucun pouvoir décisionnel. Nous auditionnons de nombreux sachants. Nous éditons une lettre mensuelle numérique diffusée à plus de 600 personnes et un rapport annuel remis au Premier ministre.

Nous exerçons notre triple mission d'évaluation, d'expérimentation et de conseil dans les domaines de l'édition publique, papier comme numérique, du renseignement administratif et de la mise à disposition des données publiques. Notre décret fondateur, en date du 11 janvier 2010, était prémonitoire : il évoquait la réutilisation des données publiques - on dirait désormais open data. Nous entretenons de bonnes relations avec la Dila, qui met certains de ses fonctionnaires à notre disposition, comme avec l'Agence du patrimoine de l'Etat (AAPIE) et les grands ministères, notamment l'intérieur, l'éducation nationale, l'environnement et le développement durable ainsi qu'avec les grands opérateurs : l'Institut national de l'information géographique et forestière français (IGN), Météo-France, l'Institut national de la statistique et des études économiques (Insee). Nous tirons beaucoup d'enseignements des méthodologies que l'Insee a mises au point pour garantir un accès aux données sensibles dans de bonnes conditions. De nombreuses questions ont été résolues par les statisticiens. En ma qualité de président du Coepia, je participe en outre aux travaux sur l'utilisation et la réutilisation des données de santé dans le cadre du groupe de travail institué par Mme Marisol Touraine. Dans ce secteur, les données sont disponibles... sinon accessibles.

L'Etat et les administrations locales, les grands services publics, les organismes de sécurité sociale occupent une place importante dans notre modèle républicain et dans la vie de nos concitoyens. Aussi, la facilité d'accès à ces administrations, aux renseignements administratifs est-elle cruciale. Nous avons des progrès à faire. Le sujet, autrefois orphelin, a été pris en main par la direction interministérielle de la modernisation de l'action publique (Dimap), et le comité interministériel pour la modernisation de l'action publique (Cimap). Nous travaillons en symbiose avec eux. Avec un brin d'immodestie, je dirai que le Coepia est le think tank du Cimap. Les attentes sont considérables et certains organismes ont pris de l'avance. Les caisses nationales de sécurité sociale, de l'assurance vieillesse des travailleurs salariés, de l'assurance maladie des travailleurs salariés, des allocations familiales ont développé des dispositifs intéressants de contact avec le public.

Nous avons pris l'initiative de réunir les principaux responsables des plates-formes téléphoniques des organismes privés ou publics afin qu'ils aient des échanges sur les bonnes pratiques. Ils ont été si contents qu'ils ont constitué dans la foulée une sorte de club d'échanges et de réflexion sous l'égide de Bercy.

Selon nous, il est important de « segmenter les publics », pour utiliser un langage marketing, autrement dit de calibrer la diffusion des informations en fonction de la tranche de population visée. L'information administrative est souvent de très bonne qualité mais elle n'est pas toujours adaptée à ses destinataires. Même un conseiller d'Etat peine à comprendre certains formulaires administratifs ! Il faut aussi calibrer les instruments. Les fonctionnaires du service d'accueil téléphonique du 3939 de Metz fournissent un travail remarquable mais ce service est coûteux et ne peut être utilisé comme premier contact vocal. Le téléphone mobile devient le principal mode d'accès à l'information administrative. Nous travaillons sur la mise en place d'applications mobiles. Cet outil oblige à être simple. C'est pourquoi nous recommandons désormais aux organismes que nous conseillons, à rebours de la pratique courante, de concevoir leurs applications mobile avant leur site internet.

Dans le domaine de l'information administrative, il convient de simplifier, de mutualiser et d'assurer la cohérence et l'homogénéité de l'information délivrée tout en mesurant les résultats et en maîtrisant les coûts. Nous sommes favorables à l'introduction d'une comptabilité analytique au sein des opérateurs et des grandes administrations, ce qui permet d'identifier les coûts, à l'image de la nouvelle obligation imposée à l'Etat par le règlement général de comptabilité publique de 2012, de manière à identifier les coûts de diffusion de l'information. Actuellement dans les programmes de la loi organique relative aux lois de finances (Lolf), l'activité de publication n'est pas identifiée en tant que telle dans les différents ministères ; elle est retracée dans les comptes « communication, « frais de personnel », « frais de fonctionnement ».

Le risque principal reste, aujourd'hui comme hier, celui de l'éparpillement, de la dispersion. Les circulaires Jospin, la Médiatrice de l'édition publique, ont marqué une première étape, achevée sauf peut-être du côté des collectivités territoriales, centrée sur le contrôle des publications imprimées. Dans un second temps - l'étape Riester, en quelque sorte - l'effort a été porté, là encore avec succès, sur la limitation de la prolifération des sites ministériels. D'un peu plus d'un millier de sites, on est passé à moins de 500, mais il faut rester vigilant. C'est le SIG qui pilote la troisième étape. L'enjeu actuel est celui des réseaux sociaux. Les ministères les utilisent déjà pour toucher les jeunes, je pense au ministère de la défense qui y a recours pour recruter les militaires du rang. Le Coepia a publié une étude sur les bonnes pratiques pour gérer les réseaux sociaux. Nous proposons des guides d'utilisation aux ministères. Les jeunes n'utilisent plus le courrier et trouvent l'ordinateur lent. Nous demandons que chaque ministère définisse une politique de publication couvrant tous ces aspects.

En matière de cartographie des sites de l'administration, des bases de données et des traitements, nous avons d'abord travaillé sur les sites juridiques. Outre Légifrance, qui est un instrument remarquable, de nombreux ministères diffusent une information juridique sur leurs sites. Il s'agit souvent de la mise sous forme numérique des anciens Bulletins officiels des ministères. Nous les avons recensés ; ils ne peuvent fonctionner qu'avec une autorisation du Secrétariat général du gouvernement. Certains de ces sites sont d'une grande utilité. C'est le cas du bulletin officiel des finances publiques-impôts (Bofif) qui remplace l'ancien système de publication des instructions fiscales de la direction générale des impôts (DGI). La base de données est impressionnante. Après des débuts compliqués, le portail fonctionne très bien. On ne peut en dire autant de la base de données des traités internationaux du ministère des affaires étrangères. Sans vouloir jeter la pierre aux services du ministère, elle a été conçue comme une base d'archives et non comme une base active dotée d'un moteur de recherche, ce qui la rend difficile à utiliser. En l'état, il est délicat de comprendre si un traité mis en ligne a abrogé ou s'est substitué à un traité plus ancien également consultable. Il est important de remédier à ces difficultés compte tenu de la place du droit international dans la hiérarchie des normes.

M. Jean-Jacques Hyest, président. - La Cour de cassation, et dans une moindre mesure le Conseil d'Etat, ne manquent pas de nous la rappeler fréquemment...

M. Michel Pinault. - Il n'y a pas d'homogénéité de présentation des sites de l'Etat. Il existe bien une charte graphique mais elle est utilisée de manière différente par chaque ministère : l'une fait apparaître la Marianne et le drapeau tricolore sur son site, l'autre non. L'utilisateur ne sait pas immédiatement qu'il se trouve sur un site de l'Etat avec la garantie de contenu que cela implique. C'est dommage ! Un effort a été réalisé sur les sites de l'Etat dans les départements et les régions, il doit être mené à présent au niveau central, avec mise à l'image, charte des couleurs... Il y a là un enjeu d'identification et de sécurité, qui a été bien compris au Canada ou au Royaume-Uni. Ces exemples peuvent nous inspirer.

Sous l'impulsion de l'open data, la réutilisation des données constitue un mouvement irrésistible, ainsi qu'Henri Verdier, qui siège au Coepia, l'a souligné lors de notre débat hier sur la transposition de la directive de juin 2013. Il convient toutefois de bien cerner son champ. Ce qui est ouvert dans l'open data, ce sont des données brutes, le plus souvent chiffrées. L'accessibilité à ces données en vue de leur réutilisation ne se confond pas avec le droit d'accès à l'information administrative au sens de la loi de 1978 ou avec la transparence de l'action publique, même si elle y contribue. La gratuité de l'accès aux données doit être gérée de manière moderne et intelligente. Le rapport remis par M. Trojette sur l'ouverture des données publiques comporte des développements très intéressants sur ce point. Le site data.gouv.fr, qui a été rendu beaucoup plus convivial et plus accessible, comporte deux compartiments distincts, le premier contient des données brutes, les fichiers estampillés par l'Etat ; les opérateurs comme IGN ou Météo France déposent, sous leur responsabilité, leurs propres traitements dans le second. Le sujet est en constante évolution. L'idée de réutilisation des données est apparue pour la première fois dans l'ordonnance du 6 juin 2005 relative à la liberté d'accès aux documents administratifs et à la réutilisation des informations publiques, qui s'est greffée sur la loi de 1978. Mais l'approche de ce texte est datée ; la problématique n'est plus aujourd'hui d'organiser l'accès individuel à des documents administratifs existants. La transposition de la directive de 2013 nous donne l'occasion d'adapter notre législation au nouveau contexte technique. Cela relève d'un choix politique car notre droit est globalement conforme à la directive et la transposition pourrait être effectuée a minima. Je suis en règle générale hostile au goldplating, cette technique consistant à saisir le prétexte d'une directive pour révolutionner un domaine, mais en matière d'ouverture des données, la législation doit être adaptée. Aux anciennes problématiques de protection des libertés publiques et des droits individuels, traitées par les lois ayant créé la Cnil et la Cada, s'ajoutent des enjeux économiques importants qui ne sont pas appréhendés par ces textes : autour de l'open data, des industries nouvelles créatrices de richesses vont émerger, ce que la législation doit prendre en compte.

De grands mouvements sont en cours dans la standardisation des référentiels au niveau international : web sémantique, web des données, big data, métadonnées... pour rendre plus efficaces les moteurs de recherches. La structuration de l'univers des données disponibles est en marche. Il ne faut pas la craindre mais y prendre notre part. Nous avons suggéré au Secrétariat général du gouvernement que l'écosystème français du web participe à l'initiative européenne ISA (Interoperability Solutions for european public Administrations).

Le bilan des stratégies d'ouverture des données des administrations est positif. La licence Etalab a été mise en place. Reste en discussion les contenus que les administrations doivent mettre en ligne sur data.gouv.fr. L'open data requiert de donner au public ce dont l'administration dispose pour son propre travail. Parfois ces outils de travail internes sont illisibles par le grand public et inutilisables par les tiers. Un partage efficace suppose leur transformation... qui a un coût. Correspond-t-elle à une obligation de service public ? Il convient à notre sens de l'envisager comme une politique publique, dans un contexte bien sûr de réduction des crédits de fonctionnement.

Le Coepia est à l'origine de la circulaire du 29 mars 2012 relative à l'efficience des activités de publication de l'Etat. Nous avons publié une « Fiche d'aide à la décision de publier à l'usage des administrations », une « Grille d'analyse des activités de publication », un « Guide d'amélioration de la qualité de l'information administrative » et un memento sur « La protection des informations à caractère personnel dans le cadre de l'ouverture et du partage des données publiques ». Ce memento a reçu l'imprimatur de la Cada et de la Cnil.

Mme Corinne Bouchoux, rapporteure.- Votre exposé exhaustif nous conforte dans l'idée que notre mission, que d'aucuns jugent inutile ou relevant de la lubie, porte sur un véritable sujet d'intérêt général. Dans le cadre de vos travaux, êtes-vous en contact avec des universitaires ou des pratiquants hétérodoxes d'internet, voire non conformes, tels que les élus du parti pirate allemand ou d'un parti très controversé en Italie qui comprend des activistes très proches de ces thématiques ? De jeunes interlocuteurs usagers des nouvelles technologies me disent que je suis restée à l'ère du cheval et de la calèche quand ils sont déjà à celle de l'automobile. Comment changer d'ère, partager plus et nous rapprocher d'eux pour prendre les bonnes décisions ? Notre mission consiste à faire un état des lieux pour proposer des solutions. A l'aune de la loi de 1978, qu'on l'envisage comme un idéal à consolider ou comme un texte à retoucher, quelles sont les priorités ?

M. Michel Pinault- Des représentants de l'écosystème du web aux pratiques iconoclastes, tels Regards citoyens et Open Knowledge Foundation (OKF) siègent dans notre formation restreinte n° 2. Leur présence est essentielle pour faire progresser nos discussions hors des sentiers battus. Ce n'est pas toujours facile. Même si leurs exigences peuvent apparaître excessives, ils sont représentatifs des attentes de nos concitoyens. Le niveau de services auquel ils sont habitués est désormais élevé : Amazon leur offre choix, simplicité et livraison rapide. Ils attendent la même chose des administrations. Le paradigme des relations entre les administrations et les administrés change fondamentalement. Elles doivent aller au-delà des attentes, comme certaines entreprises promettent un service beyond expectations... ce qui nous éloigne de la pureté originelle de l'open data. Pour sa part, le Coepia partage avec l'usager et communique grâce à sa lettre mensuelle et a mis sa documentation en ligne sur le site data.gouv.fr.

M. Olivier Garnier, secrétaire du Coepia.- Notre site n'est pas interactif. Mais faire appel à un prestataire extérieur pour concevoir un site ultramoderne aurait été en contradiction avec nos recommandations aux administrations.

M. Michel Pinault.- Notre système d'administration consultative doit être ouvert au public. Je suis partisan de consultations informelles ouvertes, préconisées par le Conseil d'Etat dans son rapport « Consulter, administrer autrement », à l'image de ce qui existe dans le secteur de l'urbanisme depuis le vote de la charte de l'environnement, des forums britanniques d'échanges sur des projets ou les méthodes adoptées par la Commission européenne avec ses livres blanc et vert. La loi de 1978 était une loi d'avant-garde. Elle a posé des principes qui demeurent valables pour notre temps mais certains des mécanismes de protection de ces principes me paraissent dépassés. Les notions de « fichiers » ou de « traitements » utilisées par la Cnil doivent être revues pour tenir compte de la fantastique collecte d'informations et données en cours. Les sanctions que peut infliger la Cnil sont limitées à 150 000 euros, et donc insuffisamment dissuasives. La Cnil et la Cada ne sont pas d'accord sur la responsabilité de l'anonymisation des données personnelles. Il faut aussi reprendre les textes sur la propriété intellectuelle : certaines données publiques sont potentiellement grevées de droits d'auteur des agents publics ce qui peut gêner leur utilisation par les entreprises, même si pour l'heure la loi n'a pas de décret d'application. Sans bousculer les grands principes qui demeurent valides, l'administration doit faire son aggiornamento. Le président Tricot disait « l'informatique n'oublie rien » ; sa puissance est un enjeu économique. Les lois de 1978 n'abordaient pas vraiment ces problématiques.

M. Yves Détraigne. - Nous avons été précurseurs en 1978, sommes-nous aujourd'hui dépassés ? Comment assurer la protection de la vie privée consubstantielle à la démocratie ? Vous êtes-vous rapprochés de démocraties étrangères comparables ? Diriez-vous qu'au regard des enjeux économiques de l'open data, la France est en retard ?

M. Michel Pinault.- Il est temps d'agir. Nous ne sommes pas en retard, la directive européenne sur la réutilisation des données publiques est d'ailleurs assez largement inspirée de la législation française. Mais il est important de prendre le train en marche et d'avancer. La percée irrésistible de l'open data doit nous servir d'aiguillon.

Notre lettre mensuelle comporte un volet international et nous publions des entretiens avec des responsables étrangers dans nos rapports annuels. Si les problématiques sont identiques, les anglo-saxons les abordent de manière plus pragmatique et moins juridique que nous. Les évolutions techniques sont si rapides qu'il est délicat de concevoir un cadre juridique pour les vingt prochaines années. Secouée, la loi de 1978 a bien tenu le cap des principes.

M. Jean-Jacques Hyest, président. Je vous remercie.

Audition de Mme Danielle BOURLANGE, directrice générale de l'Agence du patrimoine immatériel de l'Etat (Apie) (jeudi 20 février 2014)

M. Jean-Jacques Hyest, président. Nous allons maintenant entendre Mme Danielle Bourlange, directrice générale de l'Agence du patrimoine immatériel de l'Etat. inspectrice générale de l'Insee, vous êtes directrice générale de l'Apie depuis septembre 2012. Pourriez-vous nous rappeler le rôle de l'Apie, l'objet de ses interventions auprès des administrations publiques, son articulation avec le Coepia et la mission Etalab ? Pouvez-vous nous décrire les enjeux de l'exploitation des données publiques dans un contexte d'extension du principe de gratuité et nous présenter vos recommandations s'agissant des licences types de réutilisation des données, de leur articulation avec certains droits protégés ou de la mise en oeuvre de partenariats avec des opérateurs privés ? Nous vous remercions enfin de nous indiquer la position de l'agence vis-à-vis de la transposition de la directive de 2013.

Mme Danielle Bourlange, directrice générale de l'Agence du patrimoine immatériel de l'Etat. - L'Apie est une jeune institution créée en 2007 à la suite de la publication du rapport Jouyet sur l'économie de l'immatériel. Elle est née du constat que, dans les économies modernes, la performance dépend des talents, des idées, des savoir-faire, de la qualité des systèmes d'information, des marques, et que cela est vrai pour les administrations aussi bien que pour les entreprises. Les actifs immatériels constituent un levier d'efficience des administrations et un vecteur de création de valeur. Le rôle dévolu à l'agence a été de développer la prise de conscience des enjeux liés à la valorisation du patrimoine immatériel, c'est-à-dire d'initier un changement culturel. Il lui incombe aussi de promouvoir de nouveaux modes de gestion.

L'Apie entend protéger les actifs immatériels publics. Elle cherche à éviter les appropriations abusives ou les détournements - par exemple l'usurpation de l'identité des collectivités locales - qui pourraient parasiter l'action publique sur le net. Elle veille à l'intégrité et à la disponibilité des actifs immatériels.

Elle s'intéresse également à la valorisation de ces actifs. Cela ne signifie pas nécessairement les vendre ou en tirer des ressources financières mais reconnaître leur potentiel de valeur et en tirer le meilleur parti pour contribuer à la performance de l'action publique et à la satisfaction des usagers. Les actifs immatériels doivent être partagés entre les administrations et mis à la disposition des citoyens. L'agence a une conception ouverte du patrimoine immatériel de l'Etat.

Parmi ces actifs immatériels, les données publiques sont des éléments de premier ordre. Toutes les administrations produisent des données publiques qui sont souvent des données de référence. Au moment de la création de l'Apie, la loi de 1978 avait été modifiée par l'ordonnance de 2005 sur l'ouverture des données publiques mais cette innovation majeure n'était pas connue en dehors d'un petit cercle d'initiés. Il a fallu d'abord sensibiliser les administrations et les utilisateurs à l'existence de ce droit et à ses enjeux : la transparence démocratique, l'enjeu économique, la modernisation de l'administration.

La loi ne suffit pas pour développer un écosystème dynamique autour de la réutilisation des données. Des mesures d'accompagnement sont nécessaires pour la clarifier et apporter une sécurité juridique, pour ouvrir un dialogue avec les utilisateurs et les associations qui s'y intéressaient. En octobre 2008, l'Apie a proposé au ministère en charge de l'économie numérique d'inscrire dans le plan numérique 2012 la conduite de travaux interministériels pour concevoir un portail unique d'accès aux données, ainsi que la conception de licences types contribuant à la sécurisation juridique en matière de réutilisation des données. A l'époque, l'écosystème numérique n'était pas ce qu'il est actuellement. Hormis celle opérée par les éditeurs juridiques, nous manquions alors d'exemples de réutilisation des données en France et à l'étranger. Le cahier des charges du portail unique a été livré au cabinet du Premier ministre en avril 2010. La mission Etalab l'a mis ensuite en oeuvre, à partir de décembre 2011, sur le site data.gouv.fr. Début 2009, des premiers modèles de licence ont été publiés.

L'Apie joue un rôle actif au sein du Coepia auquel elle apporte son expertise. J'ai moi-même été corapporteure de la formation spécialisée sur la mise à disposition des données publiques, de la création du Coepia en 2010 jusqu'à juillet 2013. Dans ce cadre, nous avons formulé un certain nombre de recommandations visant à accélérer le processus d'ouverture des données publiques. L'une de ces recommandations, qui reste d'actualité, a porté sur la nécessité de mettre à disposition les données sous des formats ouverts. Dans une autre recommandation, nous indiquions que le secteur culturel, au-delà de ses spécificités, devait contribuer à une politique active d'ouverture des données publiques. Le Coepia a tenté de donner aux administrations des clefs pour comprendre un dispositif juridique parfois complexe. Pour éclairer l'articulation de la loi Cada et son article 13 avec d'autres lois comme la loi Cnil, nous avons récemment diffusé un memento auprès des administrations.

Nous avons également pris conscience très rapidement que l'ouverture des données devait relever d'une logique de la demande et d'une stratégie de l'offre. Dans ce cadre, une réflexion doit être menée sur les données à fort potentiel de création de valeur économique et sociale - données de santé, de transports, d'environnement. En 2012, une recommandation a été prise sur les référentiels adresses dont les administrations disposaient sous des formes variées : une mise en cohérence de ces différents référentiels s'imposait pour une réutilisation plus efficace de ces données. Cette recommandation a été reprise par le Cimap en décembre 2012. Enfin, une autre de nos recommandations a porté sur les données de santé. Elle a été versée au débat ouvert actuellement sur la réutilisation de ces données.

Nos actions de sensibilisation devaient pouvoir toucher les collectivités locales et les services déconcentrés de l'Etat. Avec la Cada, nous avons organisé des formations en région, en matière de réutilisation des données publiques, au profit de l'ensemble des cadres. Elles ont concerné entre 2010 et 2012, la Bourgogne, l'Ile-de-France, l'Aquitaine, la région Paca et le Nord-Pas-de-Calais. C'est une démarche à poursuivre.

L'Apie a apporté son concours à la mission Etalab lors de sa création, par un transfert d'expertise. Elle a contribué à la rédaction de la licence ouverte qui en est une référence. Elle a également participé activement aux travaux interministériels, sous l'égide du Secrétariat général aux affaires européennes (SGAE), en vue de l'établissement de la nouvelle directive communautaire. Aujourd'hui, l'Apie est en retrait sur ce sujet, laissant Etalab gérer le développement de l'open data. Nous continuons à participer aux travaux du Coepia et nous contribuons en tant que de besoin à ceux d'Etalab. Nous avons également noué des échanges avec les collectivités territoriales, Rennes par exemple qui a été pionnière en matière d'ouverture des données, ou le grand Lyon qui a récemment ouvert des données de transport. Le sujet est fortement évolutif. Nous ne sommes qu'au début du développement de l'écosystème de réutilisation des données. Des défis importants restent à relever.

L'un de ces défis est la mise à disposition des données dans des formats ouverts. Elle représente un coût non négligeable, notamment dans le cas de données anciennes qui nécessitent un travail de transposition. Un autre défi est l'anonymisation des données à caractère personnel. Il faudra également prendre en compte l'ouverture des données à fort potentiel, le financement de la numérisation des données culturelles, la viabilité économique des innovations à l'autre bout de la chaîne de valeur, et enfin la nécessité de faire évoluer les habitudes et d'inscrire dans le temps une nouvelle culture de la donnée dans la culture administrative.

Sur le plan juridique, certaines règles restent à clarifier. Il est important, pour les bases de données créées dans le cadre de marchés publics, qu'il n'y ait pas de frein à l'ouverture. Les données ne sont pas grevées de droits de propriété intellectuelle, mais la structure de la base de données peut l'être. Lorsqu'un prestataire développe une base de données spécifique, adaptée aux besoins de l'administration, il faut veiller à ce qu'il cède les droits de propriété intellectuelle sur cette base pour rendre possible la réutilisation des données par l'administration. Nous avons diffusé une clause type à intégrer dans les marchés publics pour faire en sorte que ces droits soient systématiquement cédés à l'administration.

Deux licences coexistent majoritairement, la licence ouverte d'Etalab et la licence Open Database license (ODbL). Elles sont toutes les deux aisément compréhensibles et interopérables, ce qui permet de croiser les données quand bien même elles proviennent d'administrations différentes, du public ou du privé, des collectivités locales ou de l'Etat. Dans la licence ODbL, la clause dite de share alike, c'est-à-dire du partage à l'identique, pose problème. Elle impose au réutilisateur de mettre à disposition les données qu'il a réutilisées, dans les mêmes conditions que celles dont il a bénéficié, c'est-à-dire une réutilisation libre et gratuite, en pratique. Le principe est séduisant dans une logique de chaîne de valeur collaborative et d'innovation cumulative. Mais le partage à l'identique peut brider l'innovation, car il n'est pas compatible avec tous les modèles économiques. Il faudrait à tous le moins prévoir des modalités d'utilisations commerciales dans ces licences.

La terminologie devrait s'adapter à l'heure du numérique. La nouvelle directive l'a fait puisqu'elle parle de format lisible par des machines, ce qui n'était pas le cas en 2003 ou dans la transposition de 2005.

Nous avons participé activement, sous l'égide du SGAE aux travaux interministériels d'où est issue la nouvelle directive. Une de ses innovations majeures est d'inscrire dans la loi un droit à la réutilisation des données, anticipée par la France dès 2005 alors que ce n'était qu'une possibilité dans le texte de 2003. Elle prévoit aussi l'extension du droit commun aux données culturelles, pour les musées, les bibliothèques et les archives. Elle met en place une instance de recours dont les décisions sont contraignantes, ce qui est nouveau. Enfin, elle généralise le principe de tarification au coût marginal. La question du financement de la numérisation des données culturelles reste posée. La nouvelle directive ouvre à cet égard certaines marges de manoeuvre, en prévoyant des mesures dérogatoires en matière de tarification et en tolérant des accords d'exclusivité limités dans le temps. Dans un contexte de redressement des finances publiques, il est important de disposer de ces marges de manoeuvre. Une réflexion doit cependant être menée sur la possibilité de modalités de financement alternatives à la tarification : crowdfunding, mécénat, services à valeur ajoutée dans une logique freemium... Les oeuvres qui sont dans le domaine public ne doivent en aucun cas être distraites dudit domaine public.

La nouvelle directive prévoit une généralisation de la tarification au coût marginal, ce qui, dans beaucoup de cas, revient à la gratuité. Des exceptions restent possibles, notamment quand des opérateurs doivent financer la diffusion des données par des redevances. La logique d'un tel dispositif repose sur la distinction entre les données brutes qui dépendent directement d'une mission de service publique - les informations juridiques, par exemple - et les données produites par des opérateurs publics dont c'est la mission, et qui doivent inscrire leur modèle économique dans l'économie numérique, mais aussi dans la trajectoire de redressement des finances publiques. Ce principe de gratuité n'exclut pas la mise en place de services à valeur ajoutée : certains utilisateurs auront par exemple besoin d'extractions ou de mises en forme à la demande, lorsqu'ils seront confrontés à des bases brutes désagrégées, dans le respect de la concurrence.

Mme Corinne Bouchoux, rapporteure. - Quels sont les moyens humains dont dispose l'Apie ? Avez-vous anticipé les effets d'une situation moins paisible et d'un contexte moins démocratique sur ces pratiques d'extrême valorisation du patrimoine immatériel, les risques potentiels ?

Mme Danielle Bourlange. - Nous sommes au total 27. Mon prédécesseur nous qualifiait de start-up administrative. Nous fonctionnons en mode projet et nous rassemblons des compétences peu représentées dans l'administration, notamment en droit de la propriété intellectuelle, très utiles dans le cadre des marchés publics, ou en marketing stratégique.

Nous nous intéressons aux risques qui menacent l'action et la souveraineté de l'Etat. Nous faisons, par exemple, de la veille sur les marques déposées qui peuvent nuire à la lisibilité des politiques publiques. Nous sommes très attentifs aux questions d'éthique, notamment dans le mécénat. Nous nous sommes intéressés très tôt à la protection des données personnelles. Dans notre premier projet de licence, nous avions rappelé dans une clause la responsabilité des utilisateurs par rapport aux données anonymisées qui pouvaient être réidentifiables par croisements. Nous avons également considéré les données les plus sensibles, pour lesquelles des conditions particulières d'ouverture devraient être prévues. Des réflexions sont en cours, notamment sur les données de santé. Le décret de 2002 prévoit que les données juridiques sont réutilisables, mais en prévoyant le respect de leur intégrité. On voit bien le risque qu'il y aurait à publier une norme juridique faussée.

Dans les régions, à Bordeaux, à Rennes, on nous a posé plusieurs fois la question de la mise en place d'un contrôle a priori. Je ne crois pas qu'il soit bon de mettre des barrières à l'innovation. La loi du 17 juillet 1978 a prévu que les données secrètes ne soient pas ouvertes. D'autres lois protectrices existent, mais toutes les données à caractère personnel ne sont pas de même nature. Dans le cadre des travaux que nous avons menés au Coepia, nous avons examiné le cas de données personnelles publiques, diffusées sur internet et donc aspirables par des machines, mais non réutilisables, soit pour des raisons techniques, soit parce que la possibilité de leur réutilisation n'a pas été prévue. Il s'agit, par exemple, de l'annuaire des médecins, accessible sur ameli-sante.fr mais dont les données ne sont pas réutilisables pour des données juridiques alors que cela pourrait présenter un vrai intérêt social, des annuaires professionnels ou des résultats de concours. Une réflexion reste à mener sur ce type de données de caractère personnel, mais qui ne représente pas de risque pour la vie privée et ont un grand intérêt social.

M. Jean-Jacques Hyest, président. - Nous vous remercions pour cet exposé précis.

Audition de M. Marc LIPINSKI, directeur de recherche au CNRS (jeudi 27 février 2014)

M. Jean-Jacques Hyest, président. - Nous poursuivons le deuxième volet de nos auditions, en entendant les producteurs de données publiques de première importance, le CNRS, l'Insee et l'IGN. M. Marc Lipinski, directeur de recherche au CNRS depuis 1986, est actuellement directeur du laboratoire international associé franco-russe de recherche en oncologie et directeur adjoint de l'Ecole doctorale de cancérologie. Il est également responsable de la mission « Science et citoyens » et conseiller régional écologiste d'Ile-de France.

Pourriez-vous nous rappeler les missions du CNRS (Centre national de la recherche scientifique), son statut, son organisation et ses financements, puis nous exposer votre analyse des enjeux de la démarche d'ouverture des données publiques scientifiques ? Quels sont les modes de coopération existants ou envisageables en la matière, entre les chercheurs, l'industrie, le grand public et le CNRS ? Quelles sont d'une part la pratique du CNRS en matière de diffusion des données scientifiques, d'autre part les conditions juridiques, techniques et financières de réutilisation de ces données ?

M. Marc Lipinski, directeur de recherche au CNRS. - Je précise que je ne suis pas mandaté par le CNRS et parle donc à titre individuel. Je dois rendre cet après-midi mon rapport sur la mission « Science et citoyens ». J'ai été vice-président du conseil régional d'Ile-de-France, en charge de l'enseignement supérieur et de la recherche, entre 2004 et 2010, ce qui m'a conduit en particulier à m'intéresser aux relations entre la science et les citoyens. C'est pourquoi le président du CNRS - qui a été reconduit hier en conseil des ministres - m'a confié cette mission.

Le CNRS est un établissement public à caractère scientifique et technologique, placé sous la tutelle du ministère de l'enseignement supérieur et de la recherche. Il est lié à l'Etat par un contrat d'objectifs pluriannuel ; le contrat actuel touche à son terme et doit être renouvelé. Il dispose d'un budget dont le montant était de 3,4 milliards d'euros en 2013, 800 millions d'euros de ressources propres, le reste financé par le budget de l'Etat. Notre établissement compte 25 à 26 000 permanents et 8 000 salariés en CDD. Il est régi par le code de la recherche qui définit les missions des organismes de recherche : accroître les connaissances scientifiques, partager et diffuser la culture scientifique, technique et industrielle, valoriser les résultats de la recherche au service de la société et promouvoir la langue française comme langue scientifique. Le CNRS est gouverné par un président, un conseil d'administration et un conseil scientifique ; il est organisé en dix instituts thématiques qui regroupent une quarantaine de sections disciplinaires et interdisciplinaires. Nous avons engagé une coopération internationale, dont un exemple est le laboratoire international de recherche en oncologie que je dirige, où nous travaillons avec des collègues russes. Une coopération existe aussi, en France, avec les universités et d'autres organismes de recherche, sous forme d'unités mixtes de recherche.

La question que vous posez est stratégique. Le traitement des big data ou données massives, qui sont une mine de connaissances potentielles donc de pouvoir, est un défi pour les institutions internationales qui en ont fait une de leurs nouvelles priorités de recherche et développement. La mission Etalab, sous l'autorité du Premier ministre, pilote depuis deux ans une politique ambitieuse d'ouverture généralisée des données publiques, avec des objectifs de réutilisation et de valorisation économique et sociétale. Dans la masse des données scientifiques, comment définir celles qui sont publiques et celles qui ne le sont pas ? Actuellement, au plan international, le critère qui semble naturel est celui du financement de l'acquisition des données : lorsque de l'argent public est intervenu, les données doivent être considérées comme publiques et doivent être traitées comme telles.

Depuis quelques années s'est développée la notion d'open science ou science ouverte, dont l'un des objectifs est le libre accès aux publications scientifiques. Les débats sont très vifs entre la communauté scientifique et les éditeurs, principal canal de diffusion des connaissances scientifiques. Il faut payer pour publier et payer pour lire les publications - y compris les siennes ! La tendance est donc à un libre accès aux publications scientifiques, mais nous sommes encore dans une phase de transition.

La science a beaucoup changé depuis vingt ans. Dans les sciences exactes, et notamment en biologie - je dirige un laboratoire de biologie - les évolutions technologiques produisent des milliards de données nouvelles, beaucoup plus que ce que les chercheurs peuvent analyser. Il y a pénurie de cerveaux face à cette masse de données. Le défi est de les rendre disponibles, réutilisables et interopérables, c'est-à-dire susceptibles d'être croisées et analysées non seulement par des scientifiques, mais aussi par des non-professionnels de la science - dans un mode de collaboration nouveau, celui des sciences citoyennes (citizen science). Il y a quelques jours, le principal éditeur scientifique, Elsevier, a proposé de fournir, en même temps que les articles publiés, les données massives sur lesquelles ils se fondent, afin qu'elles soient accessibles aux chercheurs et puissent servir de base à un travail d'extraction des données (data mining). Faudra-t-il signer un accord particulier pour avoir accès aux données brutes qui sont à la base des publications scientifiques ? La question reste posée, et le débat, je n'en doute pas, sera vif.

La science est une activité internationale à la fois hautement compétitive et collaborative ; elle fonctionne en « coopétition ». Le journal Le Monde s'est intéressé, il y a quelques jours, au burnout des scientifiques, qui doivent faire face à une compétition serrée en termes de publications et de résultats, tout en étant engagés dans une course aux crédits. Sur une période de cinq ans, les crédits du laboratoire que je dirige - une structure commune de recherche entre public et privé - sont venus à 80 % des contrats de partenariat avec les entreprises et non de subventions de l'Etat.

La politique d'ouverture des données scientifiques place le chercheur face à un dilemme : exploiter lui-même les données qu'il a produites, sans avoir les moyens d'en tirer toute la substance, ou les rendre accessibles pour que d'autres les exploitent et fassent avancer la connaissance scientifique. A mon sens, dès lors que les chercheurs sont payés sur des fonds publics, leur devoir est de faire avancer la connaissance au profit de l'intérêt général. S'ils le font intelligemment, ils peuvent même en tirer profit personnel !

L'objectif des industriels - créer de la valeur ajoutée pour faire du profit - est a priori contradictoire avec une démarche d'ouverture des données. Certains secteurs d'activité offrent néanmoins des exemples positifs, comme le monde numérique, tellement agile que ses acteurs ne perdent pas de temps à faire des brevets. Dans d'autres domaines, comme celui du lobby pharmaceutique ou big pharma, le débat est ouvert, les résultats des essais cliniques n'étant pas toujours publiés, souvent occultés ou affadis lorsqu'ils ne sont pas totalement positifs.

Le CNRS est un des organismes qui dépose le plus de brevets au monde, pour disposer de ressources propres et protéger ses intérêts. Pendant dix ans, le Taxotere, un médicament anti-cancéreux mis au point dans un de nos laboratoires de Gif-sur-Yvette, a été une manne qui a rapporté plus de 50 millions d'euros, avant que le brevet ne tombe dans le domaine public. Sur les données proprement dites, à ma connaissance, le CNRS n'a pas défini de politique précise sur le partage des données. Il encourage les chercheurs à déposer leurs publications dans des archives ouvertes, mais ils ont dans les faits une liberté de choix. En revanche, s'ils ont un contrat européen, ils doivent publier en accès libre. Le 6 décembre dernier, nous avons organisé un colloque avec ma collègue Mélanie Dulong de Rosnay, sur l'ouverture des données massives scientifiques. Le but était de passer en revue les approches et les problématiques des différentes disciplines : ils ont les mêmes approches, avec des particularités.

Grâce aux innovations technologiques, le grand public apporte sa contribution à l'avancée des connaissances scientifiques. Chacun peut utiliser son téléphone portable pour capter des sons, des images, des irradiations radioactives, et donc générer des données transmises ensuite à un organisme scientifique qui les centralise Cette tradition de contributions des amateurs forte de tous temps dans le monde naturaliste, en archéologie ou en astronomie, renaît aujourd'hui grâce aux nouveaux outils informatiques.

Pour observer l'évolution des espèces et lutter contre leur disparition, l'OCDE a ainsi mis en place en 2001 la plateforme GBIF (Global biodiversity information facility) dont le siège est à Copenhague, et qui a pour objectif de collecter dans le monde entier des jeux de données, informant sur l'état de la biodiversité. L'organisation compte plus de 100 membres, issus d'au moins 50 pays, organismes de recherche, grandes ou petites associations, consortiums, etc. En France, l'antenne du GBIF a fourni plus de 100 jeux de données, produits par des organismes de recherche - le Museum d'histoire naturel, l'Inra (Institut national de la recherche agronomique), l'Ifremer, des universités ou des associations bénévoles non-professionnelles. L'une d'elles est Tela Botanica, fondée par un ingénieur à la retraite et qui regroupe des botanistes amateurs francophones. Avec plus de 20 000 membres fournisseurs de données, elle est le deuxième plus gros contributeur français au GBIF, après le Museum d'histoire naturelle. Son siège est au Museum de Montpellier et elle est associée au CNRS qui la considère comme un acteur essentiel de la recherche en biodiversité. En tout le GBIF a reçu plus de 4 millions de données et de métadonnées, c'est-à-dire les informations contextuelles (qui a fait l'observation, où, quand, dans quelles circonstances) qui rendent les données compréhensibles, interprétables. Ce sont des outils précieux d'aide à la décision politique.

Le projet astronomique Galaxy Zoo est un autre exemple de collaboration entre les scientifiques et le grand public dans le traitement des données. En 2006-2007, un jeune doctorant en astronomie de l'université d'Oxford a eu l'idée brillante de mettre à contribution le grand public, en lui donnant accès sur internet aux images innombrables collectées par un télescope installé au Nouveau Mexique. Elles étaient assorties d'un questionnaire très bien conçu. Chaque contributeur pouvait ainsi observer et analyser des images qui n'avaient été vues ni traitées par personne ! Notre doctorant a engrangé des dizaines de milliers de contributions volontaires, et autant d'articles ont été publiés par des scientifiques à partir de ces contributions non-professionnelles, précieuses car les algorithmes d'analyse d'images ne sont jamais aussi performants que l'oeil humain.

M. Jean-Jacques Hyest, président. - Mais on arrivera bien un jour à les rendre aussi performants, sinon plus ?

M. Marc Lipinski. - Peut-être. A ce propos, l'amélioration des algorithmes se fait en analysant le comportement des non-professionnels qui les utilisent. La similitude avec les jeux vidéo est frappante, ils sollicitent les mêmes compétences. La France est très compétitive dans le domaine des jeux vidéo, malgré la concurrence de la Silicon Valley. Dans le rapport que je vais présenter cet après-midi, je propose de mettre à contribution ces compétences numériques, par exemple dans les pôles de compétitivité, comme Cap Digital en Île-de-France. La data visualisation - le fait de rendre les données compréhensibles - est un autre domaine où la France excelle, grâce au travail de l'Inria. Par exemple, il y a des dizaines de façons de rendre compréhensible la manière dont la représentation nationale répartit les ressources de l'Etat. Or une meilleure compréhension est la clef d'une meilleure analyse.

La biologie moléculaire est un domaine très spécialisé. Il y a une vingtaine d'années, on a séquencé le génome humain : la première séquence a coûté des millions de dollars et a pris des années, le séquençage étant la compilation de données recueillies sur des milliers d'individus. Aujourd'hui, il faut un jour pour établir une séquence. On accumule des milliards de séquences. La science phylogénétique consiste à comparer les séquences entre espèces, afin de comprendre leurs évolutions et de définir ce qui est propre à l'espèce humaine. Les chercheurs travaillent à partir de logiciels d'alignements de séquences. L'expérience a montré que l'intelligence humaine était indispensable pour améliorer les alignements. Des chercheurs canadiens ont donc créé des jeux vidéo qui sont aussi des logiciels d'analyse des données et ils recrutent des joueurs qui oeuvrent pour la science en s'amusant.

M. Jean-Jacques Hyest, président. - Le CNRS dépose des brevets, perçoit des redevances et octroie des licences ; il est aussi éditeur, n'est-ce pas ?

M. Marc Lipinski. - Il y a deux types de publications scientifiques, le livre et les revues. L'essentiel de la connaissance scientifique est publié dans les revues et en anglais. Le CNRS n'édite pas de revue.

Mme Corinne Bouchoux, rapporteure. - Merci pour cet éclairage stimulant. Comment mieux prendre en compte ces interactions avec la société dans l'évaluation individuelle et collective des chercheurs ? Dans le domaine de l'oncologie, toutes ces démarches participatives ne pourraient-elles pas favoriser une politique de prévention en matière de santé publique, si elles étaient déployées plus largement ?

M. Marc Lipinski. - Les chercheurs sont beaucoup évalués. En six mois, j'ai dû produire trois rapports d'activité. Nous devons décrire tout ce que nous faisons. La question est de savoir comment cet effort vis-à-vis de la société est pris en compte dans l'évolution des carrières. J'ai fait des propositions pour que les interactions avec la société soient systématiquement indiquées dans ces rapports. Mais les évaluations étant faites par nos pairs, c'est toute une culture qu'il faut faire évoluer : pour l'instant, la qualité d'un chercheur se mesure essentiellement au nombre de ses publications scientifiques. C'est aussi le rôle des organismes scientifiques que d'avoir une politique persistante pour inciter les chercheurs à travailler avec la société civile.

En oncologie comme ailleurs, la prévention consiste d'abord à donner au grand public un meilleur niveau de connaissance et de compréhension des enjeux scientifiques. La diffusion de la culture scientifique est une mission essentielle. Elle ne doit pas être théorique, mais pratique : un enfant n'apprend pas à faire du vélo en prenant des cours sur le vélo, mais en pédalant. Des initiatives comme « la Main à la pâte », que j'ai lancée en Ile-de-France auprès des écoliers, des jeunes et des adultes, sont je crois très utiles.

Mme Corinne Bouchoux, rapporteure. - On manque en France de vocations scientifiques. Que deviennent les bacheliers S une fois devenus adultes ? Ne faudrait-il pas développer des passerelles ou des formations modulaires à destination de ceux qui souhaiteraient reprendre des études scientifiques sur le tard ?

M. Marc Lipinski. - L'idée de pouvoir reprendre des études à tout moment de la vie me paraît bonne. En revanche, je ne crois pas que les jeunes se désintéressent de la science. Les revues de vulgarisation scientifique sont très lues, les fêtes ou les cafés de la science sont très fréquentés. Il y a surtout, en France, un problème de débouchés. Un lycéen choisit de passer un bac S pour avoir ensuite le choix de ses études, non parce qu'il envisage une carrière scientifique. Les débouchés scientifiques sont plus restreints en France qu'ailleurs. Le doctorat n'est toujours pas reconnu dans la fonction publique. Les entreprises préfèrent recruter des ingénieurs que des docteurs. Dans les organismes de recherche, le nombre des postes diminue. On entre de plus en plus tard dans la carrière : actuellement, on ne peut espérer devenir chargé de recherche deuxième classe au CNRS avant 35 ans, et pour un salaire inférieur à 2 000 euros. Pourquoi faire ce choix, lorsqu'on est bon élève, que l'on a accès aux grandes écoles et que l'on peut toucher à 23 ans un salaire annuel de 36 000 euros ? Un quart des jeunes Français préfèrent partir à l'étranger. Le sort qu'on leur fait en France n'est pas très enviable ; il l'est encore moins pour les jeunes scientifiques.

M. René Garrec. - Un chimiste brillant, Bernard Raveau, avait découvert la lévitation du métal au niveau de l'azote liquide. Il a publié trop vite, ce sont les Suisses qui ont eu le prix Nobel, même s'il a eu la médaille d'argent du CNRS. Comment protéger les intérêts des chercheurs et comment protéger leurs publications lorsque des intérêts industriels sont en jeu ?

M. Marc Lipinski. - Chacun doit faire son métier. Les chercheurs cherchent, publient, produisent des brevets. Les entreprises développent et valorisent ces brevets. Les chercheurs ne sont pas des chefs d'entreprise. Ce qui pose problème en France, ce sont les entreprises plus que la recherche.

M. René Garrec. - Bernard Raveau a été nommé, jeune, à l'Académie des sciences, et il a fait une belle carrière.

M. Marc Lipinski. - Beaucoup de découvertes faites dans des laboratoires français, subventionnés par l'Etat, sont valorisées ailleurs.

M. René Garrec. - Les couches minces, par exemple, qui sont la suite des travaux de Raveau. On a quand même gardé les brevets.

M. Marc Lipinski. - La réflexion devrait se situer au niveau européen plus que franco-français. Dans la mesure où les entreprises recrutent plus d'ingénieurs que de chercheurs, elles ne sont plus capables de produire des innovations de rupture et se contentent d'améliorer des processus ou des objets déjà existants. La clef du problème serait d'inciter les entreprises à recruter des docteurs, formés par quelques années de recherches concrètes.

M. René Garrec. - Le processus est très lent. J'avais négocié des accords entre les grandes écoles d'ingénieurs et Normale Sup. Notre « Atomic Anne » (Lauvergeon) vient de Normale Sup physique, elle est ensuite passée par les Mines. Elle est devenue le patron de la Cogema. J'avais également lancé une réflexion sur une ouverture européenne du CNRS. Elle n'a pas avancé d'un millimètre. Le CNRS n'a-t-il pas d'équivalents chez nos voisins ?

M. Marc Lipinski. - Si, bien sûr, des équivalents existent, en Allemagne notamment. Le problème d'harmonisation européenne des brevets est compliqué.

Dans le cadre du programme des investissements d'avenir piloté par Louis Gallois, le projet « 65 millions d'observateurs », sous l'égide du Museum d'histoire naturelle, vise à créer des plateformes et des outils numériques facilitant la collecte des données scientifiques grâce à la collaboration de toutes les bonnes volontés. Je fais partie du comité de pilotage de ce projet que dirige Romain Julliard, professeur au Museum d'histoire naturelle. Bien accueilli par les instances qui l'évaluent, le dossier traîne pourtant depuis plus d'un an. Nous en sommes à la troisième mouture. Cela montre la timidité des initiatives, dès qu'il s'agit d'investir dans des projets un peu innovants, décalés. Dans la Silicon Valley, on n'a pas peur d'investir, ni d'échouer neuf fois pour réussir la dixième !

M. Jean-Jacques Hyest, président. - Je vous remercie.

Audition de MM. Alain BAYET, secrétaire général de l'Institut national de la statistique et des études économiques (Insee) et Michel ISNARD, responsable de l'unité affaires juridiques et contentieuses (jeudi 27 février 2014)

Mme Corinne Bouchoux, rapporteure. - Nous accueillons les représentants de l'Institut national de la statistique et des études économiques (Insee), M. Alain Bayet, secrétaire général, M. Michel Isnard, responsable de l'unité des affaires juridiques et contentieuses, et Mme Françoise Maurel, directrice de la diffusion et de l'action régionale. Nous amorçons, vous l'avez compris, la seconde partie de nos auditions sur l'offre de données publiques.

Quelles sont les missions de l'Insee, son statut, ses ressources et les garanties de son indépendance ? Selon quelles modalités vos travaux statistiques alimentent-ils le débat public ? Quel est le processus de validation ? Quels fichiers administratifs exploitez-vous ?

Quelle est votre politique de diffusion des bases de données et des travaux ? Quel est le cadre juridique, le cadre technique, les services annexes ?

Comment l'Insee appréhende-t-il la dimension d'intelligence économique attachée à ses données ? L'Insee est-il saisi de demandes d'accès à ses documents ou données ? Enfin, quelle est votre position à propos de la transposition de la directive européenne de juin 2013 ?

M. Alain Bayet, secrétaire général de l'Insee. - Je vous remercie de permettre à l'Insee d'intervenir sur ces sujets. L'Insee, depuis sa création, a vocation à mettre à la disposition du public les résultats de ses statistiques et de ses analyses. L'Insee est une direction du ministère de l'Economie et des finances. Il a été créé par une loi du 27 avril 1946 et un décret du 17 juin 1946 fixe ses missions : établir les statistiques relatives à l'Etat et au mouvement des personnes et des biens ; coordonner les méthodes, les moyens et les travaux statistiques des administrations publiques, centraliser leur documentation statistique et économique et réaliser l'unification des nomenclatures et des codes statistiques ; tenir à jour l'inventaire permanent de l'économie ; observer l'évolution de la situation économique ; entreprendre, à la demande du gouvernement et des administrations publiques, et, éventuellement, de personnes physiques ou morales de droit privé, des recherches et études sur les questions statistiques et économiques ; diffuser et publier les résultats de ses travaux ; favoriser le développement des sciences statistiques et les recherches économiques relevant de sa compétence ; réaliser, pour le compte des administrations publiques, des recensements approximatifs par voie de sondage. La loi relative à la démocratie de proximité a, en outre, chargé l'Insee de l'organisation du recensement de la population.

Ainsi la diffusion et la publication des résultats de nos travaux font partie intégrante de nos missions. Notre budget s'élève à 471 millions d'euros en crédits de paiement pour l'année 2014, dont 382 millions de dépenses de personnel. Les fonds de concours et attributions de crédits sont de l'ordre de 14 millions d'euros sur les 89 millions de dépenses hors titre II. L'Insee emploie 5707 équivalents temps plein (ETPT), dont 26 % sont des cadres A. Ces chiffres ne tiennent pas compte des services ministériels qui sont incorporés dans chaque programme ministériel. Ces services sont au nombre de 16 (bientôt 17 avec le service du ministère de l'intérieur) et comportent environ 2 000 agents. Cet ensemble constitue la statistique publique française.

En amont de l'élaboration de statistiques, l'Insee est chargé de tenir trois répertoires administratifs : le répertoire national d'identification des personnes physiques, qui permet à l'Insee d'attribuer à toutes les personnes concernées le numéro d'identification au répertoire ou numéro de sécurité sociale, le fichier électoral en vue du contrôle sur les listes électorales et le répertoire national des entreprises et de leurs établissements, le Sirene.

La loi du 7 juin 1951 fixe les modalités d'élaboration des statistiques. Une modification datant de 2008 a introduit la notion d'indépendance professionnelle dans la conception, la production et la diffusion des statistiques, et a créé une Autorité de la statistique publique qui veille à son respect et à l'application du code de bonnes pratiques européen.

Durant très longtemps, les enquêtes ont été la source quasi exclusive des résultats de l'Insee. En décembre 1986, une loi a introduit un article 7 bis dans la loi du 7 juin 1951 qui oblige les administrations et les personnes de droit privé gérant un service public à transmettre à l'Insee et aux services statistiques ministériels les données recueillies dans l'exercice de leurs missions, afin d'éviter une double collecte d'informations. Les fichiers administratifs ne sont pas la seule source d'informations. Par exemple, quasiment aucune des données de l'enquête « Trajectoires et origines», qui visait à évaluer l'impact des origines et d'autres facteurs dans les trajectoires de vie, ne provenait de fichiers administratifs. Il en va de même des données sur la conjoncture, collectées périodiquement auprès des chefs d'entreprises. En revanche, l'Insee utilise les déclarations fiscales afin d'éviter d'interroger les ménages ou les entreprises sur leurs revenus ou leur chiffre d'affaires.

Avant d'être mise en oeuvre, une enquête statistique doit suivre un processus de validation. Tout d'abord le Conseil national de l'information statistique (Cnis), qui regroupe les producteurs de statistique et leurs utilisateurs, et où Mme Evelyne Didier représente le Sénat, émet un avis d'opportunité, après avoir vérifié que l'enquête est utile, nécessaire et concerne une problématique importante du point de vue des utilisateurs. Une seconde étape est un avis de conformité à l'état de l'art donné par le Comité du label de la statistique publique. Il s'agit ici de valider les choix méthodologiques faits par le maître de l'ouvrage et de donner un avis sur l'obligation de réponse à l'enquête. Enfin, le ministre chargé de l'économie publie un arrêté qui liste l'ensemble des enquêtes statistiques d'une année donnée et indique celles qui sont obligatoires. L'avis du Comité du label a toujours été suivi à ce jour.

Le Cnis est aussi un lieu de concertation plus technique, notamment avec ses groupes de travail ad hoc. Ainsi, récemment, un groupe de travail sur l'évolution du questionnaire du recensement de la population, présidé par le sénateur Jean-Claude Frécon, a proposé des modifications du questionnaire du recensement que l'Insee mettra en oeuvre dans les années à venir.

L'Insee, dont l'une des missions est de diffuser largement les résultats de ses travaux, a mis en place un système de diffusion comportant plusieurs niveaux liés notamment à la confidentialité des données communiquées. Le premier niveau est un niveau « tout public» : la diffusion est faite gratuitement sur notre site Internet, principal vecteur de diffusion. Notre site offre des informations diffusées dans les meilleurs délais, comme les indicateurs de conjoncture, des études et analyses, des ouvrages de référence sur les grandes questions économiques et sociales, et des données détaillées qui offrent un accès à d'importantes masses de données, particulièrement pour un usage professionnel. Toutes ces informations respectent le secret statistique.

Cette palette diversifiée de produits en libre accès vise à répondre aux besoins des différents utilisateurs, particuliers, enseignants, étudiants, chercheurs, entreprises, médias, administrations. De nombreuses informations sont disponibles à un niveau géographique fin (régional, départemental, communal, voire infra-communal) et les directions régionales de l'Insee publient de nombreuses études à portée régionale ou locale, en partenariat avec des collectivités locales.

Les données diffusées sont toujours accompagnées de l'ensemble des métadonnées nécessaires à leur compréhension, les sources et la méthodologie employée. L'évolution de notre gamme de produits s'appuie aujourd'hui en grande partie sur l'écoute des attentes, grâce à des enquêtes de satisfaction. Ainsi, en 2013, les « Inseenautes » ont été interrogés sur leurs pratiques de lecture sur le web, sur la collection Insee résultats et sur les définitions des termes économiques. Huit Français sur dix ont une bonne opinion de l'Insee en 2013 ; cette proportion monte à neuf personnes sur dix parmi les utilisateurs du site Insee.fr. L'Insee réalise aussi, à la demande, des prestations payantes, tarifées au coût marginal, sur ses sources statistiques, qui requièrent des opérations de confection et de mise à disposition, dans le respect du secret statistique.

Au-delà des données en libre accès sur internet, il existe deux autres niveaux de diffusion. La loi du 7 juin 1951 punit la rupture du secret statistique de la même manière que la rupture du secret professionnel et interdit la communication des données confidentielles, qui permettent l'identification des unités statistiques. Elle prévoit toutefois des dérogations, selon des modalités précises. Un second niveau de diffusion est destiné principalement aux chercheurs et aux experts du privé : il leur fournit des données plus détaillées, individuelles, mais préserve toujours l'anonymat des personnes physiques. Il s'agit d'un partenariat avec le réseau Quetelet.

Le troisième niveau ne concerne que les chercheurs et donne accès à des données confidentielles, c'est-à-dire permettant l'identification des entreprises ou des personnes physiques, avec l'accord des Archives et après avis d'un Comité du secret statistique, présidé par un conseiller d'Etat, M. Jean Gaeremynck, et qui réunit les producteurs de données, des membres du CNIS et des chercheurs. L'accord du service producteur est en outre nécessaire. Cette procédure dérogatoire concerne environ 200 dossiers par an pour environ 800 chercheurs. Afin de garantir la sécurité des données, l'Insee ne fournit pas les noms des personnes physiques, sauf besoin explicité par les demandeurs, notamment en cas de tirages d'échantillons pour des enquêtes statistiques, et n'autorise l'accès qu'au travers du centre d'accès sécurisé du Groupe des écoles nationales d'économie et statistique (Genes), établissement public depuis 1971 mais très lié à l'Insee. Le chercheur travaille ainsi dans une bulle et ne peut rien en extraire qui ne respecte pas la confidentialité. En revanche, il peut consulter les données concernant les entreprises, depuis environ 30 ans, et, depuis 5 ans, celles concernant les personnes physiques.

L'ouverture des données, ou open data, est dans les gènes de l'Insee, puisqu'une de ses missions est justement de diffuser les informations qu'il produit. Notre site internet a reçu 30 millions de visites en 2013 ; la croissance est de l'ordre de 20 % par an sur les deux dernières années. Tous nos travaux statistiques ont vocation à y être largement diffusés sous différentes formes allant jusqu'aux bases de données détaillées. Ainsi l'Insee a récemment rendu publiques au deuxième semestre 2013 des bases de données à une maille géographique très fine, avec des « carreaux » de 200 mètres sur 200 mètres. Les mentions légales de notre site autorisent la réutilisation libre et gratuite de toutes les données statistiques qu'il contient, y compris à des fins commerciales, sans licence, ni versement de redevance, sous réserve de la mention de la source.

Nous attachons une attention particulière aux formats de nos données, pour faciliter leur réutilisation. Les formats traditionnels de type csv, xls ou de bases de données ont été enrichis récemment de formats avancés : nous publions en format RDF du web sémantique, les populations légales du recensement de la population, le code officiel géographique (COG) ainsi que les nomenclatures d'activité (code NAF) et de profession (dire codification PCS). Les modalités et algorithmes de traitement de certaines données, comme celles du recensement de la population, font l'objet d'une description détaillée en ligne. En outre, à titre plus exploratoire, l'Insee est partenaire du projet Datalift, de données sémantiques interconnectées sur ce que l'on appelle le web des données. Cette stratégie de long terme d'open data initiée en 2003 a conduit l'Insee à collaborer de manière étroite avec la mission Etalab lors de sa création, pour alimenter substantiellement en données la première version de data.gouv.fr, fin 2011, et définir des solutions techniques. Avec l'ouverture de la version 2 de data.gouv.fr fin 2013, nous avons fourni de nouvelles données dans le cadre du projet de loi sur la parité hommes-femmes.

L'Insee ne reçoit que très peu de demandes de communication de documents administratifs : deux seulement en 2013 : la première concernait le résultat du recensement de la population d'une commune consultable sur le site ! - et la seconde un bulletin d'état civil datant de 1945 que l'Insee ne possédait plus. De manière générale, l'Insee ne constate pas de difficulté en la matière. En effet, si le document est couvert par le secret statistique ou par la protection de la vie privée, aucune communication n'est possible, hors la procédure dérogatoire décrite ci-dessus. Dans le cas contraire, l'Insee publie ce document sur le site internet ou le communique dès la demande.

Enfin, au titre des modifications institutionnelles et légales envisageables, je signale que nous souhaiterions récupérer les données de caisse de la grande distribution, pour améliorer le calcul de l'indice des prix et réduire le coût de collecte des données utiles. Une modification de la loi est nécessaire pour cela.

Mme Corinne Bouchoux, rapporteure. - Je vous remercie.

M. René Garrec. - Je n'ai pas de question. Je fais partie des Français qui apprécient le travail de l'Insee !

Mme Catherine Procaccia. - Je suis surprise que vous ayez si peu de demandes de transmission de documents, même mal orientées.

M. Michel Isnard, responsable de l'unité des affaires juridiques et contentieuses de l'Insee. - Sans doute est-ce parce que les personnes trouvent sur notre site l'information qu'elles cherchent. Peut-être pensent-elles aussi que nos données sont couvertes par le secret statistique et n'osent pas les demander !

Mme Corinne Bouchoux, rapporteure. - Le rapport Trojette montre que les attentes du public en matière de publication des données sont fortes et croissantes. Etes-vous prêts pour répondre à ces attentes ? En outre, quelles est votre position ou vos craintes concernant la transposition de la directive de juin 2013 ?

M. Alain Bayet. - Nous connaissons le rapport Trojette. Par principe nos données et études sont destinées à faire l'objet d'une large diffusion gratuite.

Mme Françoise Maurel, directrice de la diffusion et de l'action régionale de l'Insee. - Le rapport Trojette évoque les redevances associées aux licences pour consulter les fichiers Sirene. Ces redevances s'inscrivent dans le cadre prévu par la directive de 2013 car elles visent à couvrir le coût de réutilisation des données de ce répertoire administratif, - qui n'est donc pas un fichier statistique -, utilisé pour gérer l'identifiant unique des entreprises. L'Insee enrichit les données brutes du répertoire grâce à des enquêtes et un nettoyage régulier. La redevance est le prix de cette valeur ajoutée. La tarification est dégressive et dépend du type d'usage - final ou pour rediffusion. Il existe depuis longtemps un marché important pour la rediffusion de ces données.

M. Alain Bayet. - Le montant de la redevance s'établit à une dizaine de millions d'euros. Faut-il faire payer le contribuable  ou bien ceux qui bénéficient de cette rediffusion de données enrichies au-delà de la mission régalienne qui s'y attache ? Comme il existe un besoin de marché, cette dernière solution semble justifiée.

M. Michel Isnard. - Notre politique de diffusion nous paraît compatible avec la directive de 2013. Nous serons donc en conformité avec la loi de transposition, sauf si celle-ci allait plus loin que le texte européen, en imposant la gratuité par exemple.

Mme Corinne Bouchoux, rapporteure. - Vous avez décrit les conditions de sécurité qui entourent les consultations des chercheurs. Ceux qui s'adressent à vous sont-ils européens ou non-européens ? Dans quelle proportion ?

M. Michel Isnard. - Une quinzaine de chercheurs sur 800 est d'origine européenne ; il s'agit souvent de chercheurs francophones travaillant dans des universités européennes, au Royaume-Uni, aux Pays-Bas et aux Etat-Unis. Pour des raisons de sécurité nous n'accueillons pas de chercheurs installés dans des universités non-européennes, aux Etats-Unis ou au Canada, par exemple, en raison des modalités sécurisées de transmission des données. En revanche les chercheurs américains installés dans des universités européennes ont accès à nos données. A cet égard, Eurostat, l'office de la statistique des Communautés européennes, diffuse des données harmonisées, dont les données françaises. Elles sont très largement accessibles.

Mme Corinne Bouchoux, rapporteure. - Je ne doute pas de la robustesse de vos dispositifs de sécurité. Mais l'inventivité des pirates est sans limite. Etes-vous invulnérables à des attaques ? Y avez-vous déjà été sujets ?

M. Michel Isnard. - Il est impossible de prétendre que nous sommes invulnérables...

Mme Catherine Procaccia. - Nous ne vous croirions pas !

M. Michel Isnard. - Une société privée labellisée a réalisé deux audits de sécurité, elle n'a détectée aucun risque. Notre protection est la plus élevée possible. Mais cela sera-t-il toujours suffisant... En tout cas le Genes a fait le maximum.

Concrètement chaque chercheur reçoit une box, à l'image des box des opérateurs télécoms, qui est cryptée avec les meilleurs algorithmes disponibles. Un intrus dans la box rencontrerait des difficultés pour accéder aux données. En outre, les données échangées entre le chercheur et le centre de calcul sont cryptées. Enfin, le système comporte une sécurité biométrique, les chercheurs devant régulièrement s'identifier grâce à leurs empreintes digitales.

Mme Corinne Bouchoux, rapporteure. - Donc vous êtes sereins à l'égard du big data ?

M. Alain Bayet. - Oui, sauf en ce qui concerne les moyens pour faire face à des demandes toujours plus variées et croissantes. D'où notre demande sur les données de caisse. Notre métier de base est le traitement de l'information. Nous avons réalisé des gains de productivité considérables. En dix ans, nous avons économisé ainsi 1 000 emplois. En permanence, nous réorganisons nos processus pour fournir l'information la plus large sous la forme la plus pertinente. Notre offre s'est considérablement élargie. Nous sommes par nature partie prenante du big data.

Mme Corinne Bouchoux, rapporteure. - Combien de visiteurs consultent votre site internet ?

Mme Françoise Maurel. - Nous vous adresserons tous les documents sur le public et les enquêtes de satisfaction. Notre rapport annuel recense 30 millions de visites sur notre site par an, 170 millions de pages consultées. Aujourd'hui 26 000 personnes sont abonnées à notre lettre d'actualité en ligne, la diffusion sous format papier étant de plus en plus faible. Les lettres régionales d'activité comptent 36 000 abonnés. Enfin 125 000 personnes sont abonnées pour suivre divers indicateurs. En 2011, nous avons ouvert un compte Twitter, qui a 20 000 abonnés...

Mme Catherine Procaccia. - 22 094 exactement, je viens de le consulter...

Mme Françoise Maurel. - Cela évolue très vite ! Nous avons aussi un service Insee contact qui gère les appels avec les particuliers.

Mme Catherine Procaccia. - S'agit-il de 30 millions de visites ou de visiteurs ?

Mme Françoise Maurel. - Il s'agit de 30 millions de visites.

Mme Corinne Bouchoux, rapporteure. - Le Canard Enchaîné, dans un article du 27 février 2013, montrait qu'il était possible, simplement grâce à Google Earth ou à Google Map, en utilisant vos données fiscales publiées avec le système des petits carreaux, d'identifier les foyers fiscaux concernés, mettant ainsi en péril le secret fiscal.

M. Alain Bayet. - Ces données dites carroyées avaient été trop rapidement mises en ligne et ont été immédiatement retirées. Il a fallu quelques mois pour définir les bons algorithmes de brouillage. Fin 2013, l'Insee a mis en ligne des données avec des carreaux de 200 mètres de côté qui respectent parfaitement le secret des statistiques.

Mme Françoise Maurel. - Lors de la première mise en ligne, une erreur matérielle n'avait pas été détectée. Depuis, les algorithmes ont été revus en profondeur ainsi que les méthodes d'anonymisation. Nous ne diffusons pas de données concernant moins de onze ménages. De même, le calcul des revenus est complexe et nous éliminons les valeurs extrêmes. Les chiffres fournis sont toujours des moyennes.

M. Alain Bayet. - En février le processus de brouillage était insuffisant et il était possible de remonter à la source.

M. Michel Isnard. - Les données que nous avions publiées étaient brouillées, donc, en quelque sorte, fausses. Pour une fois que nous publiions des données inexactes ! C'était un comble pour un institut de statistique...

Mme Corinne Bouchoux, rapporteure. - Les données étaient fausses mais mettaient à mal le secret fiscal pour les ménages concernés ?

M. Michel Isnard. - Oui.

Mme Corinne Bouchoux, rapporteure. - Je vous remercie.

Audition de M. Pascal BERTEAUD, directeur général de l'Institut national de l'information géographique et forestière (IGN) (jeudi 27 février 2014)

Mme Corinne Bouchoux, rapporteure. - Nous entendons à présent M. Pascal Berteaud, directeur général de l'Institut national de l'information géographique et forestière (IGN), accompagné de Mme Stéphanie Carvalheiro qui y dirige les relations institutionnelles. Après avoir auditionné les utilisateurs de données administratives publiques - citoyens, associations, journalistes, entreprises - nous nous intéressons aux institutions qui produisent ces données. Pouvez-vous nous rappeler les missions de l'IGN ? Quel est son statut ? Comment est-il financé ? Quelle est sa politique de diffusion de ses travaux ? Quel est son positionnement sur l'ouverture des données, au regard des enjeux scientifiques, citoyens, économiques, financiers et politiques ? Envisagez-vous des partenariats ? Selon quelles modalités techniques et juridiques ? Les services offerts seraient-ils payants ? La gratuité, recommandée par certains, aurait sans doute une incidence sur la capacité de l'IGN à assurer ses missions.

M. Pascal Berteaud, directeur général de l'Institut national de l'information géographique et forestière (IGN). - Si nous avons gardé, depuis la fusion avec l'inventaire forestier national, le sigle IGN, notre nom véritable est désormais « Institut national de l'information géographique et forestière. » L'histoire de l'IGN remonte à la création, par Colbert, de la Commission royale de la carte de France et aux cartes de Cassini. Il s'agissait alors essentiellement de dresser des cartes d'état-major. C'est lors de la débâcle de 1940 que, pour éviter que cet outil stratégique ne tombe aux mains des Allemands, un décret de Philippe Pétain, signé le 27 juin 1940 à Bordeaux, a transformé le service géographique de l'armée en IGN. La fusion avec l'inventaire forestier national a eu lieu en juin 2012.

Notre métier est de décrire le territoire sous toutes ces formes. Il faut pour cela acquérir des données, ce que nous faisons grâce à des agents sur le terrain, par des vues aériennes ou grâce aux observations par satellite ; il faut ensuite les agréger dans des bases de données, puis développer des algorithmes pour les exploiter en en tirant des cartes ou des orthophotoplans. Tout n'est cependant pas automatisé : outre 800 ingénieurs et techniciens, 700 ouvriers travaillent en aval du processus. En comptant le personnel administratif, l'IGN emploie donc environ 1 700 personnes, pour un budget de 160 millions d'euros, dont 50 à 60 millions d'euros de recettes propres et 95 millions d'euros de dotation de l'Etat.

Jusqu'aux années cinquante, l'essentiel des recettes provenaient de la dotation de l'Etat. La vente des cartes a ensuite représenté jusqu'à la moitié de nos ressources, proportion qui est revenue aux alentours du tiers. Depuis cinq ou six ans, la deuxième révolution internet, constituée par l'émergence des terminaux mobiles, a donné une composante géographique à la quasi-totalité des données échangées : tous les secteurs économiques utilisent désormais l'information géographique. Le champ d'activité de l'IGN s'en trouve considérablement étendu, mais il s'y retrouve face à des acteurs tels que Google ou Apple. De surcroît, les technologies d'acquisition automatique de données ont beaucoup progressé : par exemple, l'utilisateur de GPS non seulement reçoit des données mais également en renvoie automatiquement au fournisseur et ses traces permettent à celui-ci d'améliorer en permanence les données cartographiques. Du coup, les flux s'inversent : nous vendions dans le passé à ce type d'opérateur des mises à jour régulières, ce sont eux désormais qui affinent nos connaissances. Le développement d'outils collaboratifs comme Openstreetmap a fait chuter la valeur marchande des données, parfois divisée par cinq depuis cinq ans sur certaines couches de données.

Dans cet environnement, l'IGN a-t-il encore sa place ? Si l'information disponible sur internet, même moins précise et moins qualifiée, suffit à satisfaire 80-90 % des usages, la production d'information géographique référencée, d'autorité reste un élément de souveraineté nationale indispensable : pour tirer un missile, pour asseoir une réglementation sur une base géographique, pour édifier des services publics sur un territoire, mieux vaut se fonder sur une information géographique certifiée et fine... L'IGN a donc pour vocation d'être l'opérateur national de référence de la donnée géographique publique, de fabriquer des référentiels de qualité, neutres et régulièrement mis à jour, de construire des plateformes de diffusion interactive des référentiels. Bref, il s'agit de bâtir un service numérique de description du territoire.

Cette stratégie, que nous avons élaborée il y a trois ans, nous a conduits à ouvrir gratuitement à toutes les autorités publiques l'accès aux référentiels existants, dont l'utilisation a ainsi été multipliée par vingt. Comment nous adapter à l'open data, qui est désormais une réalité incontournable ? Certaines données de socle - les référentiels de base -nécessaires à l'exercice de la citoyenneté, doivent être accessibles gratuitement. D'autres doivent aussi être rediffusées - c'est la vocation de l'IGN - mais pas forcément gratuitement. Dès lors qu'elles sont susceptibles d'être exploitées à des fins commerciales, nous pouvons les rendre payantes, à condition que les tarifs retenus ne soient pas dissuasifs et puissent évoluer avec la valorisation économique des données, en fonction du cycle de ces données. Cela risque-t-il d'empêcher l'émergence de start up ou de de la création de valeur ? C'est possible, mais nous devons veiller aussi à ce que les données produites avec de l'argent public ne servent pas à enrichir de grosses multinationales. Nous élaborons donc une tarification progressive afin de ne pas décourager les petites entreprises que nous entendons même, au contraire, aider : nous ouvrons au sein de l'IGN un incubateur de projets pour les accueillir.

Sur les 50 à 55 millions d'euros de ressources propres de l'IGN, 30 millions d'euros proviennent de la vente de cartes papier. Ce chiffre était de 45 millions d'euros il y a cinq ans et risque de tomber à 15 dans cinq ans. La valeur des données baissant inéluctablement, il importe d'offrir des services complémentaires payants, ce que nous entendons faire en aidant les entreprises privées, en espérant pouvoir récupérer à terme une partie de la valeur, mais aussi par nous-mêmes, sur un modèle de type freemium. Par exemple, le géoportail de l'urbanisme permettra de retrouver, à partir d'une adresse, le règlement d'urbanisme qui s'applique : ce service est nécessaire à l'exercice de la citoyenneté et doit être gratuit. Pour obtenir en plus une vision en trois dimensions du terrain ou un calcul des co-visibilités, il faudra payer. Nous proposerons également la liste des zonages réglementaires superposés, environ 400 en France actuellement... Et pourquoi ne pas associer à cet outil de description du territoire des données statistiques, économiques, sociales ? Les données publiques abondent en France, mais elles sont largement inexploitables. Il faut les structurer en des formats exploitables et superposables.

L'adaptation de l'IGN à ce nouveau modèle économique est cruciale. Les évolutions engagées réclament des investissements, notamment en recrutement et formation de personnels. Hélas, l'époque ne s'y prête guère. Je ne suis pas venu ici pour me plaindre, mais jamais aucune structure privée ou publique n'a réalisé une telle transformation sans un minimum d'investissements.

Mme Catherine Procaccia. - Vous avez évoqué une tarification progressive pour aider les start up. Avez-vous les moyens de détecter celles qui ne sont que des faux-nez de grands groupes ou pilotées par eux ? Par ailleurs, pouvez-vous revendre les images satellitaires que vous achetez ou devez-vous les mettre à disposition gratuitement ? Une négociation est-elle envisagée, à cet égard, au sujet du futur GPS européen ?

M. Pascal Berteaud. - Si la tarification progressive ne peut prendre pour critère le statut du client, il est possible de la fonder sur l'usage des données : gratuité pour certains usages, tarification pour d'autres. Par ailleurs, le volume utilisé n'est pas le même pour une petite entreprise et pour un grand groupe. Le prix augmente avec la quantité, contrairement à l'usage commercial classique ! La difficulté est que le modèle économique des sociétés sur internet est moins construit sur les marges dégagées que sur la valeur de revente. L'application Ways, par exemple, qui collecte en temps réel sur les smartphones des données lui permettant de calculer des temps de parcours actualisés, n'a jamais été rentable mais elle s'est revendue 1 milliard de dollars cinq ans après sa création. Il en est de même pour WhatsApp, rachetée la semaine dernière pour des considérations de concurrence. Il faut donc non seulement créer autour de l'IGN un écosystème de sociétés utilisant ses données mais aussi se préoccuper de la manière dont il nous sera possible, si l'une d'entre elles devient aussi grosse qu'Apple ou Google, de récupérer une partie de la valorisation. Sinon, il restera à dégager 30 millions d'euros en loi de finances.

Mme Catherine Procaccia. - Il le faudra bien, si les recettes des ventes de cartes sont divisées par deux...

M. Pascal Berteaud. - S'opposer à l'open data, pourquoi pas ? Mais c'est une réalité économique : nous cherchons tous les données géographiques sur internet, mais pas sur le site de l'IGN. L'un de nos services, qui regroupe une centaine de personnes au sein de la cité spatiale à Toulouse, est dédié aux données satellitaires. Notre objectif est de mettre gratuitement à disposition des autorités publiques une couverture satellitaire de la France mise à jour chaque année, avec un gestionnaire satellitaire qui ne travaille pas gratuitement. Pour des données plus précises, il faut prendre des images aériennes.

L'IGN est le centre de calcul mondial du repositionnement des satellites GPS car il compte certains des meilleurs spécialistes mondiaux de géodésie. Le paysage est en train d'évoluer fortement : les premiers satellites de la constellation Galileo sont lancés, les Russes développent leur propre constellation et les Chinois font de même. Si nous parvenons à associer ces différentes constellations, le GPS donnera des positions dont la précision ne s'exprimera plus en mètres mais en décimètres.

Mme Catherine Procaccia. - Tirez-vous des revenus de votre travail de positionnement des satellites ?

M. Pascal Berteaud. - Guère : il s'agit d'un service rendu à la communauté scientifique, dans le cadre d'une répartition mondiale du travail.

Mme Corinne Bouchoux, rapporteure. - Faut-il comprendre que l'IGN ne s'oppose plus à l'open data et compte s'y adapter ?

M. Pascal Berteaud. - Jusqu'à il y a cinq ou six ans l'IGN vivait sur une logique différente depuis 350 ans : établissement de la carte et tarification aux utilisateurs en fonction du coût d'élaboration. Les besoins ayant aujourd'hui changé, nous devons fabriquer de nouveaux produits : la logique n'est plus top-down mais bottom-up. L'an dernier par exemple nous avons divisé par huit le coût de l'accès à notre base topographique BD-Topo (tous les objets à la surface du sol) pour la France entière ; du coup, alors que nous vendions une demi-France chaque année, nous avons vendu cinq ou six France entières ! Une politique d'open data est donc indispensable, pourvu qu'elle ne soit pas naïve : il n'y a pas de raison pour que les infrastructures payées par l'Etat servent à enrichir des entreprises privées. Certains économistes estiment que l'Etat s'y retrouverait par l'impôt. Mais sur quoi l'asseoir ? Ces entreprises sont mondialisées et surtout les flux ne sont pas monétaires : nous payons l'accès à Google, par exemple, par du temps de cerveau disponible et des données personnelles. Cela dit, l'enjeu est de faire émerger un Google français... Comme l'information est devenue fortement géographique, l'IGN a un rôle à jouer en la matière.

Mme Corinne Bouchoux, rapporteure. - L'IGN, futur Google français ?

M. Pascal Berteaud. - Pas vraiment : l'IGN aide une constellation d'entreprises dont l'une, espérons-le, deviendra l'équivalent de Google, ou de WhatsApp...

Mme Corinne Bouchoux, rapporteure. - Je vous remercie.

Audition de Mme Claude REVEL, déléguée interministérielle à l'intelligence économique, et M. Philippe RAMON, conseiller senior pour la sécurité économique et les affaires intérieures (jeudi 27 février 2014)

Mme Corinne Bouchoux, rapporteure. - Nous achevons nos auditions de ce matin en entendant Mme Claude Revel, déléguée interministérielle à l'intelligence économique et M. Philippe Ramon, conseiller senior pour la sécurité économique et les affaires intérieures.

Madame Revel, votre carrière dans l'administration et le secteur privé, en France et au plan international, ainsi que votre expertise, vous ont conduite à participer à de nombreux cercles de réflexion sur les stratégies d'influence, les nouvelles règles de mondialisation et l'intelligence économique. Vous avez été nommée au poste que vous occupez le 29 mai dernier. Nous avons souhaité vous entendre afin que vous nous éclairiez sur les conséquences, du point de vue de l'intelligence économique, de l'ouverture des données publiques.

Après nous avoir rappelé le statut et les missions du délégué interministériel à l'intelligence économique, pourriez-vous nous présenter l'état de la réflexion des pouvoirs publics sur les risques de l'ouverture des données publiques par les grandes administrations et établissements publics ? Peut-être pourrez-vous dresser, à cette occasion, une cartographie des données sensibles ? Des actions de sensibilisation ont-elles été conduites et des précautions techniques ou juridiques ont-elles été prises ? Enfin, des modifications du cadre juridique actuel sont-elles envisagées, en particulier dans la perspective de la transposition prochaine de la directive de juin 2013 ?

Mme Claude Revel, déléguée interministérielle à l'intelligence économique. - Je vous remercie de votre invitation. Nous avons mesuré, en préparant cette audition, tout l'intérêt du sujet sur lequel vous avez souhaité m'entendre.

La délégation interministérielle à l'intelligence économique (D2IE) que je représente, a été fortement rénovée par le décret du 22 août 2013. Créée en décembre 2003, sous la dénomination de Haut responsable à l'intelligence économique et alors rattachée au secrétariat de la défense nationale, elle a été placée sous la responsabilité d'Alain Juillet jusqu'en 2009. Elle est devenue à proprement parler « délégation interministérielle » sous le mandat de son successeur, Olivier Buquin, et a alors été rattachée à Bercy. Le décret de 2013 a conforté sa légitimité et son caractère interministériel en la rattachant directement au Premier ministre.

Ce décret lui assigne quatre missions principales. La première est une mission de veille, d'anticipation pour alerter le Gouvernement français. Sa seconde mission est défensive. Il s'agit de garantir la sécurité de nos ressources économiques, en particulier les actifs immatériels comme les savoir-faire, l'image, la réputation ou le capital de nos entreprises. La troisième mission est offensive puisqu'il s'agit d'influence. La délégation s'attache à aider le gouvernement et les entreprises à saisir les opportunités économiques et à agir sur la formation des normes et les règles internationales, techniques et de gouvernance. Dernière mission : la formation et la sensibilisation à l'intelligence économique. C'est un volet essentiel de notre action. Nous arrivons d'ailleurs au terme d'une première expérience lancée en septembre 2011 avec 35 établissements d'enseignement supérieur pilotes, qui a consisté à promouvoir en leur sein un enseignement minimal de 40 heures sur l'intelligence économique. Aucun étudiant ne doit sortir de l'enseignement supérieur sans avoir été sensibilisé aux enjeux et aux réflexes pertinents. Nous nous attachons à cet égard à convaincre chaque responsable d'établissements d'enseignement supérieur, dont les grandes écoles, de l'intérêt de tels enseignements pour leurs étudiants, ainsi qu'à diffuser, le plus largement possible, une doctrine cohérente de l'intelligence économique, construite autour des trois premiers volets que j'ai présentés. A cet égard, il nous revient de « dé-mythifier » l'intelligence économique qui souffre encore trop souvent d'être associée à des manoeuvres secrètes alors que nous travaillons sur des informations publiques et légales. Nous menons aussi des actions de sensibilisation auprès de divers organismes du secteur privé (chambres de commerce et d'industrie, instituts, clubs d'entreprises...) ou public (institut d'administration notamment), qui relaient notre message.

Le décret du 22 août 2013 permet en outre de mobiliser des correspondants dans l'ensemble des services déconcentrés de l'Etat, des ambassades et des consulats, ce qui est utile à la constitution de notre réseau. En outre, il encourage à la collaboration avec le secteur privé.

J'en viens maintenant plus précisément au sujet qui motive notre audition. Jamais jusqu'à présent la D2IE n'a été expressément saisie de la question de l'ouverture des données publiques même si celles-ci sont en principe des données produites par les administrations publiques et qu'elles doivent désormais être largement mises gratuitement à la disposition des citoyens, sous le contrôle éventuel de la Cada (Commission d'accès aux documents administratifs).

Pour autant, nous nous sommes interrogés sur la sensibilité des informations détenues par les administrations lorsqu'a été élaboré le projet de politique de sécurité des systèmes d'information de l'Etat (PSSE), en juillet 2013, puisque le quatrième objectif retenu rappelle la nécessité d'une évaluation de la sensibilité de chaque information, afin, dans un souci de sécurité et de confidentialité, de la qualifier en conséquence en fonction des différents degrés du secret défense et d'en informer les agents qui la traitent. Certains ministères, comme celui de l'agriculture, se sont prêtés à l'exercice avec plus d'allant que d'autres. Les informations sont classifiées par niveau de sensibilité en matière de disponibilité, d'intégrité, de confidentialité et de preuve, sous la validation générale du SGDSN (Secrétariat général de la défense et de la sécurité nationale).

En principe, la loi sur le secret statistique du 7 juin 1951 interdit, sous peine de sanctions pénale, la publication d'informations individuelles à l'occasion de la diffusion de statistiques générales et soumet les enquêteurs au secret professionnel. Nous nous sommes efforcés, en 2011 et en 2012 de sensibiliser, au sein de chaque ministère, les services d'intelligence économique à la question du secret des affaires. Le président de la Cada s'est d'ailleurs interrogé sur les motivations réelles des demandes formulées par des cabinets d'avocats demandant la communication détaillée de documents produits dans le cadre d'appels d'offres. La confidentialité de certaines informations doit être la contrepartie de l'ouverture d'autres données.

La délégation interministérielle publie par ailleurs des guides pratiques sur l'intelligence économique. Une vingtaine de fiches de sécurité économique ont ainsi été rédigées par nos soins pour expliquer aux entreprises comment elles peuvent protéger en pratique leurs informations sensibles. Des principes directeurs viennent d'être rédigés à l'intention des scientifiques pour les sensibiliser à ces questions dans le cadre de mobilités ou de collaborations internationales ou de l'accueil de chercheurs d'autres pays.

Nous travaillons en ce moment très activement sur le projet de loi relatif au secret des affaires. Celui-ci est très intéressant en ce qu'il vise à instituer une protection dès le stade de l'idée : en l'état actuel du droit, le croquis ou le plan stratégique ne sont pas protégés par le droit d'auteur ou par le brevet, alors qu'ils sont de plus en plus facilement accessibles par les technologies modernes et que les risques de fuites sont démultipliés dans un contexte de concurrence mondiale. Si l'entreprise doit être transparente, les informations d'importance vitale pour son avenir doivent être réservées en amont jusqu'à ce qu'elles puissent être protégées. D'autres pays se sont déjà dotés d'une protection de ce type d'informations stratégiques. La Commission européenne travaille, quant à elle, depuis le début de l'année 2013 dans le même sens sur un projet de directive relatif au trade secret. Le principe de la valeur commerciale des idées est par ailleurs présent dans les textes relatifs aux droits de propriété intellectuelle qui touchent au commerce international, relevant du pilier dits ADPIC (accords internationaux sur la protection des droits intellectuels), de l'Organisation mondiale du commerce (OMC).

En ce qui concerne les rapports entre l'Etat et les entreprises, plusieurs points me semblent mériter réflexion. L'Etat détient de nombreuses informations confidentielles, soit pour lui-même, soit parce qu'elles lui ont été fournies par des entreprises, et qui relèvent d'une « zone grise » dans la mesure où elles n'entrent pas dans un champ de protection spécifique, comme par exemple le secret défense. Je pense en premier lieu aux données fournies par les entreprises lorsqu'elles répondent à des appels d'offre publics. Nous avons été sollicités sur ce point particulier à l'occasion des appels à projets lancés par le commissariat général à l'investissement, qui portent sur des matières très pointues et très innovantes, et dont les réponses sont donc susceptibles de contenir des informations à haute valeur commerciale. Deux PME nous ont ainsi indiqué préférer se priver d'un potentiel financement public plutôt que de fournir des informations dont la confidentialité ne leur est pas garantie. Cette situation est préjudiciable tant à ces entreprises qu'à l'ensemble de la collectivité, puisqu'elle empêche des innovations qui pourraient être très fructueuses de se faire jour et de bénéficier d'un financement. C'est pourquoi nous avons commencé à travailler sur ce sujet précis, notamment s'agissant des pôles de compétitivité, qui rassemblent une importante matière intellectuelle et qui doivent donc pouvoir protéger leur information stratégique. C'est aussi le rôle de l'Etat que de le leur rappeler afin d'éviter que cette information soit captée de manière prédatrice et dans un but contraire à nos intérêts.

Je pense également aux données détenues par les banques publiques comme la BPI ou la Coface. Pour obtenir des financements, les entreprises doivent en effet fournir de très nombreuses informations portant par exemple sur les pays dans lesquelles elles souhaitent s'implanter ou les acteurs avec lesquels elles ont l'intention de s'allier. Je suppose et j'espère que ces informations sont conservées de manière sécurisée ; je n'en ai pas pour autant la certitude. S'il est louable de rechercher la transparence, il ne faut pas permettre à nos concurrents de lire nos stratégies à livre ouvert, d'autant que la réciproque n'est pas vraie.

Je pense enfin à la publication de leurs comptes par les PME. Dans d'autres pays européens comme l'Angleterre ou l'Allemagne, seules les dispositions de la directive européenne applicable en la matière s'imposent. En France en revanche, les entreprises doivent publier davantage d'informations que celles qui sont demandées par les textes européens. C'est pourquoi, à la suite de mon prédécesseur, je me suis engagée sur ce sujet en lien avec le ministère du redressement productif. Il me semble nécessaire de distinguer une obligation de publication, qui s'impose pour les informations visées par la directive européenne, d'une simple obligation de dépôt, qui pourrait s'appliquer aux informations supplémentaires collectées dans un but de contrôle. Cette question rencontre cependant de très fortes réticences de la part du Trésor.

La question de l'ouverture des données va de pair avec celle du caractère payant ou gratuit des données mises à disposition. Il me paraîtrait choquant que des organisations puissent gagner de l'argent à partir d'informations mises à leur disposition gratuitement et de manière innocente, par exemple à travers les réseaux sociaux. Nous savons tous que certaines organisations comme Google font du profit à partir de la récupération d'informations qui ne sont pas protégées chez elles. Il ne s'agit pas de tout réglementer, mais il faut se demander jusqu'où ce type de réutilisation est admissible, et surtout jusqu'à quel niveau de confidentialité les informations peuvent être traitées.

Il faut également avoir à l'esprit que les informations en question ne sont pas seulement des données personnelles, mais également des données économiques. Je pense ici à deux aspects très précis. Le projet de règlement européen en matière de protection des données, actuellement en discussion à Bruxelles sous l'égide de Viviane Reding - et qui tarde à voir le jour, en raison notamment des manoeuvres britanniques -, traite à la fois des données personnelles et des informations économiques et financières qui circulent sur les réseaux divers et variés, auxquelles elle tend à donner un statut adapté aux technologies modernes. Ces questions sont également discutées - ou plutôt, j'espère qu'elles ne le seront pas - dans le cadre de l'accord transatlantique. La France a demandé, au nom de l'exception culturelle, que les données soient exclues du champ de cet accord tant qu'il n'existe pas de protection au niveau européen afin d'éviter une négociation au rabais. Or, la lenteur des négociations européennes s'explique en partie par l'intervention des lobbies qui souhaiteraient que la question soit tranchée dans le cadre de l'accord transatlantique... C'est pourquoi il nous faut impérativement être très actifs sur ce sujet à Bruxelles si nous voulons assurer la protection de nos données, qu'elles soient personnelles ou économiques. A la question de savoir si les données seraient comprises dans le champ de l'accord transatlantique, le négociateur européen chargé de mener la négociation nous a indiqué qu'en relèveraient les données véhiculées par les services concernés par l'accord... Il s'agit donc bien à mon sens de données sensibles et nous devons nous montrer très unis sur ce sujet.

M. Philippe Ramon. - Il faut avoir en tête que la valeur des données n'est pas seulement liée à leur caractère intrinsèquement stratégique. Bien souvent, une information ne prend sens que par son croisement avec d'autres données en apparence anodines. Si une donnée isolée sur un client ou un fournisseur d'une entreprise n'a en apparence aucune valeur, il en va différemment d'un fichier qui regrouperait des informations sur l'ensemble de ses clients et de ses fournisseurs. De même, le nom d'un collaborateur d'une entreprise n'a a priori que peu d'importance, contrairement à l'organigramme d'ensemble d'une entité. Il faut entamer une réflexion sur les éléments qui peuvent être croisés et assemblés pour élaborer une image globale.

Mme Catherine Procaccia. - De mon point de vue de néophyte, je me demande si la sécurité des entreprises est vraiment compatible avec l'open data. Alors que la publication d'un organigramme ou la réponse à un appel d'offres peuvent donner lieu au pillage d'informations, les PME doivent avoir une connaissance très pointue de ces enjeux pour pouvoir l'éviter.

Mme Claude Revel. - C'est là toute la problématique de l'intelligence économique. Nous vivons dans un monde où la transparence est la règle et il serait illusoire de vouloir empêcher la circulation de l'information. Une entreprise doit nécessairement donner beaucoup d'informations, y compris financières, sur elle-même dans un contexte de concurrence internationale, pour des raisons de cotation par exemple. Il faut donc pouvoir gérer dans un même temps à la fois la diffusion des informations et la rétention de celles qui ont une valeur stratégique. C'est pourquoi aucune règle générale ne peut être posée en la matière : les principes de l'intelligence économique doivent être intégrés et permettre d'évaluer chaque situation individuelle, tout en respectant les obligations légales d'information notamment en matière de développement durable

M. Philippe Ramon. - Aucune structure ne peut aujourd'hui s'extraire d'une logique de communication, par exemple pour chercher des financements ou des partenariats. Il faut cependant que toutes les structures qui diffusent de l'information aient conscience que celle-ci est potentiellement utilisée. S'il ne faut pas se renfermer sur soi-même, il ne faut pas pour autant fournir plus d'informations que les autres et s'inscrire dans une relation de réciprocité.

Mme Claude Revel. - L'intelligence économique pourrait être définie comme la maîtrise de l'information stratégique. L'information ne soit pas être diffusée de manière intempestive, y compris par les salariés des entreprises. Ceux-ci peuvent en effet donner des informations importantes sans le vouloir à travers les réseaux sociaux, par exemple en indiquant indirectement les déplacements à l'étranger de leurs supérieurs. Toute information de ce type doit entrer dans une démarche raisonnée de communication.

Mme Catherine Procaccia. - Selon vous, quel est le pourcentage des entreprises qui appliquent les principes que vous venez de nous décrire ?

Mme Claude Revel. - Je pense que les grandes entreprises sont plutôt sensibilisées à ces principes. D'autres entreprises de taille moyenne mais exposées de longue date à la concurrence les ont également intégrés. Cependant, et bien que nous ne disposions pas de statistiques sur ce point, je pense que la grande majorité des entreprises les ignore. Nous pourrions nous estimer heureux si un quart d'entre elles les appliquait. Un travail très important reste à faire. Il existe cependant des signes encourageants : les publics jeunes auxquels nous nous adressons comprennent tout à fait la dichotomie à laquelle nous faisons face et considèrent l'information comme une matière qu'il faut savoir gérer.

Mme Corinne Bouchoux, rapporteure. - L'introduction par le Conseil d'Etat en 2013 de la notion de « vie privée des entreprises » va dans la direction que vous nous indiquez. Je m'interroge sur les raisons de l'échec d'une des préconisations du rapport Carayon de 2003 : pourquoi n'a-t-on pas mis davantage l'accent sur la pratique du rapport d'étonnement, exercice libre et simple qui peut être appliqué des petites classes aux grandes écoles, et qui est déjà largement utilisé en Suède par exemple ?

Mme Claude Revel. - Je préconise cet exercice de longue date. Il s'agit d'une forme d'hygiène mentale que l'on peut appliquer notamment lors de tout déplacement à l'étranger afin de mieux observer son environnement, sur le modèle que nous proposons aux chercheurs. Il me semble qu'il existe une forte réticence du corps enseignant à ce type d'exercice dans un pays qui privilégie les disciplines cartésiennes telles que les sciences ou le droit. Par opposition, le rapport d'étonnement ou les principes de l'intelligence économique sont considérés comme sans importance, ou même dangereux en ce qu'ils nous éloigneraient d'une manière raisonnable de voir le monde. C'est tout le contraire de la vision anglo-saxonne, qui fait une large place aux disciplines que l'on pourrait qualifier de soft : ainsi, en droit, nous privilégions le droit positif tandis que la soft law - les bonnes pratiques, les principes directeurs - se développe partout. La présence à la tête des grandes entreprises anglo-saxonnes de personnes ayant suivi une formation littéraire est une autre manifestation de cet état d'esprit.

L'intelligence économique n'a toujours pas de reconnaissance universitaire en France : il faut nécessairement passer par une filière de sciences de gestion ou de sciences économiques, bien que des diplômes existent en la matière. L'intelligence économique suppose une approche transversale et horizontale qui s'oppose à notre organisation très verticale, pour ainsi dire « en silo ». La discipline a aussi pâti de son assimilation à des formes de piratage qui ont effectivement été pratiquées par certaines entreprises, mais qui ne reflètent pas du tout la réalité de nos préoccupations.

Mme Catherine Procaccia. - Existe-t-il des conseillers en intelligence économique qui peuvent être mis à la disposition des entreprises qui le souhaitent ?

Mme Claude Revel. - Au niveau régional, des chargés de mission spécialisés placés auprès du préfet ou des Direccte peuvent conseiller les entreprises. Les CCI (chambres de commerce et d'industrie) ont également développé une expertise en la matière, qui est cependant parfois payante. Je milite pour la mise en place de systèmes mutualisés entre PME : les syndicats interprofessionnels et les clubs d'entreprise doivent assurer une veille sur ces questions qui deviennent prioritaires. Enfin, lorsque dans une entreprise une personne est chargée spécifiquement de l'intelligence économique, elle ne se présente pas le plus souvent sous ce titre, et à juste titre, afin de ne pas attirer l'attention sur elle, dans la mesure où elle manipule de l'information stratégique.

Audition de MM. Franck VON LENNEP, directeur, et André LOTH, directeur de projet, de la Direction de la recherche, des études, de l'évaluation et des statistiques (Drees) (jeudi 6 mars 2014)

M. Jean-Jacques Hyest, président. - Dans le cadre du deuxième volet de notre démarche, nous auditionnons ce matin des organismes publics qui collectent et traitent des données publiques de santé et, tout d'abord, la Direction de la recherche, des études, de l'évaluation et des statistiques (Drees), représentée par son directeur, M. Franck Von Lennep, accompagné de M. André Loth, directeur de projet.

Après avoir rappelé les missions de la Drees, pourriez-vous, dans la suite du rapport Bras, à la rédaction duquel vous avez participé monsieur Loth, nous présenter les travaux en cours destinés à ouvrir davantage l'accès aux données de santé, conformément aux objectifs fixés par la Stratégie nationale de santé, et indiquer les orientations qui vous semblent prioritaires ; préciser les conditions du développement de la réutilisation des données de santé, notamment les précautions particulières qui doivent accompagner leur mise à disposition ; indiquer les raisons qui justifient actuellement les restrictions à l'accès aux données opposées à certains des acteurs qui s'y intéressent - l'Inserm, les ARS (agences régionales de santé) ou l'ANSM (Agence nationale de sécurité du médicament) qui peuvent y accéder depuis peu, ou les journalistes ; enfin, exposer votre vision de l'évolution de la gouvernance des données de santé, en particulier de la gestion des bases de données. Quels sont à cet égard les rôles respectifs de la Cnam (Caisse nationale d'assurance maladie des travailleurs salariés), de l'IDS (Institut des données de santé), des mutuelles ?

M. Franck Von Lennep, directeur de la recherche à la Drees. - Nos travaux s'inscrivent dans un double contexte : celui, tout d'abord, de la Stratégie nationale de santé, dont la ministre de la santé a rappelé que l'ouverture des données constitue un axe fort, à la fois en vue d'une meilleure information du grand public sur le système de santé et pour permettre une meilleure utilisation de ces données par les administrations sanitaires, les chercheurs et les industriels ; celui, ensuite, du projet open data, stratégie générale pilotée par le secrétariat général pour la modernisation de l'action publique (SGMAP). Le ministère de la santé est très mobilisé depuis un an sur ces chantiers : la ministre a confié à Pierre-Louis Bras la rédaction d'un rapport sur la gouvernance et l'utilisation des données de santé, à la suite duquel ont été mis en place plusieurs groupes de travail visant à définir les moyens de mettre en oeuvre les préconisations identifiées. Il me semble donc que nous avançons sur ces questions.

Les missions confiées à la Drees dans ce cadre tirent parti de sa large compétence. A la fois direction centrale des ministères sanitaires et sociaux et service statistique ministériel, elle opère dans le cadre du secret statistique défini par la loi de 1951 et veille scrupuleusement au respect de l'anonymat, tout en étant fortement attachée à la diffusion de ses travaux ; elle a également une connaissance fine du système de santé et notamment de l'utilisation du Système national d'informations inter-régimes de l'assurance maladie (Sniiram).

M. André Loth, directeur de projet à la Drees. - Je m'exprime ici à la fois en tant que directeur de projet à la Drees et co-auteur du rapport  Bras sur la gouvernance et l'utilisation des données de santé. La doctrine défendue dans celui-ci est claire : il faut ouvrir le plus largement possible l'accès aux données anonymes et les diffuser sans restriction ; utiliser autant que faire se peut, dans le respect de la vie privée, les données ayant un caractère indirectement nominatif ; faire enfin en sorte que les données personnelles relatives à l'activité des professionnels de santé puissent effectivement être diffusées dès lors qu'elles ont été rendues publiques sur le site de l'assurance maladie.

Les données de santé recouvrent un périmètre très vaste. Au-delà des données administratives du Sniiram, issues des feuilles de soins, et de celles du programme de médicalisation des systèmes d'information (PMSI), qui retracent les résumés de sortie hospitaliers depuis les années 90, il existe une foule d'autres informations : les données contenues dans les dossiers médicaux, celles relatives aux eaux de baignade, à l'eau potable, les données épidémiologiques, les enquêtes menées par les administrations ou les chercheurs... Ces ensembles de données médico-administratives ont été constitués à l'origine dans une visée gestionnaire. Le PMSI a ainsi été mis en place dans les années 1990 dans le but de réguler le financement des hôpitaux. Les promoteurs du Sniiram et du PMSI, constitués à l'origine avec une visée gestionnaire, ont fortement sous-estimé les usages qui pourraient être fait des données ainsi collectées, notamment dans un but de recherche.

La France, pays centralisé, dispose avec ces deux bases de données fusionnées - ensemble auquel nous nous référons sous le terme de système d'information (SI) dans le rapport Bras - de l'une des plus vastes bases de données de santé administratives au monde, si ce n'est la plus importante. Si cette base fusionnée ne fournit pas une information sanitaire exhaustive et ne renseigne pas notamment sur les risques de santé (on ignore, par exemple, si les individus concernés sont fumeurs ou quel est leur indice de masse corporelle), elle donne des informations complètes sur la consommation de médicaments ou les hospitalisations. La qualité de l'identification des informations recueillies permet leur chaînage et ainsi leur suivi tout au long de la vie des patients. Cette base doit donc être utilisée le plus largement possible à des fins d'information et de recherche. Il est à noter que cette base a été constituée très récemment : le PMSI date des années 1990 et le Sniiram fonctionne depuis 2003, le chaînage des deux systèmes ayant été mis en place en 2009-2010. Pour un système d'information d'une telle importance, on peut considérer que sa mise en place a été très rapide et a bénéficié d'une très grande réactivité de la part des administrations concernées.

Les difficultés rencontrées pour l'accès à ces bases et pour l'utilisation de leurs données sont d'ordre à la fois juridique et pratique ou technique. Le rapport Bras souligne la complexité, la confusion et le caractère inégal des règles juridiques d'accès. L'accès aux données de santé est envisagé par deux chapitres différents de la loi Informatique et libertés, selon qu'il est demandé ou non à des fins de recherche ; de ce point de vue, il y a eu depuis lors une forte évolution des esprits quant à l'utilisation possible de ces données. La Cnil (Commission nationale informatique et libertés) doit, en tout état de cause, donner son accord, y compris pour des données parfaitement anonymes, ce qui constitue une vraie curiosité. L'accès aux datamarts, c'est-à-dire aux magasins de données, parfaitement anonymes, constitués à l'usage de tiers par l'assurance maladie à l'initiative du ministère de la santé, est rendu inutilement complexe par l'intervention de la Cnil.

De l'accès aux données anonymes, il y a peu de choses à dire sinon qu'il doit être rendu possible - dès lors cependant qu'elles existent et que cet accès ne nécessite pas une production qui mobilise nécessairement des ressources. Le risque de mésusage de ces données ne saurait en aucun cas justifier qu'elles ne soient pas rendues publiques. Elles doivent donc l'être, conformément à la loi, dans des formats permettant leur réutilisation, et sans autre limite que celle de leur existence.

La question se pose différemment pour les données qui présentent un caractère indirectement nominatif. Il n'est pas envisageable que soient rendues publiques des données brutes, individuelles, chaînées dans le temps et relatives à 65 millions de personnes dès lors que l'une d'entre elles y est facilement ré-identifiable. Pour ces données, il faut donc trouver une voie étroite permettant la conciliation entre le nécessaire respect de l'anonymat et la diffusion des informations. Nous travaillons aujourd'hui à rendre cette question résiduelle par une anonymisation qui soit la plus large possible, notamment dans le cadre d'un groupe de travail sur les risques de ré-indentification. A la complexité du régime d'accès aux données indirectement nominatives s'ajoute un manque de cohérence entre la doctrine de la Cnil et celle du ministère. Nous avons probablement été trop restrictifs en ce qui concerne l'accès aux données du Sniiram, et trop laxistes s'agissant de celles du PMSI - 89 % des personnes peuvent y être identifiées simplement à partir de leur âge, leur domicile, leur date approximative d'hospitalisation ou la durée même approximative de leur séjour, et toute personne peut être identifiée dès lors qu'elle a été hospitalisée plusieurs fois au cours d'une même année. Nous avons besoin de davantage de clarté et d'homogénéité dans les règles applicables. L'échantillon généraliste des bénéficiaires (EGB) du Sniiram, établi au centième de la population française, est aujourd'hui envoyé à tous les chercheurs qui le demandent, ce qui n'est pas sans risque pour le respect de la vie privée, principe constitutionnellement protégé. On constate que toutes les administrations dans le monde sont confrontées à ce problème : l'administration britannique a ainsi été accusée d'être allée trop loin quant à l'accès aux données du NHS (National Health Service).

Le rapport Bras propose que le contrôle de l'accès aux données indirectement nominatives passe par un seul filtre d'experts, qui détermine de manière homogène si telle ou telle demande mérite d'être satisfaite au vu de ses finalités et de la méthodologie proposée. Il s'agirait d'étendre la procédure prévue par la loi Informatique et libertés pour la recherche en santé à l'ensemble des usages des données du Sniiram et du PMSI, au moyen d'un renforcement des moyens du comité consultatif sur le traitement de l'information en matière de recherche dans le domaine de la santé (CCTIRS), comité d'experts et de chercheurs qui instruit les demandes des chercheurs en amont de la Cnil.

En ce qui concerne la gouvernance des données de santé, le principe exposé par le rapport est clair : toutes les parties prenantes doivent pouvoir donner leur avis. C'est le rôle qu'a joué jusqu'à présent l'Institut des données de santé (IDS) ; il est indispensable que ce rôle soit maintenu et affirmé. Le rapport propose à cette fin la création d'un Haut conseil des données de santé destiné à permettre l'expression des différents acteurs dans la plus grande transparence.

Il est également affirmé que le système national d'information retraçant les données de santé constitue un bien public qui doit être géré de la manière la plus rigoureuse possible, en se donnant les moyens, notamment techniques, de résoudre les difficultés techniques qui se posent aujourd'hui. Les données indirectement nominatives doivent notamment être hébergées dans des conditions sécurisées permettant la traçabilité des accès, afin que l'on puisse savoir qui a accédé au système d'information et pour quelle finalité. Il faut ainsi en finir avec la pratique laxiste consistant à laisser les personnes ayant demandé une extraction de données - souvent pour d'excellentes raisons ! - partir avec un disque sous le bras... Comme pour les données fiscales, l'accès aux données de santé doit être organisé afin de permettre leur utilisation par des équipes de chercheurs, mais dans des conditions telles qu'elles ne puissent pas être indéfiniment copiées et utilisées par d'autres.

Quant au modèle économique de la mise à disposition des données de santé anonymes, il ne s'agit pas d'en rendre l'accès payant ; s'agissant des données indirectement nominatives, il pourrait en revanche être envisagé d'associer les demandeurs aux coûts liés à leur protection, avec un tarif qui pourrait être plus élevé pour ceux qui souhaitent y accéder dans un but lucratif.

Sur tous ces sujets, le rapport propose donc une doctrine claire pour sortir d'une situation de confusion sans doute imputable à la jeunesse des dispositifs de gestion des données de santé, dont les utilisations potentielles ont été largement sous-estimées à l'origine.

M. Franck Von Lennep. - J'en viens aux diverses missions en cours. Une commission pluraliste co-animée par Philippe Burnel, délégué à la stratégie des systèmes d'information de santé au ministère des affaires sociales et de la santé, et par moi-même, a été mise en place en novembre dernier, en lien avec Etalab. Cette commission, qui remettra ses conclusions en avril, réunit des représentants des patients, des producteurs de données, des industriels, des juristes... Ses travaux s'organisent selon deux axes : le premier concerne l'open data, c'est-à-dire les données anonymes et ouvertes à tous, tandis que le second porte sur les conditions dans lesquelles il est possible d'accéder aux données présentant un risque de ré-identification. Bien entendu, la frontière entre ces deux types de données n'est pas toujours très simple à établir, et nous travaillons à rendre le plus de données possibles parfaitement anonymes, le cas échéant en les appauvrissant quelque peu.

S'il serait prématuré d'exposer dès aujourd'hui les conclusions de ces travaux, il m'est possible de vous présenter quelques principes sur lesquels une convergence de vues paraît se dégager. En premier lieu, tout le monde reconnaît qu'il est nécessaire d'ouvrir largement l'accès aux données de santé. Il s'agit là d'un gage de transparence sur le système de santé, qui permet de renforcer la capacité des patients de faire des choix éclairés, et d'améliorer la sécurité sanitaire et l'efficience médico-économique, mais aussi d'un gage d'innovation lorsque les données sont réutilisées par des acteurs privés. Les participants s'accordent ensuite à reconnaître que si le risque de ré-identification n'est pas négligeable, il ne doit pas nous empêcher d'agir. Nous travaillons d'ailleurs actuellement sur l'anonymisation la plus large possible des données du PMSI ; il s'agit de faire en sorte que les croisements de variables concernent toujours plusieurs personnes afin qu'aucun usager ne puisse être identifié individuellement à partir d'une seule information. Il existe cependant des écarts d'appréciation entre les membres de la commission quant au degré du risque de ré-identification. En troisième lieu, nous considérons que l'accès aux données de santé doit être facilité, ce qui suppose de renforcer dans le même temps la traçabilité des accès et les contrôles ex post, ainsi que les sanctions pénales. A l'heure actuelle, les contrôles visant à vérifier que les données ont bien été utilisées conformément à la demande initiale et que les extractions ont été détruites après utilisation, conformément aux exigences de la Cnil, sont très faibles. Il faut également garantir des délais courts d'instruction des demandes : dans un contexte de crise sanitaire par exemple, les équipes de chercheurs ont besoin d'accéder le plus vite possible aux bases de données. Nous souhaitons également faciliter les appariements de données entre celles qui sont issues de systèmes d'information publics et celles qui ont été collectées par les chercheurs eux-mêmes auprès d'une cohorte de patients. A l'heure actuelle, un tel appariement est juridiquement très compliqué. Il faut en outre accroître la mise à disposition des informations sur les professionnels de santé et les établissements, notamment s'agissant de l'activité, des tarifs, et peut-être même de la qualité des soins. Il existe sur ce point une attente forte des patients, les professionnels de santé rappelant cependant que ces orientations ne sauraient être définies que dans un cadre concerté. Il convient enfin d'améliorer la gouvernance d'ensemble du système. Il est nécessaire de disposer d'un lieu de surveillance générale qui rassemble l'ensemble des acteurs impliqués, qui doivent pouvoir peser sur l'évolution de ces questions. De ce point de vue, la création de l'IDS a été très utile pour faire progresser le partage et la connaissance et pour permettre aux parties prenantes d'exprimer leurs attentes. Il est cependant sans doute nécessaire d'insister aujourd'hui sur la surveillance des usages des données de santé. Il faut également davantage de transparence de la part des gestionnaires des données, notamment l'assurance maladie. Nous nous efforçons par ailleurs de susciter une demande nouvelle de données, dont la formalisation n'est pas toujours aisée ; il nous faut pour cela connaître à la fois les données potentiellement accessibles et les usages qui peuvent en être faits, afin de favoriser une construction partenariale de l'open data entre les producteurs de données et leurs utilisateurs.

A côté de cette commission, divers chantiers techniques ont été lancés à la suite de la remise du rapport Bras. L'un d'entre eux, que j'ai déjà évoqué, porte sur l'anonymisation des bases de données. Un autre, en lien avec le SGMAP et l'assurance maladie, concerne l'adaptation du Sniiram à la demande nouvelle de données. Si ce système n'a pas été créé à l'origine à des fins de recherche ou d'étude, il est possible de le faire évoluer, ce qui exigera des investissements financiers. Nous travaillons enfin à la transcription de ces orientations dans la future loi de santé publique annoncée par la ministre.

De nombreux progrès ont été accomplis ces dernières années et il ne faut pas sous-estimer la qualité des données de santé déjà ouvertes aujourd'hui. La France apparaît même en pointe sur ces questions par comparaison avec les pays étrangers. Mais il reste des marges de progrès et le ministère porte des ambitions fortes sur ce sujet.

Mme Corinne Bouchoux, rapporteure. - Nous changeons donc de paradigme en passant d'une logique de compilation de données à des fins de gestion à la mise à disposition des données utilisables dans le cadre de travaux de recherche, et qui pourront dès lors être utiles à la prévention. Des affaires comme celle du Mediator n'ont-elles pas accéléré la prise de conscience de la potentielle utilité de données statistiques de santé ? Que pensez-vous de l'ergonomie de l'application permettant en théorie de consulter les avantages perçus par les professionnels de santé ? Vous avez évoqué la mise en place d'un Haut conseil des données de santé qui serait placé sous l'égide du ministère en charge de la santé - tandis que l'IDS, créé en 2007, est un groupement d'intérêt public (GIP) indépendant. Pouvez-vous nous expliquer ce choix d'une gouvernance interne ?

M. Franck Von Lennep. - Des affaires comme celle du Mediator ont en effet accéléré cette prise de conscience. Il est à noter qu'elles ont été concomitantes à la montée en charge de la base appariée Sniiram-PMSI, qui existe depuis 2009-2010 : les études réalisées à ce moment-là par la Cnam n'auraient pas été possibles quelques années auparavant. D'une certaine façon, ces événements ont montré que, dès lors qu'on dispose des données nécessaires à la mise en évidence de tels dangers, il devient criminel de ne pas les utiliser.

Les données relatives aux relations entre les professionnels de santé et les laboratoires ne relèvent pas strictement du champ des données de santé. Etalab pourra sans doute vous en dire davantage sur ce point. Elles posent en tous cas la double question juridique et technique de la mise à disposition de données publiques et de la facilité de leur utilisation par les usagers.

Un Haut conseil des données de santé placé sous l'égide du ministre de la santé n'est pas un modèle atypique. Le terme d'« égide » est d'ailleurs sans doute impropre : il s'agit seulement d'exprimer le rattachement des moyens de ce Haut Conseil au ministère en charge de la santé. Pour autant, sa présidence, son fonctionnement et son programme de travail doivent être totalement indépendants, comme c'est le cas par exemple pour le Haut conseil pour l'avenir de l'assurance maladie (Hcaam), même s'il est dans l'orbite du CGSP (commissariat général à la stratégie et à la prospective). Il reste que cet organisme, chargé d'une mission de surveillance, ne prendrait aucune décision quant à l'accès aux données. Les décisions opérationnelles relatives aux bases continueraient d'être prises par leurs gestionnaires. La définition d'une doctrine sur l'accès relèverait quant à elle soit du ministère de la santé, soit de la Cnil : on imagine mal que le régime de l'accès à des données potentiellement ré-identifiantes puisse être défini par des sociétés privées. Cet organisme aurait en somme vocation à réunir l'ensemble des parties prenantes, notamment pour permettre aux patients de faire entendre leurs voix, et à formuler des recommandations.

M. André Loth. - L'ergonomie de l'accès à certaines données nominatives relatives aux professionnels de santé concernant leurs relations avec les laboratoires est un sujet important, car il peut concerner d'autres situations. Les conditions de mise à disposition de ces données, à travers des fichiers en format pdf, ne permettent par leur réutilisation par des outils informatiques. Cela renvoie à l'article 13 de la loi portant création de la Commission d'accès aux documents administratifs (Cada), qui prévoit qu'une information rendue publique n'a pas nécessairement vocation à être utilisée par d'autres acteurs si la personne n'a pas donné son consentement, si l'information n'a pas été rendue anonyme, ou s'il n'existe pas de texte qui l'autorise. J'ai pris connaissance de cet article alors que se posait la question de la réutilisation des données relatives au tarif moyen par acte des professionnels de santé, sur laquelle s'est prononcée la Cada, et j'avoue que j'en ai été surpris. Si un texte est nécessaire pour la réutilisation de ces données, adoptons-le donc ! Nous faisons davantage face à un vide juridique qu'à un problème technique d'ergonomie, dans la mesure où la protection par le format pdf est en réalité toute relative. Cet article 13 se justifie cependant dans les cas où une information a été rendue publique dans le cadre d'une condamnation par une instance ordinale ou une juridiction pénale, en application du droit à l'oubli.

L'IDS s'est vu attribuer deux fonctions par la loi de 2004 à l'origine de sa création : une fonction d'expression des acteurs, que nous avons considérée comme indispensable dans le rapport Bras, et qui devrait être poursuivie par le Haut Conseil dont nous préconisons la mise en place ; une fonction d'échange de données, que l'on a pu présenter à travers la notion de réciprocité, et contre laquelle notre rapport a pris position. Si une donnée est publique et anonyme, alors elle doit être ouverte à tous, sans condition d'échange.

M. Jean-Jacques Hyest, président. - La possibilité de ré-identification des personnes m'apparaît comme un réel problème, qui devrait sans doute faire l'objet de dispositions législatives. Il est indispensable de protéger les données personnelles. Comment peut-on être absolument sûr que toute possibilité d'identification est écartée ? Il me semble qu'il existe toujours une marge d'incertitude...

M. André Loth. - Nous avons exposé dans le rapport un exemple qui nous a paru particulièrement inquiétant. 342 extractions de la base PMSI ont été diffusées l'année dernière à des organismes divers qui en ont fait la demande, pour des finalités déterminées et avec l'engagement de détruire ces données après quelques années. Il est cependant très difficile d'effectuer un contrôle sur ce point : vérifier que quelque chose n'existe plus est pratiquement infaisable. Il est en revanche très aisé de retrouver une personne dans la base à partir de certaines informations ou d'un événement médical déterminé, comme par exemple un accouchement - qui n'a rien de confidentiel dès lors que l'on envoie des faire-part - et de reconstituer son parcours médical, puisque les informations sont chaînées. Un tel risque, qui ne concerne pas que les personnalités connues, ne peut pas être pris. Certaines personnes mal intentionnées pourraient en tirer parti.

Comprenons-nous bien : il ne faut pas interdire l'accès à ces données, qui doivent pouvoir être utilisées dans un cadre relativement restrictif. Il est nécessaire de limiter les accès et que ceux-ci soient tracés. En matière fiscale, des techniques permettent de limiter la diffusion de certaines données, sans en restreindre l'accès : il existe un accès sécurisé et traçable permettant d'éviter que les données puissent être librement copiées. Ces techniques sont relativement peu coûteuses et pourraient parfaitement être transposées dans le secteur de la santé.

Mme Corinne Bouchoux, rapporteure. - Avez-vous connaissance de faits précis qui fondent vos inquiétudes ?

M. André Loth. - Vous connaissez la célèbre réplique « Jusqu'ici, tout va bien... ». Nous n'en avons pas connaissance pour le moment, mais on ne peut exclure qu'il existe des usages malveillants qui n'auraient pas été rendus publics. Il y a des curiosités parfois malsaines : nous savons que le dossier médical de M. Schumacher a été consulté à plusieurs reprises à l'intérieur de l'hôpital de Grenoble. En tout état de cause, nous considérons que l'on ne peut pas continuer à prendre de risques.

Mme Hélène Lipietz. - L'accouchement est une donnée personnelle, même si des faire-part sont envoyés ! On peut ne pas vouloir en avertir tout le monde.

L'agence régionale de santé (ARS) d'Ile-de-France a récemment regretté l'absence d'un fichier sur les cancers, qui existe dans d'autres pays, ce qui nourrit de nombreux fantasmes sur un lien supposé entre l'augmentation de la prévalence des cancers et la présence d'installations industrielles dans certaines régions. Pensez-vous que d'autres fichiers de ce type aujourd'hui manquants pourraient être utiles ?

M. André Loth. - Sans doute de nombreux tableaux statistiques n'existent-ils pas encore et il reste donc du travail à accomplir à la Drees et aux chercheurs. Sur les cancers en particulier, il existe à ma connaissance des registres qui ne sont sans doute pas aussi généralisés qu'ils devraient l'être. Le PMSI fournit notamment des données sur la prévalence des cancers et il me semble que l'on dispose de certaines données pour suivre leur évolution. Il faut cependant souligner qu'il existe des biais statistiques, notamment liés au dépistage et au suivi de la maladie, qui rendent de telles études parfois difficiles.

M. Franck Von Lennep. - Il faudrait interroger l'Institut national de veille sanitaire sur ce point. Dans tous les cas, si un manque apparaît, il faut que la demande puisse s'exprimer et que les producteurs de données se donnent les moyens d'y répondre. C'est tout le sens du travail de la commission que j'anime actuellement.

M. René Garrec. - J'ai été confronté à cette même question à La Hague. Il est d'ailleurs très difficile d'y répondre sans individualiser les dossiers.

M. André Loth. - J'aimerais apporter une précision sur le régime de l'accès aux données de santé. Nous sommes tous conscients que l'on ne peut laisser en libre accès des informations indirectement nominatives et qu'il faut donc sélectionner le nombre et la qualité des personnes qui y accèdent. Nous proposons qu'il soit distingué entre les organismes dont la mission permanente implique l'utilisation des données du Sniiram et du PMSI, et ceux pour lesquels cette utilisation est associée à un projet plus ponctuel. Nous considérons ainsi que l'Agence nationale de sécurité du médicament et des produits de santé (ANSM) ne peut pas ne pas avoir accès à ces données, qui plus est après l'affaire du Mediator. Certains des collaborateurs de ces organismes pourraient ainsi être habilités à accéder aux bases de données, sous le contrôle ex post de la Cnil. Dans la plupart des autres cas, un contrôle ex ante de la Cnil, instruit par des experts - c'est l'objet du CCTIRS -, pourrait être conservé, en prévoyant une possibilité d'examen très rapide en cas d'urgence. Nous n'excluons pas que puissent exister des accès permanents dans ce deuxième cas de figure : les chercheurs qui travaillent sur la cohorte Constance ont ainsi fréquemment besoin d'accéder aux données du Sniiram afin de les apparier avec les données qu'ils ont collectées, mais il s'agit bien d'un projet qui devra passer par la voie classique du contrôle ex ante de la Cnil.

M. Jean-Jacques Hyest, président. - Nous vous remercions.

Audition de MM. Christian BABUSIAUX, président, et Richard DECOTTIGNIES, directeur, de l'Institut des données de santé (IDS) (jeudi 6 mars 2014)

M. Jean-Jacques Hyest, président. - Nous accueillons maintenant MM. Christian Babusiaux et Richard Decottignies, respectivement président et directeur de l'Institut des données de santé (IDS). Monsieur Babusiaux, après une carrière à la Cour des comptes entrecoupée de longs passages dans les administrations centrales, vous êtes aujourd'hui président de chambre à la Cour et président de l'IDS. Pourriez-vous rappeler le rôle de l'Institut ; décrire les modalités de collecte, d'exploitation et de partage des données de santé par et entre les différents organismes intéressés ; indiquer les demandes d'accès dont l'IDS est saisie et la manière dont celles-ci sont traitées, le cas échéant avec l'intervention de la Cada ; les raisons justifiant des restrictions à l'accès aux données, par exemple vis-à-vis de l'Institut national de la santé et de la recherche médicale (Inserm), des journalistes, et, jusqu'à récemment, les agences régionales de santé (ARS) ; présenter la politique d'offre de données de l'IDS ; décrire les enjeux de l'exploitation raisonnée des données publiques de santé et les conditions de développement de leur réutilisation ; préciser les usages qu'il vous paraîtrait pertinent de développer et comment doit s'organiser la gouvernance de ces données, notamment entre la Caisse nationale d'assurance maladie (Cnam) et les mutuelles ?

M. Christian Babusiaux, président de l'Institut des données de santé (IDS). - Il existe des attentes et des besoins légitimes de la part de la société civile et des chercheurs en matière de données de santé. Comment faire de la recherche ou de la veille sanitaire sans données ? Les ARS ont besoin de données sur les territoires, par exemple pour élaborer les projets régionaux de santé. Les patients réclament des informations sur les soins qui leur sont dispensés et sur les parcours de soins.

Beaucoup de craintes portent sur le respect de la vie privée, alors que ce que l'on appelle le big data est en pleine expansion. Dans tous les domaines, des acteurs captent, traitent ou revendent de grandes quantités de données, par exemple à travers les réseaux sociaux. Ce phénomène est potentiellement intrusif ; mais gardons-nous d'une vision uniquement négative. Notre système pourra y gagner en efficacité : l'appareil de veille sanitaire, actuellement très en retard, devra apprendre à l'avenir à utiliser des masses de données et à y déceler des indicateurs afin d'opérer des repérages très en amont.

L'open data relève d'une toute autre logique : il s'agit d'ouvrir l'accès à des bases de données déjà constituées. Celui-ci comporte deux composantes : l'open data proprement dit, qui peut concerner, par exemple, les données météorologiques ou le trafic de la RATP, et qui n'emporte pas de difficultés quant à la protection de la vie privée ; un open data régulé, dont font partie les données de santé, et qui recouvre des données que l'on ne peut ouvrir à tous pour des raisons de sécurité. C'est dans ce dernier champ qu'intervient l'IDS, sur des données anonymisées.

L'IDS a été créé par la loi de santé publique de 2004 et effectivement mis en place en 2007. Il s'agit d'un groupement d'intérêt public (GIP) qui regroupe treize acteurs majeurs du domaine de la santé : l'Etat, l'assurance maladie, les fédérations hospitalières, les associations de patients, les organismes complémentaires, les professionnels de santé, la caisse nationale de solidarité pour l'autonomie (CNSA)... Il a été constitué comme une instance de régulation.

La première base de données constituée a été le registre des décès. Ont ensuite été mis en place le PMSI puis le Sniiram, qui n'est en réalité vraiment opérationnel que depuis 2011-2012. Depuis 2012, les données relatives aux soins hospitaliers et aux soins de ville sont chaînées au sein du Sniiram et il est, en théorie, possible de suivre les événements de santé et les parcours de soins de l'ensemble des Français. D'autres bases sont en cours de constitution, comme celle sur le handicap par la CNSA, ou le projet Monaco, qui consiste en un chaînage entre les données de remboursement par l'assurance maladie obligatoire et les complémentaires santé.

Deux modalités d'accès aux données de santé doivent être distinguées. L'extraction consiste pour la Cnam à confectionner un jeu de données répondant à une demande précise, émanant par exemple d'un chercheur, après que l'IDS a donné son accord. Un accès direct aux données, sans intervention de la Cnam, est ouvert à certains acteurs.

Le Sniiram comprend plusieurs entrepôts de données. L'échantillon généraliste des bénéficiaires (EGB) est assez largement ouvert aux membres de l'IDS, contrairement aux données de consommation inter-régimes (DCIR), qui couvrent l'ensemble des données individuelles. Ce deuxième entrepôt est fondamental pour la recherche et le pilotage du système de santé, un échantillon, même s'il comprend 650 000 personnes, ne pouvant suffire à rendre compte d'un univers aussi complexe que celui de la santé. C'est pourquoi l'ouverture de l'échantillon ne peut évacuer la question de l'accès au DCIR, qui est encore insuffisant.

Notre premier combat a été de faciliter l'accès des autorités sanitaires  au DCIR : l'Institut national de veille sanitaire (InVS), la Haute autorité de santé (HAS), l'Agence nationale de sécurité du médicament (ANSM) ont besoin d'un suivi fin. Nous avons obtenu que la HAS et l'ANSM, en dernier lieu par un arrêté d'août 2013, puissent accéder par elles-mêmes à cette grande base de données. On note donc des progrès, mais il reste encore beaucoup à accomplir. L'accès à ces données par les organismes de recherche publique (le CNRS, l'INRS, les équipes des CHU...) est un deuxième grand chantier. Nous avons franchi une étape importante en obtenant des extractions pour les CHU. Mais le délai de transmission des données, qui atteint quatorze ou quinze mois en pratique, est encore trop important par rapport aux enjeux de la recherche, même si l'on n'en est plus aux deux ans de naguère. Il serait souhaitable que la recherche publique puisse accéder directement aux DCIR ; un simple arrêté suffirait pour ce faire.

S'agissant de la gouvernance des bases de données de santé, deux aspects doivent être distingués. En premier lieu, la gestion des bases par la Cnam et l'agence technique de l'information sur l'hospitalisation (Atih) est bonne, et il me semble qu'elles sont administrées par les organismes qui ont vocation à le faire. S'agissant, d'autre part, de la régulation des accès, le législateur avait été sage en prévoyant dans la loi de 2004 la mise en place de l'IDS comme un régulateur chargé de veiller à la qualité des bases, à leur développement et à leur accès. Il avait antérieurement prévu, dans la loi de financement de la sécurité sociale de 1998, un système de gestion opérationnelle du Sniiram reposant sur des arrêtés et l'intervention d'un comité rassemblant l'assurance maladie, l'Etat et les professions de santé. Le législateur avait donc prévu une distinction entre la gestion et la régulation ou la gouvernance des bases ; mais la pratique n'a pas été conforme à cette volonté initiale. Le comité de pilotage inter-régimes du Sniiram (Copiir) a étendu son attribution de gestion à un contrôle du droit d'accès, ce qui s'explique par l'antériorité de son existence par rapport à l'IDS. La pratique a fait du Copiir un verrou d'accès. Alors qu'il est prévu qu'il se réunisse au moins deux fois par an, il ne le fait qu'épisodiquement, à tel point qu'il ne s'est pas réuni depuis un an. Pendant ce temps, les demandes des CHU et de l'Inserm, qui ont été formulées il y a dix-huit mois, attendent toujours... C'est autant de temps de perdu pour la recherche et pour les patients ! Un arrêté suffirait pourtant à autoriser l'accès de ces acteurs. La situation ne pourrait être que simplifiée si les seuls acteurs intervenant dans ce processus étaient l'IDS et le ministre en charge de la santé, que l'on voit mal s'opposer à une telle demande. Il convient de revenir à la simplicité de la séparation des fonctions voulue par le législateur.

Il faut fixer le cap d'une ouverture maîtrisée et raisonnée des bases de données de santé et avancer résolument et rapidement, sans s'encombrer de faux débats comme celui sur la possible ré-identification des personnes, car des moyens techniques existent pour la prévenir.

M. Jean-Jacques Hyest, président. - L'accès aux données de santé, que ce soit par la voie de l'extraction ou de l'accès direct, a un coût. La longueur des délais de transmission des données s'explique peut-être par un problème de moyens. Quant à l'accès direct, il faudra que les organismes concernés disposent des moyens adéquats.

M. Christian Babusiaux. - Ce point doit en effet être considéré. Le délai mis par la Cnam pour transmettre une extraction de données s'explique par plusieurs facteurs. Les chercheurs doivent expliquer aux gestionnaires de la base, qui ne sont pas eux-mêmes chercheurs, de quoi ils ont besoin, ce qui peut être très complexe ; un circuit court, avec un accès direct, permettrait de réduire les délais et les coûts. Ce délai s'explique également par un engorgement de la Cnam face aux dizaines de demandes formulées - ce qui n'est rien par rapport aux demandes qui devraient exister demain ! Il faut supprimer cet embouteillage, ce qui suppose que les acteurs qui ont la possibilité technique d'accéder directement aux bases puissent y accéder eux-mêmes, l'extraction étant réservée aux utilisateurs plus occasionnels, qui n'ont pas la possibilité de former spécifiquement certains de leurs personnels à cette fin. Il est à noter que le coût n'est pas rédhibitoire pour les demandeurs : il suffit qu'une ou deux personnes soient formées, ce qui est tout à fait réalisable au sein des équipes de recherche des CHU ou encore de l'Inserm.

Mme Corinne Bouchoux, rapporteure. - La situation est paradoxale. Nous disposons de la meilleure base de données au monde, nous dit-on, mais les chercheurs accèdent difficilement aux informations dont ils ont besoin. Avez-vous alerté la ministre de ces difficultés ? Les retards constatés dans l'accès aux données ne créent-ils pas un risque de contentieux, sachant que de 5 000 à 10 000 décès par an sont dus à des utilisations croisées de médicaments dont un médecin devrait savoir qu'elles sont inappropriées ? Compte tenu de ce qui nous a été indiqué tout à l'heure sur la création d'un Haut conseil des données de santé, ne faut-il pas craindre l'existence parallèle de deux instances compétentes en matière d'accès aux données, qui ne communiqueraient pas entre elles ? Enfin, étant donnée la fluidité des parcours professionnels, certaines personnes ne risquent-elles pas de se retrouver dans une situation difficile si elles ont eu connaissance de données de santé sensibles dans une fonction antérieure ?

M. Christian Babusiaux. - Il va de soi que nous avons alerté tous les niveaux de l'Etat, dont des représentants siègent d'ailleurs à l'IDS.

L'accès différé aux données présente d'abord un risque pour la santé publique. Un risque contentieux existe également. En novembre, un collectif avait demandé l'accès à des données de consommation du Mediator ne comportant pas d'informations nominatives et personnelles. La Cnam ayant refusé d'extraire ces données, il s'est adressé à la Cada, qui a demandé à la Cnam de les fournir le 21 novembre dernier. Le directeur général de la Cnam a d'abord refusé, puis, après notre intervention, a fini par accepter de fournir certaines des données demandées. Il y aurait donc pu y avoir un contentieux si la Cnam n'avait pas fini par accéder à cette demande.

Une autre source de contentieux réside dans l'illégalité de l'arrêté pris sur la base du projet de loi de financement de la sécurité sociale de 1998, car il va au-delà des intentions du législateur en donnant un pouvoir de verrou au Copiir avant même l'intervention du ministre. D'autres contentieux pourraient être portés devant l'Autorité de la concurrence.

Vous évoquiez la possibilité qu'un millefeuille d'organismes soit en cours de création dans le domaine des données de santé. La priorité aujourd'hui est de simplifier l'accès pour les équipes de recherche et de prendre des décisions, non de créer de nouvelles structures ou comités Théodule dont il n'est nullement besoin et qui ne pourront que compliquer la situation. Il faudrait simplement respecter la volonté du législateur. J'ai presque scrupule à vous encombrer de questions aussi simples... Il y a urgence : le temps perdu représente autant de chances perdues pour la santé des patients.

M. Jean-Jacques Hyest, président. - Le directeur de la Drees et l'un des auteurs du rapport Bras ont préconisé la création d'une nouvelle haute autorité en matière de données de santé. De votre point de vue, cette nouvelle structure n'est donc pas nécessaire ?

M. Christian Babusiaux. - Je ne suis pas le seul à être de cet avis. Aucun acteur de la société civile ne réclame la création d'un haut conseil, dont je ne vois pas du tout la nécessité. L'univers de la santé est plein de hauts conseils : on en connaît les limites. Le législateur a confié à l'IDS un double rôle de réflexion et opérationnel ; on ne peut déconnecter ces deux aspects.

Vous avez rappelé mes fonctions à la Cour des comptes... Ne vous étonnez pas que je ne sois pas favorable à la création de nouveaux comités Théodule. Le Premier ministre se préoccupe d'ailleurs davantage d'en supprimer que d'en créer.

Mme Corinne Bouchoux, rapporteure. - S'agissant des risques de ré-identification des personnes dans les bases de données de santé, avez-vous eu connaissance de dérives avérées au cours des dernières années?

M. Christian Babusiaux. - Le PMSI est ouvert avec autorisation de la Cnil - qui constitue d'ailleurs déjà une haute autorité... Je n'ai pas connaissance qu'il y aurait eu des dérapages dans l'utilisation de cette base. Des problèmes ont en revanche été constatés quant à l'accès à des dossiers papier qui circulent au sein des hôpitaux ou dans certains cabinets médicaux. Il ne faut pas surestimer les problèmes. Il existe des techniques simples d'anonymisation permettant d'éviter toute ré-identification, reposant sur des algorithmes aléatoires. Certaines données sensibles, comme la date de naissance ou le code postal, qui ne sont sans doute pas essentielles à la recherche, peuvent par ailleurs être rendues moins précises lorsqu'elles sont transmises : il est aisé de supprimer le jour de naissance pour ne conserver que le mois, de ne faire figurer qu'un code postal large. Un autre moyen pour éviter toute ré-identification repose sur le seuil quantitatif des patients d'un échantillon.

Mme Catherine Procaccia. - Il y a eu dans ma commune des suspicions de cancers pédiatriques ; nous avons créé des cohortes pour suivre les enfants. Comment le suivi de ces données est-il organisé ? Je me suis intéressée aussi aux incidences sanitaires de la chlordécone aux Antilles. Comment la veille sanitaire se déroule-t-elle et quel est le régime d'accès aux données concernées ?

M. Christian Babusiaux. - Le régime d'accès à de telles données est différent selon qu'est concerné un chercheur isolé ou l'InVS. Un arrêté ministériel autorise l'InVS et ses antennes dans les régions à accéder au Sniiram ; encore faut-il qu'il s'équipe pour ce faire et s'empare de la possibilité qui lui est ainsi ouverte. Les équipes de recherche isolées doivent s'adresser à nous et demander une extraction auprès de la Cnam. La constitution de cohortes suppose un suivi plus important dans le temps de la part des chercheurs. Il est très important de pouvoir apparier les données ainsi collectées avec celles des bases de l'assurance maladie pour en faire un outil de veille sanitaire efficace.

M. Jean-Jacques Hyestprésident. - Merci pour cette contribution extrêmement instructive, précise et intéressante.

Audition conjointe de MM. Frédéric VAN ROEKEGHEM, directeur de la Caisse nationale d'assurance maladie des travailleurs salariés (Cnam), Jean DEBEAUPUIS, directeur général de la Direction générale de l'offre de soins (DGOS) et Housseyni HOLLA, directeur de l'Agence technique de l'information sur l'hospitalisation (Atih) (jeudi 6 mars 2014)

M. Jean-Jacques Hyest, président. - Pourriez-vous nous rappeler les statuts et missions des organismes que vous dirigez ; décrire les modalités actuelles de la collecte et de l'exploitation des données de santé, en précisant notamment quels acteurs y ont accès et selon quels critères ; exposer les précautions particulières qui doivent accompagner l'utilisation et la mise à disposition de ces données ; décrire, le cas échéant, les travaux en cours pour ouvrir davantage l'accès à ces données, conformément à l'orientation fixée par la Stratégie nationale santé, et présenter la politique d'offre de données de santé à destination du grand public, notamment au travers du site Ameli.fr ? Quelle évolution de la gouvernance des données de santé pourrait être envisagée ? Quelles raisons justifient les restrictions à l'accès à ces données pour les différents acteurs qui y seraient intéressés ? Quels usages des données de santé pourraient contribuer à améliorer l'efficacité du système de soins ? Enfin, quelles sont les limites de la mise à disposition de données par l'outil Ameli.fr ?

M. Frédéric Van Roekeghem, directeur de la Caisse nationale d'assurance maladie des travailleurs salariés (Cnam). - Le sujet des données de santé est complexe et très important tout à la fois, puisque l'assurance maladie détient des données sensibles portant sur l'ensemble de la population française. Cette question doit dès lors donner lieu à un débat approfondi pour en examiner tous les aspects et en mesurer tous les enjeux.

Le système national d'information inter-régimes de l'assurance maladie (Sniiram) a été créé par la loi de financement de la sécurité sociale pour 1999. Cette base de données nationale poursuit quatre grandes finalités définies par le code de la sécurité sociale : améliorer la qualité des soins, contribuer à une meilleure gestion de l'assurance maladie, contribuer à une meilleure gestion des politiques de santé et transmettre aux prestataires de soins des informations pertinentes relatives à leur activité et leurs recettes, et, s'il y a lieu, à leurs prescriptions. Il s'agit d'un entrepôt de données anonymes, collectées à partir des informations dont disposent les différentes caisses de remboursement de l'assurance maladie obligatoire. Il comprend les données relatives à toutes les prestations remboursées dispensées en médecine de ville et par les praticiens libéraux en établissements de soins, ainsi qu'à la consommation de soins en établissement. Il fait apparaître certaines caractéristiques anonymisées des patients tels que l'âge, le sexe, le bénéfice de certaines prestations sociales comme la couverture maladie universelle (CMU), la commune et de département de résidence, éventuellement le diagnostic d'affection et, depuis une date plus récente, la date de décès.

L'intérêt de cette base de données pour l'analyse du système de soins a été fortement augmenté depuis qu'a été mis en place en 2009 leur chaînage avec celles du PMSI - les mêmes algorithmes d'anonymisation étant utilisés par l'Atih et par la Cnam - et depuis qu'a été intégrée la date de décès à partir des données de l'Insee. Nous disposons ainsi d'une base extrêmement riche ; celle-ci a par exemple permis de réaliser deux études (dites Cnam 1 et Cnam 2) sur le risque de valvulopathie attaché à l'utilisation du Mediator, qui ont conduit aux décisions de retrait de l'ANSM.

Le Sniiram n'est pas une base de données fermée et inaccessible, contrairement à l'idée erronée que l'on voit parfois courir dans la presse. Il fait l'objet de trois ensembles de restitutions : 15 bases de données agrégées thématiques, un échantillon général de bénéficiaires (EGB) au centième de la population, et enfin la base de données individuelles elle-même qui retrace les données de consommation inter-régimes (DCIR). 71 types d'organismes ont aujourd'hui accès à certains de ces niveaux de restitution du Sniiram : 64 d'entre eux ont accès aux données agrégées et à l'EGB et 6 à la totalité du DCIR, moyennant certaines précautions exigées par la Cnil. Par ailleurs, depuis 2009, 35 extractions de données de cohorte ont été réalisées à des fins de recherche.

L'accès au Sniiram intégral est ouvert aux caisses d'assurance maladie, à la Caisse nationale de solidarité pour l'autonomie (CNSA), à l'Institut national de veille sanitaire (InVS - qui, compte tenu de ses missions particulières de prévention des épidémies, bénéficie de privilèges particuliers et a accès à des données indirectement réidentifiantes avec l'accord de la Cnil), à l'ANSM, à la Haute Autorité de santé (HAS) et, depuis l'adoption d'une disposition législative et la prise d'un récent arrêté,  aux agences régionales de santé (ARS). Les ministères en charge de la santé, de la sécurité sociale et des finances et les services déconcentrés y ont également accès, ainsi que le Haut Conseil pour l'avenir de l'assurance maladie (Hcaam), l'Agence nationale de biomédecine, l'Institut national du cancer (Inca), l'Atih, l'Institut national de la santé et de la recherche médicale (Inserm), le Centre national de la recherche scientifique (CNRS), l'Institut de recherche et de documentation en économie de la santé (Irdes), le Centre technique d'appui et de formation des centres d'examen de santé (Cetaf), le Fonds CMU, l'Observatoire des drogues et des toxicomanies (OFDT), l'Institut des données de santé (IDS), l'Union nationale des organismes d'assurance maladie complémentaire (Unocam) et, plus récemment, ses fédérations constitutives, les fédérations hospitalières et leurs établissements membres (avec un accès plus limité pour ces derniers), le collectif interassociatif sur la santé (Ciss) ainsi que ses associations adhérentes (avec de même un accès restreint pour ces dernières), l'Union nationale des professions de santé (UNPS), les syndicats de professionnels libéraux membres de l'UNPS, les unions régionales de professions de santé (URPS).

En pratique, un certain nombre de ces organismes n'accèdent cependant pas au Sniiram, notamment parce qu'ils ne disposent pas des structures qui leur permettraient d'exploiter ces données - ou qu'ils n'ont pas souhaité s'organiser pour ce faire. En 2013, ont ainsi été non actifs le Hcaam (pour lequel nous réalisons des extractions sur demande), le CNRS, le Fonds CMU, le Cetaf, l'Unocam, les fédérations hospitalières et leurs établissements membres (à l'exception du cas des données de cohortes de santé publique), le Ciss et ses associations adhérentes, les URPS.

Le régime de l'accès aux données du Sniiram est strictement encadré. Il a d'abord été encadré par la loi de financement de la sécurité sociale (LFSS) pour 1999, qui a prévu que les accès sont définis par un protocole passé entre les régimes d'assurance maladie et approuvé par arrêté après avis de la Cnil. Le protocole historique datant des années 2000 a mis en place un comité de pilotage, dit Copiir, associant l'Etat (ce qui n'était pas initialement prévu par le législateur), les régimes d'assurance maladie et l'UNPS, et qui a pour rôle de proposer les évolutions qui doivent ensuite être fixées par arrêté.

On constate depuis 2002 un mouvement d'élargissement continu des organismes habilités à accéder au Sniiram. Le premier arrêté autorisant l'accès au Sniiram, en date du 11 avril 2002, a été largement complété par sept arrêtés successifs, le dernier en date étant celui qui a ouvert l'accès aux ARS. Une modification substantielle de l'accès aux données de santé est venue de la loi du 9 août 2004 avec la création de l'IDS, qui a été intégré au dispositif d'accès au Sniiram et au comité de pilotage par un arrêté du 20 juin 2005. Ont ainsi été prévus l'accès aux données du Sniiram pour les membres de l'IDS ainsi que la possibilité d'accéder à un datamart, à l'EGB ou à un traitement ad hoc pour des organismes à but non lucratif, pour une durée temporaire et sur le fondement d'un projet déterminé, après approbation de l'IDS et avis de la Cnil. Dans ce cadre, la Cnam réalise des extractions sous réserve de l'accord de la Cnil et dans le cadre d'une convention de cession de données.

Plusieurs principes président ainsi à la transmission de données du Sniiram. Sauf exception prévue par arrêté, les organismes à but lucratif n'ont pas accès à ces données. Les accès sont autorisés par la Cnil en tenant compte des risques de réidentification des personnes, notamment de façon indirecte à travers des croisements de données, ainsi que de l'adéquation des données transmises aux missions de l'organisme qui en fait la demande. Le principe de précaution est décliné à plusieurs niveaux : il est tenu compte à la fois du niveau d'agrégation et de l'échantillonnage des données, de leur périmètre (national ou régional, par exemple), ainsi que de la nature particulièrement sensible de certaines données définies comme telles par la Cnil lors de la mise en place du Sniiram. Il me semble que la définition des données sensibles devrait aujourd'hui évoluer pour tenir compte de l'enrichissement du Sniiram et des évolutions technologiques. Il existe une protection physique de haut niveau des données par un système d'identifiant et de mot de passe qui permet de garantir que seules les personnes habilitées y accèdent ; l'un des enjeux majeurs de la diffusion des données réside dans la possibilité de tracer et d'auditer les accès.

A côté du Sniiram, d'autres données concernant les professionnels et les établissements de santé sont mises à disposition par la Cnam sur son site internet. Le service ameli-direct fournit des informations sur l'adresse et les tarifs des professionnels ainsi que sur les indicateurs de qualité mesurés par la HAS s'agissant des établissements de soins. Ces données, non anonymes, sont considérées comme des données à caractère personnel au sens de la loi du 6 janvier 1978. Nous les diffusons au grand public au titre d'une autorisation spécifique ouverte par la loi du 9 août 2004 et codifiée à l'article L. 162-1-11 du code de la sécurité sociale, qui donne pour mission aux caisses d'assurance maladie de fournir « tous éléments d'information sur les tarifs d'honoraires habituellement demandés et toutes informations utiles à la bonne orientation du patient dans le système de soins ». Sont ainsi mis en ligne les tarifs des médecins, les tarifs dentaires, les horaires d'ouverture des cabinets, le nom des médecins exerçant dans un établissement de soins, le nombre d'actes pratiqués ou encore les durées moyennes de séjour.

Cette mise à disposition est bien entendu encadrée par la Cnil et toutes les données individuelles doivent faire l'objet d'une information préalable des professionnels concernés, qui disposent d'un droit de rectification. Nous ne sommes pas autorisés à transférer ces données individuelles à d'autres acteurs. La commission d'accès aux documents administratifs (Cada), qui s'est prononcée sur ce point à plusieurs reprises, a ainsi rejeté la demande de certaines sociétés privées qui souhaitaient obtenir communication de ces informations sous forme de bases de données, et l'un de ses avis de 2011 a été confirmé par le tribunal administratif de Paris. S'agissant des données relatives aux établissements de santé, la Cada s'est récemment prononcée sur le champ des données diffusables, qu'elle a limité au numéro d'immatriculation Finess ainsi qu'au numéro d'enregistrement RPPS. Ainsi, si de très nombreuses données sont disponibles dans le champ de la santé, nous devons respecter strictement les textes encadrant leur mise à disposition pour ne pas nous exposer à des sanctions pénales.

Il existe une autre contrainte relative aux données personnelles : l'article 12 de la loi du 17 juillet 1978 prévoit que la réutilisation des informations publiques est possible à la condition qu'elles ne soient pas altérées et que leur sens ne soit pas dénaturé. Dans un contentieux qui nous a opposé au site internet Fourmi Santé, il a été constaté que le simulateur de reste à charge utilisé ne distinguait pas entre les consultations de base d'un médecin et ses consultations spécialisées. Ce type de situation pourrait également engager notre responsabilité. Nous sommes par ailleurs astreints au respect des règles relatives à la propriété intellectuelle.

Nous avons mis en place à la fin de l'année 2011 une coopération avec l'ANSM afin de développer, en matière de médicament, un pôle d'expertise publique indépendant des laboratoires pharmaceutiques. En l'absence de publication du décret groupement d'intérêt public (GIP) compétent en la matière prévu par la loi « Médicament » de 2011, nous avons consolidé cette coopération par une convention qui fixe le cadre dans lequel nous réalisons des études à la demande de l'ANSM. Au titre de ce partenariat, nous avons notamment travaillé sur le risque thrombo-embolique associé aux pilules de troisième génération, sur la consommation des nouveaux anticoagulants ou, plus récemment, sur le Soriatane. Ces travaux ont donné lieu à des conférences de presse qui ont permis d'informer des risques associés aux différents produits concernés et de présenter, le cas échéant, des recommandations tendant à leur moindre utilisation. Nous avons également réalisé des études à caractère médico-économique. Cette coopération nous paraît très importante : il ne faut pas seulement se préoccuper de l'accès aux données, mais également s'assurer que celles-ci font l'objet d'un traitement pertinent, d'une interprétation correcte et que les études réalisées respectent une méthodologie adéquate. Il arrive en effet que des études effectuées par différents organismes aboutissent à des conclusions variables, notamment selon que ceux-ci sont ou non directement intéressés par le produit de santé concerné... Ainsi, une étude mise en ligne en septembre 2013, portant sur le risque thrombo-embolique associé à la contraception orale, et financée par les industriels concernés, a conclu qu'un risque statistiquement significatif ne pouvait être démontré pour les pilules de troisième génération, tandis que l'étude que nous avons réalisée montre le contraire.

Des extractions de données de cohortes sont demandées à travers l'IDS par des organismes publics dans le but de mener des études approfondies. L'Inserm, l'InVS, divers CHU comme ceux de Lyon, Toulouse, Rennes, Dijon, de La Réunion sont particulièrement demandeurs de ce type de données.

Quelles perspectives peut-on définir pour l'accès aux données de santé ? Il ne fait pas l'ombre d'un doute que le Sniiram, enrichi des données du PMSI et de l'Insee, constitue une base de donnée très importante, qui présente un intérêt évident pour l'amélioration de la connaissance du système de soins et la conduite d'études de santé publique. Dans la mesure où cette base comporte cependant des données sensibles relatives à l'ensemble de la population française, la réflexion sur l'ouverture de ces données de santé doit prendre en compte les différents risques associés et identifier les moyens de les prévenir. Le premier de ces risques est celui de la réidentification, qui a changé de nature avec l'intégration dans la base des données du PMSI et de l'Insee. La Cnil semble partager cet avis, puisqu'elle a demandé une étude spécifique sur les possibilités de réidentification. Dans le contexte nouveau du big data, il me paraît absolument nécessaire de reprendre la réflexion qui a eu lieu au début des années 2000 sur la nature des données sensibles et les risques liés aux croisements de données. Un deuxième risque concerne la possibilité d'intrusion dans les systèmes d'information. Nous sommes très vigilants sur ce point. Je me demande si nous ne sommes pas allés trop loin et si tous les organismes qui sont potentiellement autorisés à accéder aux données de santé disposent de systèmes d'information suffisamment sécurisés pour qu'ils puissent garantir que les dispositions de la loi Informatique et libertés sont pleinement respectées. Des réencadrements récents, qui ne touchent pas cependant aux données de santé, sont ainsi récemment intervenus dans le milieu hospitalier.

S'agissant des finalités de l'ouverture des données de santé, si les données dont nous disposons peuvent alimenter des études utiles à la santé publique, il est clair qu'elles peuvent également intéresser des initiatives de nature commerciale, à travers des études post-marketing ou visant à élaborer des garanties assurantielles segmentées. Nous pensons que les finalités de consultation et d'utilisation des données doivent être encadrées par la loi.

Les conditions d'utilisation des données constituent un sujet important dans la mesure où le choix d'une méthode statistique et le mode de traitement des données retenu peuvent exercer une influence significative sur le résultat d'une étude. C'est d'ailleurs la raison qui avait conduit à la création d'un GIP dédié par la loi de 2011 relative au médicament ; il avait été constaté que, dans de nombreux cas, la manière dont les données étaient traitées n'était pas conforme aux exigences scientifiques, et notamment que la neutralisation de certains effets d'échantillonnage pouvait conduire à des résultats très différents. En outre, comme je l'indiquais tout à l'heure, on note que les études financées par les promoteurs de produits ont tendance à leur être favorables. Enfin, la complexité des bases de données est telle qu'elle peut parfois conduire à des erreurs. Récemment, une étude fondée sur les données du Sniiram a ainsi conclu à un taux de recours aux neuroleptiques de 12 % dans une population, alors qu'il était en réalité de 20 % : les auteurs de l'étude avaient omis de prendre en compte les derniers médicaments génériques disponibles sur le marché. L'accès aux données et la compétence nécessaire à leur exploitation sont donc deux sujets qu'il convient de bien distinguer.

Dans ce contexte, l'expertise publique dans le domaine de la santé peut et doit être confortée, sous réserve que le secteur public s'organise de manière à prévenir les risques que j'ai évoqués. La décision d'ouvrir les données de santé à des entreprises à but lucratif est une question politique qui doit être pesée au regard des risques qu'elle pourrait engendrer. Enfin, il faut développer l'encadrement des organismes habilités afin de garantir l'application des lois de 1978, ce qui nécessite une grande professionnalisation de ces acteurs, notamment s'agissant de leurs systèmes d'information. S'agissant de l'évolution de la gouvernance des données de santé, des travaux sont en cours et il me semble que la question doit plutôt être posée au ministère des affaires sociales et de la santé.

M. Jean Debeaupuis, directeur général de l'offre de soins. - La Direction générale de l'offre de soins (DGOS) assure la tutelle de l'Atih au nom du ministère des affaires sociales et de la santé et, via les ARS, de l'ensemble des établissements de santé. A ce titre, nous portons un regard vigilant sur les systèmes d'information des établissements. Depuis trente ans, le PMSI produit des données qui, depuis une dizaine d'années, sont notamment utilisées pour l'allocation des ressources aux établissements. Les établissements et les professionnels qui collectent ces données le font dans le cadre fixé par la loi - notamment dans le cadre du code pénal qui réprime toute violation du secret professionnel et du secret médical - et par les autorisations de la Cnil.

L'Atih fournit des données à caractère nominatif sur l'offre de soins. Créée en 2000, soit au moment de la mise en place du Sniiram, elle constitue une agence indépendante, ce qui contribue à garantir la protection du secret médical. De nombreux autres organismes tels que la HAS ou l'agence nationale d'appui à la performance des établissements médicaux ou médico-sociaux (Anap) gèrent également d'importantes bases de données, qui concernent avant tout la qualité des soins ou la performance des établissements : ces informations, éclairantes quant à l'offre de soins, ne comprennent pas d'informations sensibles ou nominatives. A travers le site de l'Atih, nous mettons également à disposition du public des informations relatives à la situation financière des établissements et à leurs indicateurs de qualité.

Les données de santé collectées par le PMSI sont anonymisées : le numéro d'identification au répertoire (NIR) n'est pas directement utilisé et la Cnil a prévu des dispositifs de floutage permettant d'éviter la réidentification des patients. Ainsi, il existe différents degrés de précision dans les dates de séjour et les codes postaux ne sont pas utilisés en tant que tels mais permettent par exemple de constituer des regroupements de 5 000 habitants. Cette organisation du PMSI rend la réidentification des patients très difficile : à notre connaissance, il n'existe aucun cas dans lequel le secret médical aurait été violé grâce à ces données. Dès lors qu'il est possible de calibrer plus ou moins finement la précision des données du PMSI, une communication relativement large est permise, que ce soit à certains acteurs privés ou à des fins de recherche. Nous considérons que l'accès au PMSI est plus largement ouvert que celui au Sniiram, dont la richesse est plus importante. Afin de prévenir tout mésusage des informations du PMSI, l'Atih prévoit de mieux documenter l'utilisation de cette base.

Du point de vue des usages des données de santé, la DGOS s'intéresse bien sûr au développement d'une meilleure connaissance des mécanismes de formation des coûts de soins, à un affinement des modèles de tarification ainsi qu'à l'évaluation des efforts d'efficience que les établissements sont capables d'atteindre, notamment dans le cadre d'une dimension parcours entre établissements et entre professionnels. Ce dernier aspect est actuellement imparfaitement renseigné par le seul PMSI ; son chaînage avec le Sniiram devrait permettre de fournir des informations éclairantes à ce titre. La connaissance des parcours est indispensable pour progresser dans l'articulation des niveaux de recours et dans la mise en place de modèles de financement plus transversaux entre la ville et l'hôpital.

M. Housseyni Holla, directeur de l'Agence technique de l'information sur l'hospitalisation (Atih). - La compétence de l'Atih recouvre le secteur hospitalier sanitaire, et non le champ médico-social. Créée en 2000, l'Atih est un établissement public placé sous la tutelle des ministres en charge de la santé et de la sécurité sociale. Elle est régie par les articles R. 6113-33 à R. 6113-52 du code de la santé publique. Son conseil d'administration réunit l'Etat, l'assurance maladie et des personnalités qualifiées. Elle assure trois grandes missions, la première étant celle de collecter, d'analyser et de restituer les données relatives aux établissements de santé. Ces données recouvrent l'activité des établissements - c'est le champ du PMSI -, les coûts hospitaliers, la qualité et la sécurité des soins - ces données étant collectées pour le compte de la HAS -, des informations financières et relatives aux ressources humaines. Notre deuxième mission consiste en la gestion des dispositifs techniques de financement des établissements de santé, en relation directe avec le ministère. Nous participons également à l'élaboration des nomenclatures de santé en lien avec l'assurance maladie.

Les données les plus sensibles manipulées par l'Atih sont celles du PMSI. Les données relatives aux coûts hospitaliers reposent quant à elles sur un échantillon d'établissements et donnent lieu à une restitution agrégée. La collecte des données du PMSI est effectuée dans le cadre défini par les articles L. 6113-7 et 6113-8 du code de la santé publique et par différents décrets. Ces textes définissent les conditions de la collecte dans les établissements, notamment s'agissant des relations entre le département de l'information médicale (DIM) et les praticiens, des conditions de traitement des informations et des modalités de leur consolidation, qui doivent garantir leur confidentialité et l'anonymat des patients. Quatre arrêtés pris par le ministère pour chacun des secteurs du champ sanitaire définissent notamment les conditions de transmission des informations vers les ARS pour validation ; en pratique, cette transmission est assurée par l'Atih.

Les données du PMSI comportent un nombre d'informations limité, quoique celles-ci soient très riches pour l'analyse : le nom de l'établissement dans lequel le patient a séjourné, la durée de son séjour, son âge, son sexe, son lieu d'habitation, le diagnostic, les actes réalisés, la consommation de médicaments et de dispositifs médicaux lorsqu'elle est onéreuse. Grâce au chaînage entre les données du PMSI et celles du Sniiram, nous avons la possibilité de reconstituer le parcours de soins d'un patient sans jamais l'identifier.

L'Atih fournit aux établissements les outils techniques qui leur permettent d'agréger les données administratives, de facturation et les données médicales en les anonymisant, grâce au logiciel issu de l'assurance maladie dit « Foin » (fonction d'occultation des informations nominatives). Les informations sont ainsi anonymisées au sein des établissements avant leur transmission à l'Atih, ce traitement étant garanti par le DIM de l'établissement. Les données transmises font ensuite l'objet d'une seconde anonymisation au sein de l'Atih avant d'alimenter le Sniiram. Une troisième anonymisation est enfin opérée : ces anonymisations successives visent à créer une rupture entre les informations disponibles dans les différentes bases afin de prévenir tout risque de réidentification. Il est à noter que la fonction d'occultation de certaines informations identifiantes telles que le NIR est une fonction irréversible. Les données ainsi traitées peuvent alors être transmises à l'Etat, aux ARS, aux différentes agences sanitaires ainsi qu'à certains acteurs privés, leur diffusion étant strictement encadrée par la Cnil.

La diffusion des données est assurée par le service de réponse aux demandes externes de l'Atih. Celles-ci sont transmises aux acteurs disposant d'une autorisation de la Cnil. Nous réalisons également des traitements et des extractions à la demande pour les administrations centrales, les institutions publiques de contrôle telles que la Cour des comptes, l'IGF ou l'Igas, ainsi que pour les institutions sanitaires comme la HAS ou l'Inca. Nous constituons par ailleurs, lorsque nous constatons des demandes récurrentes, des tableaux statistiques que nous mettons à la disposition de tous ; c'est essentiellement à ces informations qu'ont accès les sociétés privées. Nous publions sur notre site internet, à travers l'outil de restitution « Snatih » (système national d'information sur l'hospitalisation), diverses informations issues du PMSI : des statistiques très agrégées sont en accès libre, comme par exemple le case-mix ou éventail des cas traités par chaque établissement ; d'autres informations ne sont accessibles qu'avec identifiant et mot de passe.

Notre système de gestion des données est sécurisé aux stades de leur collecte comme de leur diffusion et de leur conservation. La collecte relève de la responsabilité des établissements ; la transmission est effectuée selon un protocole sécurisé entre l'Atih et les établissements ; la base stockée à l'Atih est inaccessible aux tiers. Les données transmises à l'assurance maladie relèvent de sa responsabilité. Les données publiques ne sont transmises, quel que soit le statut - public ou privé - du demandeur, que sur accord de la Cnil ; le demandeur s'engage à ne pas identifier les patients et à ne communiquer ou publier les données transmises que si toute identification est impossible, et les personnes chargées du traitement des données sont astreintes au secret professionnel. Une fois l'autorisation Cnil acquise, le traitement des informations relève donc de la responsabilité du demandeur.

Les données du PMSI sont aujourd'hui très largement utilisées par l'Etat et l'assurance maladie dans le cadre de l'organisation, du financement et de la régulation des soins, ainsi que pour le contrôle des prises en charge. Elles sont également utilisées par les grandes agences sanitaires nationales (HAS, InVS...), auprès desquelles nous intervenons en tant qu'outil technique, dans le cadre de conventions ou de restitutions à la demande. Nous travaillons avec les chercheurs dans le champ épidémiologique notamment. A l'évidence, le PMSI intéresse également les industriels. 61 sociétés privées ont aujourd'hui accès à ces informations, pour des usages qui ne sont pas très différents des nôtres : à l'heure actuelle, la valeur ajoutée de ces entreprises dans le traitement des données de santé n'est donc pas encore démontrée. En outre, bien que le PMSI ne fournisse qu'un nombre limité d'information, leur exploitation n'est pas si simple.

Le rapprochement entre les données du PMSI et celles du Sniiram ouvre un très vaste champ d'études, notamment s'agissant de l'analyse des parcours de soins, ce qui intéresse bien sûr les ARS dans le cadre de l'organisation territoriale des soins.

M. Jean-Jacques Hyest, président. - Les données Insee portant sur les décès mentionnent-elles leur cause ?

M. Claude Gissot, directeur de la stratégie à la Cnam. - Les informations de l'Insee ne mentionnent que la date, non les causes des décès.  Les informations relatives aux causes sont gérées par le centre d'épidémiologie sur les causes médicales de décès (CépiDc), qui constitue un laboratoire de l'Inserm. Il existe des projets visant à analyser les causes de la mortalité post-hospitalière, qui pourraient permettre in fine d'évaluer la qualité des établissements, mais nous n'en sommes encore qu'aux débuts.

M. Jean-Jacques Hyest, président. - Les maires ne peuvent pourtant dresser d'acte de décès sans en indiquer la cause à partir des informations transmises sous pli cacheté par le médecin. A qui ces informations sont-elles transmises ? Ne pourraient-elles pas présenter un grand intérêt ?

M. Claude Gissot. - Les informations relatives aux causes de décès ne sont envoyées qu'au CépiDc de l'Inserm et l'Insee n'y a pas accès.

M. Frédéric Van Roekeghem. - Il ne fait pas de doute que ces informations présenteraient un grand intérêt pour des études de santé publique, sous réserve toutefois qu'elles soient bien documentées et qu'elles soient saisies dans des bases de données exploitables informatiquement.

Mme Corinne Bouchoux, rapporteure. - Quelle est la date de la dernière réunion du comité de pilotage du Sniiram ? Pouvez-vous nous assurer qu'aucun organisme ne se trouve actuellement dans l'attente de données du Sniiram sans pouvoir voir sa demande satisfaite faute de décision de cette instance ? Vous semblez favorable au big data mais plus mesuré quant à l'avènement de l'open data, au sens anglo-saxon du terme, dans le domaine de la santé : ai-je bien résumé votre pensée ?

M. Frédéric Van Roekeghem. - Au sens propre du terme, l'open data recouvre des données plutôt agrégées, tandis que des études approfondies de santé publique supposent l'accès à des données indirectement réidentifiantes. Ce deuxième type d'utilisation nécessite donc une professionnalisation des acteurs, une clarification des finalités au titre desquelles l'accès peut être accordé, un encadrement législatif, y compris pénal, et déontologique précis, une forte sécurité des systèmes d'information. Il est par ailleurs indispensable de réfléchir aux moyens d'assurer le contrôle d'une telle utilisation : les moyens de la Cnil ne sont pas infinis.

M. Claude Gissot. - Le Copiir s'est réuni pour la dernière fois le 18 avril 2013. Il s'est notamment prononcé sur l'accès de l'Atih, la Drees et des ARS aux données exhaustives du Sniiram. L'arrêté a été publié il y a 15 jours.

M. Frédéric Van Roekeghem. - Nous tenons les informations relatives aux réunions du Copiir à la disposition de la MCI. Vous pourrez constater que nous avons très notablement accéléré le rythme de ces réunions depuis plus de deux ans. Il faut se demander à qui les délais d'accès au Sniiram sont imputables...

Mme Corinne Bouchoux, rapporteure. - Selon les textes, le comité de pilotage du Sniiram ne devrait-il pas se réunir deux fois par an ?

M. Claude Gissot. - Cette obligation a été fixée par voie de protocole et vaut comme un règlement intérieur. Ce n'est pas une obligation législative. Rappelons-nous que la mise en place du Sniiram a été progressive : à ses débuts, il n'existait qu'un seul data mart et il n'était pas nécessaire de réunir le comité de pilotage tous les six mois. L'appariement des données du Sniiram avec celles du PMSI et l'introduction des données de l'Insee a ensuite suscité un intérêt croissant pour cette base de données : nous nous sommes alors organisés de manière à répondre aux demandes.

M. Frédéric Van Roekeghem. - Alors qu'il vient de lancer une mission de l'Igas sur l'évolution de l'accès aux données de santé, il me semble raisonnable de laisser au Gouvernement le soin de définir les orientations à mettre en oeuvre dans ce domaine. Il me paraît inopportun de gesticuler de manière désordonnée sur l'ouverture de l'accès aux données de santé quand une réflexion est en cours. Dans ce contexte, le comité de pilotage ne saurait prendre de décisions importantes sans coordination avec le gouvernement. Par ailleurs, les décisions prises par le Copiir d'avril 2013 ne sont pas encore opérationnelles ; il pourrait être intéressant que vous vous penchiez sur l'historique de l'ouverture des données de santé aux ARS, notamment sur l'intervention de la Cnil...

M. Jean-Jacques Hyest, président. - Nous entendrons Mme la ministre des affaires sociales et de la santé le 27 mars. Nous vous remercions pour votre contribution à notre compréhension de l'open data.

Audition conjointe de Mme Geneviève CHÈNE et M. Grégoire REY, pour l'Institut national pour la santé et la recherche médicale (Inserm), M. Dominique MARANINCHI, Mme Carole LE SAULNIER et M. Mahmoud ZUREIK, pour l'Agence nationale de sécurité du médicament et des produits de santé (ANSM), MM. Jean-Patrick SALES et Thomas LE LUDEC pour la Haute Autorité de santé (HAS) (jeudi 13 mars 2014)

M. Jean-Jacques Hyest, président. - Notre mission commune d'information, constituée à la demande du groupe écologiste, après avoir auditionné des utilisateurs de données publiques, analyse à présent les politiques de mise à disposition de ces données par leurs producteurs, pouvoirs publics, collectivités territoriales, services publics. Dans la suite des auditions de la semaine dernière sur les données de santé, nous recevons tout d'abord ce matin des représentants de l'Institut national pour la santé et la recherche médicale (Inserm), de l'Agence nationale de sécurité du médicament et des produits de santé (ANSM) et de la Haute Autorité de santé (HAS).

Après avoir rappelé le statut et les missions des organismes que vous représentez ainsi que la nature des données qu'ils utilisent, pourriez-vous décrire les modalités actuelles de leur collecte et de leur exploitation, en indiquant le régime d'accès à ces données ; préciser, le cas échéant, de quelles données supplémentaires vous auriez besoin ; présenter votre politique d'offre de données ; enfin, de manière plus prospective, décrire les usages des données de santé qu'il vous paraîtrait pertinent de développer dans le sens d'une amélioration de l'efficacité du système de soins.

Mme Geneviève Chène, directrice de l'Institut thématique multi-organismes (Itmo) Santé publique de l'alliance nationale pour les sciences de la vie et de la santé (Aviesan). - L'Inserm est un établissement public à caractère scientifique et technologique dédié entièrement à la recherche sur la santé humaine, à l'expertise et à la veille scientifique, placé sous la double tutelle des ministères de la santé et de la recherche. Ses quelque 300 unités de recherche qui emploient environ 10 000 personnes sont implantées dans des hôpitaux, des universités, des centres de lutte contre le cancer. Dix instituts thématiques, créés début 2008, sont associés à l'Inserm afin d'animer la recherche dans leurs domaines respectifs et de définir une prospective.

En avril 2009, l'alliance nationale pour les sciences de la vie et de la santé (Aviesan), réunissant l'Inserm, le Centre national de la recherche scientifique (CNRS) et la conférence des présidents d'université (CPU) est venue renforcer la coordination nationale de la recherche. L'Inserm joue enfin un rôle déterminant dans la construction de l'espace européen de la recherche.

Nous utilisons des données très variées : sociodémographiques, cliniques, biologiques, génétiques, d'imagerie médicale, d'exposition à des facteurs de risques, des parcours de soin et de santé, des modes de vie. Les modes de recueil sont multiples. Parfois, les données les plus intéressantes sont collectées à des fins autres que la simple connaissance. Des modes de recueil spécifiques sont également mis en oeuvre par des enquêtes ad hoc, des registres, ou dans le cadre d'essais cliniques. Les données produites en routine - causes de décès, données de registre - peuvent être mises à notre disposition par conventions et réutilisées pour des usages épidémiologiques. Ainsi, les données du système national d'informations inter-régimes d'assurance maladie (Sniiram) et du programme médicalisé des systèmes d'information (PMSI) sont très intéressantes pour la recherche en santé, même s'ils ont été conçus aux fins de gestion et de financement des soins.

De manière générale, toutes ces données sont intéressantes dès lors qu'elles sont de qualité suffisante pour produire des résultats fiables et être utiles à la décision. L'Inserm a une très grande expérience de la production et de l'utilisation de ces données et une conscience de leur très grand degré de complexité et du niveau d'expertise nécessaire pour les traiter de manière à leur donner la valeur attendue.

La plupart des données collectées dans des enquêtes ne sont utilisées qu'à des fins de recherche, d'autres, produites en routine, sont utilisées à des fins de recherche dans le cadre de conventions de mise à disposition.

L'arrêté du 20 juin 2005 fixe la liste des organismes habilités à accéder aux données du Sniiram. L'Inserm en fait partie et bénéficie d'un accès « facilité », notamment à l'échantillon généraliste des bénéficiaires (EGB), à des extractions précises, mais l'accès à la base complète du Sniiram nous est impossible, ce qui interdit de procéder à de la fouille de données (data mining ou traitement de big data) ou à des recherches sans hypothèse a priori, et freine l'acquisition d'une expertise sur cette base et l'emploi pour des objectifs de recherche. Il est en outre difficile d'enrichir les données d'une enquête avec les données du Sniiram car l'utilisation du NIR (numéro d'inscription au répertoire national d'identification des personnes physiques, dit « numéro de sécurité sociale ») exige une autorisation par décret en Conseil d'Etat.

D'autres données intéressent les chercheurs : celles de l'Insee notamment, couvertes par le secret statistique, ce qui nécessite des autorisations administratives et impose des délais non compatibles avec les exigences de compétitivité de la recherche. Les données recueillies par les médecins généralistes, les bases de données sociales, celles de la Cnam (caisse nationale d'assurance maladie des travailleurs salariés), avec lesquelles des appariements ont déjà été mis en place, celles concernant l'exposition environnementale ou l'alimentation nous seraient aussi très utiles. Un accès large et rapide aux données de santé est un enjeu majeur pour la compétitivité de notre recherche.

L'usage de données individuelles ré-identifiables est indispensable, en particulier dans le cadre du suivi de cohortes de patients, pour faire le lien entre les facteurs de risques et les cause de décès par exemple. Cloisonnement, cryptage et traçabilité sont donc indispensables. Cela exige, bien sûr, de s'assurer que ces données ne puissent pas être accessibles à d'autres fins que scientifiques. La loi « informatique et liberté » encadre leur usage. Les audits ou inspections ont montré que les chercheurs de l'Inserm font preuve d'un très grand professionnalisme dans les usages qu'ils font de ces données et sont extrêmement scrupuleux à cet égard. L'an dernier, la nécessité de faire évoluer le cadre juridique a été soulignée dans un avis de l'Aviesan : il faut faciliter l'accès aux données et leur usage, en particulier l'utilisation du NIR pour les activités de recherche. Il convient, comme le souhaitent également les sociétés savantes d'épidémiologie, que l'évolution de la réglementation européenne ne crée pas d'obstacles supplémentaires à l'utilisation de ces données.

L'Inserm n'a pas à proprement parler de politique d'offre de données ; cela étant, l'accès aux nombreuses bases de données créées à partir des initiatives des équipes de recherche fait l'objet d'arbitrages dans la plus grande transparence par les équipes et le conseil scientifique des études. En outre, l'ouverture des données, l'impact sociétal de la recherche et la collaboration avec d'autres équipes sont pris en compte dans le financement des appels à projets et l'évaluation des unités de recherche. Ces données font également l'objet de publications scientifiques à destination du grand public et les chercheurs doivent pouvoir y accéder.

La recherche publique doit bénéficier de règles spécifiques d'accès aux données de santé, afin de faciliter et d'accélérer leur exploitation. L'Inserm, qui joue déjà un rôle pivot pour l'accès à l'EGB, pourrait se positionner sur cet usage de données de santé pour la recherche : ses équipes présentent en effet des garanties d'indépendance, de déontologie et de compétence en la matière.

L'usage des bases de données exige une maîtrise sémantique, c'est-à-dire une bonne connaissance du sens des données qu'elles rassemblent et il doit être sécurisé au maximum en cas d'appariement et d'anonymisation : la centralisation est ici nécessaire. L'Inserm peut ainsi jouer un rôle de filtre pour l'usage des données car le service rendu au chercheur doit être indépendant du secteur privé, mais aussi de l'exécutif.

L'Aviesan a proposé  d'établir une procédure institutionnelle claire, confiée à un opérateur unique, pour l'accès des chercheurs au Sniiram et à d'autres bases de données administratives et médico-administratives, avec des circuits et des modalités de procédure différents selon que la demande émane du secteur public ou du secteur privé, et qui permette de  vérifier la pertinence des demandes d'accès au regard du contenu des bases. Est également recommandée la création d'une ou plusieurs plateformes techniques mutualisées, permettant l'extraction, le formatage, l'aide à la mise en forme et l'appariement des données extraites de ces bases, bénéficiant d'un financement spécifique garanti, distinct de celui qui est alloué aux organismes gestionnaires des bases. Ces plateformes seraient fondées sur un échange de savoir-faire entre ces organismes chargés de la gestion des bases et les équipes de recherche. L'Itmo de santé publique que je dirige est bien placé pour représenter la partie recherche dans le processus de constitution de cette interface.

Le Président de la République a récemment annoncé un grand programme de recherche sur la biologie des systèmes. Cette réflexion doit s'inscrire dans ce nouveau programme d'investissements d'avenir : c'est en effet la compétitivité de la recherche française qui est en jeu.

La base nationale de pharmacovigilance devrait être mieux exploitée, de même que la base de données sur les causes de décès en matière de surveillance sanitaire. Si elle avait été aussi bien renseignée et aussi rapidement en 2003 qu'aujourd'hui grâce à la certification électronique des décès, on aurait pu détecter beaucoup plus tôt la hausse de la mortalité due à la canicule. Faciliter l'accès à des données par les chercheurs, c'est encourager une approche plus interdisciplinaire en santé humaine, en recherche interventionnelle en santé des populations et dans le cadre du programme de biologie des systèmes. Les chercheurs forment le voeu qu'une part de leurs recherches puisse aider à des décisions plus éclairées, car fondées sur des faits documentés, en matière de politiques d'intervention en santé publique. Au-delà, il y a des interactions possibles entre les décideurs, les chercheurs, les gestionnaires des bases de données, les acteurs de soins et les acteurs de santé, grâce à la mise en commun des données de santé.

M. Jean-Jacques Hyest, président. - Monsieur le professeur Maraninchi, pas une semaine ne passe sans que l'on parle de l'ANSM. Son approche des données est nécessairement différente de celle de l'Inserm.

M. Dominique Maraninchi, directeur général de l'Agence nationale de sécurité du médicament et des produits de santé (ANSM). - Vous m'ôtez les mots de la bouche. L'ANSM est l'autorité nationale de régulation des produits de santé. L'Etat lui délègue la capacité d'autoriser, de surveiller ou d'interdire l'usage des produits de santé. La loi de décembre 2011 a rappelé à cet égard que les arbitrages devaient d'abord prendre en compte la sécurité des personnes et non la sécurité ou l'équité du commerce. Bien sûr, nos décisions font grief, à l'encontre de parties qui sont rarement d'accord... D'où la nécessité d'expertises fortes et transparentes, pour lesquelles nous devons disposer de moyens à la hauteur de ceux des producteurs de santé. L'obligation de transparence, que la loi du 29 décembre 2011 a imposée à toutes les parties, nous y compris, ainsi que le recours au principe de précaution pour protéger les patients, ont fait évoluer notre travail : nos décisions, plus transparentes et plus réactives, sont établies sur des faisceaux d'arguments fondés sur des données de sources diverses. Nous vivons dans une interpellation régulière de la part des citoyens.

Où collectons-nous les données ? Auprès des parties et d'abord des opérateurs de santé : résultats d'expériences in vitro et in vivo, données cliniques, précliniques et para-cliniques, protégées par le secret industriel et commercial, qui fondent nos arbitrages bénéfice-risque, au regard des indications revendiquées pour les populations concernées. Cela vaut avant et après l'autorisation de mise sur le marché (AMM). Une fois qu'elle est accordée, des données sur la sécurité du produit continuent à nous être transmises. Tous les producteurs de principes actifs ou de nouveaux traitements sont soumis à l'obligation de mettre en oeuvre des plans de gestion des risques, y compris post marketing. Depuis 2011, après l'AMM, nous prenons fréquemment des décisions relatives à la sécurité des produits, tels qu'ils sont réellement utilisés dans la vraie vie, à partir de données de marketing réelles ou de l'assurance maladie et non plus sur la base d'études cliniques, plus ou moins idéalisées... On se rappelle du Mediator ; d'autres décisions comparables sont intervenues depuis lors à partir de signaux de vigilance qui ont pu être vérifiés très rapidement par l'accès aux bases nationales et grâce à la collaboration des chercheurs. Nous disposons maintenant d'une antenne de pharmaco-épidémiologie avec un chercheur de l'Inserm et nous avons une bonne capacité à collecter des données venant d'autres sources que les producteurs.

Nous disposons d'une capacité de collecte des données d'autres sources que les entreprises pharmaceutiques. Les réseaux de vigilance (pharmacovigilance, matériovigilance, hémovigilance) nous adressent près de 100 000 déclarations par an : l'articulation de ces données avec les autres bases (mortalité, Sniiram) nous confère une puissance d'analyse et de détection considérable. Le travail de repérage des données de signalement précède celui de recherche d'explications. Il est en grande partie automatisé et en lien avec des bases de données européennes. Bien sûr, nous pourrions publier une partie de ces données mais elles sont souvent abstraites et incompréhensibles pour le grand public. Nous n'avons guère les moyens de forcer les industriels, ni les chercheurs, à faire une étude dans le temps voulu par nos processus de décision. Il importe donc que nous puissions disposer de nos propres capacités de collecte, d'instruction, d'investigation et de traitement des données.

Il faut en outre lutter contre les risques de conflits d'intérêts. Les règles déontologiques sont de plus en plus poussées. Dans l'analyse, notre agence doit être totalement indépendante des équipes de recherche liées de près ou de loin à l'industrie.

Depuis trois ans, nos fonds d'intervention nous donnent les moyens de conduire des études indépendantes, publiques, de qualité. Il est très difficile pour le citoyen de comprendre qu'une même équipe puisse travailler de temps en temps pour l'industrie et pour le régulateur. Cette recherche indépendante que nous mettons en place est une petite révolution. Elle a besoin de financements publics. Dans le domaine du médicament, les financements les plus importants proviennent toujours des industriels. Ce n'est pas une fatalité. Nous sommes à un tournant.

Les données que nous utilisons relèvent du secret médical et du secret industriel et commercial et sont donc très confidentielles. Nous en produisons, aussi, en réponse à une demande ou pour informer le public. Toutes les réunions de nos commissions font l'objet d'ordres du jour et de comptes rendus et sont filmées. Ces données sont accessibles, sous réserve du secret industriel et commercial et des données personnelles ou qui pourraient être tracées.

Où allons-nous ? Le futur règlement sur les essais cliniques obligera les industriels à publier les résultats des essais, même non publiés, même négatifs. L'accès aux données sources n'a pas encore fait l'objet d'un arbitrage et est au coeur d'un contentieux judicaire européen. Certaines entreprises se sont dotées de codes de bonne conduite et mettent déjà spontanément ces données à disposition, peut-être pour améliorer leur image... Le sujet doit être suivi dans notre pays avec la plus grande attention afin de mieux fonder les décisions.

Ce qui compte, c'est de relier plusieurs types de données entre elles. En France, elles sont très riches mais l'établissement des liens reste difficile alors que nos décisions de sécurité doivent être fondées sur des faisceaux d'arguments. Nos décisions faisant grief et étant souvent contestées, nous devons avoir les moyens de les défendre et que les industriels ne soient pas privilégiés dans l'accès aux données publiques. Le financement public de la recherche doit donc être un critère d'accès aux données. Les données que nous produisons pour fonder nos décisions sont rendues publiques et notre site Internet compte désormais 2,7 millions de connexions par an, soit deux fois plus qu'il y a deux ans. La base de données du médicament, mise à jour mensuellement, a été ouverte en novembre et sera téléchargeable fin mars. Le partage de données est donc possible et répond manifestement à une véritable demande.

Nous produisons également de l'information à destination des professionnels pour les mettre en garde sur les risques que présente l'usage de certains produits soumis à prescription obligatoire, dès que nous recevons des signaux indiquant qu'ils sont trop ou mal utilisés. Le partage de données, de vente, par exemple, avec les professionnels est très utile, comme on l'a vu avec la consommation des pilules de troisième et quatrième générations, dont la part est passée de 40 % à moins de 20 % à la suite de nos mises en garde, sans qu'il ait fallu faire évoluer la réglementation.

M. Thomas Le Ludec, directeur délégué de la direction de l'amélioration de la qualité et de la sécurité des soins (DAQSS), Haute Autorité de santé (HAS). - La HAS est une autorité publique indépendante à caractère scientifique qui emploie près de 300 collaborateurs et travaille avec 3 000 experts. Elle a trois missions principales : aider les pouvoirs publics dans leurs décisions de remboursement des actes, produits et techniques sanitaires, sur la base d'une évaluation médico-économique ; émettre des recommandations, des guides et référentiels à destination des professionnels et des patients pour un bon usage des produits et de l'offre de santé ; certifier, enfin, les établissements de santé.

La HAS produit des données accessibles sur son site : les comptes rendus des réunions des commissions et du collège sont ainsi mis en ligne depuis des années, de même que les déclarations publiques d'intérêts des personnels, des experts et des membres.

Nous réutilisons de nombreuses données, issues de la recherche (la littérature scientifique) et du système de santé (consommation et production de soins). Nous produisons des indicateurs de qualité et de sécurité des soins dans les établissements, de certifications d'établissements de santé : un cycle de certification produit environ 18 000 décisions. Enfin, sur les dix-huit spécialités à risques, qui concernent 11 000 professionnels, nous détenons une base de données sur les évènements porteurs de risques.

M. Jean-Patrick Sales, directeur délégué de la direction de l'évaluation économique et de santé publique (Demesp), HAS. - Nous utilisons des données produites et mises en base par d'autres : le PSMSI, le Sniiram pour l'EGB et les DCIR (données de consommation inter-régimes), le Codex, qui se trouve à l'ANSM, avec laquelle nous avons des liaisons informatiques, l'Atih (agence technique de l'information sur l'hospitalisation) pour le PMSI et certains indicateurs, dans le cadre d'une convention. Nous disposons également d'un accès mesuré à des bases de dispensation, construites à partir de projections et de modèles basés sur des échantillons des officines de pharmacie, afin de connaître l'utilisation et le volume dont nous avons besoin, pour évaluer la population cible et fixer le prix des produits admis à remboursement. D'autres bases de données sont enfin ouvertes par les industriels.

Notre accès aux bases de données médico-administratives est maintenant satisfaisant : un arrêté de juillet 2013 nous a donné accès à l'échantillon exhaustif du Sniiram. Cette base est difficile à manipuler ; nous réservons nos compétences en interne, limitées en la matière, à l'établissement de rapports pour le ministère, à sa demande, sur l'insuffisance rénale ou la prise en charge de l'hypertension artérielle, par exemple.

Les évaluations de protocoles de collaboration professionnelle dits de l'article 51 de la loi HPST (Hôpital, patients, santé et territoires), ou d'autres expérimentations de télémédecine ou encore de parcours de l'article 70 supposent l'accès à des données locales produites au sein des territoires de santé, qui soulèvent des interrogations sur leurs modalités de collecte, de traitement et de mise en forme. Nous avons là un champ d'incertitudes sur les remontées et les responsables de ces données, la HAS n'ayant pas, en dehors du domaine spécifique de la certification, de capacité à conduire des évaluations sur site.

Nous demandons aux industriels des études post-inscription, en aval des études post AMM. L'enjeu est de connaître l'utilisation réelle des produits : est-elle conforme à ce qui a été prévu ou anticipé ? Ces études sont encadrées (par un accord-cadre pour le médicament et un autre pour les dispositifs médicaux) et dorénavant explicitement prévues dans les conventions liant les industriels au Ceps (comité économique des produits de santé) pour l'obtention des prix mais les industriels n'ont pas accès aux données médico-administratives nécessaires à leur réalisation, sauf à passer par le faux-nez d'un organisme de recherche. Il leur faut donc mettre en place des cohortes, ce qui est coûteux et impacte le prix. Il serait utile, sans préjudice des missions de recherche et de sécurité sanitaire, de leur ménager un champ d'accès spécifique par l'intermédiaire d'un tiers de confiance. La complexité d'accès à ces bases devrait faire l'objet d'une industrie et d'une validation spécifiques.

M. Thomas Le Ludec, directeur délégué de la DAQSS, HAS. - En 2012, nous avons publié un guide de bonne utilisation des données sur la qualité et la sécurité des soins. Nous portons une attention particulière à ce que les indicateurs de qualité des soins, difficiles à obtenir, retraçant des processus, ne soient pas utilisés à mauvais escient. Les ratios standardisés de mortalité hospitalière, par exemple, doivent être maniés avec précaution. Dans d'autres pays, une diffusion hâtive de ces données a conduit à des pratiques d'optimisation du codage initial, ce qui a faussé l'appréciation des établissements de santé.

M. Jean-Jacques Hyest, président. - Comme les statistiques de la police !

M. Thomas Le Ludec, directeur délégué de la DAQSS, HAS. - Des guides de bon usage sont donc indispensables. En application de la loi de financement de la sécurité sociale de 2012, pour offrir une vision à l'ensemble des Français sur l'appréciation de la qualité des établissements de santé, nous avons ouvert au public, le 28 novembre 2013, la première version d'un site Internet interactif, Scope santé. L'usager peut choisir le set de données qui l'intéresse. Plus de 100 000 connexions différentes ont été enregistrées en trois mois. L'objectif est d'offrir une deuxième version plus complète, dans une logique d'ouverture des données-sources : prioritairement celles dont nous sommes producteurs, sur la certification des établissements de santé et l'amélioration de la qualité et de la sécurité des soins ; également celles qui sont produites par l'Atih et la direction générale de l'offre de soins (DGOS), avec laquelle nous travaillons en partenariat dans le cadre d'une convention et d'un copilotage.

M. Jean-Patrick Sales, directeur délégué de la direction de l'évaluation économique et de santé publique (Demesp). - Nous allons aussi ouvrir d'autres fichiers, notamment sur le service médical rendu. Reste notamment la littérature dite « grise » c'est-à-dire non publiée, qui est un élément d'information important d'évaluation des produits de santé. Il y a un antagonisme entre le secret industriel et commercial et la transparence à l'égard des professionnels de santé et du grand public. Les données détaillées et les dossiers retirés en cours d'examen ne sont pas communicables. Depuis que nous avons la charge d'une mission d'évaluation médico-économique, le prix réel d'un traitement est très difficile à connaître, - je vous renvoie au rapport qui est sorti ces jours derniers sur le prix du médicament -, et l'évaluation dans ce domaine, fondée sur la définition d'un traitement de référence, doit être avant tout comparative.

M. Jean-Jacques Hyest, président. - Nous avons reçu les responsables de l'Atih et de l'assurance-maladie, laquelle possède, avec l'Insee, l'une des plus vastes bases de données. Des rationalisations sont certainement possibles. Mais tel n'est pas notre sujet.

Mme Corinne Bouchoux, rapporteure. - Quelles évolutions souhaitez-vous voir apporter aux lois fondatrices de 1978, votées avant l'apparition d'Internet, quand le patient n'était pas encore acteur de sa maladie ? Par ailleurs, on parle de 5 000 à 10 000 décès par an liés au mésusage de médicaments. En quoi un meilleur accès aux documents administratifs et aux données publiques permettrait-il de faire levier pour réduire ce nombre ? Enfin, les lenteurs n'occasionnent-elles pas des contentieux, au motif du préjudice de chance ? Vos réponses pourront être complétées par écrit.

Mme Carole Le Saulnier, directrice des affaires juridiques et réglementaires, ANSM. - En vertu de la loi instituant la Cada (Commission d'accès aux documents administratifs), nous transmettons beaucoup de documents, sauf procédure judiciaire en cours. Deux difficultés s'élèvent à propos du compte rendu de nos réunions : le secret industriel et commercial d'abord - sur les stratégies commerciales (par exemple les demandes d'essais cliniques), la jurisprudence, peu fournie, n'est pas claire ; le secret financier ensuite : les chiffres de vente et les données d'exposition peuvent-ils être mis en ligne quand il n'y a qu'une spécialité sur le marché ? La transparence pose des questions complexes.

M. Dominique Maraninchi, directeur général de l'ANSM. - On ne cesse de nous demander : « Combien de décès iatrogènes ? Combien sont liés aux pilules ? Aux anticancéreux ? » Nous avons besoin de rendre publiques des informations standardisées, régulières, sans permettre l'identification d'un patient ni créer de panique. Nous travaillons avec le centre d'épidémiologie sur les causes médicales de décès (CépiDc). Peut-être faudrait-il que les médicaments soient mentionnés dans les certificats de causes du décès mais il ne faut pas les rendre trop difficiles à remplir par les professionnels de santé. Que le législateur soit vigilant sur la loyauté de l'information : on peut décéder d'un accident vasculaire cérébral (AVC) à 90 ans, comme mon père, tout en prenant des anticoagulants, sans que la cause puisse en être attribuée à ces derniers.

Les informations de pharmacovigilance disponibles en France sont plus nombreuses que partout ailleurs au monde, rapportées à la population ; la question est de savoir ce que l'on en fait.

Nous manquons de davantage de déclarations des citoyens. Nous sommes au XXIe siècle et les personnes handicapées, par exemple, connaissent mieux les dangers d'un fauteuil que les professionnels. C'est ce que nous voulons développer et stimuler, avec une capacité de traitement et d'instruction de ces données.

M. Jean-Patrick Sales, directeur délégué de la direction de l'évaluation économique et de santé publique (Demesp). - Quand nous sommes astreints à communiquer des documents, nous sommes au bord du contentieux avec un tiers et pratiquons alors un caviardage maximaliste des documents ou comptes rendus qui suscite le soupçon. Une évolution serait souhaitable.

Les informations sur les décès captent l'attention mais l'on peut mourir de sa belle mort bien que l'on mésuse d'un ou plusieurs produits de santé. Quelle est la part du mésusage dans l'exercice thérapeutique au sein de la population ? La question est de savoir si les bons patients sont traités par les bons produits, ce que nous cherchons à savoir lors des renouvellements d'inscription en commission de transparence et comment aider les professionnels à prendre les bonnes décisions - dans le logiciel de prescription, la presse professionnelle ou de recommandations, quitte à rendre certaines recommandations opposables. Tout cela peut diminuer à terme le nombre de décès, même si celui-ci n'est pas à placer au premier plan.

M. Grégoire Rey, directeur du centre d'épidémiologie sur les causes médicales de décès (CépiDc) à l'Inserm. - De par ma fonction, le décès m'intéresse particulièrement, même si l'on essaye de l'éviter... La remontée d'informations provient de la base nationale de pharmacovigilance (BNPV) et des causes médicales du décès, le médecin pouvant déclarer un lien avec un médicament, bases qui peuvent être croisées et enrichies. Par ailleurs, les données globales du Sniiram retracent la prise de médicaments par tous les assurés, jusqu'au décès, permettant d'évaluer les risques de mortalité ou d'associer la prise d'un médicament à la survenue d'une cause de décès. Il s'agit en l'occurrence d'améliorer la connaissance, l'action étant du ressort de l'ANSM.

M. Mahmoud Zureik, directeur de la stratégie et des affaires internationales à l'ANSM. - Pour garantir la sécurité des patients, il faut disposer de données qui éclairent la décision. Un large accès aux données, sécurisé, dans le respect des personnes, leur ouverture aux chercheurs et aux autorités publiques, ne peut qu'améliorer l'usage des produits de santé. Nous avons accès aux données du Sniiram depuis juillet 2013 mais uniquement pour trois ans et l'année en cours. Ce n'est pas suffisant pour examiner ce qui s'est passé, en particulier la durée d'exposition, lorsque le pronostic vital est engagé. Accéder aux données archivées est indispensable pour l'agence. Nous souhaitons que le projet en cours, qui permettrait de relier les données du Sniiram, du PMSI et du CépiDc, aboutisse rapidement pour la sécurité des patients. Nous souhaiterions aussi, pour des problèmes de sécurité sanitaire avérés ou soupçonnés, avoir accès à des données de cohortes.

Mme Geneviève Chène, directrice de l'Institut thématique multi-organismes (Itmo) à l'Inserm  - La loi « informatique et libertés » a été écrite dans un contexte très différent et nous avons changé d'ère, y compris sur le nombre des données de santé disponibles pour une seule personne, qui peut se compte en millions. Traitées comme il convient, elles sont à la source de nouvelles connaissances. Or la loi française est l'une des plus strictes au monde. Une évolution de la réglementation européenne sur la protection des données personnelles est à l'ordre du jour mais les données de recherche ne sont pas traitées de manière particulière. Ceci a peu de conséquences en France, car nos bases sont déjà strictement encadrées depuis 1978. Mais ayons à l'esprit la compétitivité de la recherche française et la nécessité de nouer des collaborations avec nos collègues étrangers. Certaines pourraient ne plus être possibles à l'avenir, parce qu'elles passent par la mise en commun de bases de données intégrées à l'échelon européen, car la transposition de la directive l'interdirait à un certain nombre de nos collègues.

M. Jacky Le Menn. - Je suis vice-président de la commission des affaires sociales. Dans le cadre du rapport sur la tarification hospitalière que nous avons rédigé avec mon collègue Alain  Milon pour la mission d'évaluation et de contrôle de la sécurité sociale (Mecss) l'an dernier, nous avons souligné le manque de fiabilité des données hospitalières, dont le codage peut assez aisément être forcé, lors de la saisie, ce qui permet d'obtenir des ressources substantiellement améliorées. Par ailleurs, la garantie du secret médical est également en cause, des sociétés privées intervenant en sous-traitance des établissements de santé, dans le but de faire rentrer le plus possible de ressources dans l'établissement, ce qui a fait réagir des syndicats de médecins et même la Cnil. Comment peut-on mieux rédiger les cahiers des charges à ces égards ?

Autre problème,  le financement et l'évaluation des coûts des traitements : les échanges des données entre l'assurance-maladie et les agences régionales de santé (ARS) sont manifestement difficiles.

M. Thomas Le Ludec, directeur délégué de la DAQSS, HAS. - Le PMSI concerne au premier chef l'Atih. Vous soulevez la question plus générale du contrôle des données. Les résultats de l'enquête que nous avons menée l'an dernier sur les indicateurs de sécurité et d'efficacité des soins sous l'égide de l'inspection générale des affaires sociales seront bientôt rendus publics ; le contrôle doit se faire par échantillonnage régulier. Une suspicion s'est développée en Grande-Bretagne sur le forçage de codages, destiné à éviter la dégradation du ratio de mortalité hospitalière.

M. Jean-Jacques Hyest, président. - Je vous remercie pour tous ces éléments très intéressants.

Audition, pour Open data France, de Mme Sandrine MATHON, chef du service administration à la direction des systèmes d'information de la mairie de Toulouse, MM. Jean-Marie BOURGOGNE, chef de projet « Montpellier territoire numérique » et Jean-Christophe ELINEAU, cofondateur, (jeudi 13 mars 2014)

M. Jean-Jacques Hyest, président. - Opendata France associe des collectivités territoriales désireuses de rendre publiques leurs données. Je vous invite à présenter votre analyse des enjeux politiques, sociétaux et économiques de cette démarche dans les territoires et son articulation avec la stratégie nationale et déconcentrée de l'Etat ; à montrer comment les projets se construisent entre plusieurs niveaux d'administration locale et les collaborations développées avec les instituts statistiques, l'IGN (Institut national de l'information géographique et forestière) ou les services déconcentrés de l'Etat ; à exposer les difficultés éventuellement rencontrées pour réutiliser les données mises à disposition par d'autres producteurs ; à décrire les modalités d'enrichissements des jeux de données par les acteurs économiques locaux, les citoyens, ou les acteurs publics locaux ; à présenter les services payants éventuellement créés à partir des données ; à indiquer les cadres juridiques de réutilisations retenus ; à décrire les modalités d'accompagnement des utilisateurs, enfin à dresser un premier bilan des retombées économiques de la démarche et de la méthodologie d'évaluation.

Mme Sandrine Mathon, chef du service administration à la direction des systèmes d'information de la mairie de Toulouse, d'Opendata France. - Nous vous transmettrons un document écrit. La démarche Open data a commencé à Rennes en 2010, et progressivement plusieurs collectivité ont ouvert leur portail de données. Nous nous sommes donc réunis, dans un premier temps entre techniciens (spécialistes de la normalisation des données, juristes, communicants ...), tout d'abord pour mutualiser notre temps de travail et pour que chacun ne réinvente pas la poudre. La nécessité nous est vite apparue de fédérer les collectivités territoriales elles-mêmes, en travaillant avec les élus, c'est pourquoi l'association a vu le jour en octobre 2013 à Toulouse, sous la présidence du maire, Pierre Cohen. L'association permet de se regrouper, de soutenir les collectivités engagées dans cette démarche. Chaque collectivité est représentée par un élu, épaulé par un technicien. Aux dix-huit collectivités et Epci fondateurs (villes et métropoles de Toulouse, Nantes, Rennes, les villes de Paris, Bordeaux, Montpellier, Digne, communautés urbaines de Bordeaux et du grand Lyon, région Paca, conseils généraux de Saône-et-Loire, Gironde, Loire Atlantique, communes de Brocas et Balma) sont associés Etalab, l'association LiberTIC, une association nantaise et la fondation internet nouvelle génération ; d'autres collectivités territoriales devraient bientôt adhérer, parmi lesquelles Nice, l'Ile-de-France, les régions Haute-Normandie, Nord-Pas-de-Calais, Pau, Strasbourg, Angers...

Nous nous heurtons à des difficultés juridiques, techniques et à problèmes opérationnels basiques. Conduire un projet d'open data c'est être en mode guérilla, jusqu'à la date butoir de l'ouverture du portail ; ensuite, quelle que soit la taille de la collectivité, il faut aller chercher les données avec les dents car les services producteurs se considèrent trop souvent comme les propriétaires de leurs données, plutôt que comme des producteurs qui doivent mettre leurs données au service d'autrui.

Nos moyens sont modestes, puisque nous ne sommes pas mis à disposition de l'association, mais l'animons sur notre temps, en sus de nos missions principales. La cotisation annuelle est fixée à 2 000 euros pour les plus grandes collectivités.

M. Jean-Marie Bourgogne, chef de projet, Montpellier territoire numérique. - Au sein de l'association se côtoient des régions de plusieurs millions  d'habitants et de petites bourgades comme Brocas avec ses 800 habitants. L'open data répond d'abord à une demande politique, ou du directeur général des services, que nous sommes chargés de mettre en oeuvre. C'est pourquoi, au-delà du développement de l'expertise, la présence des élus est nécessaire pour asseoir la légitimité de l'association face à la Cada, la Cnil, le SGMAP (secrétariat général à la modernisation de l'action publique).

L'open data a trois objectifs : l'accès à la connaissance du territoire ; la transparence de l'action publique ; le développement de nouveaux services en direction des habitants, qui n'ont pas nécessairement d'incidence économique immédiate.

Transparence, disais-je : il ne s'agit pas de stigmatiser des élus ou des agents mais de renouer le lien entre citoyens et élus. L'expérience montre que jamais les données publiées, même potentiellement sensibles, n'ont été utilisées de manière malveillante. Ce sont plutôt les données non communiquées qui suscitent la suspicion.

L'open data permet de créer de décloisonner les propriétés des données des services producteurs et de développer de nouveaux services, par exemple dans le domaine de la multi-modalité des transports, en libérant les données détenues séparément par chaque opérateur et, à ce titre, peut susciter l'intérêt d'autres acteurs.

M. Jean-Christophe Elineau, cofondateur d'Opendata France. - Le fichier sur l'assiduité des conseillers municipaux a permis d'engager un débat avec les citoyens au sein de mon village. Ces données permettent d'engager le débat avec les citoyens.

M. Jean-Jacques Hyest, président. - Mais quelles données un village comme le vôtre peut-il publier ?

M. Jean-Christophe Elineau. - Nous avons publié vingt-deux jeux de données comportant quatre-vingt-dix fichiers sur l'école, l'eau, l'économie, le budget, l'histoire du village : je vous invite à consulter le site data.gouv.fr, où nous figurons dès la deuxième page sur une dizaine de pages au total, bien avant des collectivités beaucoup plus importantes...

M. Jean-Jacques Hyest, président. - Mais est-ce vraiment utile ? Et les données sont-elles anonymisées ? Pour des petites séries, c'est crucial.

M. Jean-Christophe Elineau. - L'anonymat est en effet très important. Le sénateur Gorce a attiré l'attention là-dessus. Il est trop tôt pour mesurer l'utilité des données mises en ligne depuis août 2013. Après les élections, nous comptons aller plus loin dans le sens de la démocratie ouverte et, personnellement, j'en attends beaucoup.

Mme Sandrine Mathon. - Nous avons été entendu par la mission d'information de la commission des Lois sur les données personnelles. En fait, les collectivités disposent de banques de données qui n'ont aucun caractère personnel : voirie, ronds-points, voies ferrées, budgets, marchés publics... C'est là notre priorité. Nous verrons ensuite comment rendre publiques des données personnelles anonymisées, s'il y a lieu.

M. Jean-Marie Bourgogne. - Les données concernées sont déjà souvent publiques, dans le cadre du conseil municipal ou par l'intermédiaire de la Cada. Nous ne faisons que formater cette publication et faciliter l'accès.

M. Jean-Christophe Elineau. - L'open data est un moyen de valoriser le patrimoine des collectivités, au sens large, par exemple forestier, dont la gestion est un enjeu considérable dans notre commune des Landes.

M. Jean-Jacques Hyest, président. - Il faut aussi avoir en tête le patrimoine immatériel. Comment mieux diffuser l'accès aux oeuvres d'un musée communal, par exemple ?

Mme Sandrine Mathon. - Nous allons prochainement publier les données afférentes à la liste des oeuvres, à leur prix d'achat... mais pas à leur localisation dans les réserves !

M. Jean-Marie Bourgogne. - Les données les plus habituellement mise en ligne correspondent à la voirie, aux espaces publics, à l'exécution budgétaire, aux services publics... Le champ culturel est l'un de ceux qui ont du mal à s'ouvrir, pour des raisons... culturelles, ou juridiques, propres à ce secteur. Je sais qu'une cellule open data au ministère de la culture et de la communication est très active sur cette question mais qu'elle se heurte à des réticences. Il en va de même du champ scientifique et universitaire, pourtant grand producteur et utilisateur de données : les données produites par les chercheurs restent protégées, même lorsqu'elles sont financées sur fonds publics : le mouvement open science a du mal à se développer face aux opérateurs commerciaux qui publient les résultats des recherches.

Le service public en revanche est assez ouvert. Une quarantaine de collectivités se sont lancées. Huit des dix plus grandes métropoles pratiquent déjà l'open data.

M. Jean-Jacques Hyest, président. - Pas toutes au même niveau.

M. Jean-Marie Bourgogne. - Personne ne fait semblant : environ un tiers des données restent à publier pour des raisons diverses (les données ne sont pas prêtes), deux bons tiers sont déjà ouvertes. Beaucoup de petites ou moyennes collectivités n'y vont pas, faute de moyens. Les collectivités de rang supérieur peuvent les y aider, notamment en hébergeant leurs données sur des plateformes. Tout le monde s'y met, car on voit bien les incidences sociales et économiques de l'open data, qui améliorent aussi l'image, l'attractivité, la visibilité de la collectivité. Les collectivités travaillent bien ensemble mais l'open data est un enjeu politique. Les collaborations sont parfois difficiles quand le maire n'est pas le président de l'agglomération : on risque de perdre alors de l'argent et du temps, comme à Bordeaux ou Montpellier, par exemple, à cause de l'empilement de structures qui ne sont gérées pas par les mêmes majorités, et donc des portails.

Etalab moissonne désormais les données des collectivités pour les mettre à disposition plus facilement sur le portail de l'Etat. Il s'agit d'éviter les doublons et de mutualiser. Les services déconcentrés de l'Etat, les établissements publics autonomes, en revanche, ne jouent pas toujours le jeu, non plus que les opérateurs privés délégataires de service public dont les contrats ne comportent pas l'obligation d'ouvrir les données.

M. Jean-Jacques Hyest, président. - C'est que le contrat est mal rédigé.

M. Jean-Marie Bourgogne. - C'est vrai lorsque le contrat est ancien. Progressivement, avec les avenants de reconduction, les choses s'améliorent... Sandrine Mathon nous aide à rédiger les arguments juridiques.

M. Jean-Jacques Hyest, président. - Quid de l'IGN et de l'Insee ?

M. Jean-Marie Bourgogne. - Le rapport Trojette sur le sujet, très précis, est sorti en juillet 2013. Facturer l'utilisation des licences risque de freiner l'innovation, ce qui profitera in fine aux géants comme Google. Les retombées financières (les redevances), pour l'essentiel, sont très faibles et finalement contreproductives. Les choses devraient prochainement évoluer.

M. Jean-Jacques Hyest, président. - Beaucoup de collectivités territoriales ont un système d'information géographique (SIG). Pourquoi ne pas se coordonner ?

M. Jean-Marie Bourgogne. - Elles en ont parfois plusieurs, avec des instruments propriétaires ; mais le SIG entre de plus en plus dans le champ de l'open data. Les usagers utilisent ces données, tout en en les coproduisant.

M. Jean-Christophe Elineau. - L'hébergement des données pose problème aux plus petites collectivités territoriales. Ma commune a d'abord eu recours aux ressources du conseil général de la Gironde, puis au portail data.gouv.fr. Pour ne pas se couper de ses habitants, il importe toutefois de créer aussi un portail local sur lequel les habitants vont chercher l'information. La secrétaire de mairie de Brocas reçoit un appel par semaine sur la démarche open data de la commune.

Mme Sandrine Mathon. - A Toulouse, les 37 communes membres de l'agglomération (de 200 à plus de 30 000 habitants) ont d'emblée pu héberger leurs données sur un portail communautaire.

Le conseil général de Saône-et-Loire travaille avec la préfecture pour élaborer des règles de coopération. Les autres membres de l'association s'inspireront de son expérience pilote. En interne, l'avantage du portail open data est qu'il rassemble toutes les informations, en décloisonnant les services administratifs ; il répond à la perplexité des agents de la collectivité, de ceux des autres administrations (comme la préfecture de Haute-Garonne), comme des usagers, qui ne savent pas toujours à quel service s'adresser, et permet de gagner en efficacité administrative. Le rassemblement de ces jeux de données intéressent les services déconcentrés, les citoyens, des opérateurs privés ; il peut susciter la création de nouveaux services.

L'accès aux données est notre premier objectif : publier, toujours publier, sous un format normalisé et utilisable. La normalisation n'est pas toujours aisée : chaque collectivité territoriale publie ses données sous des formats différents et nous avons pour principe général de publier les données telles qu'elles résultent de nos outils métiers, en s'assurant simplement qu'elles ne soient pas en format propriétaire. Ce sont les utilisateurs qui, le cas échéant, retravaillent les données pour les exploiter. Si nous pouvions faciliter ce travail en harmonisant les données en amont sur des sujets connexes, ce serait autant d'énergie gagnée. Certains de nos techniciens s'y sont spécialisés mais la normalisation doit avoir un champ géographique plus large, national, voire international. Des groupes de travail notamment européens s'y attachent aussi, ainsi que le W3C (World Wide Web Consortium) au niveau mondial.

L'enrichissement des données par les acteurs économiques locaux, le crowd sourcing, est un peu décevant. Toutefois, le projet Open Street Map, qui repose sur des contributions volontaires et a permis de cartographier très complètement Haïti après le séisme afin d'y faciliter l'acheminement des secours, est désormais enrichi par les données publiées par les collectivités territoriales. Pour les territoires engagés dans l'open data, ces cartes sont à présent les plus complètes. Google Map au-delà de 50 000 connexions, impose un tarif, pas Open Street Map. Pour un opérateur de transports, par exemple, la différence est sensible. C'est pourquoi Tisséo (réseau de transports toulousain) et le SDIS (Service départemental d'incendie et de secours) utilisent la solution Open street map.

M. Jean-Christophe Elineau. - La carte Open Street Map comporte les numéros des habitations, ce qui facilite les interventions des pompiers.

M. Jean-Marie Bourgogne. - Comme Wikipedia, Open Street Map repose sur la coopération de ses utilisateurs, une plateforme technique solide et des processus précis de contrôle et de validation des contributions. D'autres projets équivalents pourraient être envisagés sur la santé ou la nourriture par exemple.

M. Jean-Jacques Hyest, président. - Pas par les collectivités territoriales ?

M. Jean-Marie Bourgogne. - Non, ils émaneront des habitants, qui les créeront avec le soutien des services publics.

M. Jean-Jacques Hyest, président. - Et le développement de services payants ?

M. Jean-Marie Bourgogne. - On nous avait promis l'Eldorado, mais il existe encore peu de services payants utilisant l'open data. En revanche, beaucoup sont d'intérêt public. D'autres relèvent de l'économie sociale et solidaire et sont en partie financés par le public. Il existe peu d'applications rentables économiquement, mais un écosystème se met en place. Pour un coût faible, de l'ordre de 20 000 à 30 000 euros, la plus-value sociale d'un projet open data est très importante.

M. Jean-Jacques Hyest, président. - Pour une grande collectivité, c'est peu ; pour une petite, beaucoup...

M. Jean-Christophe Elineau. - Dans la mienne, cela m'a coûté la patience de mon épouse, ce qui vaut très cher...

Mme Sandrine Mathon. - Le bilan des retombées économiques est modeste en l'état. Deux ou trois start up emploient 4 ou 5 salariés sur chaque territoire. L'open data n'est pas très coûteux mais demande du temps, du prosélytisme et de l'animation. Cela apporte un surcroît d'efficacité à tous, du décloisonnement, ne serait-ce qu'en offrant un point de contact unique très précieux. Le bilan économique est donc mitigé et difficilement quantifiable. A Nantes, les différentes collectivités territoriales (région, conseil général, ville, métropole) ont mutualisé les moyens techniques en mettant en place une plateforme commune pour l'hébergement de leurs données, sous des habillages différents.

M. Jean-Jacques Hyest, président. - Pourtant, il y a toujours une concurrence entre collectivités territoriales !

Mme Sandrine Mathon. - Oui, mais elles prouvent ainsi qu'elles peuvent travailler ensemble.

M. Jean-Jacques Hyest, président. - Merci.

Audition, pour l'Assemblée des départements de France (ADF) de MM. Jean-Pierre QUIGNAUX, conseiller innovation, anticipation et nouvelles technologies de l'ADF, Stéphane NORGEOT, directeur des services de l'information et des relations avec l'usager et Mme Sophie GUIARD, directrice générale adjointe du pôle ressources, du conseil général des Côtes-d'Armor et de M. Jean-Michel MARTIN, directeur des services de l'information du conseil général de Saône-et-Loire (jeudi 13 mars 2014)

M. Jean-Jacques Hyest, président. - Nous entendons à présent des représentants de l'Assemblée des départements de France (ADF). Mme Céline Guyon (responsable de la politique de gestion des documents du conseil général de l'Aube) est absente ?

M. Jean-Pierre Quignaux, conseiller innovation, anticipation et nouvelles technologies, ADF. - L'Aube travaille beaucoup sur l'archivage électronique. Le conseil général ne se sent pas encore concerné par les problématiques évoquées dans votre questionnaire car ils ne sont pas encore prêts pour l'ouverture des données.

M. Jean-Michel Martin, directeur des services de l'information, conseil général de Saône-et-Loire. - A ce propos, allez-vous recevoir l'association des archivistes français ?

M. Jean-Jacques Hyest, président. - Une mission de la commission des lois du Sénat qui travaille sur la protection des données personnelles a reçu cette association. Nous allons lui proposer de nous envoyer une contribution écrite.

M. Jean-Pierre Quignaux. - Les départements sont au coeur de la problématique de la collecte, du traitement et de la diffusion des données administratives à utilité publique. L'ouverture de ces données nous concerne donc au premier chef, au titre de l'administration comme de la démocratie. Nous avons réalisé des travaux avec l'association « Décider ensemble » sur les enjeux démocratiques de l'open data où nous nous sommes interrogés sur l'ouverture des données publiques. Nous sommes également interpellés par la problématique des données personnelles à travers notamment toutes les problématiques de l'aide sociale qui sont au coeur des compétences des départements.

Les archives départementales, la protection du patrimoine, n'échappent pas à cette problématique de l'ouverture des données. Les départements sont de plus en plus appelés à produire des données sur eux-mêmes pour nourrir l'attractivité notamment économique et touristique de leur territoire et pour la prise de décision politique.

L'ouverture des données publiques est liée au développement de l'e-administration. Nous devons à la fois réfléchir à notre production de données dans le cadre de notre organisation actuelle et à la collecte et au traitement de l'information générée par les nouvelles technologies, susceptible d'améliorer notre efficacité. Le rapport de M. Claudy Lebreton, président de l'Assemblée des départements de France, sur Les Territoires numériques de la France de demain, souligne bien que nous sommes face à un changement de paradigme culturel. La révolution numérique gagne tous nos processus de travail et de création de politiques publiques. Il nous faut donc développer une culture interne de la donnée et du numérique, doublée d'une culture partenariale du bien commun public numérique territorial avec les citoyens et les entreprises, susceptible de valoriser notre territoire et de favoriser le déploiement d'un vivre-ensemble harmonieux.

La Saône et Loire est le premier département à s'être lancé dans l'open data et les Côtes d'Armor sont le dernier de la douzaine de départements qui se sont d'ores et déjà lancé dans cette démarche.

M. Jean-Michel Martin. - Qu'avons-nous fait en Saône-et-Loire ? Les responsables politiques y ont exprimé une volonté politique forte de libérer les données, avec deux objectifs : la transparence et le développement économique. Les données brutes, financières, économiques, budgétaires, touristiques, sont inutilisables pour le citoyen. Nous avons donc mis en place un outil (dataviz) facilitant la consultation, l'illustration, la visualisation et la comparaison des données que nous publions. Pour les entreprises, nous avons voulu faciliter l'exploitation des données en créant une plateforme où il est possible de stocker plusieurs téraoctets de données et de développer des outils. Nous avons publié tous les budgets de 2 000 à 2013, les frais de cabinet, ceux des élus, des données sur l'agriculture... Nous avons développé des partenariats, par exemple avec le SDIS sur l'accidentologie... Nous préparons une convention avec la préfecture afin de mettre en commun des jeux de données cohérents. Nous mettons en valeur les ensembles de données que nous publions, par exemple à travers des graphiques, afin que les citoyens s'y intéressent. Les enseignants peuvent aussi sensibiliser les élèves à ce sujet, dans le cadre de l'instruction civique. Cette approche doit progressivement entrer dans les moeurs. Le rôle des élus est déterminant en la matière. Les containers de données peuvent être mutualisés entre collectivités. Ensuite, chaque collectivité peut choisir de mettre l'accent sur telles ou telles données.

M. Jean-Pierre Quignaux. - L'idée se fait jour aujourd'hui qu'il s'agit aussi de fournir des données pour en recevoir en retour, pour susciter des processus démocratiques et être en interaction avec le territoire.

M. Jean-Michel Martin. - Il faut que les mêmes données se retrouvent dans plusieurs collectivités, ce qui permettrait à une entreprise de structurer les données publiées, de veiller à ce qu'elles soient utiles aux usagers. Mais pour gagner de l'argent, une entreprise a besoin d'une grande masse de données collectées au niveau national, voire au-delà. Pour l'instant, l'essentiel est de mutualiser les capacités afin de réduire les coûts mais pas de tout centraliser pour laisser de la place pour des initiatives qui ne sont pas encore identifiées.

M. Stéphane Norgeot, directeur des services de l'information et des relations avec l'usager, conseil général des Côtes d'Armor. - Le département des Côtes d'Armor est un peu en retard : notre portail d'open data est encore en construction et ne sera ouvert qu'en juin 2014. Notre premier objectif est la transparence de l'action publique. L'open data aura peut-être aussi un impact économique. La publication des données nous obligera également à revoir notre processus interne de production de données. Nous publions d'abord des données qui reflètent le coeur de notre action : action sociale et infrastructures routières. Pour cela, nos jeux de données doivent être structurés. Cela valorisera le travail des agents ou des travailleurs sociaux qui saisissent des données, sans y voir aujourd'hui d'autre fin que statistique ou administrative.

Enfin, nous privilégions une approche partenariale. Le conseil général est le plus gros employeur des Côtes d'Armor. Notre appel d'offres prévoit 50 000 à 60 000 euros d'investissements, plus 100 000 à 150 000 euros pour quatre à cinq ans de fonctionnement.

M. Jean-Pierre Quignaux. - Soit un total de 200 000 euros...

M. Stéphane Norgeot. - Au moins ! Notre plateforme technique sera ouverte à d'autres collectivités du département, ce qui permettra de mutualiser les moyens techniques, tout en conservant à chacune d'entre elles la possibilité d'afficher son propre portail. Nous avons retenu des technologies open source, ce qui est cohérent pour un projet open data. Nous ne pouvons pas payer l'accès aux données qui pourront même être réutilisées sans contrepartie, ni mention de leur origine. Nous souhaitons en effet faciliter au maximum leur exploitation et les retombées économiques grâce à cette licence ouverte. Nous associons à notre projet les associations qui sont dans le domaine du numérique et qui souhaitent participer à la création de valeur dans le département. Les acteurs locaux nous pousseront sans doute à imaginer de nouveaux jeux de données qui entraîneront des usages novateurs et nous donneront une mesure de l'utilité de la donnée libérée.

M. Jean-Jacques Hyest, président. - Quel intérêt, en effet, de libérer des données si cela ne devait servir à rien ?

M. Jean-Pierre Quignaux. - La démarche du conseil général des Côtes d'Armor reflète bien l'esprit du rapport Lebreton sur les territoires numériques de demain. Le déploiement de la culture du numérique doit servir le bien commun numérique. Il s'agit de renouer le vivre-ensemble et l'action publique collective afin d'accroître la qualité territoriale. La création commune de connaissances, autour d'enjeux communs de développement. C'est un levier d'innovation et de réinvention de l'action publique collective. Il s'agit d'un véritable changement culturel, j'y insiste, dans lequel les départements s'engagent de concert à produire de la confiance territoriale partagée. Territorialisation, mutualisation, collaboration : tels sont bien les enjeux sociétaux, démocratiques et économiques du numérique. Les départements ne s'engagent pas seuls et travaillent avec les autres collectivités sur des plateformes collaboratives interterritoriales.

Le choix est le suivant : trier collectivement nos données ou être triés, voire étrillés ! Si nous ne nous donnons pas les moyens collectifs d'exploiter nos données, d'autres le feront, car le très haut débit peut être un véritable aspirateur de valeur ajoutée hors des territoires.

Audition de M. Serge MORVAN, directeur général des collectivités locales (jeudi 13 mars 2014)

M. Jean-Jacques Hyest, président. - Pour terminer, nous entendons le directeur général des collectivités locales. La direction générale des collectivités locales (DGCL) est un grand producteur de données, et un gros utilisateur de données, notamment démographiques. Pouvez-vous nous présenter votre pratique en matière d'accès aux documents administratifs ? Les demandes sont-elles nombreuses ? Sur quels types de documents portent-elles ? Des interrogations en la matière vous sont-elles remontées par les services déconcentrés de l'Etat et les collectivités locales ? Quelle est la politique de la DGCL en matière de mise en ligne de documents administratifs et de données publiques ? Pensez-vous répondre aux besoins ? Quels partenariats sont-ils mis en oeuvre en la matière avec les collectivités locales ? Quelle est votre analyse des enjeux politiques, sociétaux et économiques de la démarche d'ouverture des données publiques dans les territoires et son articulation avec la stratégie nationale et déconcentrée de l'Etat : la DGCL dispose-t-elle notamment d'une mesure statistique des retombées économiques dans les territoires ? Quelles sont les perspectives en la matière dans le cadre de la stratégie gouvernementale relancée en 2012 ? Quelles données réutilisables mettez-vous en ligne ?

M. Serge Morvan, directeur général des collectivités locales. - La DGCL utilise beaucoup de données et répond à de nombreuses questions sur l'accès à des documents administratifs et plus largement de droit des collectivités locales et des établissements publics, notamment les intercommunalités, sur le statut de la fonction publique territoriale, sur les conditions d'exercice des mandats locaux... Nous sommes aussi chargés de la répartition des dotations de l'Etat et des fonds de péréquation de l'Etat aux collectivités locales et entre les collectivités. Ces répartitions interviennent lors du premier quadrimestre de l'année, aussi y travaillons-nous en ce moment même. Cette année, le calcul de la contribution des collectivités territoriales au redressement des finances publiques a un peu compliqué les choses, ce que je regrette, même si nous respecterons naturellement les délais juridiques.

Pour répartir les dotations, nous avons besoin de données démographiques, fiscales, budgétaires, sociales : d'où nos partenariats avec l'Insee et la DGFiP. Il nous faut aussi calculer le potentiel fiscal et financier, disposer du produit individualisé des droits de mutation à titre onéreux (DMTO), de la cotisation sur la valeur ajoutée des entreprises (CVAE)... Pour cela, nous collaborons avec la DGFiP et les services de l'Etat concernés. Nous travaillons sur des données propres à éclairer le Gouvernement et le Parlement sur les décisions concernant les collectivités locales et les relations de l'Etat avec celles-ci.

Nous utilisons donc et produisons aussi beaucoup de données pour assurer notre mission. Les textes juridiques qui émanent de la DGCL sont évidemment publiés, mais, en raison des exigences de la légistique, pas toujours conformes aux principes de clarté et de lisibilité de la loi... Heureusement Légifrance consolide les textes ! Nous recevons des demandes d'accès aux documents administratifs sur les délibérations du Comité des finances locales (CFL), du Conseil supérieur de la fonction publique territoriale (CSFPT), du Conseil national de la formation des élus locaux (CNFEL) ou des autres comités et conseils dont nous assurons le secrétariat. Chercheurs et statisticiens s'adressent également à nous pour nourrir leurs études, notamment pour accéder à des données. Des demandes nous sont aussi adressées dans le cadre de contentieux. Nous suivons, là encore, les règles de la loi de 1978 et examinons en particulier s'il s'agit de documents intermédiaires ou de documents susceptibles d'être communiqués et ce qu'il convient d'anonymiser. Depuis mai 2013, un portail commun entre DGCL et DGFiP a été créé, regroupant les portails Bercy-Colloc et DGCL auparavant distincts. Y sont publiés procès-verbaux, statistiques, circulaires, notes d'information à destination des préfets, rapports et études, qui existent encore au format papier, comptes rendus... Un département dédié (département des publications, de l'information et de la documentation, dépendant de mon directeur de cabinet) répond aux questions des internautes ou les transmet au bureau concerné : plus de 570 questions spécifiques ont ainsi été traitées ou transmises depuis avril 2013, émanant de collectivités, de préfectures, d'organismes publics, d'établissements bancaires, de fonctionnaires, de particuliers, de chercheurs. Elles portent essentiellement sur les dotations !

Une enquête de satisfaction devra sans doute être menée. Nous avons cependant l'impression que le portail répond aux attentes, puisque nous comptions 155 119 visites en mai 2013 et que nous avons atteint, en janvier 2014, 371 709 connexions mensuelles. Le service statistique ministériel, département des études et statistiques locales, placé directement sous mon autorité, est chargé des relations avec l'Insee et publie un Bulletin d'informations statistiques, sur des sujets d'actualité ou de fond. Le dernier numéro, consacré à l'achèvement de la carte intercommunale au 1er janvier 2014, comporte de nombreuses données statistiques.

S'agissant de l'accès aux données publiques, et plus particulièrement de la DGF (dotation générale de fonctionnement) et ses composantes, un CD-Rom est adressé gratuitement aux associations d'élus. Pour les entreprises - le service statistique de la Banque postale collectivités territoriales par exemple, qui a succédé à Dexia - la redevance de 1 524 euros, appliquée jusqu'en 2013, a été supprimée cette année, conformément à la décision du Comité interministériel pour la modernisation de l'action publique (CIMAP). On comptait jusqu'ici une quinzaine de demandes par an.

La DGCL s'efforce à la fois de représenter les collectivités territoriales au sein de l'Etat et l'Etat face aux collectivités territoriales.

M. Jean-Jacques Hyest, président. - Comme les préfets au niveau local !

M. Serge Morvan. - C'est en effet la même chose, au niveau central. Nous constatons ainsi combien les moyens informatiques des collectivités sont disparates. Or la transparence est indispensable à la démocratie locale. Un article du projet de loi de mobilisation des régions, déposé le 10 avril dernier sur le bureau du Sénat, qui n'a pas été examiné à ce jour, mais qui sera sans doute repris dans le projet de loi en cours de préparation, concerne justement l'open data, au sein d'un bloc d'une dizaine d'articles sur l'enjeu majeur pour la démocratie locale de la transparence financière. Il avait reçu la bénédiction du Conseil d'Etat, après de longues discussions avec Mme de Saint-Pulgent, dans le cadre du projet de loi initial.

M. Jean-Jacques Hyest, président. - Dans ce cas !

M. Serge Morvan. - Reste à arbitrer le nouvel avant-projet de loi.

Mme Corinne Bouchoux, rapporteure. - Les lois de 1978 datent d'une autre époque technologique, d'une autre époque d'attentes des citoyens. Jugez-vous des évolutions nécessaires ? Les « cas baroques » de l'intercommunalité ont-ils été recensés ? Chacun pense à Saint-Jean-de-la-Croix, dans le Maine-et-Loire... Je n'ai pas trouvé le nombre de recours sur le site. Quid de l'historique des grands électeurs dans les départements ? Certains candidats aux élections sénatoriales sont membres de diverses instances... En 2010, en alléguant d'excellentes raisons, l'on m'a poliment refusé, à la préfecture comme au ministère, l'accès aux listes des candidats aux précédentes élections, comportant des données qui auraient pu pourtant m'être fort utiles, comme citoyenne et historienne. Sans donner leurs coordonnées personnelles, ne pourrait-on au moins communiquer les noms et prénoms des grands électeurs afin de reconstituer les données historiques sachant qu'en droit rien ne s'y oppose et qu'il s'agit d'informations intéressantes?

M. Jean-Jacques Hyest, président. - Profession, âge... Bien d'autres éléments sont dignes d'intérêt !

M. Serge Morvan. - La DGCL se pose parfois des questions sur l'évolution de la législation, au regard des nouvelles technologies, mais n'a pas lancé de réflexion formelle à ce sujet, qui n'est pas de son ressort direct au sein de l'Etat. En revanche, lors de la discussion d'un projet de décret présenté au CSFPT pour autoriser le vote électronique dans les collectivités locales pour les élections professionnelles de décembre 2014 dans la fonction publique territoriale, sur lequel la Cnil a donné un avis en janvier 2014, les experts, comme les représentants des organisations syndicales et des collectivités locales, ont souligné les limites technologiques du texte.

M. Jean-Jacques Hyest, président. - Pour les services de l'Etat, la jurisprudence de la Cada est claire, les litiges rares. Aucun litige concernant la DGCL n'a été transmis à la Cada. Qu'en est-il des collectivités territoriales ? Certains particuliers abusent et certains collectivités peinent à garantir la transparence...

M. Serge Morvan. - Il arrive que des particuliers se tournent vers nous après avoir essuyé un refus d'une collectivité...

M. Jean-Jacques Hyest, président. - Vers les sénateurs aussi...

M. Serge Morvan. - En matière de contrôle de légalité, si une partie demande communication de l'analyse de la DGCL transmise au préfet, seul responsable de ce contrôle, s'agit-il d'un document intermédiaire ou d'un document faisant grief, susceptible d'être transmis ? La question s'est posée quelquefois et la DGCL a toujours considéré que seule la décision du préfet pouvait être transmise. En effet, notre document comprend une analyse en droit, que le préfet n'est pas tenu de suivre car le contrôle de légalité va au-delà.

La carte de l'intercommunalité a donné lieu à quatre recours contentieux seulement, qui ont pour la plupart abouti à des QPC (questions prioritaires de constitutionnalité) sur le fondement de la non-constitutionnalité des pouvoirs exorbitants du droit commun conférés au préfet par l'article 60 de la loi du 16 décembre 2010. Le dernier mémoire en défense que nous ayons rédigé concerne le rattachement de la commune de Thonon à la communauté d'agglomération limitrophe.

La DGCL ne dispose pas des listes de grands électeurs : je ne peux donc vous répondre mais je transmettrai votre question à la direction de la modernisation et de l'administration territoriale (DMAT), compétente pour les élections nationales et au secrétariat général du ministère de l'intérieur. Nous travaillons sur les questions électorales mais nous ne participons pas à l'organisation des élections législatives ou sénatoriales.

M. Jean-Jacques Hyest, président. - Détenez-vous les fichiers d'élus ? Désormais, des données sur l'âge, les activités professionnelles de tous les candidats seront disponibles. C'est encore plus intéressant si l'on dispose aussi des données antérieures.

M. Serge Morvan. - Nous ne détenons pas ces fichiers, mais obtenons les informations dont nous avons besoin lorsque nous les demandons.

Mme Corinne Bouchoux, rapporteure. - Dans certains départements, faute de chercheurs actifs dans le domaine, les candidats sont pénalisés. Il en va de l'équité entre les candidats. Je vous remercie d'en faire part à la direction concernée.

Mme Catherine Procaccia. - Comment est assurée la cohérence entre les informations disponibles sur votre portail et sur les sites des préfectures ?

M. Serge Morvan. - Nous mettons régulièrement les données à jour. Nous disposons de liaisons informatiques spécifiques à cette fin.

Notre portail est organisé de manière à satisfaire tous les types d'utilisateurs, depuis le curieux jusqu'au savant. Il donne au fur et à mesure des informations de plus en plus précises. En général, l'information circule bien entre les préfectures et nous.

Mme Catherine Procaccia. - Les sites des préfectures sont de qualité très diverse...

M. René Garrec. - Vous adressiez autrefois des circulaires, désormais des notes d'instruction. Quelle est leur valeur juridique ? Peut-on regarder ces instructions comme des actes préparatoires ?

M. Serge Morvan. - Les circulaires ne peuvent pas être réglementaires. Les notes d'information ne font pas grief. Elles sont transcrites dans les actes réglementaires préfectoraux qui, eux, peuvent être déférés aux juridictions administratives.

M. Jean-Jacques Hyest, président. - Monsieur le directeur général, merci.

Audition autour du projet JocondeLab de MM. Jean-François BALDI, délégué général adjoint de la délégation générale à la langue française et aux langues de France et Thibault GROUAS, chef de la mission langue et numérique, Mme Claire CHASTANIER, adjointe au sous-directeur des collections du service des musées de France et M. Laurent MANOEUVRE, chef du bureaude la diffusion numérique des collections, de la Direction générale des patrimoines du  ministère de la culture et de M. Vincent PUIG, directeur exécutif de l'Institut de recherche et d'innovation (IRI) (jeudi 20 mars 2014)

M. Jean-Jacques Hyest, président. - Notre mission commune d'information, créée à l'initiative du groupe écologiste, a désigné Mme Bouchoux en qualité de rapporteure. Elle a vocation à analyser les politiques menées par les pouvoirs publics en matière de communication des documents administratifs et d'ouverture des données publiques. Cette matinée est consacrée aux données culturelles.

Nous recevons tout d'abord Mme Chastagnier et MM. Puig, Grouas, Baldi, et Manoeuvre, qui participent, pour le ministère de la culture, au projet JocondeLab : ils nous présenteront les contours de cette initiative, nous donnant ainsi l'occasion d'aborder les questions de la valorisation des ressources culturelles : l'indexation collaborative, les conditions et limites de la réutilisation des données culturelles.

M. Jean-François Baldi, délégué général adjoint de la Délégation générale à la langue française et aux langues de France. - Le projet JocondeLab se situe dans le droit fil de nos missions, telles que précisées par l'arrêté du 17 novembre 2009 : mettre en oeuvre, conjointement avec d'autres ministères et d'autres services, des actions de l'Etat destinées à promouvoir le plurilinguisme. JocondeLab est un outil qui permettra, à terme, de consulter l'essentiel des catalogues des collections des musées de France, rassemblés au sein de la base Joconde, en quatorze langues, dont quatre régionales de France.

Le développement de ce projet, du côté du ministère, a été rendu possible par la constitution d'un pôle sur les langues et le numérique qui n'existait pas il y a un an et demi. JocondeLab s'inscrit dans le programme de modernisation et de simplification du ministère de la culture, conformément aux voeux du Premier ministre.

M. Thibault Grouas, chef de la mission langue et numérique de la Délégation générale à la langue française et aux langues de France. - Avant JocondeLab existait un partenariat stratégique, SémanticPédia, entre le ministère de la culture, l'INRIA et Wikimédia France signé le 19 novembre 2012 pour favoriser l'échange des expertises et compétences pour réaliser des projets communs. Le premier projet financé par le ministère a consisté en l'extraction par DBpedia de ressources présentes sur Wikipédia, afin de constituer une nouvelle base de données, consultables en plusieurs langues. Le ministère a développé à cette fin un programme de sémantisation, dans le cadre du schéma directeur des systèmes d'information du ministère, qui vise à permettre l'alignement ou « liage » de bases de données entre elles. Voilà d'où est issu le projet JocondeLab qui, en partenariat avec l'Institut de recherche et d'innovation du Centre Pompidou, a associé trois directions du ministère de la culture, la délégation générale que nous représentons avec M. Baldi, le service des musées de France, la sous-direction des systèmes d'information... Ce n'était pas très courant ! En bref, JocondeLab aligne les données présentes sur Joconde avec les entrées de Wikipédia, dont le plurilinguisme est plus avancé, ce qui permet ensuite de consulter les données d'origine dans d'autres langues que le français. Nous ne nous en tenons pas à notre alphabet : le chinois et l'arabe sont déjà disponibles. Outre la langue française, quatre langues régionales de notre pays, le basque, l'occitan, le catalan, le breton, sont également présentes. Et ce, grâce à la richesse du fonds Wikipédia dans ces langues auquel il peut être accédé par des moteurs de recherche.

Mme Claire Chastagnier, adjointe au sous-directeur des collections du service des musées de France. - Nous sommes très heureux de participer à ce projet. Extrêmement innovant, il est porteur d'avenir pour Joconde. Il élargit notre réflexion.

M. Laurent Manoeuvre, chef du bureau de la diffusion numérique des collections de la Direction générale des patrimoines. - La direction - devenue service - des musées de France a toujours eu le souci de rendre les oeuvres des musées accessibles au plus grand nombre. La base Joconde date des années soixante-dix : c'est une vieille dame. Elle a été créée pour et par des conservateurs de musées. En 1992, elle a été rendue disponible sur le minitel, au 3614 Joconde, et la première exposition virtuelle y a été organisée en 1994, elle concernait la peinture du siècle des lumières ; la base Joconde, pionnière en ce domaine, a ensuite été transférée sur Internet dès 1995.

Le catalogue mutualisé Joconde rassemble les collections de 200 musées, soit 500 000 notices, dont 300 000 illustrées ; 52 millions de recherches ont été effectuées sur son site l'année dernière et les images ont été ouvertes plus de 7 millions de fois en plein écran. Les utilisateurs sont le plus souvent francophones ou, du moins, francophiles. Ces collections provenant du monde entier, en ouvrir l'accès à de nouveaux publics dans leur langue était pour nous une priorité.

M. Vincent Puig, directeur exécutif de l'Institut de recherche et d'innovation. - L'IRI, créé en 2006 par le Centre Pompidou, est une entité de recherche indépendante sous forme associative, dirigée par Bernard Stiegler. L'institut consacre ses recherches à l'avenir de la diffusion des savoirs, via son projet de digital studies - ou « études numériques » en français. Celles-ci croisent l'évolution des savoirs avec la manière dont le public se les approprie. JocondeLab croise une expertise ancienne, puisqu'elle date de l'invention des bibliothèques et l'on peut remonter à celle Alexandrie, et une autre expertise, celle du public ! Cette approche invite à développer des chantiers d'indexation collaborative.

La méthode suivie peut être directive et passer par la définition limitative des mots clés utilisables. Elle a été suivie avec succès pour la mise en ligne des archives départementales, grâce à la motivation très importante des contributeurs aux fonds d'archives généalogiques par exemple. Une deuxième méthode, plus libre, consiste à croiser des folksonomies - appellations populaires - et des taxonomies - appellations scientifiques. Une cartographie est ensuite élaborée pour les croiser mais elle mobilise toutefois d'importantes ressources informatiques et produit parfois des résultats qui manquent de nuance. D'où notre préférence pour une troisième méthode, celle d'une contribution libre mais encadrée, en fonction des mots clés déjà utilisés - en l'espèce, par les contributeurs de Wikipédia.

M. Thibault Grouas. - Ce projet se distingue aussi par sa rapidité et son faible coût : il a débuté en mai 2013 pour être achevé en janvier 2014 ; le site est ouvert depuis le 27 janvier. L'accès est possible par mots clés, par mappemonde, par références historiques ou par artistes. De nombreuses fonctionnalités innovantes sont offertes. Il ne s'agit pas de remplacer la base Joconde, mais d'expérimenter de manière ouverte, sans trop de contraintes techniques, de nouvelles approches et de prouver par l'exemple, l'intérêt qu'elles peuvent avoir. Cette méthode a déjà été utilisée pour le site « Histoire des arts ».

Le projet se caractérise également par son faible coût de développement. La convention de partenariat signée avec l'IRI s'élève à 50 000 euros : le projet est donc loin d'être pharaonique. Nous sommes du reste, au vu des résultats, fortement sollicités par les responsables de la modernisation publique.

M. Laurent Manoeuvre. - Le travail dit d'alignement, c'est-à-dire de mise en relation des termes scientifiques et populaires n'a pas été simple, mais la correspondance a fonctionné pour 80 % des termes scientifiques. Il ne s'agit pas forcément des mêmes termes, ce qui nous a parfois imposé de réfléchir à ceux que nous devions retenir. Celui d'architecture commerciale, par exemple, n'existe pas dans Wikipédia, où l'on trouve plutôt « petit commerce » et « grandes surfaces ». Mais les vocabulaires ne sont, en définitive, pas si éloignés, même s'ils peuvent évoluer.

Nous avons aussi mis à profit cet outil pour lancer plusieurs processus collaboratifs. Les musées procèdent en ce moment à un colossal travail de récolement décennal qui devrait s'achever en juin 2014. Ils n'ont pas toujours le temps de faire des descriptions approfondies. On a donc lancé, comme souvent en matière d'archives, des appels à contribution du public pour indexer certaines données et images dans JocondeLab. A la fin de la semaine dernière, on comptait 2 000 contributions. Leur qualité est variable, mais elles sont faites très sérieusement. Une autre expérimentation vise à évaluer et valider les processus susceptibles de garantir la qualité des apports collaboratifs. Il faut être rigoureux et mettre en place un échange entre experts et contributeurs pour que les résultats offerts au public soient fiables. Le succès des projets collaboratifs, comme celui des archives de la Vendée, repose ainsi sur une forte participation du public.

M. Vincent Puig. - Nous travaillons sur l'herméneutique du numérique, la science participative. En effet, la suprématie de certains moteurs de recherche conduit à l'appauvrissement de la langue ou des critères d'indexation, ce que l'on désigne par le terme d'« entropie ». De fait, vous tapez quelques lettres et l'on vous propose déjà des mots clés - on se demande d'ailleurs qui les a choisis mais c'est une autre affaire... Il faut combattre une telle tendance, procéder à un travail d'herméneutique et conduire des ateliers d'interprétation, comme le fait le Museum d'histoire naturelle.

Sur Wikipédia, chaque article conserve la trace de ses rédactions successives auxquelles les internautes peuvent se référer, ce qui garantit la qualité de la catégorisation collaborative. Il serait utile de compléter en ce sens les outils comme JocondeLab. La confrontation fait progresser la science. La question de la catégorisation, qui est au coeur de nos activités, est très intéressante à discuter.

M. Thibault Grouas. - Une précision : l'indexation collaborative est également multilingue. La maison peinte sur une toile de Vincent van Gogh sera référencée à house en anglais, casa en espagnol. Les correspondances multilingues établies par Jocondelab entre les différentes notices nous ont permis de limiter la traduction aux seuls termes employés par l'interface de navigation.

Mme Corinne Bouchoux, rapporteure. - Vous contribuez très utilement à la culture partagée. Comment concilier tout cela avec la sécurisation des collections publiques ? Certains musées, notamment américains, photographient le recto et le verso des tableaux. Le coût de cette opération est un vrai sujet. Y procéder systématiquement est impensable, s'y refuser totalement aussi. Que comptez-vous faire ? Une réponse par écrit est possible.

M. Jean-Jacques Hyest, président. - Quid des droits d'auteur pour les oeuvres contemporaines ?

M. Laurent Manoeuvre. - La libre réutilisation des données est la règle pour le projet de catalogue européen des collections des musées nationaux, Europeana. S'agissant des musées nationaux, nous avons débloqué tous les droits de réutilisations d'images et de textes. Pour les musées territoriaux en revanche, ce serait un gros travail de recueillir l'accord de toutes les collectivités. En outre, un petit musée de province comme le musée Alfred Danicourt à Péronne vend des clichés photographiques pour plusieurs milliers d'euros par an : ce revenu n'est pas négligeable.

La libre réutilisation a un enjeu : la National Gallery de Washington l'autorise, les photos des oeuvres qu'elle possède sont reproduites partout. Même chose pour les oeuvres du Rijksmuseum, dont les reproductions sont disponibles gratuitement en haute définition... Ces clichés ont vocation à circuler partout dans le monde et à s'imposer au détriment des nôtres. L'image de notre patrimoine en dépend.

M. Alain Richard. - La réponse n'est pas tout à fait complète. Lorsque l'auteur de l'image est vivant et détenteur de ses droits, la cession de droits au musée qui l'expose n'emporte pas forcément la pleine autorisation à transférer les droits de diffusion de ses images. Il faudrait étudier chaque contrat ! Je note aussi que lors du vote de la loi de 1985, beaucoup étaient persuadés que le la bataille était perdue d'avance et que le droit d'auteur allait en Europe s'effacer devant le système américain du copyright. C'est l'inverse qui s'est produit.

M. Vincent Puig. - Les droits d'auteur en matière de logiciel sont un autre enjeu de taille pour les grands acteurs du numérique, un enjeu politique pour le W3C, le World wide web consortium, avec les menaces sur la neutralité du net. Les pressions politiques, pour une libération des données comme pour leur soumission accrue aux règles de la propriété, sont nombreuses et fortes. Des menaces planent sur la neutralité de l'internet. L'accès aux algorithmes permet seul de constituer le web sémantique. Les services informatiques du ministère de la culture sont attachés au principe de codes sources libres, ce qui garantit une bonne compréhension des rapprochements. L'accès aux algorithmes est aussi important que l'accès aux données. La revue Réseaux a publié en octobre dernier une contribution très intéressante sous le titre Politique des algorithmes, les métriques du web.

Audition conjointe de Mme Georgette ELGEY, présidente du Conseil supérieur des archives, et de MM. Hervé LEMOINE, directeur du Service interministériel des archives de France et Bruno RICARD, chargé de mission (Siaf) (jeudi 20 mars 2014)

M. Jean-Jacques Hyest, président. - Nous recevons à présent Mme Elgey, présidente du Conseil supérieur des archives et M. Lemoine, directeur du service interministériel des archives de France, pour évoquer la communication des archives. Après nous avoir rappelé le statut et les missions du Conseil supérieur, pourriez-vous nous indiquer quelles sont ses recommandations ? Des modifications législatives vous paraissent-elles nécessaires ? Quelle est la position du Conseil sur la transposition de la directive de juin 2013 ?

Mme Georgette Elgey, présidente du Conseil supérieur des archives. - Si un arrêté de 1988 a modifié sa composition, le Conseil supérieur des archives n'en est pas moins une institution centenaire. Elle est purement consultative, composée de quarante membres, dix-neuf de droit, les autres nommés par le ministère de la culture en qualité de personnalités qualifiées. Elle compte aussi des représentants de syndicats. En un mot, c'est le seul lieu où se rencontrent tous les acteurs qui s'intéressent aux archives. Depuis 1988, elle comprend deux parlementaires. Actuellement, il s'agit du sénateur Garrec et du député Gaymard. Leur présence a donné à l'institution un poids qu'elle n'avait pas. La lutte contre la suppression des archives d'état civil anciennes envisagé par un projet européen a porté ses fruits en partie grâce à eux. Nous avons récemment publié un guide des archives notariales. Nous travaillons actuellement sur le statut juridique des archives orales, problème qui n'a jamais été réglé.

M. Jean-Jacques Hyest, président. - Communication, mise en ligne, réutilisation des documents numérisés, transposition de la directive de 2013, où le Siaf en est-il sur tous ces chantiers ?

M. Hervé Lemoine, directeur du Service interministériel des archives de France (Siaf). - Ces questions sont d'importance. Avant même d'être un enjeu culturel, les archives ont une dimension régalienne et citoyenne. Le Siaf, héritier institutionnel de la direction des archives de France, existe en son état actuel, au sein de la direction générale des patrimoines du ministère de la culture depuis la RGPP. Service du ministère de la culture, il met en oeuvre les dispositions du code du patrimoine, essentiellement son livre II : conception, coordination et pilotage de la politique d'archivage. Nous vous enverrons une contribution écrite sur ce point.

Notre première responsabilité est de veiller à ce que les archives publiques, d'abord garantes de droits pour les citoyens, soient conservées dans le réseau des services publics d'archives. Nous avons donc un droit - exorbitant ! - de vie ou de mort sur les archives. C'est une responsabilité très forte à l'égard de la conception de ce qui va constituer le socle de connaissance juridique et citoyen pour les temps futurs !

Deuxième mission : nous sommes la tête de réseau des centres des archives nationales : celui de Paris et ses sites de Fontainebleau et de Pierrefitte, et le réseau territorial des archives départementales. Les directeurs des archives départementales sont des fonctionnaires d'Etat mis à disposition des collectivités territoriales, qui assurent le contrôle scientifique des archives territoriales. Ce maillage fin du territoire atteste qu'en la matière, la décentralisation a été réussie. Notre troisième mission - mais je ne m'y attarde pas - est de nature culturelle.

Les archives sont un domaine interministériel par excellence, avec cependant un régime d'autonomie pour les archives de la défense et celles du Quai d'Orsay.

M. Jean-Jacques Hyest, président. - Et celles des assemblées parlementaires !

M. Hervé Lemoine. - Bien entendu, et sur le fondement d'une loi organique. Le réseau représente 4 000 kilomètres linéaires de documents : 70 nouveaux kilomètres linéaires de plus chaque année ! Une fois échue leur durée d'utilité administrative, les documents nous sont versés. Les demandes de consultation des documents sont de deux ordres : les plus nombreuses sont le fait de chercheurs ou de particuliers, à des fins de recherche historique ou généalogique ; les autres demandes sont motivées par la nécessité pour l'intéressé de justifier d'un droit. Celles-ci concernent des documents ayant une durée de vie administrative « secondaire » plus longue - consultation d'un jugement de divorce à l'occasion d'une succession, de dossiers de tutelle, d'adoption, d'hypothèques par exemple, qui font l'objet de 8 000 consultations par an rien qu'à Paris. Ces dernières années, de nombreux services ont cherché à limiter la durée d'utilité administrative « première » si je puis dire des documents, afin d'en accélérer le transfert vers les services d'archives départementales, et ainsi leur transférer une charge non négligeable, ce dont les conseils généraux ne manquent pas de se plaindre.

L'accès aux archives est encadré par les articles L. 213-1 à L. 213-3 du code du patrimoine. Les conditions ont été alignées sur celles définies à l'article 4 de la loi du 17 juillet 1978 relative à la communication des documents administratifs.

Le principe est celui d'une consultation gratuite sur place, l'envoi d'une copie payante par courrier ou encore l'envoi gratuit par courriel quand le document est déjà numérisé. Le délai de réponse est d'un mois, ce qui pose parfois difficulté pour les documents administratifs nécessaires dans des procédures judiciaires. Les services, qui ne peuvent donner priorité à une demande sur l'autre, ne peuvent pas toujours répondre en temps utile pour l'intéressé, surtout lorsqu'à côté un particulier demande la copie de centaines de pages de registres, alors que nous manquons de personnel pour ce faire. L'alignement du code du patrimoine sur la loi de 2008 pour l'accès aux documents administratifs et la consultation des archives publiques, a donc eu des effets de bord problématiques et nous ne parvenons pas toujours à tenir les délais.

Autre difficulté, la numérisation de données personnelles. Faut-il transférer à celui qui en fait la demande la totalité du fichier ? La réutilisation suppose en principe une autorisation de la Cnil. Dans le même temps, nous ne pouvons en interdire la consultation. Or de tels documents sont particulièrement volatiles et le risque est grand, qu'à l'occasion de cette consultation, ils nous échappent, nous privant ce faisant de tout contrôle sur leur réutilisation future. La question du rapprochement opéré en 2008 pose à cet égard problème, je ne vous cache pas que nous cherchons à remédier à ces écueils dans le projet de loi en préparation. Nous entretenons de bonnes relations avec la Commission d'accès aux documents administratifs (Cada), à laquelle nous siégeons. Nous avons parfois des débats, comme sur la définition de la demande abusive : est-ce seulement la volonté de nuire à l'administration, ou bien aussi une demande excessive de copies ?

Je reviens sur la question des délais de communication, Selon la loi de 2008, tout document administratif est immédiatement disponible, sauf exceptions. Il faudrait mieux articuler les délais et les simplifier, aussi bien pour le citoyen que pour le praticien des archives. Pour un même dossier d'archives, entité physique, il existe souvent plusieurs délais : soixante ans, soixante-quinze ans, vingt-cinq ans à partir du décès de la personne, cent ou cent vingt ans à partir de la naissance de la personne.

Il serait par ailleurs utile de poursuivre l'ouverture des archives aux citoyens. Il existe beaucoup trop d'exceptions, dont certaines choquantes, et la ministre de la culture s'est émue de l'existence d'archives réputées définitivement incommunicables.

Lors de l'inauguration du site de Pierrefitte, le Président de la République a souligné que, si le secret était légitime, il ne devait pas faire obstacle à la transparence démocratique nécessaire. C'est évidemment notre feuille de route.

M. Jean-Jacques Hyest, président. - Cela peut poser difficulté pour les archives judiciaires.

M. Hervé Lemoine. - Nous sommes très favorables à des dérogations générales spécifiques, lorsqu'elles répondent à des demandes sociales fortes. M. Lionel Jospin en avait accordé une pour des archives de la Seconde Guerre mondiale. Nous travaillons sur des dérogations générales spécifiques concernant les archives de la Seconde Guerre mondiale non encore communicables ; celles relatives aux grands travaux de la présidence de François Mitterrand ; ou encore celles du procès de Klaus Barbie, enregistré à des fins historiques. Nous nous efforçons de répondre ainsi aux demandes des historiens et à la demande sociale.

Qu'en est-il de la diffusion numérique ? Depuis quinze ans, nous avons, les collectivités territoriales et l'Etat, mené une politique délibérément volontariste de numérisation et de mise en ligne des archives publiques. Photos, cartes postales, se prêtent particulièrement bien à la numérisation, qui est un vecteur de démocratisation de la connaissance.

Cette politique a porté ses fruits : 300 millions de documents sont d'ores et déjà disponibles sur les sites Internet des archives nationales et départementales, plus de 2 milliards de pages sont lues annuellement, ce qui fait des archives les données culturelles les plus consultées en France. Les internautes, particulièrement les généalogistes, sont très friands des archives de l'état civil, mais aussi les registres de délibérations des communes - on apprend beaucoup sur l'histoire de leur commune en lisant les comptes rendus des délibérations des conseils municipaux. Il en est de même pour les archives photographiques, souvent méconnues, qui sont de précieux documents sur l'histoire sociale et patrimoniale de nos terroirs.

Actuellement, nous portons un grand projet avec les collectivités locales, notamment les départements : un mémorial électronique des 9 millions de combattants de la Première Guerre mondiale. Pour l'heure, le site « Mémoire des hommes » ne recense que les « morts pour la France ». Nous voudrions aller plus loin afin de reconstituer le parcours et les opérations de toutes les unités combattantes, donc de tout soldat. Le Président de la République y attache une grande importance, il l'a mis en exergue dans sa conférence de presse du 7 novembre 2013. Au moment où l'on parle de la Grande Guerre, l'enjeu est que chacun puisse retracer le parcours de guerre détaillé d'un aïeul, d'un collatéral, d'un proche. Cette base sera reliée avec les journaux de toutes les unités combattantes.

Tout cela serait impensable sans un partenariat fort, étroit et innovant, entre l'Etat et les départements.

A cet égard, il nous revient d'assurer la sécurité juridique des projets, notamment en instruisant les demandes auprès de la Cnil, et leur sécurité technique, notamment l'interopérabilité des données et le moissonnage des données. Administration centrale, nous avons également à coeur de soutenir financièrement les projets locaux et de garantir un accès équitable aux données sur tout le territoire, faire en sorte qu'aucun site départemental n'affiche une page blanche parce qu'il n'a pas eu les moyens de les mettre en ligne.

La première directive de 2003, telle que transposée dans notre droit national, restait floue s'agissant des données culturelles, en principe exclues de son champ, ne prévoyant que la possibilité de dérogations à ce droit commun. Cela a amené certaines collectivités à considérer qu'elles pouvaient opposer un refus à toute demande de réutilisation à titre commercial émanant d'une société privée. La Cada a considéré que seul un motif d'intérêt général pouvait justifier un tel refus, ce qui n'est guère plus précis. D'où des contentieux.

Espérons que la transposition de la prochaine directive lèvera toutes les ambiguïtés - à commencer pour la réutilisation des données personnelles, qui nécessite une autorisation de la Cnil. Il le faut car les collectivités territoriales, qui ont beaucoup investi depuis quinze ans en ce domaine, ont le sentiment d'être « siphonnées » par des sociétés privées à des fins commerciales. La transposition prochaine de la nouvelle directive est l'occasion d'y revenir pour trouver une solution pragmatique, concrète et durable. Nous sommes favorables à la réutilisation sous condition de licences précisant les conditions, notamment financières. En 2010, nous avons élaboré un règlement général encadrant le principe de cette réutilisation ; nous allons y retravailler avec Etalab.

Il faut aussi préciser le champ de ce que l'Union européenne désigne sous le vocable de documents administratifs, dont l'acception paraît plus large dans la directive qu'en droit français. En effet, quid des archives privées, qui sont nombreuses dans nos services, car elles font l'objet de dations ? Il conviendra de le préciser à l'occasion de la transposition de la nouvelle directive afin d'éviter des contentieux.

Mme Corinne Bouchoux, rapporteure. - Merci de cette synthèse sur un sujet stratégique.

M. Alain Richard. - Pour contribuer à la réflexion collective, nous rencontrons, en ce domaine comme dans d'autres, un choc entre le possible et le souhaitable. Ceux qui ont demandé la création de cette mission veulent plus de souhaitable ; d'autres devront bien dire à un moment ou à un autre, ce qui est possible.

La gratuité pose une question d'intérêt général. Le droit de tirage qu'elle confère à tout citoyen, pour tout motif, même le plus futile, sur le temps et la diligence des fonctionnaires chargés des archives s'exerce au détriment de la collectivité. La gratuité peut être, de plus, banalisante et dévalorisante, et modifier l'attitude des citoyens vis-à-vis du service qui leur est rendu. Ce principe, il faut le dire, n'est pas forcément égalitaire ni progressiste ; il coûte à la collectivité.

Les archives sont un acte de souveraineté. En français, le terme d'Etat renvoie à ce qui reste, ce qui subsiste, ce qui tient debout. Les archives sont un élément du squelette de l'Etat ! Malgré tout le respect que j'éprouve pour le Président de la République, la mode de la transparence, un peu superficielle, méconnaît complètement l'intérêt général dans certains cas. Il existe de solides raisons de ne pas toujours imposer la publicité immédiate des archives. Comment un juge se prononcera-t-il s'il sait que ses propos dans le cadre du délibéré ne seront pas tenus secret de son vivant ? Le fonctionnement de la justice pourrait en être altéré.

M. Jean-Jacques Hyest, président. - Madame Elgey, dans votre carrière d'historienne de la IVe République, avez-vous eu des difficultés à vous faire communiquer des archives publiques ?

Mme Georgette Elgey. - La plupart des dérogations que j'ai demandées m'ont été accordées. Je dois toutefois signaler que j'ai rencontré plus de difficultés à accéder aux rapports de Germaine Tillion aux archives de la France d'outre-mer. Après avoir enfin obtenu une dérogation, ma déception a été grande car le carton étiqueté à son nom ne contenait que des échanges de correspondances sur le virement de son traitement entre le CNRS et le gouvernorat général : aucun de ses rapports rédigés lorsque Jacques Soustelle était gouverneur général de l'Algérie n'avait été conservé !

Du reste, la consultation des archives est délicate. Les documents peuvent parfois être éparpillés. J'ai souvenir, aux archives historiques de l'armée de terre, d'une dénonciation d'exactions par le maire d'une commune de la banlieue d'Alger, attestée par de nombreuses signatures. Or, dans un autre dossier, il apparaissait en réalité que les faits allégués étaient totalement faux et qu'il s'agissait d'une manoeuvre contre le régiment du général de La Bollardière. Cela vaut pour d'autres épisodes que la guerre d'Algérie. Je songe à la lettre d'un ancien compagnon de la Libération protestant parce que le mari algérien de sa nièce avait été tué par l'armée. Dans un autre dossier, on comprenait que cet homme avait été dénoncé... par sa femme, la nièce en question. Les archives, précieuses et passionnantes, doivent être traitées avec précautions et humilité. Elles ne recèlent pas forcément la vérité - si tant est que celle-ci existe.

M. Jean-Jacques Hyest, président. - Merci pour cet échange passionnant. J'ai veillé, lors de la discussion de la loi sur les archives, à ce que les directeurs d'archives départementales soient encadrés et nommés par l'Etat, avec l'accord de la collectivité locale. C'est une garantie de professionnalisme.

M. Hervé Lemoine. - En effet. Je suis souvent amené à présenter notre modèle à l'étranger ; j'insiste sur la nécessité d'une unité de la « doctrine archivistique » sur le territoire, afin d'assurer une équité totale sur le territoire. C'est une question régalienne. Pour autant, la doctrine n'est pas hors-sol : critères de sélections, délais, tout cela est discuté entre administration centrale et services départementaux au sein de groupes de travail. Notre modèle est du reste un exemple pour de nombreux pays.

M. Jean-Jacques Hyest, président. - Une question pour l'avenir : comment la « e-administration » conservera-t-elle ses données à long terme, données paradoxalement plus nombreuses qu'à l'époque du papier ?

M. Hervé Lemoine. - Il y a un risque de page blanche en effet.

M. Jean-Jacques Hyest, président. - Tout est électronique, notamment dans les échanges avec la préfecture. On stocke, bien sûr. Mais ensuite, comment archive-t-on ?

M. René Garrec. - Cela mérite un prochain rapport !

M. Jean-Jacques Hyest, président. - Je m'en inquiète depuis longtemps. Il y a des enjeux techniques et un problème de moyens.

M. Hervé Lemoine. - Un tiers des départements se sont dotés de plateformes d'archivage électronique depuis 4 à 5 ans seulement. L'Etat travaille, dans le cadre d'un projet interministériel entre les archives nationales, les affaires étrangères et la Défense, sur une brique logicielle, dénommée Vitam, pour faciliter cet archivage et gérer le cycle de vie des données électroniques, mais nous sommes encore loin du schéma idéal...

M. Jean-Jacques Hyest, président. - Le Sénat participe également à ce projet. Il est en avance, il faut le dire car c'est peu connu.

Audition de M. Bruno RACINE, président de la Bibliothèque nationale de France (BnF) (jeudi 20 mars 2014)

M. Jean-Jacques Hyest, président. - Nous entendons M. Bruno Racine, président de la Bibliothèque nationale de France (BnF), accompagné de M. Arnaud Beaufort, directeur général adjoint chargé des services et des réseaux.

L'ouverture des données culturelles est un enjeu majeur mais aussi un défi technique et juridique. Pouvez-vous nous présenter la politique de diffusion et de réutilisation des données de la BnF ? Quels sont ses objectifs ? Quels partenariats avez-vous développés, y compris avec les acteurs privés ? Comment voyez-vous la transposition de la directive de juin 2013 et la mise en oeuvre des engagements de gratuité pris dans le cadre du G8 ?

M. Bruno Racine, président de la Bibliothèque nationale de France. - Je précise que M. Arnaud Beaufort a également été le rapporteur du volet « numérisation » de la culture, hors archives, demandé par le Premier ministre dans le cadre de la modernisation de l'action publique (MAP).

La BnF a une politique ancienne de numérisation du patrimoine : Gallica a ouvert en 1998, à la fin du siècle dernier. La politique de numérisation, initialement concentrée sur les textes fondamentaux, a changé d'échelle en 2005, à la suite de l'annonce de la diffusion massive de textes par Google. Nous sommes alors passés d'un processus artisanal à un processus de masse pour les imprimés, livres et revues. Nous allons prochainement lancer le troisième marché de numérisation de masse qui sera ouvert à hauteur de 30 % à des bibliothèques partenaires en France.

Depuis 2009, nous nous attachons également à numériser ce que nous appelons dans notre jargon les collections spécialisées : manuscrits, partitions, estampes, gravures, photographies, cartes et plans, monnaies et médailles... qui font la singularité de notre patrimoine.

Gallica rend accessibles 2,9 millions de documents libres de droit. Si on leur ajoute les documents sous droits de Gallica qui ne sont pas consultables à distance mais seulement intramuros, cela fait 3,2 millions de documents en tout. Cet écart va s'accroître avec la numérisation de textes sous droits, notamment dans le cadre de la loi sur les indisponibles.

Nos objectifs sont les suivants : rendre disponibles à distance les collections de la BnF, dont la consultation était naguère réservée à quelque 1 300 lecteurs accrédités par jour, mais aussi assurer la conservation des manuscrits fragiles jusqu'alors très peu accessibles qui deviennent ainsi largement accessibles sans dommage pour les originaux, enfin ouvrir le champ aux réutilisations à des fins récréatives, éducatives ou commerciales, notamment éditoriales. Il convient en la matière de distinguer les « métadonnées » -  les notices descriptives des documents et notices bibliographiques - et les documents eux-mêmes. Les deux problématiques, si différentes soient-elles, sont naturellement liées.

Notre public n'est pas limité. Il est composé certes essentiellement des chercheurs et éditeurs mais, avec la numérisation, nous pouvons toucher les enseignants et les communautés virtuelles qui se cristallisent autour de tel ou tel thème ou centre d'intérêt. C'est en quelque sorte, et comme le souhaite la Commission européenne dans ses recommandations, faire de cette masse considérable de données culturelles un aliment pour la croissance d'industries créatives et favorisant l'émergence de nouveaux services ou produits marchands.

Concernant les métadonnées, il a fallu, car elles étaient enregistrées sous un format assez ancien, entreprendre un travail considérable de reprise des 13 millions de données bibliographiques, qui n'étaient pas exploitables par les moteurs de recherche. Ce service est mené via data.bnf.fr qui, à la différence d'un catalogue classique, réalise des clusters - des agrégations de données sur un sujet particulier. Prenons, que sais-je, Balzac. Vous trouverez rassemblées sur une même page l'intégralité de ses oeuvres, des travaux sur ses oeuvres, mais aussi des gravures ou des photos. Ainsi se trouve structuré un réservoir très riche et très facilement repérable par les moteurs de recherche. Depuis le 1er janvier 2014, l'ensemble de ces données ont été placées sous la licence Etalab.

Europeana, le portail qui donne accès aux ressources numériques européennes et dont j'assure la présidence pour deux ans encore, a demandé aux institutions contributrices de placer les métadonnées sous la licence libre la plus ouverte possible (CCO), qui n'oblige pas à mentionner la source initiale, tout simplement parce que nous n'avons pas les moyens de contrôler la réutilisation des données ni d'appliquer des sanctions. Tous les services culturels français n'avaient pas procédé ainsi, certaines notices très savantes étant protégées par le droit d'auteur, et leurs contenus sont donc sortis d'Europeana, ce qui a réduit la part des contenus français sur ce portail. Les bibliothèques françaises toutefois n'ont généralement pas suivi cette voie restrictive et préféré considérer que leurs notices étaient faites pour être mises à disposition, sauf à disparaître.

Pour la BnF ou l'INA, la libération des métadonnées ne posait pas de problème majeur. Les musées et les archives la voyaient d'un autre oeil, dès lors que les notices étaient couvertes par le droit d'auteur. Finalement, nous en sommes venus à l'idée que la libération des métadonnées est un phénomène de fond, y faire obstacle diminuerait la part des auteurs français dans Europeana.

J'en viens aux contenus eux-mêmes. La problématique rejoint celle des archives. La réutilisation des contenus de Gallica est libre dès lors qu'elle n'a pas de but commercial. Si tel est le cas, nous appliquons une grille de tarifs, votés au conseil d'administration, publics et qui respecte l'esprit de la directive : le tarif est légèrement supérieur au coût marginal de production. Et il est identique pour tous : nous ne sélectionnons pas les clients au plus fort potentiel.

La filiale de numérisation de la BnF a été créée il y a deux ans, dans le cadre des investissements d'avenir. La création de cette structure dédiée répondait à une condition posée par le Commissariat général à l'investissement. La filiale a conclu deux accords : sur le livre imprimé ancien, antérieur à 1700 ; et sur les collections sonores. Un autre projet à venir porte sur la presse ; il n'entre pas dans le cadre de la numérisation de masse des imprimés car cette dernière dépend financièrement du Centre national du livre alors que la presse relève d'un système de financement spécifique. Les collections numérisées dans le cadre de ce nouveau partenariat, qui intéressent un public plus large que les textes en latin du XVIe siècle, seront immédiatement accessibles, contrairement au partenariat précédent qui prévoyait une exclusivité de dix ans au partenaire privé. Ces conditions de réutilisation sont conformes à la directive européenne. Nous plaidons pour une durée d'indisponibilité des données abaissée à sept ans.

En matière de collections sonores, le modèle est hybride : une partie est en libre accès à travers la plateforme qui héberge certaines de ces données : YouTube, Dailymotion, etc. Les partenariats à venir concerneront également des fonds thématiques, -histoire de l'art et droit, auquel contribue la bibliothèque du Sénat-, ou régionaux, notamment les revues des sociétés savantes locales qui sont une mine de renseignements considérable.

La BnF anime un réseau de pôles associés - bibliothèques municipales et universitaires, auxquelles nous redistribuons sous forme de subventions environ 2 millions d'euros par an. Cette coopération alimente maintenant principalement la numérisation de masse et permet d'assurer la cohérence de la démarche de numérisation, ce qui permet d'éviter les doublons et que subsistent des lacunes importantes, dans le cadre du schéma national de numérisation des bibliothèques qui m'avait été demandé par Mme Albanel alors ministre de la culture, et que j'ai remis à son successeur. Nos partenariats couvrent également la diffusion. Gallica procède en outre au moissonnage des ressources numériques d'autres bibliothèques publiques et devient ainsi une sorte de bibliothèque numérique de France, au-delà des seules collections de la BnF.

Les données numériques étant périssables, la BnF a développé, grâce au financement du CNL (Centre national du livre), un système de préservation et d'archivage réparti (Spar) qui offre également ses services à des tiers, du simple stockage à la diffusion. Nous mettons en outre en oeuvre avec la bibliothèque nationale universitaire de Strasbourg, le service « Gallica marque blanche », qui permet aux bibliothèques partenaire de se doter de leur propre bibliothèque numérique sans avoir à réaliser tous les investissements techniques ou logiciels nécessaires : leur bibliothèque numérique, entièrement personnalisée à ses couleurs, est en fait opérée par Gallica, qui référence également les ressources du partenaire dans un enrichissement à double sens : le partenaire peut en effet importer toutes les références qui présentent en effet un intérêt pour lui, par exemple nos documents sur l'Alsace repris par Numistral, mis en oeuvre par la BNU de Strasbourg. C'est un bon exemple de ce qu'un grand établissement public national peut faire en matière de mutualisation de ses réalisations, toutes les améliorations apportées aux fonctionnalités de Gallica bénéficiant immédiatement aux bibliothèques numériques des partenaires.

Par ailleurs, nous voyons bien la demande de libération des contenus numérisés qui émerge. C'est en réalité un choix politique qui est sous-jacent et qui n'est pas celui du Gouvernement français ni le nôtre. La réutilisation commerciale est aujourd'hui payante. La rendre gratuite pour stimuler la croissance et l'édition numérique se conçoit, mais le modèle économique des institutions publiques culturelles devrait alors être revu en profondeur. Aujourd'hui, la BnF perçoit 500 000 euros par an au titre de ces redevances pour exploitation. Cette ressource peut même aller croissant : nous avons conclu un accord avec Hachette pour l'impression à la demande des oeuvres numérisées de Gallica et, depuis l'année dernière, nous voyons croître la demande et donc les recettes potentielles.

- Présidence de M. Yves Détraigne, vice-président -

Mme Corinne Bouchoux, rapporteure. - Lorsque cette mission a été demandée, la question de la gratuité n'était qu'une parmi d'autres. J'ai suivi les débats à l'Assemblée nationale : qu'est devenue la question de la consultation des accords de partenariat par les parlementaires ?

M. Bruno Racine. - J'ai sollicité l'avis de la Cada sur ce point. Son avis très circonstancié indique ce qui peut être communiqué. Sont donc disponibles en ligne les accords dûment biffés pour les stipulations nuisant au secret industriel et commercial. J'ai en outre transmis à M. Bloche les accords intégraux. Ce qui a été possible à l'Assemblée nationale le sera pour le Sénat...

Mme Corinne Bouchoux, rapporteure. - C'était ma seconde question !

M. Bruno Racine. - Une précision : la directive n'a pas d'incidence sur nos tarifs, car nous l'avions anticipée.

Mme Corinne Bouchoux, rapporteure. - Les positions du G8 sur la gratuité dépassent le cadre de cette modeste mission...

Audition de M. Mohammed Adnène TROJETTE, magistrat à la Cour des comptes, auteur d'un rapport sur l'ouverture des données publiques (jeudi 20 mars 2014)

M. Jean-Jacques Hyest, président. - Nous recevons maintenant M. Trojette, magistrat à la Cour des comptes, auteur du désormais fameux rapport intitulé sur L'ouverture des données publiques : les exceptions au principe de gratuité sont-elles toutes légitimes ?. Après nous avoir rappelé les principales conclusions de votre rapport, pourriez-vous nous éclairer plus particulièrement sur les éléments de calcul des bénéfices susceptibles de résulter, en France, pour les différentes catégories d'acteurs, de l'ouverture des données publiques ; l'ampleur et l'intérêt, pour les différentes catégories d'utilisateurs, des gisements de données publiques non encore ouvertes ; les capacités des producteurs de données publiques à supporter les coûts de leur mise à disposition ; les modalités de calcul des redevances pour accès aux données publiques qui seraient maintenues, en particulier : le lien entre la prestation et le service rendu ; le calcul du coût du service ; la pertinence de clauses d'exclusivité temporaire (dans le domaine culturel notamment) ; enfin, les conditions auxquelles pourrait être développée une offre de services complémentaires payants par les producteurs de données publiques : les acteurs que vous avez entendus ont-ils une démarche documentée à moyen terme en la matière ? Votre rapport trace tout un programme !

M. Mohammed Adnène Trojette, magistrat à la Cour des comptes. - Je vous remercie de m'avoir invité à m'exprimer sur ce sujet sur lequel je me suis beaucoup investi car je l'estime crucial pour la santé de notre démocratie, la capacité de modernisation de notre administration, ainsi que pour certaines filières industrielles d'avenir. Ingénieur en informatique et télécoms de formation, ancien élève de l'ENA et aujourd'hui magistrat à la Cour des comptes, chargé de cours à Sciences Po sur l'Etat et la révolution numérique, j'ai à connaître de questions liées à l'informatique tant sous l'angle technique qu'à travers celui de la gestion publique depuis une dizaine d'années. Mes propos n'engagent nullement la juridiction à laquelle j'appartiens.

Conformément aux orientations fixées par lettre de mission, mon rapport traite exclusivement des cas où les informations publiques mises à disposition dans le cadre de la loi Cada sont commercialisées. Il est intervenu alors que le gouvernement, qui envisageait de donner un second souffle à l'ouverture des données publiques, s'interrogeait sur le sens des résistances opposées à ce mouvement par certaines administrations. Ce rapport apporte d'abord des clarifications factuelles et étayées sur plusieurs points : les raisons pour lesquelles les administrations ont fait le choix de mettre à disposition des données publiques de manière payante, alors que d'autres jeux de données sont accessibles gratuitement ; le montant des recettes tirées des redevances associées et les modèles économiques retenus par les administrations qui ont fait le choix de la commercialisation. Je me suis intéressé, en deuxième lieu, à l'impact sur la société de l'ouverture des données publiques, en m'appuyant notamment sur une comparaison internationale. J'ai enfin exploré les perspectives d'évolution des modèles de mise à disposition des données publiques.

Pour réaliser cette étude, j'ai envoyé un questionnaire sommaire à l'ensemble des administrations publiques productrices ou collectrices de données publiques avant d'auditionner chacune d'entre elles, et j'ai élaboré, pour chacun des services concernés, une fiche de synthèse validée par ce service. J'ai également fait parvenir un questionnaire à trente-six missions économiques françaises à l'étranger : sans doute serait-il intéressant que la direction générale du Trésor mette les réponses à votre disposition, voire les publie. J'ai enfin auditionné de nombreux experts et personnalités issus de l'administration française ou étrangère, de la société civile, de la sphère économique ou encore du monde universitaire.

J'ai tiré cinq grands enseignements de ces travaux. En premier lieu, les motivations avancées pour mettre en place des redevances de réutilisation de données publiques apparaissent parfois contestables. Ensuite, les recettes perçues en 2012 n'étaient pas de 100 millions d'euros et en hausse, comme certaines administrations ont pu le prétendre, mais de 35 millions d'euros - dont 4,5 millions acquittés par des acteurs publics -, en baisse d'un tiers par rapport à 2010. Le montant de ces recettes est concentré sur un très faible nombre d'acteurs, principalement l'Insee et l'IGN. Troisièmement, les modèles économiques retenus portent le plus souvent atteinte au principe de gratuité régulièrement réaffirmé par les autorités politiques et font fréquemment office de barrière à l'entrée pour les acteurs économiques, les citoyens et les associations. En quatrième lieu, tout porte à croire que l'ouverture des données publiques est source de bénéfices pour la société dans son ensemble, avec des effets directs et indirects qui pourraient s'élever à plusieurs milliards d'euros selon des estimations réalisées à l'étranger. Ces effets bénéfiques s'exercent à la fois sur le bien-être social, sur la création de valeur et d'emplois et sur les gisements de productivité grâce aux externalités générées. Enfin, la mise à disposition de données brutes doit être faite sur un modèle de plateforme qui attirera des utilisateurs innovants et favorisera l'apparition d'écosystèmes de réutilisation.

Quatre des motifs invoqués par les administrations pour mettre en place ou maintenir des redevances de réutilisation me paraissent fragiles. Le motif budgétaire a quasi-systématiquement été mis en avant, que la redevance soit présentée comme une « recette de poche », une « poire pour la soif » en période de contrainte budgétaire ou comme une ressource propre développée en contrepartie de la suppression ou de la diminution de subventions dans le cadre de la révision générale des politiques publiques (RGPP). Cette situation rend sensible, et non impossible, le passage à un modèle dans lequel les administrations ne percevraient plus de redevance. Ce motif est parfois accompagné d'un argument qui me paraît juridiquement fragile, et qui peut sonner comme une forme de chantage vis-à-vis des autorités budgétaires, selon lequel il faudrait renoncer à la production de données en cas de disparition de la redevance associée, dans la mesure où cette recette sert au moins à couvrir la collecte et la production des données. Or, la constitution de ces informations relève pour les établissements publics concernés de missions de service public statutairement définies et constitue une charge permanente et courante financée par autorisation budgétaire, conformément à la loi organique relative aux lois de finances (Lolf). Troisième motivation avancée par les administrations : la mise en place de redevances permettrait de réguler, c'est-à-dire de limiter, la demande de données - alors que, dans le même temps, l'Etat cherche à mettre en place une mise à disposition et une réutilisation massives de données ! Cette motivation me semble sinon choquante, du moins très contestable. D'autres acteurs conçoivent la redevance, de manière plus ou moins consciente, comme un moyen de protéger certains acteurs économiques en instaurant une barrière à l'entrée, c'est-à-dire en mettant en place une atteinte à la concurrence. Telle administration indique ainsi qu'elle souhaite « favoriser les gros clients » tandis que telle autre justifie l'inutilité d'élargir la base de ses clients par une baisse des prix par le fait que « les principales entreprises concernées sont déjà servies ». D'autres administrations évoquent un « consentement à payer » des acteurs établis... qui annoncent bien sûr un prix conforme à leurs intérêts, c'est-à-dire suffisamment bas pour assurer leur rentabilité et suffisamment élevé pour éviter que de nouveaux acteurs n'entrent sur le marché. Parfois captées par les intérêts de leurs clients, les administrations craignent alors que la suppression de leurs redevances ne déstabilise l'écosystème existant.

J'aimerais à présent revenir sur le modèle de plateforme, qui consiste à attirer à soi les profils créatifs afin de favoriser l'innovation. Ce concept, exposé dans l'ouvrage L'Age de la multitude d'Henri Verdier et Nicolas Colin et repris dans le rapport de Nicolas Colin et Pierre Collin sur la fiscalité du numérique, fait écho à une réalité. Par exemple, en donnant gratuitement accès à sa bibliothèque Apple Store, l'entreprise Apple attire à elle des dizaines de milliers de développeurs d'applications souvent innovantes, qui totalisent des milliers d'années-travail, et récupère des données d'utilisation qui lui permettent d'identifier des usages ; en outre, elle perçoit 30 % des recettes issues des ventes. Ce concept de plateforme est très ancien : ainsi, les universités ont pour vocation de former des étudiants, mais elles fournissent également des services de base (de l'immobilier, du mobilier, la présence d'enseignants, une cafétéria, une bibliothèque...). Lorsque cela fonctionne bien, elles attirent à elles de bons étudiants et de bons enseignants. L'interaction au sein de l'écosystème universitaire favorise ainsi l'innovation et apporte un bénéfice à la collectivité. Pourquoi l'Etat ne fournirait-il pas semblablement une infrastructure informationnelle à disposition de tous et régie par le principe de gratuité, qui soit ainsi susceptible de profiter à la collectivité ? Il s'agit ainsi de récolter le produit des initiatives de la société civile et du tissu économique : c'est ce qu'on appelle, en économie, internaliser les externalités.

Il conviendrait de limiter la multiplication des licences locales, spécifiques à telle administration ou telle base de données, et de promouvoir les licences standards, interopérables et utilisables à l'international, à la fois pour favoriser la simplicité et la lisibilité de nos bases de données et pour augmenter leur attractivité. Je suis partisan des licences libres, qui permettent de diffuser des données brutes ou enrichies. Une clause de paternité des données pourrait éviter les attributions fallacieuses. Les clauses de share-alike supposent que la rediffusion de données même enrichies ou tronquées se fasse sans condition juridique supplémentaire par rapport à la mise à disposition initiale ; elles encouragent ainsi les démarches coopératives et collaboratives. Les gros projets - Linux, Wikipédia, OpenStreetMap - sont fondés sur ce modèle qui permet aux derniers maillons de la chaîne de se hisser sur les épaules des géants qui sont passés avant eux. On comprend que certains acteurs commerciaux soient effrayés ! La ville de Paris propose un modèle intéressant : l'accès gratuit aux données suppose l'acceptation de clauses de share-alike ; dans le cas contraire, l'accès devient payant.

L'ouverture des données publiques n'est pas exempte de risques ou de freins. Il ne faut pas oublier tout d'abord qu'une telle politique exige, en amont, une conception nouvelle des systèmes d'information et une réflexion lors de la conclusion de contrats de commande publique afin que les données ne soient pas appropriées par des acteurs privés. Le deuxième risque est celui d'une approche patrimoniale des données publiques et des redevances associées, qui résulte souvent d'une interprétation erronée du rapport Lévy-Jouyet sur le patrimoine immatériel de l'Etat. Cette perspective fait obstacle à une approche interministérielle et de long terme de la gestion des données publiques ; dans certains pays, des data officers y veillent, appliquant une vision transversale. Attention, d'ailleurs, à ne pas fournir des prétextes à l'inaction administrative. L'organisation de l'administration peut être propice à l'inertie ; et pour peu que celle-ci voie dans la redevance une recette de poche, le blocage n'est pas loin. La protection de la vie privée est souvent brandie comme un chiffon rouge, prétexte à ne pas progresser dans l'ouverture des données. Sur le sujet du big data, ensuite, il ne faut céder ni à la naïveté ni à la paranoïa. Son périmètre doit être bien distingué de celui de l'open data : la politique d'ouverture des données publiques n'a pas vocation à mettre en danger la vie privée des citoyens. Les données personnelles aujourd'hui les plus utilisées sont d'ailleurs celles mises en ligne par les utilisateurs eux-mêmes. Vous saurez plus vite si j'ai la grippe en consultant ma page Facebook qu'en fouillant la base de données de remboursement de la caisse nationale d'assurance maladie (Cnam). Quatrième risque : la préférence des acteurs pour le court terme. En 2010, l'IGN a ainsi perçu quelques millions d'euros pour la vente de ses bases cartographiques aux géants du web. On s'est cependant rendu compte quelques années plus tard qu'il s'agissait d'une opération unique : les acteurs privés, qui font travailler gratuitement les utilisateurs en leur offrant par exemple des sacs à dos équipés de caméras, ont désormais les moyens de se passer des données de l'IGN. En outre, cette barrière à l'accès aux données a empêché de nombreux utilisateurs potentiels de développer des services alternatifs. Au total, le bénéfice de cette vente a été très inférieur à la valeur potentielle actualisée de la base de données de l'IGN. Face à ce risque, la plateforme est une stratégie intelligente et qui permet de conserver la souveraineté sur les données publiques ; l'IGN y travaille actuellement. Le dernier risque est celui d'une approche défensive et protectionniste. Le niveau élevé de certaines redevances s'explique par la peur de la captation de la valeur par de grands groupes privés qui échappent à l'impôt en France ou en Europe. Mais comment penser sérieusement qu'une redevance de 15 millions d'euros puisse arrêter des groupes tels que Google, Facebook ou Amazon ? Attention à ne pas différer des choix importants sous l'effet d'un complexe de citadelle assiégée.

A la suite de mon rapport, le Gouvernement a pris plusieurs mesures : il a supprimé certaines redevances, a clarifié sa doctrine sur ce point en précisant qu'elles ont toutes vocation à disparaître, et a confié au secrétariat général pour la modernisation de l'action publique une mission d'accompagnement de plusieurs opérateurs dans leur transition vers de nouveaux modèles économiques.

J'en viens aux questions que vous m'avez adressées. Vous m'interrogez sur les éléments de calcul des bénéfices susceptibles de résulter pour les différentes catégories d'acteurs de l'ouverture des données publiques. Celle-ci présente tout d'abord un intérêt non marchand non négligeable pour la démocratie et la modernisation des administrations. D'un point de vue économique, les références scientifiques permettant de chiffrer l'impact de l'ouverture des données sur la société sont rares. Des modèles empiriques existent néanmoins, qui font état d'une évolution en trois phases, au terme de laquelle les données sont sources de revenus. La première, où l'on renonce à la redevance et où l'on investit (on sème), est une phase coûteuse et déficitaire pour la collectivité publique. Puis vient la phase de germination, les premiers gains de productivité apparaissent, une activité économique se développe. Enfin vient la récolte, sous forme de bénéfices sociaux et économiques, donc fiscaux. Voyez l'expérience danoise, ou le cas du secteur de la météo aux Etats-Unis après l'ouverture des données publiques. Une étude finlandaise conclut que le chiffre d'affaires du secteur de l'information géographique croît davantage (de l'ordre de 15 % supplémentaires) dans les pays qui ouvrent cette information gratuitement ; les travaux de l'IGN semblent corroborer ce constat, puisque l'ouverture de ses données aux organismes chargés d'une mission de service public a conduit à la multiplication par vingt des volumes de leur téléchargement. Au Royaume-Uni, l'ouverture des données publiques en 2010-2011 a engendré un profit estimé à plus de 8 milliards d'euros, dont 2 en bénéfices directs.

Vous m'interrogez également sur l'ampleur et l'intérêt pour les différentes catégories d'utilisateurs des gisements de données publiques non encore ouvertes. Le propre de ces données est l'incertitude des effets qui résulteraient de leur ouverture ; pour autant, il est possible d'anticiper l'impact de l'utilisation de certains types de données. S'agissant des données de santé, les informations relatives à la prescription des statines en Angleterre, qui étaient remboursées à hauteur de 450 millions d'euros par an, montrent qu'une économie de près de 230 millions d'euros aurait pu être réalisée si un générique avait été systématiquement prescrit. L'exploitation de ce type de données, qui laissent entrevoir des possibilités d'économies considérables, peut constituer un instrument très précieux d'aide à la décision publique. Il faut par ailleurs avoir à l'esprit que le monopole de fait ou de droit dont disposait l'Etat sur la collecte ou la production des données constituant des référentiels, comme les registres d'entreprises, les données géographiques ou les informations figurant dans les bulletins officiels (pour l'achat public notamment) est aujourd'hui remis en cause. Dans ce contexte, plutôt que sur les gains de l'ouverture, il faut s'interroger sur les pertes certaines que font courir le maintien des barrières et l'absence d'une réutilisation massive : perte d'un lien avec les citoyens, de valeur économique et de souveraineté dès lors que les utilisateurs se tournent vers des bases de données privées. OpenStreetMap, souvent plus performant que les services de Google, Microsoft et Apple dans les zones denses, est de plus en plus utilisé par les services publics de sécurité, notamment les pompiers et le Samu. Idem pour le projet collaboratif Open Meteo Foundation ; il est aujourd'hui préféré par les acteurs publics. Il a été imaginé par un petit génie français de 22 ans dans sa chambre, chez ses parents...

Avant d'étudier les coûts de la mise à disposition, il faut se poser la question de l'utilité d'une redevance pour service rendu. Est-il même souhaitable de mettre en place une redevance sur des données brutes élaborées dans le cadre d'une mission de service public ? A cette question, le Gouvernement a clairement répondu non. Il me semble que l'analyse par les coûts n'est pas pertinente. D'abord, parce que les coûts associés à une mission de service public ne peuvent être financés que par l'autorisation budgétaire. Ensuite, parce que la comptabilité analytique n'est pas toujours efficace pour calculer ces coûts. En troisième lieu, le respect de l'article 15 de la loi Cada est difficile à contrôler. Enfin, dans le secteur du numérique, un tarif défini a priori, fondé par exemple sur le consentement à payer, est nécessairement hasardeux dans la mesure où tous les utilisateurs potentiels ne sont pas connus. Toutes les entreprises du web, dans leur phase d'expérimentation, appliquent la gratuité pour identifier les vrais usages et en déduire ensuite la tarification appropriée.

Il me semble que l'article 15 de la loi Cada, et notamment ses premier et troisième alinéa, crée une confusion quant au concept de gratuité de la réutilisation des données publiques et entretient une ambiguïté autour des motifs qui peuvent justifier la mise en place d'une redevance, sans compter que la vérification des plafonds de recettes est très complexe. Il me semble en revanche intéressant qu'une tarification puisse reposer sur des services ou des droits supplémentaires dits premium - à condition qu'une telle tarification ne s'oppose pas à la possibilité d'accéder gratuitement à l'ensemble d'une base de données brutes, qui constitue un bien public informationnel. Ces services supplémentaires peuvent recouvrir un débit accru, un accès anticipé aux ressources, un accès à des traitements supplémentaires, la mise à disposition d'espaces de stockage volumineux, la fréquence de mise à jour de la base de données ou encore la mise en place de hotlines. En ce qui concerne les droits supplémentaires, on peut penser à un droit de réutilisation dans le cadre de licences très permissives. J'y insiste, il faut ouvrir l'accès aux données brutes, notamment pour les jeunes pousses, les entreprises innovantes. Tout modèle qui limite leur accès, en privilégiant les gros volumes ou l'activité commerciale de l'acquéreur, est dangereux.

Les financements coopératifs peuvent être particulièrement adaptés pour des opérations ponctuelles de financement de services complémentaires détachables d'une mission de service public. Je pense par exemple à l'ouverture de stocks de données qui ne sont plus alimentés et qu'il est nécessaire de remettre en forme. Ces modes de financement, qui n'engagent à rien, ont le mérite d'éviter les barrières à l'entrée et les clauses d'exclusivité dans le temps. La plateforme MyMajorCompany a rencontré un grand succès dans le domaine culturel.

En conclusion, plutôt que de considérer les bases de données publiques comme des ressources naturelles épuisables, reprenons l'analogie du grain de blé qui est semé et récolté ou encore celle de la bougie de Thomas Jefferson qui peut servir pour en allumer d'autres sans perdre elle-même en luminosité...

Mme Corinne Bouchoux, rapporteure. - Sans tomber dans la grandiloquence, je pense que ce rapport fera date, comme en son temps le rapport Nora-Minc et sa vision de l'évolution de la société française. Vous avez précisé que votre présentation n'engagerait que son auteur. Quelle a été la réception de votre rapport au sein de la Cour des comptes ? Avez-vous le sentiment que les acteurs politiques et économiques en ont perçu les enjeux ? Que répondez-vous à un syndicaliste qui disait que votre rapport était le chaînon manquant, ajouté à la Lolf, pour une remise en cause du service public ?

M. Mohammed Adnène Trojette. - Au sein de la Cour des comptes, mon rapport a été transmis à tous les présidents de chambre, et je suis sollicité en interne pour en présenter les conclusions.

Dans la presse, on a parlé de ce rapport d'une façon réductrice, en mettant en avant l'idée d'une gratuité absolue alors que je me suis bien gardé d'aller jusque-là, au vu de la situation de nos finances publiques. Pour ma part, j'insiste sur la notion de stratégie de plateforme : là est l'important à l'ère du numérique. Enfin, fonctionnaire et ancien boursier de l'enseignement supérieur, je suis très loin de vouloir planter un poignard dans le dos de l'Etat en sapant le service public. Ce qui est en question aujourd'hui, c'est la mutabilité, y compris technologique, du service public. Sur la question de la gratuité, je ne suis pas sûr d'avoir été bien entendu par tous les acteurs publics. Plus exactement, certaines administrations publiques, qui ont des intérêts particuliers, préfèreraient que mon rapport n'existe pas.

Mme Corinne Bouchoux, rapporteure. - Votre rapport a-t-il été conçu également comme un moyen de lutter contre le poids des lobbies et les conflits d'intérêts, ou cet aspect des choses vous est-il apparu par la suite ?

Après avoir lu votre rapport, j'ai décidé de faire un stage, comme chaque parlementaire en effectue dans les entreprises ou les institutions, au sein de la Cour des comptes.

M. Mohammed Adnène Trojette. - Je suis heureux d'avoir suscité une vocation ! Je n'ai pu travailler directement sur la question de la prévention des conflits d'intérêts dans le cadre qui m'avait été fixé. Néanmoins, la mise en place de barrières à l'accès aux données publiques et d'obstacles à la concurrence peut apparaître troublante... Il faut également garder à l'esprit que l'ouverture des données publiques est nécessaire pour alimenter la transparence et la confiance que les citoyens peuvent placer dans l'action publique. En outre, selon l'association Regards citoyens, la transparence sur les marchés publics est une condition essentielle pour favoriser l'accès des petites entreprises à l'achat public.

M. Jean-Jacques Hyest, président. - Merci infiniment.

Audition de M. William GILLES, directeur du master droit du numérique-administration-entreprises à l'école de droit de la Sorbonne, université Paris I (jeudi 20 mars 2014)

M. Jean-Jacques Hyest, président. - Nos travaux nous ont permis d'identifier un certain nombre d'obstacles juridiques à l'ouverture des données, sur lesquels nous aimerions faire le point avec vous. Quels sont les droits attachés aux données publiques ? Comment les administrations peuvent-elles circonscrire précisément ces droits afin qu'ils n'en limitent pas l'utilisation ? La licence vous paraît-elle toujours nécessaire ? La gouvernance des données publiques doit-elle être améliorée ?

M. William Gilles, directeur du master droit du numérique-administration-entreprises à l'école de droit de la Sorbonne, Université Paris I. - Je ne rappellerai pas le droit existant, chacun peut facilement consulter maintes sources à ce sujet ; je préfère formuler des recommandations. Les grands principes sont connus : on les trouve sur le site de la Cada. Notre modèle, ancien - la France a d'ailleurs été pionnière -, est inadapté à l'émergence de la société d'information. Protection des données personnelles, respect des droits des tiers détenteurs ou transparence et participation citoyenne, tout cela nous conduit à réinterroger notre modèle et notre cadre juridique. Il serait nécessaire de clarifier le droit applicable aux données publiques, de mieux définir les usages des données, de revoir la gouvernance publique.

La loi du 17 juillet 1978 ne concerne que les documents administratifs, y compris ceux émanant des opérateurs privés exerçant une mission de service public. Le droit français distingue le droit à l'information, souvent appelé droit d'accès ou droit de communication, du droit à la réutilisation, seul visé par la transposition de la directive du 26 juin 2013. Le droit à l'information se décompose en un droit général et un droit restreint - je vous renvoie à l'article 6 de la loi de 1978.

L'Union européenne a souhaité étendre ce droit en facilitant la réutilisation des données possédées par les musées, les bibliothèques et les archives et en limitant les freins à cette réutilisation, qu'il s'agisse des redevances, des droits d'exclusivité ou de recours en cas de refus d'accès.

La tentation serait, pour le Parlement, de se focaliser sur ce seul droit à la réutilisation. Or le droit de l'information, qui a une finalité fondamentalement démocratique, est le préalable du droit à la réutilisation. Leurs logiques sont certes différentes : l'information procède en effet du gouvernement ouvert, alors que la réutilisation procède de la logique des données ouvertes. Les données ouvertes ou open data ne sont qu'un des aspects du gouvernement ouvert. Le chantier est large : il concerne toutes les informations qui ont vocation à être mises en ligne. Est-il normal que toutes les collectivités territoriales ne publient pas leurs délibérations et leurs budgets sur Internet ? Certaines le font, mais dans des formats non standardisés, qui ne permettent pas une réutilisation facile. Autre difficulté : les droits d'auteur ; je pense par exemple aux conclusions des rapporteurs publics du Conseil d'Etat, qui permettent d'éclairer la décision mais ne sont pas diffusées.

Quelle réponse synthétique apporter à vos interrogations ? Les droits d'information et de réutilisation connaissent des exceptions parfois justifiées : la protection de la vie privée ou les intérêts nationaux, par exemple. En revanche, certains cas sont plus discutables : certaines administrations refusent de communiquer l'information malgré l'avis favorable de la Cada, d'autres font preuve de mauvaise volonté en transmettant des contenus dans des formats non standardisés.

Soulignons une autre difficulté : le producteur de la base de données a, en sus du droit d'auteur, un droit, qui lui est propre, d'empêcher l'extraction de sa base de données. Dans l'affaire qui a opposé Notrefamille.com au service d'archives départementales de la Vienne s'agissant des données d'état civil, le tribunal administratif de Poitiers a rendu une décision originale le 31 janvier 2013, en considérant le département comme un producteur de données ayant mis en oeuvre des moyens de production et des investissements.

Les difficultés devraient être levées avec la transformation de la loi de 1978 du fait de la transposition de la directive. Les services d'archives, les bibliothèques, les musées devraient être désormais couverts - mais pas les services publics industriels et commerciaux, dont les bases de données continueront d'être protégées.

Par ailleurs, la faiblesse des pouvoirs de la Cada explique la limitation de l'open data. Cela étant, les opérateurs non couverts par la loi de 1978 se réfèrent au droit de la propriété intellectuelle. Celui-ci protège non seulement les bases de données, les créateurs mais aussi les logiciels dès lors qu'ils sont uniques. Je souligne que l'administration a la possibilité d'acquérir les droits d'exploitation, mais non les droits moraux, distincts des droits patrimoniaux. Il en résulte que les auteurs peuvent toujours opposer un droit de divulgation ou un droit de repentir pour s'opposer à la réutilisation des données.

En revanche, les algorithmes ou les fonctionnalités d'un programme ne sont pas protégés par le droit d'auteur. La Cour de justice de l'Union européenne l'a confirmé en 2012, de même que la Cour de cassation dans un arrêt du 14 novembre 2013. Celle-ci a précisé que de tels outils conceptuels ne reflètent pas la personnalité de leur auteur et qu'ils n'expriment pas une originalité propre.

Depuis 2006 cependant, les agents publics bénéficient dans une certaine mesure d'un droit - encadré - de propriété intellectuelle sur leur production numérique. Cela peut limiter l'accès aux données, ces agents disposant d'un droit de divulgation et d'un droit de repentir ou de retrait. Pour faciliter la diffusion des oeuvres, le législateur a souhaité restreindre ces droits moraux à l'instar de ce qu'il a prévu en matière de logiciels. L'agent public dispose d'un droit de divulgation, mais dans le respect des règles auxquelles il est soumis dans le cadre de ses missions. De même, l'agent public ne peut s'opposer à la modification de son oeuvre par sa hiérarchie dès lors qu'elle ne représente pas une atteinte à son honneur ou sa réputation. Afin de prévenir tout conflit, le législateur pourrait prévoir que les données collectées par les agents publics relèvent en principe de leur mission de service public et que leur modifications sont réputées intervenir pour l'intérêt du service.

Qu'en est-il des oeuvres collaboratives associant agents publics et privés ? Au regard du droit existant, les jeux de données peuvent être rattachés à la notion d'oeuvre collective, ce qui donne un droit à l'administration sur l'ensemble de l'oeuvre.

Licences et clauses d'exclusivité peuvent limiter l'usage des données, vous l'avez noté. Les accords d'exclusivité sont encadrés car il s'agit d'un monopole d'exploitation, mais ils peuvent aussi se comprendre au regard de l'investissement nécessaire et important de la part du secteur privé. Par exemple, Google a décidé de numériser 15 millions d'ouvrages sur les 130 millions existants, il a passé un accord sur 400 000 ouvrages avec la Bibliothèque nationale australienne, un million d'ouvrages en Italie, respectivement pour 30 millions et 100 millions d'euros. En cela, il effectue une mission de service public, en contrepartie de quoi l'entreprise a un monopole d'exploitation.

La directive du 26 juin 2013 prévoit deux exceptions à l'interdiction de principe des clauses d'exclusivité : lorsqu'elle est nécessaire au fonctionnement d'un service d'intérêt général et pour la numérisation des ressources culturelles des administrations publiques. Elle recommande alors une durée d'exclusivité de dix ans, avec une clause de réexamen.

Pour finir, j'en viens à la gouvernance des données publiques. Elle doit évoluer, c'est une nécessité. Je propose trois axes. Distinguer le producteur du gestionnaire serait particulièrement innovant ; les administrations collecteraient les informations selon un référentiel commun, mais la définition des politiques d'open data resterait aux collectivités. En revanche, il faut un gestionnaire public des données. Erigé en établissement public et en gestionnaire unique, Etalab aurait une force de frappe considérable. L'intérêt serait de proposer davantage de services à partir d'un compte individualisé, notamment de nouveaux moyens de rémunérations pour les services complémentaires, et de créer une licence nationale pour les grands comptes - les entreprises multinationales qui consomment beaucoup de données nationales sans acquitter d'impôts en France. Ce ne serait pas une mesure de discrimination mais un droit d'utilisation.

Deuxième axe : les licences doivent être multiples, pour répondre à tous les besoins. Le share-alike est intéressant pour certaines entreprises, pour les collectivités. Pour d'autres, la clause de partage présente des inconvénients : elle met en place une viralité, puisque l'on est contraint de partager les données dans les mêmes conditions.

Enfin, un organe de contrôle renforcé pourrait prendre le relais de la Cada : j'imagine une commission nationale de l'information publique, qui saurait tirer les conséquences de l'évolution de la notion de document administratif vers celle d'information publique.

Je propose donc un aménagement plus vaste du droit existant que la stricte transposition de la directive. A la France d'affirmer son leadership tout en tenant compte de son modèle administratif multiséculaire face à un Royaume-Uni qui veut s'imposer comme le pionnier de l'open data.

Mme Corinne Bouchoux, rapporteure. - A votre sens, quel est le niveau d'acceptabilité de vos propositions dans le monde politique ?

M. William Gilles. - La loi de 1978 a évolué à la suite de l'affaire Safari. A nouveau, nous réfléchissons à ces questions, dans une conjoncture où le respect de la vie privée peut être bafoué, on l'a vu. Comment lever les obstacles politiques ? En expliquant l'intérêt citoyen de mes recommandations.

Je ne retranche rien aux pouvoirs des collectivités territoriales qui restent maîtres de leurs politiques. Au contraire, je souhaite une structure plus forte, sortie du giron de l'Etat, en charge de la seule gestion des données, pour avoir une plus grande accessibilité et éviter toute forme de recentralisation. Alternativement, on pourrait avoir des structures d'envergure régionale, et l'Etat la sienne, en veillant bien sûr à l'interopérabilité. Enfin, la question n'est pas tant celle de l'acceptation par le monde politique que celle de l'intérêt des citoyens.

Mme Corinne Bouchoux, rapporteure. - Quel est le coût de vos propositions, à l'heure où l'on cherche 50 milliards d'euros d'économies ?

M. William Gilles. - Je vais m'atteler à une évaluation. Quoi qu'il en soit, la création d'une licence grands comptes et la rémunération des services à valeur ajoutée sont une voie du financement pour ce nouvel organisme chargé de valoriser les données publiques.

M. Jean-Jacques Hyest, président. - Vous pensez donc que l'on peut approfondir le rapport Trojette. Le débat n'est pas clos !

M. William Gilles. - Trop souvent, les universitaires réfléchissent de leur côté, les administrations du leur. Il faudrait les réunir, ainsi que les utilisateurs, au sein d'une nouvelle mission de réflexion.

M. Jean-Jacques Hyest, président. - Nous avons à coeur de les entendre tous. Nous vous remercions.

Audition de représentants du ministère de l'écologie, du développement durable et de l'énergie, MM. Michel-Régis TALON, directeur, adjoint au secrétaire général, Benoît PIGUET, conseiller auprès du secrétaire général, Julien BOUCHER, directeur des affaires juridiques, Mme Aurélie CHAUVIN, chef de bureau à la direction des affaires juridiques, MM. Jean Paul ALBERTINI, commissaire général au développement durable, et Sylvain MOREAU, chef de service au commissariat général au développement durable (jeudi 27 mars 2014)

M. Jean-Jacques Hyest, président. - Sur la proposition du groupe écologiste, le Sénat a décidé la création d'une mission commune d'information sur l'accès aux documents administratifs et aux données publiques. Mme Bouchoux et moi-même avons été désignés rapporteure et président. Nous avons d'abord reçu des associations, organismes de réflexion, journalistes et entreprises, afin de mesurer les progrès réalisés et les difficultés rencontrées en matière d'accès aux documents administratifs et aux données publiques.

Deuxième volet : analyser les politiques conduites par les pouvoirs publics, les collectivités locales et les administrations. Pour notre première audition de la matinée, nous accueillons une délégation du ministère de l'écologie, du développement durable et de l'énergie, conduite par M. Michel-Régis Talon, directeur, adjoint au secrétaire général du ministère. Il est accompagné par MM. Benoît Piguet, conseiller auprès du secrétaire général et Julien Boucher, directeur des affaires juridiques, Mme Aurélie Chauvin, chef de bureau à la direction des affaires juridiques, MM. Jean-Paul Albertini, commissaire général au développement durable, et Sylvain Moreau, chef de service au commissariat général, Mme Soraya Thabet, directrice de cabinet du directeur général de l'énergie et du climat, et M. Serge Artico, chef du bureau de la réglementation, du pilotage de l'inspection et des contrôles de la qualité de la direction général de la prévention des risques.

Pourriez-vous faire un point sur l'application des règles de transparence de l'information en matière environnementale, l'accès du public à cette information et la politique d'ouverture des données publiques environnementales ? La présence en ligne des informations environnementales ? L'information mise à disposition dans le cadre des procédures d'information préalable, de concertation ou d'enquête publique ?

Quelles suites est-il envisagé de donner aux propositions faites par le Conseil d'Etat dans son rapport de 2011 ? Vous nous parlerez, enfin, de l'ouverture des données publiques sur l'environnement et les risques naturels et technologiques, ses modalités techniques, financières et juridiques. Beau programme !

M. Régis Talon, directeur, adjoint au secrétaire général du ministère de l'écologie, du développement durable et de l'énergie. - Préalablement, je dresserai un bilan, peut-être un peu schématique, de la question car nous sommes dans un champ extrêmement complexe couvrant des domaines d'intervention aussi divers que la biodiversité, les infrastructures, le transport, les risques naturels et technologiques, l'énergie ou le changement climatique. Le corpus juridique qui s'impose à nous et son évolution reflètent cette complexité. D'où l'importance numérique de notre délégation. Le Secrétariat général a une fonction de coordination.

Trois thèmes, à commencer par la liberté d'accès aux documents administratifs, régie par la loi de 1978, qui a d'ailleurs profondément évolué depuis sa création. Ensuite, l'information, plus diversifiée et désormais essentiellement sous forme numérique, et l'obligation de la porter à la connaissance du public. Enfin, le concept le plus novateur et peut-être le plus déstabilisateur : l'ouverture des données. Elle nécessite une adaptation des modèles des administrations et des grands établissements publics.

Le cadre juridique est posé par la loi du 17 juillet 1978. Dans un ministère très déconcentré, les pôles régionaux jouent un grand rôle dans le catalogage des informations et l'indexation des documents administratifs. Les outils existent, documentaires ou archivistiques, au niveau territorial comme national, pour intégrer et localiser les données. Ce n'est pas anodin quand nous avons en charge la prévention des risques... Un indicateur : 32 saisines de la Cada, interventions ultimes, en 2013. C'est peu, et ce nombre est en constante diminution ; il était de 50 à 70 il y a une dizaine d'années. Preuve que le service accroît son efficacité. La publication des documents administratifs et des informations géolocalisées est couverte à la fois par la législation Cada, par l'article L. 124-1 du code de l'environnement et, bien sûr, la directive européenne. Le portail toutsurlenvironnement est conçu sur un mode collaboratif ; il référence les données propres au ministère, aux collectivités territoriales et aux opérateurs. Le site portail du ministère joue également un grand rôle : 12 millions de visiteurs et 35 millions de pages consultées en 2013, soit une augmentation de 5 % à 6 % l'an. Belle évolution quand on connaît la versatilité des internautes. La moitié des consultations vient des moteurs de recherche, preuve d'une haute exigence de référencement. Parmi les sujets consultés, « énergie, climat, air » reçoivent 2 millions de visiteurs par an, soit plus de 17 % d'augmentation ; « ville durable, aménagement », plus de 1,5 million de visiteurs, soit un doublement du nombre de visites. Les consultations des pages « transports », avec 2 millions de visiteurs, et celles du développement durable et de la prévention des risques, avec 2 millions de visiteurs aussi, sont en augmentation de 20 %. Parallèlement, le nombre des consultations internes diminue. De fait, les études des directions régionales de l'environnement, de l'aménagement et du logement (Dreal) sont moissonnées, indexées et cataloguées à partir de mots-clés, pour enrichir le site Tout sur l'environnement, qui est opérationnel depuis 2008-2009. Le processus d'enrichissement est continu.

Enfin, l'ouverture des données, leur utilisation et leur réutilisation gratuite avec les deux décrets de 2011 sur Etalab posent deux débats. Le premier sur les données « logement », qui touche le ministère de l'égalité des territoires et du logement ; le second, plus complexe, concerne les données « transport », car se dressent des obstacles techniques, économiques, voire politiques. Ce qui vaut d'ailleurs pour d'autres domaines ; donner les lieux de reproduction des gypaètes, c'est bien, mais la survie de l'espèce peut s'en trouver menacée. L'ouverture en temps réel de données sur un accident dans un RER peut provoquer des mouvements de foule incontrôlés... Ajoutons que l'ouverture, aujourd'hui soumise à redevance, des données de certains opérateurs, comme l'IGN ou Météo France, posera un problème vital pour leur modèle économique. L'adaptation demandera du temps, surtout en cette période de contrainte budgétaire.

Le ministère, stricto sensu, a ouvert 50 jeux de données - étant entendu que ces jeux de données rassemblent des bases de données beaucoup plus nombreuses ; si on intègre les opérateurs sous sa tutelle, 300 à 310. A comparer avec d'autres grands ministères : 360 jeux de données pour l'éducation nationale, 260 pour le ministère de l'économique et des finances ou celui de l'intérieur. Nous ne sommes pas les derniers... En outre, nos données sont accessibles en open source -utilisables sans logiciel propriétaire.

M. Julien Boucher, directeur des affaires juridiques. - Notre ministère est, sans être le seul, particulièrement concerné par le régime d'accès aux données environnementales. Il s'agit d'un régime renforcé, l'article 7 de la Charte de l'environnement confère au droit à cet accès une valeur constitutionnelle. Il est également consacré par la convention d'Aarhus de 1998 et la directive européenne de 2003 - dernière d'une série. Régime renforcé aussi par les droits reconnus aux administrés, plus larges que ceux ouverts dans la loi de 1978.

L'articulation entre ce régime spécifique et celui de la loi de 1978 ne pose pas de difficultés pratiques. D'emblée, lors de la transposition de la directive de 1990, le législateur avait créé un pont entre le code de l'environnement et les dispositions générales de la loi de 1978 en plaçant la Cada au centre du dispositif - laquelle commission joue un rôle tout à fait essentiel d'harmonisation des concepts et des pratiques. Bien évidemment, des sujets prêtent à discussion. Notre droit traditionnel reconnaît le droit d'accès à des documents tandis que le régime européen porte sur des informations et non sur le support documentaire de celles-ci. L'administration française, dans notre droit, n'a pas à élaborer de documents qui n'existent pas ; pour l'Europe, le fait qu'une information ne soit pas matérialisée dans un support ne peut être un motif légitime d'en refuser l'accès.

Autre sujet, les motifs de refus. Le droit de l'environnement reconnaît aux citoyens des droits d'accès plus étendus que ne le fait le droit commun. Le cas des documents préparatoires est emblématique. En principe, l'administration peut refuser la communication de documents tant que la décision finale n'est pas prise. Tel n'est cependant pas le cas en matière environnementale, comme le Conseil d'Etat l'a rappelé : le droit européen fait primer l'impératif de participation des citoyens à l'élaboration de la décision en matière environnementale, qui suppose qu'ils aient accès aux documents avant que la décision soit prise. Cela dit, nous ne rencontrons pas de grandes difficultés au quotidien.

M. Jean-Paul Albertini, commissaire général au développement durable. - Les ministères ont élaboré différents outils pour répondre à la demande d'information des citoyens. Le portail Tout sur l'environnement, créé en 2009, est issu du Grenelle de l'environnement. Il est fortement monté en puissance, passant de 20 000 ressources à 85 000 aujourd'hui ; il est mis à jour très régulièrement, par moissonnage automatique mais aussi, c'est indispensable, par une intervention humaine, trimestrielle. C'est particulièrement important : la décision du Gouvernement, en septembre 2012, lors de la Conférence environnementale, de publier les données sur la santé environnementale et les risques émergents, non sur un site spécifique, mais sur le portail Tout sur l'environnement, nous impose d'assurer une bonne mise à jour de ces informations essentielles.

Le site repose sur une charte d'adhésion volontaire des organismes potentiellement concernés, qui fixe des garanties réciproques et encourage une démarche d'amélioration progressive. Après les opérateurs publics, nous avons encore du chemin à faire avec les collectivités territoriales, mais aussi les Dreal. La situation est aujourd'hui totalement satisfaisante pour un tiers d'entre elles, notre objectif est qu'elle le soit pour toutes en 2015.

L'intégration de l'ex-Ifen, Institut français de l'environnement, n'a strictement rien changé du point de vue des missions ou des procédures, du service rendu et de l'accès aux données, contrairement à ce qui a été dit lors d'une audition précédente. Seule l'organisation administrative et les outils techniques ont changé. Le service statistique du ministère publie tous les quatre ans un rapport sur l'Etat de l'environnement. Ceux de 2002, 2006 et 2010 sont parus, nous préparons celui de 2014.

Concernant l'IGN, il faut être attentif à la perte de recettes induite par l'ouverture gratuite des données. En période de contrainte budgétaire, cela pourrait menacer les missions de l'institut. L'adaptation ne se fera pas du jour au lendemain. Quel serait d'ailleurs le sens de cette ouverture si elle est exploitée par des grands groupes, qui revendront très cher des informations obtenues gratuitement ?

M. Jean-Jacques Hyest, président. - Idem pour Météo France ?

M. Jean-Paul Albertini, commissaire général au développement durable. - Oui, même si l'incidence budgétaire est moindre.

M. Julien Boucher, directeur des affaires juridiques. - Je reviens sur le rapport de 2011 du Conseil d'Etat. L'accès aisé à l'information environnementale est une condition à la participation éclairée des citoyens à la décision et favorise la constitution d'une culture environnementale. Le rapport a eu des suites : l'article 16 de la loi du 17 mai 2011 relative à la simplification et à l'amélioration de la qualité du droit a permis de substituer à la consultation des organes consultatifs dans le processus de décision celle du public. Conformément à l'article 7 de la Charte de l'environnement, le principe de participation du public a été organisé par la loi du 27 décembre 2012 et l'ordonnance du 5 août 2013. On peut également citer l'article 3 de la loi du 12 novembre 2013 relative à la simplification des relations entre l'administration et les citoyens, qui porte adoption de la partie législative du code des relations entre les citoyens et l'administration et vise spécialement l'information et la participation du public. Cette codification, soulignons-le, pourra être apportée à droit non constant. Ce sera l'occasion de lever les difficultés comme le voulait le Conseil d'Etat.

M. Serge Artico, chef du bureau de la règlementation du pilotage de l'inspection et des contrôles de la qualité de la direction général de la prévention des risques. - Les antennes-relais font l'objet de nombreux documents administratifs. La particularité de ce dossier est de ne pas faire l'objet d'étude d'impact, contrairement à ce qui est prévu pour les installations classées. Toutefois, compte tenu de l'impact possible sur la santé humaine, l'Agence nationale des fréquences, sur son site Cartoradio.fr, publie des informations sur les antennes installées et les résultats des mesures pour chacune d'entre elles. La transparence existe donc, même si le régime diffère de celui des installations classées. Ajoutons que l'implantation d'une antenne fait l'objet d'un dossier complet qui doit être communiqué au maire ; elle ne peut être décidée qu'après concertation avec lui.

Pour les installations classées, la circulaire du 20 février 2013 impose déjà la mise à disposition du public d'un certain nombre de données (arrêté de prescription initiale, mise en demeure, sanction administrative éventuelle...). Vous nous avez interrogés sur l'opportunité de la mise en ligne des rapports d'inspection, qui actuellement n'intervient qu'après que la sanction a été prononcée. Procéder à la mise en ligne avant la décision de l'administration ne serait pas sans poser de difficultés, puisque la phase d'instruction s'en trouverait perturbée, alors même qu'il n'est pas certain qu'elle aboutira à une sanction : quid notamment du droit de réponse de l'exploitant ? Le ministère n'est cependant pas opposé à ce qu'une expérimentation limitée soit menée sur cette question, pendant trois ou quatre ans, pour évaluer les adaptations organisationnelles et techniques nécessaires.

M. Jean-Jacques Hyest, président. - Le ministère attend-il qu'un Scot soit approuvé pour le mettre en ligne ?

M. Julien Boucher, directeur des affaires juridiques. - Pour tout document soumis à la participation du public, il existe deux phases de publicité : le projet, ce qui suppose une mise à disposition suffisamment en amont, puis le document lui-même afin d'en assurer l'opposabilité.

Mme Corinne Bouchoux, rapporteure. - Si des progrès ont été réalisés, vous en avez fait Etat, ils sont insuffisants, notamment pour les sites classés, alors que les principales dispositions ont été intégrées dans notre droit en 2005. L'esprit de la convention d'Aarhus n'est pas respecté. Avez-vous un échéancier ? Vous pouvez nous répondre par écrit.

M. Jean-Jacques Hyest, président. - Merci de cet échange très instructif.

Audition de Mme Marisol TOURAINE, ministre des affaires sociales et de la santé (jeudi 27 mars 2014)

M. Jean-Jacques Hyest, président. - Nous accueillons Mme Marisol Touraine, ministre des affaires sociales et de la santé.

L'ouverture de l'accès aux données de santé est un enjeu majeur, dont le principe figure dans la stratégie nationale de santé, et à l'appui duquel des recommandations ont été formulées dans le rapport sur la gouvernance et l'utilisation des données de santé remis par M. Bras.

En matière de communication d'informations relatives à la santé, quelles sont les difficultés rencontrées, les précautions particulières à prendre, les coûts afférents ? Quels principes doivent guider l'ouverture des données de santé ? Quelles données doivent être ouvertes ? Le cadre juridique ne doit-il pas être clarifié ? Quels usages des données développer en vue d'une amélioration de l'efficacité du système de soins ?

La gouvernance des données de santé est également un sujet complexe : la situation actuelle est-elle satisfaisante ? Comment la faire évoluer ? Enfin, comment renforcer la surveillance ex post de l'utilisation des données de santé auxquelles l'accès a été autorisé ?

Mme Marisol Touraine, ministre des affaires sociales et de la santé. - Je salue votre travail. L'ouverture des données de santé, effectivement, est un sujet majeur auquel nos concitoyens sont de plus en plus attentifs. La demande d'accès à ces données spécifiques va croissant, sans toutefois que la nature des données auxquelles l'accès est demandé soit toujours bien identifiée. Je suis résolument déterminée à améliorer l'accès à ces données, qui constituent des éléments d'information importants, dès lors que des principes et des garde-fous sont clairement posés. L'ouverture des données, essentielle pour les patients, les professionnels, les industriels et les chercheurs, permettra des progrès considérables dans l'évaluation et l'amélioration de notre système de soins ; en favorisant une plus grande transparence, elle permettra aux patients de faire des choix mieux éclairés ; elle améliorera les conditions de la veille sanitaire grâce à l'évaluation en vie réelle des produits de santé et des pratiques médicales. Évaluation, transparence, veille sanitaire : voilà les trois orientations que je souhaite fixer  - ma stratégie nationale de santé reposant, je le rappelle, sur les soins de proximité, la prévention et la démocratie sanitaire.

L'ouverture des données de santé, je l'ai dit, doit s'effectuer dans un cadre maîtrisé : l'anonymat et le respect de la vie privés sont deux principes absolument intangibles. L'enjeu est de trouver le bon équilibre entre le respect de ces principes et un niveau d'ouverture satisfaisant, ce qui explique que nous prenions le temps de la réflexion. Je ne suis pas sourde, j'entends que certains veulent aller plus vite. Pour autant, dans le secteur de la santé, la précipitation ne peut pas être notre ligne de conduite. Sensible à ce dossier, j'ai demandé l'année dernière à M. Bras un rapport sur la gouvernance et l'utilisation des données de santé, qui m'a été remis le 3 octobre 2013. Une commission open data en santé ainsi que plusieurs groupes de travail ont également été mis en place. Dans ce cadre, ma stratégie se décline selon deux axes. D'abord, favoriser l'accès aux données de santé, tout en garantissant le respect absolu de la vie privée et de l'anonymat. Ensuite, mettre en place une gouvernance adaptée à ces enjeux.

S'agissant tout d'abord de l'accès aux données de santé, il faut être pleinement conscient des facteurs qui la limitent, et qui ont été bien mis en lumière par le rapport de Pierre-Louis Bras : on ne peut ignorer les risques de réidentification indirecte, qui existent quoi qu'on en dise. Des personnes publiques, responsables publics ou personnalités du monde du spectacle, risquent de voir leurs problèmes de santé étalés dans la presse.

La difficulté d'accéder aux données n'est pas seulement de nature juridique : elle est également liée à leur complexité et à l'insuffisance des services de mise à disposition. J'ai lancé plusieurs chantiers afin, tout d'abord, de faire clairement la distinction entre les données anonymes et celles qui sont indirectement nominatives. Les premières pourront être mises à disposition du public sans restriction. Un régime d'accès sécurisé, qui devra être plus transparent, plus lisible et plus réactif, doit être défini pour les secondes. La Cnil pourrait se voir confier, après avis d'un comité technique d'experts, la délivrance des autorisations d'accès pour tous les chercheurs, qu'ils relèvent d'un organisme public ou privé - la distinction actuelle est inopérante et engendre des contournements. Un régime de droit commun fondé sur la nature des projets devra être instauré. En revanche, il faudra distinguer les projets d'intérêt public de ceux dont la finalité est purement commerciale. Les données publiques n'ont pas vocation à alimenter les stratégies marketing des entreprises privées... Il faudra des délais d'instruction encadrés et un accès en urgence possible en cas de crise sanitaire notamment.

Pour cela, les organismes publics devront être dotés de moyens d'expertise renforcés. Le Système national d'information inter-régimes de l'assurance maladie (Sniiram) est une base complexe, dont l'exploitation requiert des compétences pointues. La Caisse nationale d'assurance maladie (Cnam) a été la première à investir pleinement son exploitation. L'Agence nationale de sécurité du médicament (ANSM) a constitué une équipe dédiée, de même que l'Institut de veille sanitaire (InVS) ; mon ministère s'y prépare également.

S'agissant des données relatives aux professionnels de santé, il existe des restrictions à la publication de certaines d'entre elles. Les données relatives aux honoraires, à la nature et au volume de l'activité, aux pratiques de prescription, et de façon plus générale à la qualité de la pratique constituent néanmoins les champs prioritaires de publication : c'est une attente forte des patients. Des données nominatives existent déjà sur le site Ameli.fr. Il ne s'agit pas de surveiller les professionnels individuellement mais de mieux suivre les pratiques collectives. Un exemple : c'est grâce à l'exploitation de ces données que nous avons pu réagir rapidement dans l'affaire des pilules contraceptives. Nous voulons forger des indicateurs pertinents pour les professionnels comme pour les patients.

Pour les établissements de santé, les publications statistiques sont déjà nombreuses. En dehors des restrictions liées au secret industriel et commercial, il n'existe pas de limite à l'ouverture de ces données. Comme pour les professionnels de santé, les informations relatives à la qualité et au coût des soins apparaissent prioritaires.

L'activité et la qualité des pratiques individuelles des professionnels de santé salariés sont quant à elles faiblement documentées d'un point de vue statistique. La mise en place d'un recueil de données individualisées par praticien, au moins sur certains champs, pourrait constituer une première étape.

Le second axe du travail que je conduis vise à mettre en place une gouvernance de la gestion des données de santé mieux adaptée et plus lisible. Trois missions relèvent selon moi de la puissance publique : la gestion de la base de données du Sniiram et de l'offre de service en matière de mise à disposition ; la régulation des accès aux données sensibles ; la surveillance d'ensemble et l'évaluation du dispositif. L'assurance maladie gère le Sniiram ; un volet spécifique figurera dans la future convention d'objectifs et de gestion. La régulation de l'accès sera du ressort du ministère de la santé, après avis de la Cnil pour les organismes publics et directement par celle-ci, après avis d'un comité d'experts, pour les chercheurs. La surveillance pourrait être conduite par une instance regroupant toutes les parties prenantes -Etat, assurance maladie, représentants des patients et des professionnels, établissements de santé, industriels, organismes complémentaires. Elle évaluerait les conditions d'ouverture des données et définirait chaque année les orientations à venir pour mieux répondre aux besoins des différents acteurs.

En somme, il s'agit donc de renforcer la mission de surveillance et d'impulsion actuellement assurée par l'Institut des données de santé (IDS). Cela nécessite d'élargir le champ de ses membres, notamment aux industriels. Il faut également veiller à bien distinguer les questions juridiques concernant les autorisations d'accès, qui relèvent de la Cnil, des aspects techniques et politiques. De ce point de vue, le statut de groupement d'intérêt public (GIP) de l'IDS ne se justifie pas : nous n'avons pas besoin d'un lieu d'échange de données, mais d'une enceinte indépendante d'expression des avis.

Mesdames, messieurs les sénateurs, si nous voulons franchir une nouvelle étape de la démocratie sanitaire, il est primordial d'organiser l'ouverture des données de santé en respectant l'anonymat et la vie privée. Ce sera bientôt réalité dans la future loi de santé publique.

M. Jean-Jacques Hyest, président. - Merci. Vous avez évoqué le cas de la pilule Diane 35 : il me semble que si l'alerte a été donnée, c'est à la suite d'incidents, et ce n'est qu'ensuite que l'on a constaté à partir des données de santé qu'elle était largement prescrite en dehors de ses indications.

Mme Marisol Touraine, ministre. - L'alerte sur les pilules de troisième et quatrième générations a été médiatiquement lancée à la suite d'une plainte. Les instances sanitaires avaient cependant donné l'alerte à de nombreuses reprises. La HAS, plusieurs années auparavant, avait recommandé qu'elles ne fussent pas prescrites en première intention. Une étude spécifique avait également été consacrée à Diane 35. On ne peut pas dire que les autorités sanitaires ne s'étaient pas saisies du sujet, mais les données existantes n'ont pas été suffisamment exploitées et l'avis de la HAS n'a pas été suivi d'effet. Il a fallu que je monte au créneau de manière très ferme, notamment en saisissant les instances européennes, pour qu'on assiste à un renversement des prescriptions. 

M. Jean-Jacques Hyest, président. - Ce médicament était utilisé à une autre fin...

Mme Catherine Procaccia. - Ce n'est pas le seul !

Mme Marisol Touraine, ministre. - Il était utilisé en dehors de son autorisation de mise sur le marché (AMM). Nous devons disposer de la réactivité qui nous manque aujourd'hui pour pouvoir, à partir de l'exploitation de données collectives - j'y insiste : l'objet n'est pas de montrer du doigt tel ou tel médecin -, identifier des problèmes de prescription en dehors des indications. Certaines prescriptions hors AMM peuvent d'ailleurs être fondées, auquel cas celle-ci doit être revue ; mais en cas de contournement de l'AMM, il faut rappeler que l'utilisation du médicament concerné dans de telles conditions présente des risques.

Mme Corinne Bouchoux, rapporteure. - A mesure des auditions, nous avons bien senti l'extrême complexité du sujet et la multiplicité des acteurs. L'accès aux documents administratifs et aux données de santé répond à une forte attente des patients quand elle inquiète les professionnels et les lobbies. Les patients, les citoyens veulent aujourd'hui être acteurs de leur maladie, ils veulent comprendre et choisir de façon éclairée. Comment mieux les associer à la gestion du secteur ? En matière d'accès aux documents administratifs et aux données publiques, rapprocher le régime des données de santé de celui des données environnementales est-il pertinent ?

Mme Marisol Touraine, ministre. - C'est vrai, le domaine est très complexe, ce qui nuit à la lisibilité et à la compréhension des dispositifs et des responsabilités pour nos concitoyens, ainsi que pour les professionnels qui ne savent pas toujours où s'adresser pour signaler un événement indésirable. Nous devons mieux structurer les relations entre les professionnels et les autorités publiques afin que chacun assume ses responsabilités. Nous entrons dans un temps nouveau de la démocratie sanitaire, j'en suis convaincue. Si nous n'organisons pas l'accès à l'information, certains s'en chargeront et, sans doute, sans avoir le souci de l'intérêt général. Il y a quelques années, alors qu'aucune donnée relative aux établissements de santé n'était publiée, des hebdomadaires se sont mis à élaborer des hit-parades d'hôpitaux ou de cliniques. Ce n'est pas très scientifique, mais tout le monde les regarde ! D'où ma volonté de mettre en place un service public de l'information en santé. Voyez la base de données sur les médicaments consultable sur le site www.medicaments.gouv.fr, qui génère des millions de consultations de la part des patients comme des professionnels. S'agissant des établissements de santé, je veux garantir l'accès à des données objectives (en termes, par exemple, de maladies nosocomiales) et non pas établir un quelconque hit-parade.

Peut-on s'inspirer du régime existant pour les données environnementales ? Il existe une différence de taille entre ces données et les données de santé : les deuxièmes étant extrêmement sensibles parce que par nature individuelles, il faut absolument garantir leur anonymat et leur confidentialité. Simplifier l'accès, oui ; définir des procédures d'accès adaptées, oui ; contraindre l'administration à produire en open data des données agrégées, oui ; mais pas au détriment de l'anonymat.

Les lanceurs d'alerte, maintenant : comment transformer les professionnels de santé en lanceurs d'alerte bien identifiés ? Comment repérer les signaux pertinents ? Je souhaite réorganiser les agences sanitaires pour que le rôle de chacune d'entre elles soit plus lisible.

Mme Corinne Bouchoux, rapporteure. - Le Parlement a voté la loi Blandin sur les lanceurs d'alerte ; les décrets tardent à être publiés.

Mme Marisol Touraine, ministre. - Je transmettrai votre impatience...

M. Christian Cointat. - Je partage votre sentiment, madame la ministre : tout doit être fait pour garantir le respect de la vie privée. Cependant, en créant le doute et l'angoisse, l'absence d'information peut être pire qu'une mauvaise information. Ne construisons pas quelque chose de trop complexe. N'avez-vous pas l'impression, quelle que soit votre volonté d'aller de l'avant, que nous sommes en train d'ouvrir des portes à une sorte de club restreint de professionnels de santé et d'associations en oubliant les citoyens, qui ont besoin d'être informés pour pouvoir être responsables ? Ne pourrait-on pas considérer que l'information est ouverte à ceux qui la demandent dès lors qu'elle n'a pas d'effet sur la vie privée ?

Mme Marisol Touraine, ministre. - La demande du citoyen n'est pas de même nature que celle des professionnels. Le citoyen a besoin de s'informer sur un médicament ou un établissement de santé dans les situations où il a besoin d'être sûr qu'on ne lui cache rien - les Français, gros consommateurs de médicaments, s'en défient pourtant - ou lorsqu'il doit faire un choix. Ces informations doivent provenir d'études dont on doit pouvoir garantir qu'elles sont réalisées de manière objective et hors de toute situation de conflit d'intérêts. La réponse à cette demande passe par la mise en place de procédures transparentes : c'est le sens du décret dit « Sunshine act » que j'ai pris l'année dernière, qui renforce la transparence sur les liens qui existent entre les professionnels de santé et les industriels, et qui sont nécessaires au progrès thérapeutique. En revanche, l'exploitation des millions de données de santé collectives disponibles ne peut être faite par les citoyens. Pour ce faire, les chercheurs disposent de systèmes informatiques très sophistiqués. Il s'agit par exemple d'alerter des professionnels sur le fait qu'ils ont collectivement pris l'habitude de prescrire un médicament en dehors de son AMM. Ce dont nous avons besoin dans ce cadre, c'est d'un système qui nous permette de réagir plus vite : les données doivent remonter et être analysées. La confiance naît de la transparence, j'en suis convaincue.

M. Yves Daudigny. - Je retiens votre détermination à avancer en la matière, tout en posant des garde-fous. Vous avez parlé du risque de réidentification ; le danger n'est-il pas que les organismes complémentaires sélectionnent leurs adhérents en fonction des données individuelles auxquelles ils ont pu accéder ? Vous avez également évoqué des évolutions législatives. Vos projets prennent-ils en compte la règlementation européenne en cours d'élaboration sur la protection des données personnelles ? Quelle place demain pour l'IDS dans la nouvelle gouvernance ?

Mme Marisol Touraine, ministre. - La loi fait interdiction aux organismes complémentaires d'accéder aux données individuelles de leurs adhérents en dehors de celles figurant dans le questionnaire rempli par ces derniers - mais elle n'interdit pas les tarifs différenciés... Il ne faut pas que l'ouverture des données leur permette de contourner cette interdiction. De la même façon, on ne peut ouvrir les données de santé à des fins commerciales ou de lobbying. Si on ne doit pas faire la différence entre chercheurs privés et publics, l'objectif d'intérêt général doit être la condition de l'accès aux données.

Nous nous inscrivons bien sûr dans le cadre de la réglementation européenne, tout en faisant valoir les spécificités de l'organisation de notre système.

L'IDS a un rôle tout à fait important à jouer : je veux le réaffirmer. Sa mission doit évoluer vers la surveillance d'ensemble du dispositif d'accès aux données de santé. Il faut élargir sa composition, notamment aux industriels. La structure de GIP ne me paraît pas adaptée et une réflexion est engagée sur l'opportunité de faire évoluer l'IDS vers un haut conseil. Nous avons besoin d'un lieu d'expression des avis, indépendant et identifié comme tel.

Mme Catherine Procaccia. - Quid des organismes de sécurité sociale ? Disposent-ils de toutes les données ?

Mme Marisol Touraine, ministre. - La sécurité sociale dispose des données ; l'enjeu, c'est de mieux les utiliser pour améliorer la qualité des soins et la pertinence de certains actes. De la qualité du parcours de soin résulte d'ailleurs une meilleure maîtrise des dépenses - même si l'enjeu de l'ouverture des données de santé dépasse bien sûr la seule question financière.

M. Jean-Jacques Hyest, président. - L'amélioration de l'exploitation des données permettra en effet d'améliorer la politique de santé publique, mais tel n'est pas l'objet de notre MCI. Nous disons, comme à notre habitude : attention à la divulgation des données personnelles, soyons vigilants ! Mais il ne faut pas non plus s'abriter derrière ce principe pour restreindre l'accès plus que nécessaire...

Mme Corinne Bouchoux, rapporteure. - On peut ouvrir les données en théorie mais dans le même temps rendre l'accès très difficile en pratique. Pour les cadeaux faits aux médecins par les laboratoires, il existe un logiciel... quasi inutilisable dès lors que l'on souhaite utiliser ces données à grande échelle.

L'arsenal mis en place en 1978 a été une grande avancée. Faut-il aller plus loin au XXIe siècle ? Nous avons quelques idées...

Mme Marisol Touraine, ministre. - Sur le deuxième point, il m'est difficile de répondre précisément à ce stade de notre réflexion.

Le premier point, sur le décalage entre l'ouverture théorique et l'accès effectif, me paraît très important. Selon la loi de décembre 2011, chaque laboratoire doit mentionner sur son site les avantages financiers accordés aux professionnels de santé. Dans le décret, le champ de cette contrainte a été élargi et un site national créé pour que les informations convergent. Nous avons donc un dispositif permettant l'interaction : aux laboratoires maintenant de l'alimenter. Nous en sommes là. Une culture nouvelle doit émerger. Dans quelques années tout cela ira de soi, j'en suis convaincue. La base « médicaments », quant à elle, est simple d'accès ; tout y figure, du plus simple au plus compliqué, l'information grand public est disponible comme les études techniques.

La transparence est un gage de connaissance, de confiance, à condition de ne pas en faire un outil pour une chasse aux sorcières. L'objectif n'est pas « zéro relation » entre les professionnels de santé et les industriels ; mais il faut savoir qui fait quoi pour éviter que les intérêts privés s'imposent dans l'ombre.

M. Jean-Jacques Hyest, président. - Merci, madame la ministre.

Audition du M. Eivind SMITH, professeur de droit public, université d'Oslo (jeudi 27 mars 2014)

M. Jean-Jacques Hyest, président. - Après de nombreuses auditions qui nous ont permis de mieux appréhender ce qui existe en France en la matière, nous nous tournons vers les modèles nordiques d'accès aux documents administratifs et d'ouverture des données publiques. Nous avons le plaisir d'accueillir sur ces sujets M. Eivind Smith, professeur de droit public à l'université d'Oslo.

Existe-il un droit général d'accès aux documents administratifs et aux données publiques en Norvège et en Suède ? Quelle est sa portée ? Quelles en sont les limites juridiques ? Quelle est la procédure d'accès ? Quels sont les recours en cas de refus ? Les sanctions ?

Le principe de la mise à disposition en ligne et de l'ouverture des données publiques à des fins de réutilisation est-il affirmé en droit ? Quelles sont les stratégies publiques et les modalités de publication et de mise à disposition d'informations publiques ?

Comment le législateur suédois, les administrations et le public ont-ils reçu et mis en oeuvre la directive de 2003 ? L'extension du champ de l'ouverture par la directive de juin 2013 notamment aux institutions culturelles et le principe de gratuité prévu par la Charte du G8 s'appliquent-ils déjà ? Des difficultés sont-elles anticipées en la matière ?

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - Je suis heureux d'être entendu par le Sénat. J'ai appris la semaine dernière seulement qu'on me demandait aussi un aperçu sur le système suédois, que je connais mais que je n'ai pas vraiment eu le temps d'approfondir.

Les modalités, les traditions, les outils et les systèmes juridiques varient d'un pays à l'autre dans ce qu'on appelle la sphère nordique. Pour autant, les résultats sont similaires. Il existe quatre lois constitutionnelles écrites en Suède, dont deux concernent la liberté d'expression et les droits connexes ainsi que la publicité des actes administratifs et des données publiques. Leurs racines remontent au XVIIIe siècle. Pour le constitutionnaliste que je suis, il est frappant de constater que, avant même la forme du gouvernement, la liberté d'expression, la liberté d'information et l'accès aux informations administratives, sont inscrits au coeur d'un texte constitutionnel très détaillé. Seule la loi peut fixer des limites à ces droits et les dispositions législatives en la matière sont très détaillées.

Le cas norvégien est différent : une grande commission gouvernementale a proposé une loi en 1958 sur le contrôle de l'administration publique instituant l'ombudsman ; une loi relative aux procédures administratives non contentieuses a été votée en 1967 ; une autre, relative à l'accès aux documents administratifs, a été adoptée en 1970, malgré la résistance des éminents juristes chargés de la préparer ; un nouveau texte a enfin été adopté en 2006. Le droit d'accès des parties dans des procédures administratives non contentieuses relève de la loi de 1967, le droit d'accès du public aux données administratives, de celle de 2006. Le droit d'accès des parties est évidemment plus large - le secret industriel et commercial des documents administratifs en particulier ne leur est pas opposable.

Il existe en Norvège un droit général d'accès aux documents administratifs et aux données publiques, qui résulte non de la loi de 2006 mais de notre Constitution. Celle-ci est bicentenaire mais a été modifiée environ 300 fois... Un amendement de 2004 a ainsi totalement réécrit l'article 100 sur la liberté d'expression pour l'élargir au-delà de la liberté de la presse à la liberté d'information quel que soit le support de diffusion concerné, et, en son alinéa 5, au droit d'accès, de regard, de tous sur les informations détenues par l'Etat et les collectivités locales ainsi que les délibérations des tribunaux et des organes politiques élus. Des limites existent cependant, prévues par la loi, dans le souci de protection de la vie privée et de toute autre considération de poids. Sa mise en oeuvre a fait l'objet de la loi de 2006 ; elle s'applique aux administrations publiques de tout niveau. Le Parlement prévoit le même droit de regard dans son Règlement - mais l'essentiel des travaux parlementaires se fait au sein des partis, qui ne sont pas soumis audit Règlement...

M. Jean-Jacques Hyest, président. - C'est vrai partout ! Mais la délibération publique est, elle, transparente...

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - Les auditions en commission aussi, sauf exception, depuis 1814 ! L'article 100, alinéa 5, de la Constitution norvégienne s'applique aussi aux tribunaux, mais dans le cadre d'une réglementation très précise.

Le droit d'accès, très large, connaît cependant quelques limites juridiques. Le modèle est certainement le même dans tous les régimes proprement démocratiques. La législation, notamment la loi de 1967, prévoit le respect de la vie privée, du secret industriel et commercial, des secrets protégés par la loi, par exemple la sécurité nationale et les négociations internationales. Ce sont les documents produits et ceux reçus par une administration qui sont accessibles. Plutôt que de documents, il conviendrait d'ailleurs parler de données détenues par les administrations, sans compter que le mot « document » évoque le papier, qui tend en pratique à disparaitre au profit des supports numériques. Un même document peut contenir trois données, dont une secrète ; seules les deux premières seront accessibles. De plus en plus, les registres des lettres et e-mails des administrations sont ouverts à la consultation, ce qui intéresse particulièrement la presse. Le gouvernement sortant l'a décidé avec fracas : désormais, tous les ministères doivent publier leur registre de communication sur internet, qui est donc accessible sauf exceptions, ce qui permet d'identifier le document utile et ensuite d'en demander communication ; si l'administration oppose un refus à la demande quand cela est prévu par la loi, elle doit motiver sa décision.

Pour les archives, lorsque le secret protégeant certains documents, - secret administratif ou secret national - le délai de communicabilité est de 60 ans et peut parfois être prolongé. Au sein d'une commission à laquelle je participe, nous réfléchissons à l'ouverture totale des archives de la Seconde Guerre mondiale, ce qui va sans doute intervenir prochainement en dépit de certains aspects très sensibles. Concernant la procédure, la Norvège, contrairement à la Suède, ne dispose pas de tribunaux administratifs. Il a été maintes fois question de créer une commission indépendante pour traiter les recours concernant l'administration, mais malheureusement l'unanimité politique s'est toujours faite contre elle. On en reste à un recours administratif par la voie hiérarchique, jusqu'au roi. En cas de silence de l'administration pendant cinq jours, la réponse est réputée négative, ce qui ouvre la voie au recours hiérarchique.

M. Jean-Jacques Hyest, président. - Donc, pas de recours juridictionnel ?

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - En pratique non parce que les délais de jugement sont trop longs et que la communication perd alors de son intérêt. L'absence de tribunaux administratifs a un prix.

M. Jean-Jacques Hyest, président. - Et chez nous un coût...

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - Il existe néanmoins des procédures civiles.

L'ouverture des données publiques à des fins de réutilisation ne constitue pas vraiment un enjeu politique en Norvège, y compris en matière de propriété intellectuelle. Une loi de 1961 règle la question et prévoit que la propriété intellectuelle ne s'oppose pas à l'accès aux documents administratifs.

Il n'y a pas à proprement parler de marché pour les données publiques. Nous avons développé d'excellentes bases de données juridiques, avec paiement pour les données les plus techniques, comme la jurisprudence. De toute façon, les administrations ont tout intérêt à faire connaître leurs activités et à communiquer sur leurs outils et procédures.

L'application de la directive de 2003 ne semble pas avoir posé de difficultés d'application particulières en Suède. En Norvège, non plus : nous faisons en effet partie de l'Espace européen mais notre régime de droit d'accès était déjà très avancé.

M. Jean-Jacques Hyest, président. - La directive de 2013 prévoit la gratuité, or leur production a un coût. Certaines données peuvent ensuite être commercialisées, ce qui peut poser problème ! Google Earth par exemple utilise en France les données de l'IGN. Est-il question en Norvège de licences de réutilisation ?

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - Je ne suis pas spécialiste en la matière. Le principe, c'est la gratuité ; s'il y a des exceptions, c'est la loi qui les détermine. Pour moi, il serait légitime de couvrir les coûts, au moins les frais de reproduction, d'autant que l'accès aux registres peut susciter des demandes portant sur des milliers de photocopies. Sur les données au sens large, les archives nationales publient de nombreux documents accessibles à un prix modeste pour couvrir leurs frais.

M. Jean-Jacques Hyest, président. - D'après un récent article, la Norvège met en ligne la totalité de sa littérature gratuitement. Comment traitez-vous la question du droit d'auteur ? Peut-on encore vendre des livres ?

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - C'est un sujet que je connais peu... Pour autant, nous avons le souci de protéger le marché du livre. L'oeuvre d'Ibsen est accessible en ligne gratuitement, mais pas les derniers romans...

M. Jean-Jacques Hyest, président. - Ibsen doit être tombé dans le domaine public, de toute façon !

Mme Corinne Bouchoux, rapporteure. - Vous parlez un bien meilleur français que mon norvégien... Vous l'avez compris, nous réfléchissons à l'amélioration de l'accès aux documents administratifs en France. Concernant les registres des communications des administrations, est-ce à dire que votre ministre de la santé rend publiques les lettres qu'il a reçues de tel ou tel laboratoire, patient, citoyen ou industriel ? Les intervenants sont-ils nommément cités ? Quel est l'intérêt de cette mesure ? Les lettres des ministres sont-elles également publiées ? Qui exploite ces correspondances ? Il y a fort à parier qu'en France nous attendrons longtemps avant de connaître la correspondance quotidienne de Mme Touraine, que nous venons d'auditionner...

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - N'importe quelle administration est tenue de publier son registre de communications, afin que les documents puissent être retrouvés. Même chose pour les ministères, les organismes Etatiques et, progressivement, les municipalités. Les courriers reçus et envoyés sont décrits avec un certain niveau de précision sans toutefois porter atteinte aux secrets protégés par la loi, notamment la vie privée. Ces registres constituent des banques de données très riches que la presse utilise pour des recherches, des articles, creuser une affaire, parfois pour aller à la pêche aux informations, ce qui peut produire des résultats substantiels mais au prix de ressources importantes dont seuls disposent les grands média. Le dispositif est coûteux et très chronophage pour les fonctionnaires, ne serait-ce que pour faire la part de ce qui relève du secret.

M. Jean-Jacques Hyest, président. - Les bases de données brutes sont difficilement exploitables.

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - Il est très facile pour un citoyen de demander communication d'une masse énorme de données... La charge est lourde pour les administrations.

Mme Corinne Bouchoux, rapporteure. - Y a-t-il un registre de ceux qui demandent à consulter les documents ?

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - Je ne le pense pas, d'autant que les demandeurs n'ont pas à se justifier pour demander l'accès.

Mme Corinne Bouchoux, rapporteure. - Existe-t-il un organisme, comme notre Cour des comptes, qui aurait calculé le coût de cette transparence  pour les administrations?

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - Je ne le crois pas. Il n'y a pas de Cour des comptes en Norvège, mais un organisme - la révision nationale - qui relève techniquement du Parlement mais travaille de manière tout à fait indépendante et qui peut parfois être très embarrassant pour le Parlement.

Mme Corinne Bouchoux, rapporteure. - Cette hyper transparence favorise-elle une plus grande probité des acteurs publics ?

M. Eivind Smith, professeur de droit public à l'université d'Oslo. - La transparence est aujourd'hui perçue comme un moyen de combattre la corruption, nécessaire mais sans doute pas suffisant.

Pour finir, une précision importante : tous les documents ne sont pas accessibles à tout moment. L'administration a le droit de ne pas divulguer ses documents de travail en cours d'élaboration.

M. Jean-Jacques Hyest, président. - Ce sont effectivement des documents préparatoires. Merci pour cet exposé très intéressant. Les pays nordiques sont souvent exemplaires mais il n'est pas toujours facile d'adapter ce modèle à un pays latin comme le nôtre.

Audition de Me Christopher J. MESNOOH, avocat aux barreaux de Paris, New-York et Washington (jeudi 3 avril 2014)

M. Jean-Jacques Hyest, président. - Après avoir reçu un certain nombre d'associations, de collectifs citoyens, de cercles de réflexion, de journalistes et d'entreprises, nous accueillons M. Christopher Mesnooh, avocat aux barreaux de Paris, New-York et Washington, spécialiste du droit des technologies de l'information.

Pourriez-vous nous présenter le droit d'accès aux documents administratifs et aux données publiques aux Etats-Unis ? Quel est son champ d'application ? Quelle est la procédure d'accès ? Les recours en cas de refus : y a-t-il un régulateur administratif ou juridictionnel compétent en la matière ? Quelles sont les sanctions applicables ?

Sur l'open data, y a-t-il des stratégies publiques de mise à disposition d'informations publiques ? L'ouverture des données publiques à des fins de réutilisation est-elle considérée comme un enjeu politique, social et économique important ? Quelles en sont les modalités ? Quel est le cadre juridique et financier de la réutilisation des données ?

M. Christopher Mesnooh, avocat aux barreaux de Paris, New-York et Washington DC. - Le Freedom of Information Act (FOIA) date de 1966. Il concerne les agences, c'est-à-dire les ministères et les institutions fédérales situées à Washington qui constituent l'infrastructure administrative et Etatique car, lorsque l'on parle du gouvernement, l'on désigne là-bas ce que l'on appelle ici l'Etat.

Cette loi a été imaginée et votée à un moment où il s'agissait de concilier le développement de l'Etat, notamment dans sa dimension militaire, et les principes démocratiques de base que constituent l'ouverture et la responsabilité envers les citoyens. Les débats avaient débuté dans les années 1950, lors de la guerre froide, et ils ont duré une dizaine d'années. Ancien soldat, le président Eisenhower n'y était pas très favorable, estimant que le développement de l'appareil militaire et la sécurité étaient prioritaires. Avec la guerre du Vietnam, une contre-culture s'est développée et le contexte a changé au milieu des années 1960. Finalement voté en 1966, le Freedom of Information Act (FOIA) est entré en vigueur le 4 juillet 1967. Il donne accès, pour le public américain comme non américain, aux documents officiels produits par la seule branche exécutive (la présidence, la vice-présidence, les agences), mais, conformément au principe de séparation des pouvoirs, ni à ceux du Congrès ni à ceux de la justice. Les documents concernés doivent avoir été produits par une agence et être conservés sous le contrôle de celle-ci. Deux mots sont revenus dans les débats parlementaires : openess (ouverture) et accountability (obligation de responsabilité du gouvernement envers les citoyens).

La loi a ensuite été revue en fonction des évolutions politiques. En 1974, après le Watergate et la démission forcée du président Nixon, sa portée a été élargie et certains privilèges et exceptions bénéficiant aux services secrets et à la police ont été supprimés. L'année 1974 a vu l'adoption du Privacy Act, équivalent de la loi française du 6 janvier 1978 créant la Commission nationale de l'informatique et des libertés (Cnil). En 1986 cependant, l'administration de Ronald Reagan, voyant dans cette loi une menace, a renforcé les exceptions dont pouvaient se prévaloir l'Etat et les agences pour restreindre l'accès aux informations. On était alors loin de l'idéologie des années 1960 et 1970... En 1996, Bill Clinton, avocat, plus libéral au sens américain du terme, a pris l'initiative du Electronic Freeedom of Information Act afin de rendre la législation compatible avec les débuts de l'Internet. Cinq ans plus tard, nouveau virage après les attentats du 11 septembre 2001 : le gouvernement républicain de George Bush fils a, sans changer la loi, donné consigne de défendre devant la Justice les agences qui ne communiquaient pas leurs documents. En 2003, l'accès aux documents a été limité pour les associations, les institutions et les gouvernements étrangers. Cette législation, en évolution permanente au gré des alternances politiques, reste cependant à peu près la même depuis 1966 : elle demeure une arme donnée aux citoyens américains pour contrôler leur gouvernement.

A la différence du système français qui a mis en place la Commission d'accès aux documents administratifs (Cada) française, il n'existe pas aux Etats-Unis d'organisme central chargé de faire respecter la loi. Chaque agence dispose d'un bureau chargé de vérifier que la loi est correctement appliquée en son sein et de traiter les demandes du public. Les Américains sont hostiles à une extension des compétences fédérales sur ce sujet. Dès lors, il appartient à chacun de trouver la bonne agence et le bon interlocuteur pour répondre à sa demande. On recense chaque année 600 000 demandes, qui concernent surtout le Department of Homeland Security, créé par Bush après le 11 novembre, puis les départements de la Défense, de la Santé et de la Justice. Au cours des trois ou quatre dernières années, le taux de refus de communication s'est établi à environ 45 %. Chaque agence doit présenter tous les ans un rapport sur les documents demandés, fournis et refusés, ainsi que sur les délais d'accès. En outre, une riche information, notamment juridique, figure sur leurs sites internet. Dès 1966, des reading rooms ou salles de lecture physiques ont été installées pour permettre la consultation des documents non classifiés. En 1996, des salles de lecture virtuelles ont également été mises en place sur internet par chaque agence.

Jusqu'en 2003, il n'y avait aucune restriction liée à la profession, au statut ou même à la nationalité pour l'accès aux informations publiques. En 2003, suite aux attentats de 2001, je vous rappelle que les gouvernements, personnes et institutions étrangères ont été écartés.

Si les demandes n'ont pas à être motivées, elles doivent être écrites, qu'elles prennent la forme d'un courrier adressé sur papier ou par voie électronique : la procédure est plutôt informelle. Les agences doivent fournir un effort « raisonnable » pour, le cas échéant, identifier les documents demandés ; plus la demande est précise, plus la recherche sera facile et les délais de communications seront courts. Les délais de communication, initialement de dix jours ouvrés, ont été portés à vingt jours en 1996. Cependant, si la charge de travail de l'agence est trop importante, celle-ci doit en aviser le demandeur en l'invitant à reformuler sa demande afin de mieux circonscrire la recherche. Au total, malgré sa complexité et le nombre de demandes annuelles, le système fonctionne étonnamment bien. Une procédure accélérée est prévue en cas d'urgence, notamment si la vie ou la sécurité d'une personne est menacée ou si la sécurité publique est en jeu. Dans quelques cas, le traitement des demandes a ainsi été accéléré.

Les agences n'ont pas d'obligation de résultat, mais sont tenues de mener avec diligence les recherches nécessaires. Elles doivent transmettre les documents sur le support demandé. Il est possible de rejeter totalement ou partiellement une demande, sous réserve de motiver cette décision par l'une des neuf exceptions prévues par la loi - informations classées secret-défense ou touchant à la conduite des affaires extérieures ; informations relatives aux règles de fonctionnement interne des agences ; communications internes des agences ou des agences entre elles ; informations protégées par une loi fédérale (notamment dans le domaine fiscal) ; informations protégées par le secret commercial et financier ; informations sur la vie privée ; informations sur la sécurité intérieure et les enquêtes de police ; informations relatives au contrôle des institutions financières. Il existe en outre des exemptions, pour lesquelles le refus de communication ne peut être remis en cause par la voie de l'appel : elles concernent des questions de sécurité, les affaires pénales, le terrorisme, l'intelligence et les renseignements généraux.

En cas de refus de communication, le citoyen peut former un recours gracieux auprès du bureau spécialisé de l'agence concernée, puis, en cas d'échec, un recours contentieux devant les tribunaux fédéraux. Pour 600 000 demandes annuelles, l'on compte 11 000 recours gracieux par an, et seulement 300 à 500 recours contentieux, car il est difficile de remettre en cause une décision bien justifiée par un enjeu sécurité intérieure, par exemple. Avec la multiplication des documents disponibles en ligne, les demandes se font de plus en plus personnelles. Nombre de recours concernent des personnes à qui l'on a refusé l'octroi de la carte verte ou de la citoyenneté américaine. Il arrive souvent également que des journalistes reconnus, qui s'intéressent aux dysfonctionnements gouvernementaux, portent leur demande devant les tribunaux.

Le Privacy Act de 1974, qui donne aux individus accès aux informations les concernant, ne vaut que pour les citoyens américains.

Le président Obama, avocat de formation, est très favorable à l'open society, même s'il en oublie parfois les principes, lorsqu'il s'agit de sécurité nationale ou de politique étrangère...

M. Jean-Jacques Hyest, président. - Pouvez-vous nous préciser le cadre juridique et financier de la réutilisation des données ?

M. Christopher Mesnooh. - L'accès aux données publiques, tout d'abord, peut dans certains cas être payant : une agence peut facturer un coût selon l'étendue de la demande qui lui est adressée. Ce coût est cependant minime et n'est jamais dissuasif. Pour les personnes physiques, les 100 premières photocopies sont gratuites, les suivantes coûtent 10 centimes l'une. La gratuité est de règle pour les institutions universitaires et académiques et il existe des coûts réduits pour les organes de presse.

L'on n'avait pas imaginé en 1966 la réutilisation et l'exploitation commerciale des données personnelles. Les principales bénéficiaires de cette réutilisation sont les sociétés commerciales américaines situées sur la côte ouest et les institutions financières new-yorkaises, qui pratiquent un intense lobbying contre la mise en place d'une réglementation portant sur la réutilisation des données privées. A l'heure actuelle, il n'existe pas de loi fédérale encadrant la collecte, le traitement, la divulgation et la commercialisation des données. Compte tenu des enjeux, une évolution me paraît cependant inéluctable. Fait exceptionnel, l'Europe est même citée en exemple sur ce sujet, sur lequel elle est considérée comme très en avance.

Mme Corinne Bouchoux, rapporteure. - Quel a été l'effet de l'affaire Snowden ?

Mme Hélène Lipietz. - J'allais poser la même question.

M. Christopher Mesnooh. - Wikileaks et l'affaire Snowden ont eu des effets contradictoires. Certains préconisent de renforcer la transparence des informations qui concernent l'Etat, d'autres insistent plutôt sur la protection des données individuelles. L'administration Obama y est favorable, mais le poids commercial de certaines entreprises, dotées de technologies envahissantes, est très grand. Au sein du Congrès, dominé par les avocats, on note cependant une prise de conscience. Où placer le curseur ? Internet a un avantage : quelles que soient les contraintes envisagées, des milliers de pages peuvent être disponibles sur n'importe quel site internet. Il ne saurait y avoir de contrôle absolu des données publiques dans nos démocraties occidentales.

M. Jean-Jacques Hyest, président. - Je vous remercie de vos très intéressants propos.

Audition de M. Richard SWETENHAM, conseiller du directeur général chargé de contribuer à la mise en oeuvre et au développement de la politique de la Commission européenne dans le domaine de l'open data (jeudi 3 avril 2014)

M. Jean-Jacques Hyest, président. - M. Richard Swetenham, conseiller du directeur général chargé de contribuer à la mise en oeuvre et au développement de la politique de la Commission européenne dans le domaine de l'open data, suit ce sujet de l'ouverture des données publiques à la Commission européenne depuis vingt ans - une belle longévité !

Sans doute avez-vous de ce fait une vision précise de la mise en oeuvre de l'ouverture des données publiques dans les différents Etats membres, dans la suite de la directive de 2003, d'autant que vous avez participé à l'élaboration de la directive de juin 2013 qui la complète. Pourriez-vous nous présenter les enjeux européens de l'ouverture des données publiques, notamment en matière économique ? La Commission a-t-elle dressé un bilan de ce qui a été déjà fait ? Par ailleurs comment les Etats membres pourraient-ils récupérer une partie de la valeur dégagée par l'ouverture de leurs données publiques ? Y a-t-il des discussions au niveau européen sur ce sujet ? Enfin, quels sont les principaux apports de la nouvelle directive ? Comment la Commission envisage-t-elle le contrôle du respect des principes qu'elle pose ? De manière plus spécifique, quelle est la portée des exceptions, en particulier de l'exclusion au titre de la confidentialité des informations commerciales ? Quelles sont les conditions d'accès à l'information produite par les institutions européennes et leur politique d'ouverture de leurs données ?

M. Richard Swetenham, conseiller du directeur général chargé de contribuer à la mise en oeuvre et au développement de la politique de la Commission européenne dans le domaine de l'open data. - Je vous remercie d'avoir invité un représentant de la Commission européenne et je me réjouis que le Sénat s'intéresse à ce sujet que la Commission considère depuis longtemps comme un enjeu majeur, ce qui l'a conduite à jouer un rôle pionnier en la matière. L'on ne peut en effet pas dire que lorsqu'elle s'est saisie du sujet en 2001, il était considéré comme d'une grande importance politique. Cependant, au fil du temps, l'intérêt de ce sujet n'a fait que croître, avec le développement de la réutilisation des données publiques à des fins commerciales par des entreprises, l'émergence d'un large mouvement en faveur de l'open data au nom de la transparence de l'action publique, du contrôle des citoyens, voire de l'efficacité de la gestion des services publics, et, plus récemment encore les enjeux du big data, - la collecte automatique massive de données publiques et privées par des entreprises -, soulève des questions autour de la protection de la vie privée et de la répartition des coûts et des bénéfices éventuels. Au-delà de l'adoption de la directive, la discussion se poursuivra.

Dans les années 1990 déjà, des travaux préparatoires ont été menés par un groupe d'experts, le Legal Advisory Board. Une première impulsion politique a été donnée par un commissaire européen qui avait compris, grâce à des contacts avec l'industrie, qu'il y avait là un gisement inexploité. Le législateur européen - Parlement et Conseil -, a été convaincu et une première directive a été adoptée. Dans la plupart des cas, les délais de transposition n'ont pas été respectés. Il a en outre fallu que les dix nouveaux Etats membres mettent en place une législation ad hoc. Certains d'entre eux, issus du bloc de l'Est, avaient déjà adopté une législation très libérale en matière d'accès aux documents administratifs, parfois plus que celle de l'Allemagne, mais nous avons dû négocier avec eux pour qu'ils aillent au-delà et assurent l'entrée en vigueur sur le plan national des règles posées par la directive de 2003.

En 2010, la Commission, qui était tenue de passer en revue l'Etat d'avancement de la mise en oeuvre de l