Allez au contenu, Allez à la navigation

Pour une intelligence artificielle maîtrisée, utile et démystifiée - Rapport

15 mars 2017 : Pour une intelligence artificielle maîtrisée, utile et démystifiée - Rapport ( rapport d'information )

II. POUR UNE INTELLIGENCE ARTIFICIELLE UTILE, AU SERVICE DE L'HOMME ET DES VALEURS HUMANISTES

Proposition n° 6 : Redonner une place essentielle à la recherche fondamentale et revaloriser la place de la recherche publique par rapport à la recherche privée, tout en encourageant leur coopération

Il faut parvenir à redonner une place essentielle à la recherche fondamentale et à revaloriser le rôle de la recherche publique par rapport à la recherche privée, tout en encourageant leur coopération.

Seule la recherche fondamentale peut permettre de répondre aux problèmes d'explicabilité des algorithmes et de biais dans les données. Nous en avons besoin car, des enjeux de maîtrise des technologies à ceux du du financement de la recherche publique, tout se tient.

La recherche fondamentale pose, par ailleurs, la question du mode de financement des projets : il faut favoriser la recherche transversale et ne surtout pas reproduire l'hyperspécialisation entre sous-domaines de l'intelligence artificielle.

Ce serait une erreur de financer d'un côté la perception, d'un autre, la vision, encore d'un autre la prise de décisions, l'apprentissage machine, la robotique, la relation homme-machine...

Il faut mobiliser les équipes de chercheurs autour de grands projets nationaux structurants et résister aux sirènes de l'hyperspécialisation entre sous-domaines de l'intelligence artificielle.

D'après les informations recueillies par vos rapporteurs, le Commissariat général à l'investissement (CGI), Bpifrance et l'initiative du Gouvernement France IA pourraient orienter le futur PIA dans le sens de cette hyperspécialisation, ce qui est de nature à les inquiéter.

Le mode de financement des projets pourrait de plus gagner à s'inscrire dans des temps plus longs que 3, 4 ou 5 ans seulement, de manière à porter les projets à leur pleine maturation. C'est ainsi le cas aux États-Unis pour la plupart des projets soutenus par la Fondation nationale pour la science, visitée par vos rapporteurs à Washington (National Science Foundation ou NSF), mais encore du projet Todai Robot250(*) conduit depuis 2011 pour dix ans à l'Université de Tokyo au Japon, avec le soutien de l'Institut national de l'informatique japonais et l'entreprise Fujitsu.

Des projets de grandes bases de données labellisées, nécessaires à l'apprentissage machine, pourraient être lancés, par exemple autour de la langue française, du marché de l'emploi ou des données de santé, sous condition d'anonymisation. Ces initiatives pourraient se faire en liaison avec la CNAM, l'APHP, la BNF, l'INA ou, encore, avec Pôle emploi. Dans son intervention lors de la journée « Entreprises françaises et intelligence artificielle » organisée par le MEDEF et l'AFIA le 23 janvier 2017, Yves Caseau, animateur du groupe de travail sur l'IA de l'Académie des technologies, a fourni les premières recommandations de son groupe, la première consistant à la collecte en France de jeux de données massifs251(*), car ces jeux de données sont essentiels au développement de l'intelligence artificielle par l'apprentissage.

Quant au niveau des investissements requis, vos rapporteurs ne se sont pas avancés à réaliser leur propre chiffrage. Selon Bertrand Braunschweig, directeur du centre Inria de Saclay, l'effort financier nécessaire serait de l'ordre de 100 millions d'euros par an sur dix ans, financements publics et privés compris.

De très nombreuses coopérations public-privé existent et fonctionnent et il est loisible de s'en inspirer (Microsoft-Inria, CNRS avec IBM, Rhodia, Thalès, Michelin...)

Jean-Gabriel Ganascia pose la question de l'articulation entre recherche publique et recherche privée de la manière suivante : « Depuis une trentaine d'année, un accent très fort a été mis au plan européen et au plan national, sur les projets collaboratifs entre l'université et l'industrie. Cela a certainement eu des aspects très bénéfiques, mais ce mode de coopération présente aussi des limites. En effet, le caractère très administratif du montage des projets qui conduit, en particulier au plan européen, à solliciter des sociétés spécialisées pour le montage des projets, le taux d'acceptation des projets (moins de 8 %, parfois de 2 % pour certaines actions), les procédures d'évaluation très rigides, conduisent à une recherche chère, conventionnelle et peu innovante, tendant à stériliser les équipes. À cela, il faut ajouter qu'en l'absence de post-évaluation sérieuse, on n'est pas en mesure de tirer parti des résultats de projets financés, ce qui conduit à un gaspillage des ressources. Il faudrait encourager des partenariats bilatéraux entre une équipe privée et un laboratoire public, avec des actions plus légères. Il est à noter que des actions à plus long terme, comme les Labex, ou des financements de bourses de type « CIFRE » complétés par des contrats conclus grâce au crédit d'impôt recherche, peuvent avoir des effets très positifs ».

Il est important de produire de l'intelligence artificielle « à la française », en intégrant notamment les sciences humaines et sociales. Les réponses possibles à la question de la vulnérabilité de la société aux bouleversements des innovations technologiques doit pouvoir s'appuyer sur les sciences humaines.

Proposition n° 7 : Encourager la constitution de champions européens en intelligence artificielle et en robotique, tout en poursuivant le soutien aux PME spécialisées, en particulier les start-up

Il faut encourager la constitution de champions européens en intelligence artificielle et en robotique, sans retomber dans les erreurs du projet Quaero252(*) mais plutôt en suivant les traces des succès du modèle d'Airbus, ce qui pourra impliquer de poser la question du droit de la concurrence dans l'Union européenne, très contraignant en matière de concentrations. Cette proposition s'ajoute à celle de poursuivre les mesures de soutien aux PME spécialisées, en particulier les start-up.

Faire émerger des champions européens et soutenir notre tissu de PME passe aussi par un écosystème rendu encore plus favorable grâce à la mise à dispositions de très grands volumes de données (vue au paragraphe précédent), l'accès facilité à des supercalculateurs, dont les puissances de traitement pourraient être mises en réseau sur le cloud, l'harmonisation du droit applicable, par exemple en matière de protection des données personnelles dans l'Union européenne.

Sans verser directement dans le nationalisme industriel appliqué à l'intelligence artificielle, il faut réfléchir aux formes de protection qui pourraient être instituées, car les laboratoires français sont pillés de leurs chercheurs par des multinationales nord-américaines et chinoises. La question du soutien à la création, mais aussi à la croissance des entreprises françaises de ce secteur, en particulier de ses start-up, doit être étudiée, afin de faire émerger une industrie française de l'intelligence artificielle qui développera des produits innovants compétitifs et exportables. Là aussi, en plus de l'encouragement et de la facilitation de l'accès aux dispositifs de soutiens, des protections pourraient être utiles.

Comme l'affirment justement Thierry de Montbrial et Thomas Gomart, dans un ouvrage qu'ils viennent de publier en février 2017, nous devons défendre « notre intérêt national » et vos rapporteurs y ajoutent « notre intérêt européen ».

Proposition n° 8 : Orienter les investissements dans la recherche en intelligence artificielle vers l'utilité sociale des découvertes

Il faut orienter les investissements dans la recherche en intelligence artificielle vers l'utilité sociale des découvertes, en encourageant les applications à impact sociétal bénéfique : bien-être, santé, dépendance, handicap, infrastructures civiles, gestion des catastrophes... De manière caricaturale, la recherche appliquée en intelligence artificielle ne doit pas s'intéresser qu'au trading à haute fréquence (THF).

Il convient de saisir, dans notre intérêt national, les opportunités ouvertes par les technologies d'intelligence artificielle. Là aussi, les entreprises privées, qui se donnent pour objectif d'informer et d'éduquer dans le domaine de ces technologies et d'accroître leurs effets bénéfiques pour la société, pourraient participer à l'effort collectif nécessaire.

Proposition n° 9 : Élargir l'offre de cursus et de modules de formation aux technologies d'intelligence artificielle dans l'enseignement supérieur et créer, en France, au moins un pôle d'excellence international et interdisciplinaire en intelligence artificielle et en robotique

Il est nécessaire d'élargir l'offre de cursus et de modules de formation aux technologies d'intelligence artificielle dans l'enseignement supérieur et de créer en France au moins un pôle d'excellence international et interdisciplinaire en intelligence artificielle et en robotique. Il s'agit de renforcer ces formations, alors que des besoins considérables apparaîtront bientôt pour le développement de l'intelligence artificielle. Des cycles de formation longs apparaissent donc nécessaires, mais des cycles de formation plus courts et plus professionnalisants le sont aussi, le cas échéant selon un processus itératif.

Il sera possible de s'appuyer sur l'expérience des 138 cours spécifiques en intelligence artificielle, ou techniques en relation avec l'IA, dispensés dans l'enseignement supérieur français chaque année et sur les 16 masters existants qui, de près ou de loin, sont spécialisés en intelligence artificielle en France, à l'image du Master MVA-MATH de l'ENS Cachan, du Master en sciences cognitives (Cog master) de l'ENS Ulm, des Masters ANDROIDE (AgeNts Distribués, Robotique, Recherche opérationnelle, Interaction, Decision) et DAC (Master Données, Apprentissage et Connaissances de l'Université Pierre-et-Marie-Curie Paris 6 (UPMC), du Master en informatique spécialité intelligence artificielle de Université Paris-Descartes ou, encore du Master « Intelligence Artificielle et Reconnaissance des Formes » de l'Université Paul Sabatier de Toulouse.

En outre, il est nécessaire de créer en France au moins un pôle d'excellence international et interdisciplinaire en intelligence artificielle et en robotique. Jusqu'à deux ou trois pôles pourraient voir le jour, appuyés sur l'excellence d'Inria, du LAAS de Toulouse, de l'ENS, de l'Institut Mines-Télécom... Ils ne seraient pas nécessairement géographiquement localisés, mais, à défaut d'une création pure et simple, il paraît urgent d'encourager la coordination et d'accroître la cohérence des instituts et des centres existants, et de leurs équipes de recherches à travers des réseaux d'excellence en IA.

Vos rapporteurs ont visité au Royaume-Uni, en Suisse et aux États-Unis des pôles d'excellence à visibilité internationale et à vocation interdisciplinaire. Ils jugent indispensables de s'inspirer de ces pôles pour structurer la recherche française, qui est déjà d'excellent niveau. Et comme l'a fait remarquer le jeune chercheur Jill-Jênn Vie à vos rapporteurs, le cas de son laboratoire de recherche Riken en intelligence artificielle à Tokyo montre qu'il est possible de développer l'excellence à l'échelle de tout un pays, ici le Japon, et que ce rayonnement est utile à tous les chercheurs concernés.

Proposition n° 10 : Structurer et mobiliser la communauté française de la recherche en intelligence artificielle en organisant davantage de concours primés à dimension nationale, destinés à dynamiser la recherche en intelligence artificielle, par exemple autour du traitement de grandes bases de données nationales labellisées

L'initiative « France IA » est une étape importante dans la mobilisation de la communauté française de la recherche en intelligence artificielle. Il faut continuer et structurer encore davantage celle-ci, par exemple en organisant davantage de concours primés à dimension nationale, destinés à dynamiser la recherche en intelligence artificielle, par exemple autour du traitement de grandes bases de données nationales labellisées.

Les projets de la DARPA, à l'image de celui présenté à vos rapporteurs au siège de l'organisme en matière de cybersécurité, reposent souvent sur ce modèle, qui crée une saine émulation au sein des équipes. Un travail avec l'ANR peut être envisagé pour définir une offre française de grands concours primés en IA et contribuer à l'excellence de la recherche en France.

Les « hackathons »253(*) qui sont à la fois le principe, le moment et le lieu d'événements dans lesquels des développeurs se réunissent pour faire de la programmation informatique collaborative, sont des pistes à creuser pour assurer une telle promotion de la recherche et de l'innovation en intelligence artificielle.

Le traitement de grandes bases de données nationales labellisées nécessitera de mettre à disposition des jeux de données massifs, ce que le Gouvernement pourrait favoriser comme il a été vu dans la proposition n° 6.

Proposition n° 11 : Assurer une meilleure prise en compte de la diversité et de la place des femmes dans la recherche en intelligence artificielle

La place des femmes et la question des minorités dans la recherche en intelligence artificielle sont des défis qu'il convient de relever.

Diversifier le profil des chercheurs en intelligence artificielle et travailler sur le thème de la diversité dans ce secteur apparaissent nécessaires, vos rapporteurs ayant noté la sous-représentation des minorités dans ce secteur. La réponse qui leur a été faite, selon laquelle ce serait le cas plus globalement pour tout le secteur de l'informatique et pour les filières scientifiques en général, ne suffit pas à justifier la situation présente. Il s'agit d'ailleurs d'un axe de travail du CNSTI.

Dans le secteur de l'informatique, la vigilance et la prise en compte des problématiques de biais et de discriminations dans les algorithmes et les données seront d'autant plus grandes que les acteurs du domaine seront issus d'une plus grande diversité.

Ils notent, d'ailleurs, que le Gouvernement a signé, le 31 janvier 2017, un plan sectoriel « mixité dans les métiers du numérique » avec une quinzaine de structures telles que Cap digital, le Syndicat national du jeu vidéo, TECH-IN France ou Syntec numérique. Des plans similaires ont été lancés auparavant dans le secteur du bâtiment ou les transports. Il est vrai qu'on ne dénombre que 28 % de femmes dans le secteur du numérique contre 48 % dans le reste de l'économie, et que derrière ce pourcentage se cache une réalité encore moins admissible : les femmes sont surtout présentes dans les emplois de secrétariat du secteur du numérique, mais sont particulièrement sous-représentées dans les métiers de techniciens, d'informaticiens ou d'ingénieurs.

Là aussi, les entreprises privées, qui se donnent pour objectif d'informer et d'éduquer dans le domaine de ces technologies ainsi que d'accroître leurs effets bénéfiques pour la société, pourraient participer à l'effort collectif nécessaire.


* 250 En novembre 2016, ce robot a échoué pour la quatrième année consécutive à intégrer la prestigieuse Université de Tokyo. Ses concepteurs tirent à chaque rentrée scolaire les leçons de cet échec pour faire progresser la machine.

* 251 Les trois autres recommandations sont :


· commencer à utiliser des réseaux neuronaux afin de résoudre des problèmes de classification externe (exemple : TensorFlow outil en open source développé par Google) ;


· maîtriser la technologie d'automatisation (robotic process automation) en augmentant le volume d'investissement dans la robotique de pointe et de robotique à haute performance ;


· implémenter les premiers chatbots d'assistance client sur des périmètres fonctionnels simples.

* 252 Le projet, imaginé par la France en 2004 en tant qu'un des cinq premiers PMII (programmes mobilisateurs pour l'innovation industrielle), lancé en 2008 avec le soutien de l'Allemagne et abandonné en 2013, visait à développer des « outils intégrés de gestion des contenus multimédias », dont des extensions multimédias pour des moteurs de recherche de nouvelle génération qui devaient permettre de rechercher par le contenu non seulement du texte, mais aussi des images, du son et de la vidéo. L'ambition de constituer les fondements technologiques européens de futurs moteurs de recherche a donc rapidement avorté, l'américain Google demeurant dans un quasi-monopole (en dépit des qualités éthiques du moteur de recherche français « Qwant »). Le projet Quaero s'est donc soldé par un échec mais il n'est pas nécessaire d'espérer pour entreprendre ni de réussir pour persévérer, cf. http://www.quaero.org/

* 253 Ce mot valise a été formé sur la base de « hack » (activité de manipulation d'un système informatique) et de « marathon ». La référence au « marathon » provient du fait que le travail des développeurs est souvent conduit sur plusieurs jours et sans interruption.