II. L'UTILISATION DE L'IA DANS LES PRATIQUES DES CHERCHEURS
Dans le prolongement du récent rapport de l'Office établi par le député Alexandre Sabatou et les sénateurs Patrick Chaize et Corinne Narassiguin sur les derniers développements de l'IA2(*), les membres du Conseil scientifique ont évoqué l'impact de l'IA sur leurs pratiques de chercheurs et insisté sur la nécessité pour l'organisation de la recherche de s'adapter aux nombreux enjeux qui en résultent.
A. UN IMPACT DÉJÀ SIGNIFICATIF ET DES PERSPECTIVES NOMBREUSES
1. Un usage généralisé
L'IA revêt une importance croissante pour la recherche, comme en témoigne de façon emblématique l'attribution en 2024 des prix Nobel de physique et de chimie à des chercheurs ayant développé ou mobilisé l'IA3(*).
Dans les sciences de l'ingénieur, en particulier la photonique, l'IA est utilisée principalement pour l'apprentissage des réseaux de neurones et l'aide à la décision : reconnaissance d'images et de formes, traitement de données massives ou encore simplification de structures complexes telles que le routage de circuits électroniques.
L'IA joue un rôle clé pour la réduction de données en astrophysique, où le volume d'informations à traiter est considérable (par exemple, s'agissant du projet de radiotélescope international « Square Kilometre Array Observatory », 700 pétabytes par an, soit plusieurs térabytes par seconde en régime de croisière). Les réseaux neuronaux convolutifs permettent d'identifier les données à conserver et de les classifier.
Cet apport de l'IA est également central dans le secteur de la recherche biomédicale et de la santé, qui travaille sur des bases de données nombreuses et volumineuses.
Dans le domaine de l'énergie et de l'environnement, l'IA et la science des données se sont imposées de la recherche fondamentale jusqu'aux applications industrielles et la maintenance prédictive, en particulier pour le développement des technologies bas carbone. L'IA est utilisée pour l'analyse des données, la modélisation ou la simulation, mais aussi, depuis l'essor des grands modèles de langage (LLM), pour l'aide à la rédaction.
L'intérêt des LLM et des outils conversationnels est également bien identifié dans les sciences humaines et sociales (SHS) : facilitation de tâches administratives (constitution de tableaux ou de supports de présentation), aide à la rédaction ou à l'élaboration de protocoles de recherche, analyse de textes (traitement automatisé de corpus volumineux), constitution et interprétation de données.
Ainsi, de nombreuses disciplines qui travaillent avec de grandes bases de données (langues, économie, archéologie, humanités traditionnelles) utilisent désormais l'IA pour la lecture automatique d'écritures anciennes ou l'extraction de données.
En philosophie, la validité de ChatGPT en tant que « sparring partner » est reconnue, et son utilisation est fréquente.
Au total, les chercheurs sont unanimes sur l'intérêt que peuvent représenter les nouveaux outils d'IA pour le résumé de contenus et le gain de temps appréciable dont ils peuvent les faire bénéficier.
2. Des perspectives nombreuses
Les perspectives offertes par les nouveaux développements des technologies d'IA sont nombreuses, en particulier pour la reconnaissance d'images et la robotisation. Les chercheurs indiquent en effet que l'analyse textuelle et d'images sera de plus en plus centrale pour l'exploitation des corpus de données.
Les pratiques des chercheurs devraient continuer à être transformées par les LLM et leurs conséquences sur les méthodes de production, d'analyse et de classification des données, en particulier dans les SHS.
Dans le champ des sciences sociales et des recherches quantitativistes, qui impliquent la constitution de matériaux empiriques constitués à partir d'enquêtes comme des sondages ou des interviews d'échantillons représentatifs, des travaux de simulation de sondages par l'IA sont par exemple expérimentés par certains chercheurs, avec des interrogations sur les limites inhérentes à la simulation de comportements sociaux à partir de populations virtuelles4(*).
Les retours d'expérience des représentants du centre de recherches politiques de Sciences Po (Cevipof) font également état d'une performance élevée de ChatGPT pour le commentaire de modèles statistiques réalisé dans un cadre expérimental.
L'évaluation de la capacité de cet outil à réaliser des classifications de données relatives à des positions politiques à partir de verbatims offre également des perspectives encourageantes : son niveau de maturité est désormais suffisant pour réaliser un travail de classification d'une qualité quasi équivalente à celui d'un être humain5(*).
La place que prendront ces outils dans la formulation des questions de recherche est un autre point qu'il conviendra d'évaluer.
S'agissant enfin des méthodes d'analyse des données, les chercheurs identifient une tendance vers l'hybridation des méthodes statistiques traditionnelles avec les méthodes computationnelles.
À cet égard, il est probable que les nouvelles générations de chercheurs soient conduites à coder davantage que leurs prédécesseurs et que les équipes de recherche intègrent un nombre croissant de développeurs informatiques.
* 2 Rapport Assemblée nationale n° 642 (17e législature) - Sénat n° 170 (2024-2025), déposé le 28 novembre 2024, ChatGPT, et après ? Bilan et perspectives de l'intelligence artificielle.
* 3 En physique, John Hopfield et Geoffrey Hinton ont utilisé des outils de la physique pour développer des méthodes qui sont à la base de l'apprentissage automatique actuel (les réseaux de neurones artificiels). En chimie, David Baker, Demis Hassabis et John Jumper ont, avec l'appui de l'IA, fait avancer la connaissance de la structure tridimensionnelle des protéines à partir de leur séquence d'acides aminés.
* 4 SocArXiv Papers | Machine Bias. How Do Generative Language Models Answer Opinion Polls?
* 5 https://journals.sagepub.com/doi/10.1177/20531680251335653