
Pour les adeptes du Gloom et du Doom, l’intelligence artificielle générative (IAGen) suscite et favorise la crétinisation de l’esprit et entraîne la baisse de valeur des recherches scientifiques.
On peut en discuter, mais il y a des points de vue plus nuancés, dont l’intéressante étude de D. Filimonovic/C.Rutzer/ C.Wunsch, Can GenAI Improve Academic Performance ? Evidence from the Social and Behavioral Sciences, arXiv :2510.02408vl [econ.GN], 2 octobre 2025 (https://arxiv.org/abs/2510.02408):
L’étude examine si l’adoption d’outils d’intelligence artificielle générative par les chercheurs en sciences sociales et du comportement a entraîné une hausse mesurable de leur productivité scientifique et de la qualité des publications.
L’introduction de ChatGPT fin 2022 constitue le point de rupture observé. Les auteurs comparent l’évolution des chercheurs dont les textes présentent des signes d’usage d’IA à celle de pairs comparables avant et après cette date. Ils concluent à une augmentation significative du nombre d’articles publiés chez les adoptants et à une légère amélioration du prestige moyen des revues ciblées. Les effets sont plus marqués pour les jeunes chercheurs, les disciplines techniques et les auteurs issus de pays non anglophones.
Le protocole repose sur un panel équilibré où chaque auteur-année indique le nombre d’articles publiés et le facteur d’impact moyen des revues, fixé à son niveau de 2019 pour neutraliser les effets de reclassement. Les variables de contrôle incluent le pays et l’institution d’affiliation, le champ disciplinaire, le sexe inféré et la durée de carrière. Trois grands ensembles disciplinaires sont retenus : économie et finance, sciences sociales et psychologie. Seuls les chercheurs actifs avant et après 2022 sont conservés pour permettre l’analyse des trajectoires pré- et post-adoption.
L’identification des utilisateurs d’IA repose sur des marqueurs lexicaux caractéristiques du style des textes générés par modèles de langage. Une liste d’environ soixante mots-clés est appliquée aux titres et résumés
Afin de limiter les biais de sélection, les auteurs construisent un groupe témoin comparable à partir d’un score de propension estimé selon la productivité antérieure, le facteur d’impact moyen, l’âge de carrière, le sexe, le champ disciplinaire et la proximité linguistique avec l’anglais.
L’année 2022 sert de période de référence. Les coefficients estimés montrent l’absence de différences significatives avant cette date, puis une hausse relative de la productivité de 15 % en 2023 et 36 % en 2024 pour les adoptants, accompagnée d’un gain de 1 à 2 % du facteur d’impact moyen. Ces résultats restent robustes lorsqu’on modifie la définition des adoptants ou le ratio d’appariement, ce qui suggère que les effets captent bien une dynamique liée à l’usage d’outils d’IA.
Les gains de productivité sont plus élevés dans les domaines considérés comme plus techniques – économie et psychologie – où l’usage d’outils numériques et statistiques est courant. Les chercheurs en début de carrière (moins de sept ans depuis la première publication) bénéficient davantage de l’IA, vraisemblablement parce qu’elle compense un déficit de ressources ou d’expérience rédactionnelle. Les auteurs issus de pays dont la langue est éloignée de l’anglais montrent aussi des gains plus importants, signe que l’IA atténue partiellement les obstacles linguistiques à la publication internationale. Les différences selon le sexe sont en revanche faibles.
L’étude s’inscrit dans la continuité de recherches sur l’effet des technologies numériques sur la production scientifique, mais innove par l’identification individuelle de l’adoption et le suivi temporel des trajectoires. Elle montre que l’IA générative a des effets différenciés : elle accroît la production sans dégrader la qualité apparente des publications, et tend à réduire certaines inégalités, notamment linguistiques. Les auteurs reconnaissent toutefois plusieurs limites. Leur indicateur, fondé sur le langage, ne saisit pas l’usage de l’IA pour la programmation, l’analyse de données ou la génération d’idées, et peut inclure des faux positifs. Les effets non observés, tels que des différences de motivation ou de ressources, peuvent subsister. Enfin, l’horizon temporel court ne permet pas de mesurer les effets d’équilibre à long terme, ni les ajustements des standards éditoriaux.
Les implications de politique scientifique sont discutées avec prudence. L’accès institutionnel équitable aux outils d’IA apparaît comme un levier pour réduire les asymétries de langue ou de moyens. Les auteurs recommandent d’accompagner cette diffusion de garanties de transparence : mention des usages d’IA dans les publications, traçabilité des contributions humaines et formation des comités d’éthique à l’évaluation de ces textes. L’étude invite ainsi à concevoir une régulation non prohibitive mais encadrante, conciliant efficacité, intégrité et équité d’accès.
En résumé, l’usage d’outils d’IA générative est associé, à court terme, à une hausse substantielle de la productivité et à une amélioration marginale de la qualité mesurée des publications. Ces effets semblent particulièrement bénéfiques pour les chercheurs les plus exposés aux contraintes linguistiques ou de ressources. L’étude conclut sur la nécessité d’un encadrement institutionnel de l’usage de l’IA, fondé sur la transparence, l’accès équitable et la responsabilité, afin que les gains d’efficacité scientifique ne se fassent pas au détriment de l’intégrité académique.
Me Philippe Ehrenström, avocat, LLM, CAS en Droit et Intelligence Artificielle