Science ouverte :
des chercheurs de l’IEMN ouvrent leurs jeux de données
Publier les données brutes ou retraitées de ses recherches sur un entrepôt de données institutionnel présente de nombreux avantages : traçabilité des données, contribution à la communauté scientifique, conformité aux demandes institutionnelles, transparence vis-à-vis de la société. Plusieurs chercheurs de l’IEMN s’y sont lancés, notamment grâce à l’ouverture de la collection IEMN sur l’entrepôt national Recherche Data Gouv
Données : « ouvrir autant que possible, fermer autant que nécessaire »
CNRS : En 2020, le CNRS a déployé un plan « Données de la recherche » pour accompagner sa communauté dans le fait de rendre les données accessibles et réutilisables. Le directeur général délégué à la science, Alain Schuhl, explique dans un interview pourquoi il est important de rendre les données de la recherche ouvertes.
Interview à lire dans sa version intégrale ici: CNRS : un plan ambitieux pour des données accessibles et réutilisables
Alain Schuhl :
« La mise à disposition des données attachées à une publication scientifique est indispensable pour comprendre, reproduire et valider un résultat scientifique. Partager ces données permet aussi à d’autres équipes de les réutiliser sans avoir à les générer une nouvelle fois, ce qui permet un gain de temps et assure une meilleure utilisation des fonds de la recherche. Surtout, de nouvelles connaissances peuvent émerger du croisement de données issues de communautés très différentes, à condition qu’elles soient diffusées avec un haut niveau de qualité et de contextualisation. Il est donc important de rendre les données « FAIR » – faciles à trouver, accessibles, interopérables, réutilisables – dès la conception des projets de recherche. »
« C’est parfois un véritable changement de culture qui est nécessaire. Il faut donc faire évoluer les pratiques et les mentalités tout autant que développer des outils pour la gestion, le partage, la préservation à long terme et la diffusion des données de recherche. »
Université de Lille : Ouvrir la science à la société, et permettre à tous d’accéder librement aux publications et aux données de la recherche : c’est le projet de l’Université de Lille, pionnière en la matière, qui est détaillé dans sa feuille de route en 2021.
« Le projet LORD (Lille Open Research data) propose un dispositif complet d’assistance et d’accompagnement des équipes de recherche de la métropole lilloise sur l’ensemble des volets concernant la gestion des données. Il se décline en plusieurs actions destinées à couvrir les besoins des équipes de recherche : actions de sensibilisation et de formation, accompagnement individualisé des équipes sur toutes les étapes du cycle de vie des données, ainsi que sur les codes et logiciels. L’objectif est de soulager au maximum les équipes de recherche. »
« Les chercheurs peuvent retrouvez tous leurs interlocuteurs grâce au guichet unique. De plus, l’IEMN dispose de son propre correspondant données au sein de l’unité. Alliant connaissance de l’unité, enjeux disciplinaires et culture de la donnée, ce dernier joue un rôle central pour fournir un accompagnement adapté au contexte de l’unité. »
UPHF : En 2023, l’UPHF a mis en place un comité de pilotage de la donnée et un règlement sur la gestion des données de la recherche à l’UPHF a été acté. Il permet de fixer les lignes directrices pour la gestion et le partage des données au sein de l’établissement. Le règlement rappelle les bonnes pratiques que l’UPHF recommande pour l’ensemble du processus de recherche :
« A minima, que les données liées aux publications soient partagées avec la communauté scientifique dans un souci de transparence et de preuve en appui aux résultats présentés et dans le respect des principes de l’intégrité scientifique. »
Une production de recherche à part entière : l’IEMN sur l’entrepôt institutionnel ⇒ Recherche.Data.Gouv
Romain Peretti, Fabrizio Cleri ou plus récemment encore Stéphane Lenfant ont misé sur l’entrepôt institutionnel RDG pour ouvrir leurs jeux de données, profitant du lancement de la collection IEMN. Cette dernière peut être alimentée directement ou en miroir par les espaces de nos tutelles CNRS, Université de Lille et Université Polytechnique Hauts de France. L’entrepôt de données RDG, bien au-delà de répondre aux exigences des financeurs respectifs (Région Hauts de France, ANR, Europe,…) offre un cadre structurant et une réelle qualité des métadonnées et assure ainsi une visibilité accrue. Ces publications de jeux de données constituent une réelle production de recherche à part entière. Espérons que l’expérience de nos « early tester » permettra la diffusion rapide de ces bonnes pratiques au sein des groupes de recherche de l’unité. Car l’IEMN entend bien, dans le respect des exceptions légitimes encadrées par la loi qui peuvent se poser en contexte de zone à régime restrictif (ZRR), continuer sur cette voie d’une science plus ouverte, collaborative et durable.
-
PERETTI Romain; HANNOTTE Théo; DENAKPO Elsa; OSSEIRAN Noureddin, 2024, « Full acquisition of 100k & 50k terahertz time domain spectroscopy reference time traces », https://doi.org/10.57745/Y35DYN, Recherche Data Gouv, V1
⇒ Publication associée
Denakpo Elsa, Hannotte Théo, Osseiran Noureddin, Orieux François, Peretti Romain « Signal estimation and uncertainties extraction in TeraHertz Time Domain Spectroscopy », 2024 arXiv: 2410.08587
- LENFANT Stephane, 2025, « Data from article entitled « Electroisomerization Blinking of an Azobenzene Derivative Molecule », https://doi.org/10.57745/E2GOOP, Recherche Data Gouv, V1
⇒ Publication associée
S. Godey, H. Therssen, D. Guérin, T. Mélin, S. Lenfant « Electroisomerization Blinking of an Azobenzene Derivative Molecule Nanotechnology », 36, 105702 (2025) doi: 10.1088/1361-6528/ada2f3
- ARAVANAN Vinnarasi; RAOURAOUA Nessim; BRYSBAERT Guillaume; GIORDANO Stephano; LENSINK Marc F.; CLERI Fabrizio; BLOSSEY Ralf, 2024, « Molecular dynamics data for DNA base flipping », https://doi.org/10.57745/30ABBY, Recherche Data Gouv, V2
- SARAVANAN Vinnarasi; RAOURAOUA Nessim; BRYSBAERT Guillaume; GIORDANO Stephano; LENSINK Marc F.; CLERI Fabrizio; BLOSSEY Ralf, 2024, « Molecular dynamics data for UDG enzyme », https://doi.org/10.57745/C5UQ2X, Recherche Data Gouv, V1
- SARAVANAN Vinnarasi; RAOURAOUA Nessim; BRYSBAERT Guillaume; GIORDANO Stephano; LENSINK Marc F.; CLERI Fabrizio; BLOSSEY Ralf, 2024, « Molecular dynamics data for UDG-dsDNA », https://doi.org/10.57745/G2RQ3E, Recherche Data Gouv, V1