publier

Partager ses données

15 février 2023

Le mouvement d’ouverture de la science ne se limite pas aux publications. La bonne gestion et le partage des données apparaissent aujourd’hui comme l’une des clés du progrès de la recherche scientifique.

Ouverture des données, validation et visibilité de la science

On peut définir les données de recherche comme les éléments factuels (textes, données chiffrées, mais aussi images, sons, etc.) produits, observés ou collectés par le chercheur et utilisés comme sources principales pour la recherche.

Ces données sont essentielles pour permettre de corroborer ou de réfuter les théories scientifiques : il importe donc de favoriser leur accessibilité afin de garantir l’intégrité des résultats publiés et de permettre une relecture ouverte de la science. La diffusion des données rend possible leur réutilisation en vue de nouveaux résultats et de nouvelles directions de recherche. Elle contribue également à accroître la visibilité des travaux. 

Le mouvement d’ouverture des données de la recherche s’inscrit aujourd’hui dans le cadre européen de l’open data construit par la directive PSI (Public Sector Information) sur la communication des documents publics et dans celui de la Loi pour une République numérique (2016), dont l’article 30 prévoit, dans la mesure du possible, la mise à disposition et la réutilisation des données issues de projets financés au moins par moitié par des fonds publics 

Les solutions de diffusion et de partage existantes

Il existe différentes manières de diffuser des données à l’issue d’un projet :

  • Certains éditeurs proposent de joindre les données à la publication comme “supplementary materials” : cette pratique n’est pas recommandée car les données intègrent un environnement captif et perdent en visibilité.
  • Il est préférable de déposer les données dans un entrepôt qui offrira des garanties de documentation, de sécurité et de pérennité.
  • Il est également possible de rédiger un “data paper” auquel seront jointes les données. Il s’agit d’une forme de publication revue par les pairs exclusivement consacrée à la description des données utilisées.

Le partage des données doit s'anticiper, comme le rappelle le Guide Partager les données liées aux publications scientifiques du Comité pour la Science ouverte. Quelle que soit la solution envisagée, il importe d’assurer en amont la documentation et la curation des différentes étapes de travail sur les données, par exemple en rédigeant un Plan de gestion de données.

Les entrepôts de données

Les entrepôts de données sont une solution de stockage et de diffusion des données produites dans le cadre d’une recherche. Ils offrent des services adaptés (description des données, choix des accès, licences, identifiants) et peuvent bénéficier d’une certification qui garantit leur qualité. 

Outre les entrepôts généralistes tels Zenodo, HAL ou encore Figshare, il existe des entrepôts spécialisés dans certains domaines, comme GBIF pour des données relatives à la biodiversité). En France, NAKALA, plateforme maintenue par l’infrastructure Huma-Num, permet le dépôt, la documentation et la diffusion des données de la recherche en SHS.

En juillet 2022 a été ouvert l'entrepôt Recherche data Gouv, qui propose une solution française de stockage et de diffusion de données provenant de toutes disciplines.

Pour découvrir d’autres plateformes, le répertoire re3data brosse un large panorama des entrepôts de données existants dans le monde, classés au choix par pays, par discipline ou par format de données.

Pour plus de précisions, on consultera la plateforme DoRANum et le guide de bonnes pratiques sur la gestion des données de recherche, de l'Atelier Données - MITI du CNRS.