La mise à disposition des données et des outils pour les explorer à la communauté scientifique fait partie des bonnes pratiques que le chercheur doit garantir dès le début de tout projet de recherche ou recueil de données et actualiser au cours des différentes étapes jusqu’à la diffusion elle-même. Cette pratique est vivement encouragée par les instances évaluatrices des projets qui éditent un guide que nous vous invitons à consulter au fur et à mesure de ses actualisations, par exemple avec le guide PGD sur le site de l’ANR (https://anr.fr) ou Horizon Europe (https://www.horizon-europe.gouv.fr/) dans le cadre des projets européens.
Cette notion est corrélée aux principes FAIR (Findable Accessible Interoperable Reusable) qui régissent les bonnes pratiques en matière de données, une donnée scientifique n’étant pas considérée comme valide que si elle peut être vérifiée par les pairs et réutilisée pour poursuivre les recherches à partir des travaux antérieurs. La science ouverte cherche en effet aussi bien à rendre accessible les publications scientifiques que les données de recherche pour garantir la continuité des travaux.
L’objectif du plan de gestion des données est de consigner, dès la conception du projet, l’ensemble des données qui seront recueillies, leurs caractéristiques, leurs conditions d’utilisation et leur diffusion pendant et après le projet.
Place du PGD et de l’Open Science dans le projet
Nous attirons votre attention sur le fait que vous ne pouvez pas attendre l’étape de diffusion pour vous en charger, vous seriez alors confronté à des descripteurs (ou métadonnées) absents qui rendraient vos données difficiles à comprendre, et donc à réutiliser, par des chercheurs d’un autre domaine ou bien à des autorisations des locuteurs.trices qui seraient insuffisantes pour donner l’accès aux enregistrements à des membres externes au projet.
PGD et données générales
Dans une première étape, il faut identifier la nature des données, leur condition d’obtention, leur format, leur volume, les métadonnées associées, les données réutilisables, le(s) logiciel(s) requis, puis suggérer des réutilisations possibles, en particulier si c’est déjà le cas.
PGD et Aspects juridiques
A travers des questions ciblées, le Plan de Gestion des Données permet de répondre précisément aux questions juridiques liées aux données collectées, pour guider les chercheurs dans leurs éventuelles restrictions d’accès, sans étiqueter systématiquement l’ensemble des données comme sensibles. Des licences d’utilisation connues sur le plan international et faisant l’objet de description complète seront proposées.
Un autre élément de réponse concerne le consortium qui régit un projet et la responsabilité de chacun de ces acteurs.
PGD : quelques questions pour l’élaborer
- Y a-t-il une obligation de partage (ou à l’inverse une interdiction ou une restriction) ?
- Quelles données seront partagées à l’issue du projet ? Si toutes les données ne sont pas disponibles de la même façon, ou en même temps, le préciser.
- Quelles sont les réutilisations potentielles de ces données ?
- La lecture des données nécessite-t-elle le recours à un logiciel ou un outil spécifique ? Si oui, lequel et comment y accéder ?
- Comment les données seront-elles partagées ? Comment les données sont-elles rendues accessibles ? (voir la section Les infrastructures numériques de mutualisation de corpus).
- Avec qui les données seront-elles partagées ? Sous quelle licence ? Quelles seront les procédures d’accès : ouverture à tous ou à un groupe spécifique, type de contrôle ? (Voir : Choisir une licence)
- A partir de quand, et pendant combien de temps, les données seront-elles partagées ?
Ressources disponibles
Certains modèles de Plans de gestion des données sont disponibles sur Internet pour permettre aux autres chercheurs de les adapter à leurs besoins propres, ainsi que des logiciels pour faciliter le “déroulement” des différentes étapes. Actuellement, on peut citer :
- la présentation “Guidelines on FAIR data management in Horizon 2020” ;
- la présentation de la science ouverte et du PGD sur le site de l’ANR ;
- le site DMP OPIDOR (DMP Data management Plan est la version anglaise du PGD) propose des modèles de PGD pour des jeux de données de différentes natures et héberge, entre autres, le modèle de PGD de l’ANR ;
- les webinaires de l’ANR, des institutions ou l’OPIDOR Tour qui circule dans les différentes villes universitaires en France
PGD de structure
En parallèle des Plans de Gestion des Données pour les projets, d’autres types de Plans de Gestion des Données (pour les données elles-mêmes, pour les structures, etc.) sont en train d’émerger … À Suivre