Infos et consignes - COVID-19

Bibliothèque

Gestion des données de la recherche

Introduction


Définition de données de recherche

Les données de recherche sont des informations issues des différentes méthodes utilisées au cours d'un processus de recherche scientifique.

«Ces données comprennent des ensembles quantitatifs de données sociales, politiques et économiques, des renseignements qualitatifs sous forme numérique, des données de recherche expérimentale, des bases de données d'images et de sons fixes et mobiles, ainsi que d'autres objets numériques utilisés à des fins d'examen analytique» (tiré du site Web du CRSH).

 

Définition de gestion des données de recherche

Données de recherche Canada définit la gestion des données de recherche par «stockage, consultation et préservation des données issues d'un travail de recherche quelconque. La gestion des données touche le cycle complet des données, de la planification des recherches à leur exécution et de l'enregistrement des données au moment de leur création et de leur exploitation jusqu'à la préservation à long terme des résultats, une fois les recherches achevées» (tiré du glossaire de Données de recherche Canada).

«La gestion des données de recherche comprend également le partage des données, s'il y a lieu» (tiré du site Web du CRSH).

Les activités associées à la gestion des données de la recherche telles qu'identifiées par Données de recherche Canada sont essentiellement les suivantes :

  • Désignation des fichiers (manière adéquate de nommer les fichiers de données);
  • Contrôle et assurance de la qualité des données;
  • Accès aux données;
  • Documentation (y compris degré d'incertitude);
  • Stockage des données;
  • Archivage et préservation des données;
  • Partage et réutilisation des données;
  • Intégrité des données;
  • Protection des données;
  • Protection des renseignements personnels;
  • Droits associés aux données;
  • Protocoles expérimentaux (en laboratoire ou sur le terrain).

(tiré du glossaire de Données de recherche Canada - concept Gestion des données de recherche)

 

Exigences des organismes subventionnaires

Le Conseil de recherches en sciences humaines du Canada (CRSH), le Conseil de recherches en sciences naturelles et en génie du Canada (CRSNG) et l'Institut de recherche en santé du Canada (IRSC) ont adopté en 2016 une déclaration de principes sur la gestion des données numériques en plus de présenter une ébauche de la politique sur la gestion des données de la recherche.

Déclaration de principes des trois organismes sur la gestion des données de la recherche

«L'objectif de la présente déclaration de principes est de promouvoir l'excellence dans les pratiques de gestion et d'intendance des données numériques de travaux de recherche financés par les organismes. La déclaration de principes s'appuie sur les politiques existantes des organismes et aide les chercheurs, les communautés de chercheurs et les établissements de recherche à répondre aux exigences actuelles et futures des organismes en matière de gestion des données de recherche» (tiré de la Déclaration de principes des trois organismes sur la gestion des données numériques).

Politique des trois organismes sur la gestion des données de la recherche

L'ébauche de la politique a été soumise pour consultation en 2018. La version finale est attendue pour 2021.

«La politique vise les détenteurs de subvention et les établissements qui administrent les fonds des trois organismes subventionnaires. Elle ne s'applique pas aux boursiers ou aux titulaires de chaire».

  • Pour les chercheurs

«Toutes les demandes de subvention soumises aux organismes devraient inclure des méthodologies qui tiennent compte des meilleures pratiques en matière de gestion des données de recherche. Les organismes incitent les demandeurs à dresser des plans de gestion des données de recherche comme étape essentielle de la conception de projets de recherche».

  • Pour les établissements

«Chaque établissement qui administre des fonds des trois organismes doit créer une stratégie institutionnelle de gestion des données de recherche. Cette stratégie décrira la façon dont l'établissement fournira à ses chercheurs un environnement qui permet et appuie des pratiques de calibre mondial pour la gestion des données de recherche».

«Les établissements sont encouragés à consulter les ressources qui existent pour appuyer l'élaboration de leurs stratégies, comme le modèle de stratégie institutionnelle du réseau Portage».

 

Documentation à consulter

Introduction à la gestion de données de recherche : document synthèse (Réseau Portage / ACRL - Incluant le cycle de vie des données de recherche)

De bonnes pratiques en gestion de données de recherche : guide sommaire (Réseau Portage / ACRL)

Cadre de référence des trois organismes sur la conduite responsable de la recherche (Secrétariat sur la conduite responsable de la recherche Canada, 2016)

Le «cadre de référence décrit les responsabilités et les politiques connexes qui s'appliquent aux chercheurs, aux établissements et aux organismes et qui, ensemble, contribuent à la mise en place d'un environnement de recherche favorable. Il précise les responsabilités des chercheurs à l'égard de l'intégrité de la recherche, de la demande de fonds, de la gestion financière et des exigences concernant certains types de recherche et définit ce qu'est une violation des politiques des organismes» (p. 1) .

Modèle de stratégie institutionnelle de gestion des données de recherche version 2.0 (Réseau Portage / ACRL)

Guide d'accompagnement pour l'élaboration du modèle de stratégie institutionnelle version 2.0 (Réseau Portage / ACRL)

Éditeurs de revues et organismes subventionnaires (guide élaboré par Polytechnique Montréal)

Guidon, A. (2013). La gestion des données de recherche en bibliothèque universitaire. Documentation et bibliothèques, 59 (4), 189-200.

Plan de gestion de données (PGD)


Définition

Les plans de gestion de données (PGD) servent à organiser les données en prévision de leur utilisation dans le cadre d'un projet de recherche. Ils permettent également de faciliter la réutilisation des données une fois le projet de recherche terminé.

Un PGD inclut entre autres, une description des données et des métadonnées obtenues lors de la recherche. Il comprend aussi des informations sur les fichiers, le stockage et le mode de partage des données.
 

L'Assistant PGD du Réseau Portage - modèles de plan de gestion de données

Il existe différents modèles de plan de gestion de données (PGD). Le Réseau Portage propose aux chercheurs canadiens l'outil Assistant PGD. Sous forme de questions, cet outil permet de créer par étape, un plan de gestion de données de recherche, en français ou en anglais. Il est nécessaire de créer un compte sur Assistant PGD pour sélectionner un modèle.

Le Réseau Portage fournit plusieurs modèles de plan de gestion de données.

Voici quelques exemples de modèles :

Sciences Humaines Numériques

Levy, Michelle. (2020, October 2). Plan de gestion des données modèle #1: Sciences Humaines Numériques. Zenodo. http://doi.org/10.5281/zenodo.4064171 (PDF)

Sciences humaines numériques et données secondaires

Gray, Vincent, & Cooper, Alexandra. (2020, September 8). Plan de gestion des données modèle #2: Sciences humaines numériques et données secondaires. Zenodo. http://doi.org/10.5281/zenodo.4019314 (PDF)

Méthodes mixtes

Doiron, James. (2020, September 8). Plan de gestion des données modèle #3: Modèle fictif sur « Méthodes mixtes ». Zenodo. http://doi.org/10.5281/zenodo.4019569 (PDF)

Sciences naturelles

Persaud, Bhaleka, Van Cappellen, Philippe, Reza Nezhad, Fereidoun, Neilson, Maggie, & Szigeti, Kathy. (2020, October 21). Plan de gestion des données du groupe de recherche en écohydrologie (Modèle). Zenodo. http://doi.org/10.5281/zenodo.4116598

Sciences sociales

Leviten-Reid, Catherine. (2020, October 21). Plan de gestion de données pour Personnes, places, politiques et perspectives (Modèle). Zenodo. http://doi.org/10.5281/zenodo.4116582

Un plan de gestion de données de recherche inclut habituellement les informations suivantes:

La collecte de données
Les données recueillies et les formats de fichiers des données. Il est utile de prévoir une procédure de dénomination des fichiers et des différentes versions.

Documentation et métadonnées
Le chercheur doit fournir une documentation adéquate qui décrit les données et qui permet leur interprétation, à long terme.

Stockage et sauvegarde
Prévoir les besoins de stockage pour la durée du projet de même que les besoins de sauvegarde des données afin d'en faciliter l'accès par les membres de l'équipe de recherche.

Conservation
Prévoir la conservation à long terme des données et des fichiers.

Partage et réutilisation
Planifier quelles données seront partagées, sous quelle forme de même que la licence d'utilisation.

Responsabilités et ressources
Établir les responsabilités concernant la gestion des données du projet de recherche de même que les ressources qui seront nécessaires.

Conformité aux lois et à l'éthique
Identifier les conditions légales, éthiques ou intellectuelles de gestion des données, notamment les données sensibles.

Organisation des données et stockage


Cette section offre des informations et des pratiques utiles sur la gestion des fichiers et le stockage des données : métadonnées, noms et formats de fichiers, versionnage, etc.

Métadonnées

Définition

«Donnée qui renseigne sur la nature de certaines autres données et qui permet ainsi leur utilisation pertinente».

Les métadonnées «permettent de connaître l'origine et la nature des données stockées dans [un dépôt de données], de comprendre comment elles sont structurées, de savoir comment y avoir accès et comment les interpréter, de connaître les différents modèles de données en présence et les règles de gestion de ces données».

Référence : Grand dictionnaire terminologique (2002)

Exemple de métadonnées

Métadonnées de la référence bibliographique :

  • Titre du projet;
  • Auteur/Collaborateur;
  • Sujet (discipline);
  • Mots-clés;
  • Langue;
  • Date;
  • Méthodologie de recherche;
  • Formats des fichiers;
  • Etc.

Gestion des fichiers : noms, versions, formats, conservation, sauvegarde

1. Noms des fichiers

1.1. Ordre des éléments du nom du fichier

Il est recommandé de placer le sujet principal du document au début du nom du fichier, puis d'ajouter un ou quelques noms communs significatifs afin de qualifier le fichier, notamment lorsqu'il est nécessaire de préciser le type de document dans le nom du fichier (ex.: procès-verbal, entente, statistiques, etc.).

Référence : Université du Québec en Outaouais (UQO). Secrétariat général. Archives et gestion documentaire. (2013). Directive relative à la dénomination des documents électroniques.

1.2. Longueur du nom du fichier

Afin d'assurer l'interopérabilité d'un fichier dans les différents environnements où il est susceptible d'être exploité, il est recommandé de limiter la longueur de son nom. Un maximum de 50 caractères est recommandé.

1.3. Majuscules et minuscules

L'utilisation des minuscules facilite la lisibilité du nom d'un fichier et son repérage dans un ensemble de fichiers.

1.4. Caractères spéciaux

Dans le nom d'un fichier, les caractères spéciaux ou les caractères réservés propres à un environnement sont à proscrire : ex.: Windows (%, $, !, *, /, &, ?). L'utilisation des signes diacritiques (accents et ponctuation) est aussi à proscrire.

1.5. Caractères de remplacement d'un espace ou d'un séparateur

Afin d'éviter les difficultés d'interprétation du nom d'un fichier par les systèmes d'exploitation, le point (.) n'est jamais utilisé pour remplacer un espace ou pour séparer les éléments du nom d'un fichier. Le point sert à identifier l'extension du fichier (ex.: .pdf).
Le tiret bas (_) est privilégié pour séparer les éléments du nom d'un fichier. (ex.: conseil_pedagogique_pv_2007-06-01.doc)

Référence : Université du Québec en Outaouais (UQO). Secrétariat général. Archives et gestion documentaire. (2013). Directive relative à la dénomination des documents électroniques.

Documentation à consulter :

2. Versions (versionnage des fichiers)

Le versionnage est la conservation de toutes les versions successives d'une entité logicielle. Il est conseillé de ne pas travailler sur la version antérieure d'un fichier, notamment dans le cadre d'activité en collaboration. Pour les ébauches, privilégiez l'ajout d'une numérotation séquentielle (ex.: 01 ; 02 ; etc.) jusqu'à la version finale. Dans le cas d'une révision de la version finale, celle-ci pourrait être numérotée à son tour (ex.: 1.0) et ses versions subséquentes (1.1. ; 1.2.).

Le terme «version» ou l'abréviation «v» est ajouté dans le nom du fichier suivi du tire bas (_) et du numéro de la version.

Un nouveau document créé à partir d'une version finale doit être sauvegardé sous un nouveau nom de manière à ne pas écraser la version précédente (ex.: micrographie_projets_2008_v_finale.doc).

Référence : Université du Québec en Outaouais (UQO). Secrétariat général. Archives et gestion documentaire. (2013). Directive relative à la  dénomination des documents électroniques.

3. Formats de fichiers - conservation - pérennité

Il est recommandé de :

  • privilégier un format de conservation moins dépendant des applications de bureautique afin de faciliter l'interopérabilité, l'Intelligibilité, la lisibilité et l'accessibilité à long terme des fichiers. Par exemple, un document Word pourra être sauvegardé sous un format .rtf;
  • privilégier les formats «ouverts» plutôt que les formats «propriétaires» afin de faciliter l'interopérabilité, l'intelligibilité, la lisibilité et l'accessibilité à long terme des fichiers. Le format html est un exemple de format ouvert;
  • sauvegarder un document final en format .pdf-a, .pdf, ou .tiff afin de favoriser la préservation de l'authenticité et de l'intégrité du document.

Référence : Université du Québec en Outaouais (UQO). Secrétariat général. Archives et gestion documentaire. (2013). Directive relative à la dénomination des documents électroniques.

Documentation à consulter :

Exemples de formats de fichiers proposés sur le site de la bibliothèque de l'Université d'Ottawa - Gestion de données de recherche - Désignation des fichiers et disposition des données.

4. Sauvegarde

Le Service des archives et de la gestion documentaire du Secrétariat général de l'UQO a élaboré une Directive relative à la prise de copie de sauvegarde qui décrit les procédure à suivre pour le sauvegarde ou le stockage de documents.

Données sensibles


«Le devoir éthique de confidentialité réfère à l'obligation qu'ont les personnes ou les organisations de protéger l'information qui leur est confiée. Ce devoir comporte l'obligation de protéger l'information contre l'accès, l'utilisation, la divulgation et la modification non autorisés, d'une part, et contre la perte et le vol, d'autre part».

Référence : chapitre 5 - Énoncé de politique des trois conseils, Éthique de la recherche avec des être humains (2018)

La confidentialité des données des participants doit être préservée à toutes les étapes du cycle de recherche : collecte, utilisation et analyse des données, diffusion des résultats, conservation, sauvegarde, destruction des données.

Protection de l'information - protection des données

Des mesures de protection matérielles, administratives ou techniques doivent être prises pour assurer la confidentialité des données:

  • accès sécurisés aux données, aux documents, aux ordinateurs;
  • utilisation de mots de passe;
  • antivirus;
  • pare-feu, etc.
  • S'assurer que les participants ne peuvent être identififés : anonymiser, coder, dépersonnaliser les renseignements.

Conservation des données

Les périodes de conservation des données peuvent variées selon la discipline. Le Comité d'éthique et de recherche (CÉR) de l'UQO suggère de «prévoir une période de conservation minimale de 5 ans» pour les données nominalisées. Quant aux données dénominalisées, le CÉR propose de «prévoir une période maximale de 25 ans».

Référence : Politique d'éthique de la recherche avec des êtres humains de l'UQO

Destruction des données

Une fois les délais de conservation expirés, les données doivent être détruites au moyen de pratiques sécuritaires : destruction des données en formats papier (déchiquetage) ou électroniques (mécanismes d'effacement (logiciels de suppression de fichiers), destruction matérielle de dvd, etc.).
 

Boîte à outils pour les données sensibles — destiné aux chercheurs

Le réseau Portage a conçu une boîte à outils pour la gestion des données sensibles qui comprend un glossaire, une matrice de risque et un document sur l’utilisation du langage de la gestion de données de recherche pour un consentement éclairé.

Glossaire terminologique

Groupe d'experts sur les données sensibles. (2020, October 14). Boîte à outils pour les données sensibles — destiné aux chercheurs Partie 1: Glossaire terminologique sur l'utilisation des données sensibles à des fins de recherche. Zenodo. http://doi.org/10.5281/zenodo.4088986

Matrice de risque

Groupe d'experts sur les données sensibles. (2020, October 19). Boîte à outils pour les données sensibles — destiné aux chercheurs Partie 2: Matrice de risque lié aux données de recherche avec des êtres humains. Zenodo. http://doi.org/10.5281/zenodo.4107119

Langage de la gestion de données de recherche et consentement éclairé

Groupe d'experts sur les données sensibles. (2020, October 19). Boîte à outils pour les données sensibles — destiné aux chercheurs Partie 3 : Langage en matière de gestion de données de recherche pour le consentement éclairé. Zenodo. http://doi.org/10.5281/zenodo.4107186

 

Documentation à consulter

Énoncé de politique des trois conseils, Éthique de la recherche avec des être humains

Politique d'éthique de la recherche avec des êtres humains de l'UQO

Politique concernant l'accès et la protection des renseignements personnels de l'UQO

Modèle de formulaire de consentement de l'UQO

Différents formulaires de consentement pour le partage des données de l'UKDataService

Partager (où déposer)


Certains facteurs sont à considérer dans le partage des données de la recherche :

  • Planifier le consentement pour le partage et la réutilisation des données
  • Déterminer quelles données seront partagées et de quelle nature seront ces données
  • Attribuer une licence d'utilisation des données (ex., Licence Creative Commons)
  • Vérifier les aspects éthiques ou juridiques auprès de l'institution ou du Comité d'éthique
  • Établir la durée de partage des données

 

Où déposer?

Dataverse

Autres dépôts de données de recherche :

Dépôt fédéré des données de recherche (DFDR) : données canadiennes

Open Access Depository

re3data.org (Registry of Research Data Repository)

 

Documentation à consulter

Tableau des critères et caractéristiques à considérer lors du choix d’un dépôt de données (Université de Sherbrooke)

Comment citer des données de recherche dans le style de l'APA (APA)