Aller au contenu principal

Dépôts de données de recherche

Explorez les dépôts de données de recherche parmi ceux disponibles à l’Université Laval, dont Scholars Portal Dataverse, ou offerts sur le marché.

Qu’est-ce qu’un dépôt de données?

Un dépôt de données est un espace de stockage organisé qui permet la description des données par le biais de champs de métadonnées. Ainsi décrites, les données deviennent repérables par les personneshumains et les machines, ce qui favorise leur découverte et leur réutilisation. La plupart du temps, les dépôts de données sont utilisés pour loger des données finales ainsi que la documentation nécessaire à leur compréhension. Les données dans un dépôt ne sont pas nécessairement en accès ouvert.

Données actives et données finales

Les données actives sont des données qui sont en cours d’utilisation dans le cadre d’un projet de recherche. Au moment où les données sont mises dans un dépôt et qu’on leur attribue un identifiant unique (ex.: DOI), elles sont considérées comme finales, car leur modification doit entraîner la création d’une nouvelle version des données, ce qui n’est pas toujours possible dans les dépôts.

Les outils PULSAR et VALERIA, propres à l’Université Laval permettent d’héberger des données actives et finales.

Pourquoi diffuser ses données dans un dépôt? 

  • Pour vous conformer aux exigences des organismes subventionnaires ou à celles de certaines revues dans lesquelles vous publiez.
  • Pour conserver vos données de manière sûre.
  • Pour augmenter la visibilité et l’impact de la recherche effectuée avec ces données.
  • Pour partager vos données après l’achèvement de votre projet, ce qui permettra entre autres de les croiser avec d’autres données et de faire progresser votre domaine de recherche.   

Le dépôt des données permet aux chercheurs et aux chercheuses de choisir dans quelle mesure les données peuvent être accessibles aux autres, et sous quelles modalités. Le fait de rendre les données accessibles aux autres favorise la réutilisation, la validation, la reproduction et les liens vers d’autres données et résultats de recherche. 

Quelles données devraient être préservées? 

Il n’est pas nécessaire de préserver toutes les données recueillies et créées pendant la durée d’un projet de recherche. Les données à préserver devraient: 

  • être réutilisables
  • être compréhensibles et inclure des informations sur leur provenance
  • avoir une certaine valeur (si elles sont complexes, coûteuses à obtenir ou qu’il est impossible de les récolter à nouveau)
  • être de qualité. 

Les données de recherche qui ne sont pas considérées comme des données importantes peuvent être détruites à la fin du projet de recherche. Les données non-importantes peuvent inclure les notes préliminaires à un projet de recherche, les premières versions de différents documents ou du matériel dont le coût d’entreposage est élevé, mais qu’il est facile de recueillir une nouvelle fois. Les données de recherche qui ne mèneront pas à une publication et qui ont servi pour l’enseignement au 1er cycle et aux cycles supérieurs en vue d’un travail académique font partie de cette catégorie et n’ont pas besoin d’être conservées après l’obtention du diplôme. 

Comment choisir un dépôt? 

Choisir son dépôt de données au début du projet de recherche permet de mieux adapter le traitement des données aux exigences du dépôt, mais ce choix peut également être fait à la toute fin de la recherche. Plusieurs contraintes peuvent orienter votre choix, par exemple: 

  • les exigences de l’organisme subventionnaire
  • les exigences de l’éditeur du périodique dans lequel est publié un article tiré des données 
  • les exigences de votre institution et de vos partenaires.

Si vous n’avez aucune contrainte, les questions suivantes peuvent vous aider à choisir un dépôt: 

  • Existe-t-il un dépôt majeur dans votre discipline?
  • Est-ce que le dépôt peut accepter vos données (format, taille, etc.)?
  • Quels sont les termes et les conditions du dépôt (propriété, partage, diffusion, etc.)?
  • Est-ce que le dépôt propose de conserver à long terme les données?
  • Est-ce que le dépôt a obtenu une certification reconnue (ex.: certification CoreTrustSeal)?
  • Est-ce que le dépôt fait un suivi de l’utilisation des données?
  • Y a-t-il des coûts associés à ce dépôt?

Types de dépôts de données

Plusieurs options s’offrent à vous pour déposer vos données de recherche. Voici les différentes options de dépôts qui s’offrent à vous.

Borealis, le dépôt Dataverse canadien

L’Université Laval met à la disposition des chercheurs un dépôt de données Borealis, de l’organisation Scholars Portal, et offre un soutien complet à ses utilisateurs.

Principales caractéristiques:

  • Dépôt institutionnel de l’Université Laval
  • 3 Go et moins par fichier
  • Données sur des serveurs canadiens sécurisés
  • Données repérables (ex.: Google)
  • Émet des DOI
  • Accepte tous les types de données
  • Contrôle précis de l’accès

Pour plus d'information, vous pouvez consulter:

Dépôts disciplinaires

Différents dépôts, propres à des domaines particuliers, sont également disponibles.

Principales caractéristiques:

  • Propres à un domaine précis
  • Destinés à la recherche spécialisée ou qui produit des ensembles de données exceptionnellement volumineux
  • Pourraient n’accepter que certains types de données
  • Admissibilité, tarification, entreposage et fonctionnalités variables
  • Les données peuvent êtres entreposées à l’extérieur du Canada
  • Certains dépôts ne sont pas moissonnés
  • Support limité

Consulter les sites Web ci-dessous trouver un dépôt propre à votre discipline:

Registry of Research data repository
Data repositories
NIH Data Sharing Repositories

Dépôt fédéré de données de recherche (DFDR)

L'Alliance de recherche numérique du Canada offre une plateforme fédérée pour la recherche et la gestion des données de recherche numériques et la découverte.

  • Ouvert aux membres de la communauté de recherche associés à un établissement canadien
  • Prend en charge des fichiers de 2,5 Go et plus
  • Données entreposées sur des serveurs canadiens
  • Données repérables (ex.: Google)
  • Émet des DOI
  • À utiliser si vous avez de grandes quantités de données

Consulter le DFDR