Table des matières

Entrepôts de données (catalogage des données non géo spatiales)

Un entrepôt de données est un outil de catalogage, de valorisation et de partage.

Il n'est pas destiné à héberger des bases de données vivantes (i.e. régulièrement interrogées et mises à jour), ni à stocker des données ou à les archiver. Le stockage des données vivantes peut se faire dans des bases de données.

Contrairement aux données géospatiales qui nécessitent des infrastructures de stockage adaptées, les données non-géospatiales, même si elles sont géolocalisées, ne nécessitent pas d’être lues par un système d’information géographique. L’IRD et le département INEE (CNRS)- Museum National d'Histoire Naturelle mettent à notre disposition des infrastructures de données qui assurent la double fonction de catalogue (bases de métadonnées) et d’entrepôt (stockage sécurisé), même si elles ne sont pas strictement liées. Ces trois infrastructures utilisent le même outils, Dataverse, mais chacun à ses propres règles. Nous vous conseillons en première intention, de déposer vos données sur ces entrepôts institutionnels en privilégiant celui de la tutelle du principal investigateur de l’étude concernée. D’autres entrepôts généralistes ou spécialisés, gratuits ou payants sont également à votre disposition. Ils sont recensés par Datacite Repository Finder ou Re3data.org.

Les entrepôts institutionnels

CNRS (INEE) : https://data.indores.fr/

Avant toute publication d'un jeu de données dans l'entrepôt InDoRES, il est impératif de compléter sa fiche de métadonnées dans cat.InDoRES en passant par le lien créer un nouveau jeu de données.

IRD : https://dataverse.ird.fr/

Université de Montpellier : https://entrepot.recherche.data.gouv.fr/dataverse/umontpellier

CNRS Research Data : https://entrepot.recherche.data.gouv.fr/dataverse/cnrs

Recherche Data Gouv : https://entrepot.recherche.data.gouv.fr/dataverse/root

Les entrepôts externes

Zenodo : https://zenodo.org/

Figshare : https://figshare.com/

Harvard dataverse : https://dataverse.harvard.edu/

Dryad : https://datadryad.org/stash

Entrepôts thématiques :

Entrepôts des éditeurs scientifiques :

En pratique

Un entrepôt de données est une infrastructure destinée au stockage de données numériques et métadonnées (descriptions) associées. Sa mission est d’assurer l’organisation, le signalement, l’accès, l'interopérabilité et le stockage des données, en vue de leur réutilisation. Il permet de sauvegarder des jeux de données et les partager mais ce n'est pas un outil d’archivage à long terme ni un outil collaboratif.

Critères de choix d'un entrepôt

Pour aller plus loin vous pouvez consulter le guide Comment bien choisir son entrepôt sur HAL

Déposer un jeu de données ISEM dans un entrepôt institutionnel

Documentation utilisateur disponible sur Comment déposer un jeu de données