Gestion des données de recherche

Formats des fichiers

Afin d’éviter la perte de données due à l’incompatibilité ou la désuétude du matériel et des logiciels, il est recommandé de sauvegarder les fichiers dans des formats ouverts, normalisés, non compressés, non cryptés et non propriétaires.

UK Data Service Recommended Formats

Sauvegarde et sécurité

Noms des fichiers et gestion des versions

Nom des fichiers:

Recommandations pour le nommage de vos fichiers électroniques

Contrôle des versions:

Le contrôle de version permet de suivre les révisions d'un ensemble de données ou d'un processus. Il est essentiel si la recherche implique plus d'une personne. Il y a plusieurs avantages à conserver une trace des différentes versions de fichiers, la plus importante étant la possibilité de restaurer les données à partir d'une version antérieure plutôt que d'avoir à tout recommencer. Le contrôle des versions permet aussi de s'assurer qu'on ne travaille pas avec une version périmée d'un fichier. 

Chaque version doit être bien nommée selon les conventions recommandées et chaque changement, aussi petit soit-il, doit aussi être inscrit dans les fichiers journaux. Dans certains cas, des outils de partage de fichiers et des logiciels de contrôle de version peuvent être utiles (ex.: Git, Subversion).

Un indicateur de contrôle de version peut être inscrit dans le nom du fichier (ex.: v01, v02, v1.4), la convention standard consistant à utiliser des nombres entiers pour les révisions majeures et des nombres décimaux pour les mineures.

Voir plus

Métadonnées

Les métadonnées servent à décrire les diverses caractéristiques d’un  jeu de données. Il existe des normes de métadonnées qui fournissent un cadre préétabli pour décrire des données . L'utilisation de ces normes est l’un des éléments qui permettent de rendre les données détectables, citables et prêtes à l'emploi par d'autres chercheurs.

Quelques normes de métadonnées :

Générales : Dublin Core / MODS (Metadata Object Description Schema)
Arts:
VRA (Visual Ressource Association Core)
Données géospatiales: ISO 19115
Éducation :
LOM (Learning Object Metadata)
Sciences : Darwin Core / ITIS (Integrated Taxonomic Information System)  /  EML (Ecology Metadata Language)
Sciences humaines: TEI (Text Encoding Initiative)
Sciences sociales :
DDI (Data Documentation Initiative)

Le Digital Curation Centre  maintient un inventaire des normes de métadonnées par discipline.

Le site FairSharing.org fournit de l'information sur les normes de metadonnées en relation avec les bases de données et les politiques liées aux données.

Exemple de métadonnées :

  • Titre (nom du projet ou du jeu de données)
  • Créateur, collecteur
  • Date de création ou modification
  • Description (méthodologie, instrumentation, échantillonage, validation, etc.)
  • Format
  • Mots-clés
  • Identifiant unique (idéalement, un identificateur d'objet numérique ou DOI)
  • Couverture (spatiale ou temporelle)
  • Langue
  • Organisation de publication
  • Type de ressource
  • Droits / Licence / Approbation éthique
  • Financement / Agence de financement
  • Dépôt (endroit où les données sont archivées)