Nommage de fichiers et gestion de versions

Guide complet sur la façon de mieux nommer et organiser vos données

Les bonnes pratiques pour le nommage des fichiers numériques

RDM file naming
Image: Laure Perrier, University of Toronto
  • Évitez d’inclure des espaces, des points et des caractères spéciaux (par exemple &,? ou!)
  • Incluez le trait d’union (—), le symbole de soulignement (_) ou la majuscule (C) pour séparer les éléments d’un nom de fichier
  • Employez une abréviation dans le nom de fichier pour identifier:
    • L’instrument utilisé, la phase (s’il y en a plusieurs) et la phase de transformation (p. ex. originale, brute, comprimée, numérisée, recodée, restructurée et nettoyée)
    • La source des données provenant de tiers (fournisseur de données ou chercheur principal) (p. ex. YinGiordanoAntarcticImagesSTCCensus2016)
    • L’équipe (si vous travaillez avec plusieurs équipes)
    • La langue (si vous travaillez avec plusieurs langues)
  • Insérez les détails relatifs à la version du document dans le nom de vos fichiers, s’il y a lieu

Quelques exemples de noms bien choisis

  • MCIM_Proposal_0.9.doc
  • PressHouseUserManual-01.02.doc

Les bonnes pratiques pour la structuration des dossiers

Folder organization
Image: Laure Perrier, University of Toronto
  • Limitez l’étendue des dossiers à trois ou à quatre niveaux
  • Envisagez de limiter à dix le nombre de dossiers contenus dans chacun de vos dossiers
  • Incluez un dossier de « documentation » dans l’organisation de vos dossiers. Ce dossier pourrait inclure :
    • Des propositions de projet ou des protocoles
    • Des formulaires de consentement ou d’approbation
    • Des documents de méthodologie
    • Un plan de gestion des données
    • Le code employé pour le recodage, les analyses et les résultats
    • Des fichiers Readme (lisezmoi) comportant des renseignements de transformation
    • Des fichiers Readme (lisezmoi) comportant les noms ou les titres au complet des abréviations utilisées dans un nom de fichier
    • Des livres de codes ou des guides

Choisissez un format de fichier

Un format de fichier soigneusement choisi peut vous aider à assurer l’accès et le partage de vos données à long terme. Une fois l’analyse des données terminée à l’aide des logiciels et des formats les mieux adaptés à l’analyse prévue, songez à convertir vos fichiers en fichiers stables et ouverts pour les préserver à long terme.

  • Non-propriétaire
  • Sans perte
  • Normalisé dans le domaine ou d’usage courant dans le milieu de la recherche
    • Incluez les étiquettes des données (métadonnées)
  • Adhérant à une norme ouverte et documentée
    • Interopérable parmi diverses plateformes et applications
    • Publié intégralement et disponible libre de redevances
    • Applicable entièrement et indépendamment par plusieurs fournisseurs de logiciels sur plusieurs plateformes, sans aucune restriction de propriété intellectuelle pour la technologie requise
    • Conçu et maintenu par un organisme de normes ouvertes ayant un processus inclusif et bien défini pour l’évolution de la norme.

Des exemples de formats préférés pour différents types de données

  • Conteneurs : TAR, GZIP, ZIP
  • Bases de données : XML, CSV, POR
  • Géospatiales : SHP (avec SHX et DBF), DBF, GeoTIFF, NetCDF, e00
  • Images en mouvement : MKV, MPEG, AVI
  • Sons : FLAC, WAVE, AIFF, MP3
  • Statistiques : ASCII, DTA, POR, SAS, SAV
  • Images fixes : TIFF, PDF/A, PNG, GIF
  • Textes : PDF/A, ASCII, TEI XML
  • Archives Web : WARC
chat loading...