La conservation des bases de données. Dimensions spécifiques et questions corrélées

14èmes Journées des Archives de Louvain, 24 avril 2014

Thomas VAN DE WALLE, Chef du Département Archivage électronique et archives audiovisuelles des Archives nationales de France (ANF), a sous-titré sa présentation « Images d’un monde flottant » (voir les images finales).

Dans le contexte français, la mission des archives nationale est la conservation des archives définitives des services centraux de l’Etat. Ces derniers n’ont pas pour mission de produire des archives mais des prestations aux citoyens. Les Archives Nationales ont 30 ans (1982-2014) d’expérience dans l’archivage des bases de données. En 2014, 150 millions de fichiers (env. 20 To de données) sont archivés. Le service stocke aujourd’hui 283 versements de données structurées sur un total de 357 versements électroniques (env. 80% des versements).

Les principes posés dans les années 80 restent toujours valables.
L’archivage doit être indépendant de toute technologie, dont il découle :

  • Une veille technologique pour éviter l’obsolescence technique dans l’objectif de la conservation préventive et des migrations
  • Une information codée doit être accessible en dehors du système qui l’a produite pour pouvoir être considérée comme archivée, ce qui garanti l’indépendance des documents

Les recettes de l’archivage des bases de données

  • Export des données à plat (actuellement du CSV)
  • Collecte systématique d’une « documentation » en parallèle à l’archivage des données
  • Documentation sur la signification des données
  • Documentation sur l’organisation des données
  • Documentation sur l’historique de la vie de la base de données (élaboration, utilisation, actions liées à l’archivage…)
  • Description systématique des données archivées dans des outils dédiés :
  • Description de l’application dont est tiré le fichier archivé
  • Description du fichier archivé
  • Description de la structure du fichier archivé
  • Description des données contenues dans le fichier archivé

L’archivage des bases de données est assimilable à des prises de vues successives.
Afin de garantir de la fiabilité dans le temps la documentation est primordiale.
La continuité est mieux préservée par des systèmes simples et stupides.

Les bases de données sont un monde mouvant :

  • Des technologies mouvantes (entre 1960 et 2000 les bases de données ont été hiérarchiques, relationnelles, orientées-objet, entrepôts de données, NoSQL)
  • Des usages mouvants (calculs statistiques, production dynamique des documents, réceptacle d’information pour le partage et la conservation)
    puis : usage liés aux types d’objets, usage variable selon les nombres d’utilisateurs (= risque de pertes et d’incohérence)
  • Des contenus mouvants : Avec différentes logiques d’acquisition. Par « campagne » (ajout de gros lots de données selon un rythme donné), par « mise à jour » (ajout, modification et suppression de données en mode continu), auquel s’ajoutent les problématiques des mises à jour des documents (doublon, version) et celles des données modifiées automatiquement par les systèmes.

Compte tenu de l’évolution actuelle une collaboration interministérielle (Affaires étrangères, Culture et communication, Défense) a vu le jour pour construire un logiciel commun basé sur des outils libres sous le nom de VITAM. Un changement de perspective amène à privilégier la facilité des accès.

schéma-simple-VITAMSchéma du projet VITAM
Source et commentaires : http://archiverleternite.blogspot.ch/2013/07/sae-oais-les-3-ages-vus-par-un.html

 ADAMANT est le module de VITAM qui sera développé pour les archives nationales et qui devra assurer l’interface avec les applications préexistantes aux ANF. Les développements sont planifiés pour la période fin 2014-fin 2016.

Sa conclusion a porté sur …
Les évolutions à venir :

  • Les outils : diversité ou rationalisations ?
  • La réutilisation : une démultiplication des moyens de conservation et d’accès ?
  • Les données personnelles : quel équilibre démocratique ?
  • Les modèles logiques : vers une complexité accrue ?
  • Les documents : une espèce en voie de disparition
  • Des évolutions garantissant un usage prolongé …

.. .et les pistes suivies par les ANF

  • Pour les bases associant données et documents : les considérer avant tout comme un ensemble de documents dotés de métadonnées structurées
  • Pour gérer la collecte, maintenir la logique d’extraction et poursuivre le travail de sélection et de qualité des données
  • Pour les besoin de la conservation à très long terme, maintenir les principes de l’autonomie technologique et de la conservation d’une documentation sur l’histoire des données archivées
  • Pour maintenir la confiance. Prêter un soin extrême à la question de la gestion des droits et traiter la question de l’anonymisation
  • Pour l’accès aux données, disposer de capacités de recherche sur les métadonnées accrues et utiliser des outils de visualisation et d’exploitations génériques

Cela devrait permettre de passer de ceci :
Hiroshige LaVague

À cela :
Pecheur_Hiroshige

D’autre aspects du projet VITAM ont été abordé par Thomas Van de Walle dans sa présentation au colloque Digital Diplomatics (en anglais) à Paris en novembre 2013 (accessible ici : http://www.cei.lmu.de/digdipl13/wp-content/uploads/Van-de-Walle.pdf )

Sur des questions plus techniques qui sous-tendent le projet VITAM on peut consulter le blog de Frédéric Bréguier « archiver l’éternité » ici : http://archiverleternite.blogspot.fr/

About these ads

À propos de regarddejanus

Archiviste, Record-manager et enseignant
Ce contenu a été publié dans archivistique, base de données, conservation électronique, VITAM (projet SAE-ANF), avec comme mot(s)-clef(s) , , , . Vous pouvez le mettre en favoris avec ce permalien.

Une réponse à La conservation des bases de données. Dimensions spécifiques et questions corrélées

  1. Ping : La conservation des bases de données. Di...

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s