Archiver une base de données n’est pas toujours la bonne solution !

J’ai déjà exposé combien la confusion entre gestion des données et gestion des documents était un facteur de complexité pour l’archivage électronique (https://regarddejanus.wordpress.com/2010/12/22/donnees-%E2%80%93-transactions-%E2%80%93-documents-premiere-esquisse/). Un récent travail de bachelor de la HEG de Genève vient de mettre en évidence cette problématique d’une manière des plus intéressantes. Sous le titre « La base de données de l’aide sociale SOSTAT : Analyse, évaluation et proposition d’archivage pour les Archives de la République et Canton du Jura » (http://gildyr.files.wordpress.com/2011/11/01_travail_bachelor_yildirim_avec_annexes_pdf.pdf) Gülşen Delia YILDIRIM s’est livré a une analyse exemplaire de la problématique de l’archivage des bases de données. Le cas dont elle s’est occupée concentre deux problèmes courants, l’un propre à tous les environnements qui mêlent base de données et base de documents, l’autre propre à l’environnement helvétique, qui est le partage des tâches entre la confédération et les cantons, avec ses implications en ce qui concerne la responsabilité de l’archivage. Elle résume son travail dans son e-portfolio (http://gildyr.wordpress.com/2011/11/13/production-documentaire-outil-evaluation/)

Dans les premiers chapitres elle effectue un résumé de la problématique de l’archivage des bases de données. Rien de très nouveau pour ceux qui sont familier avec ces questions mais un excellent résumé pour les néophytes.

C’est évidemment la deuxième partie qui a retenu toute mon attention. Après une présentation détaillée du contexte : services utilisateurs et lien entre l’application SOSTAT fournie par l’Office fédéral de la statistique et son utilisation par le canton, elle analyse de façon détaillée les liens entre les données de l’application et les documents constituant les dossiers d’assistance du canton. Par cette analyse approfondie elle montre que les informations pertinentes se retrouvent en fait sous trois formes, la partie essentiellement données dans l’application SOSTAT, la partie documents numériques/numérisés dans le système de GED du canton (dénommé GipDoc) et enfin dans le dossier papier, qui se révèle être le plus complet. Les tableaux qui résument cette situation (Figure_30 et annexe_10) montrent l’étendue de cette complexité.

Elle complète cette analyse systémique par une analyse de la valeur archivistique, qui l’amène à la conclusion que les documents les plus dignes d’archivage sont effectivement les dossiers papiers. Il ne s’agit pas d’un choix doctrinal ou rétrograde. En effet, elle examine la faisabilité de l’archivage de la base de données (schéma idéal : Figure_39), qui est en soit techniquement réalisable, mais fini par l’exclure car :

  • la base de données est incomplète (elle a initialement été conçue pour collecter des données d’ordre statistiques)
  • la dénomination de ses champs est elliptique, ce qui rend sa compréhension difficile en dehors de son environnement de base, ce qui sera inévitable lors de l’archivage
  • les archives cantonales ne possèdent ni l’infrastructure ni les compétences pour assumer un tel archivage numérique
  • La base GED est un fourre-tout (l’expression est la mienne) qui nécessiterait une restructuration fondamentale avant que l’on puisse en extraire de manière fiable les documents nécessaires à un archivage numérique

Son argumentaire est encore plus développé, je n’ai sélectionné ici que les points qui me paraissent les plus saillants.

Outre cet excellent travail d’analyse sur le processus de l’assistance sociale et l’analyse archivistique de la base de données, qu’elle résume dans un schéma de procédure générique (Tableau_5) dont on peut s’inspirer, l’auteure, dans ses conclusions, expose les pré-requis que l’administration jurassienne devrait remplir en terme d’organisation et de gestion de ses processus informationnels pour envisager un archivage électronique fiable de ses bases de données et de ses bases documentaires. Je la cite en guise de conclusion : « Dans les faits, cela signifie qu’avant même de pouvoir envisager l’archivage numérique à l’échelle cantonale, il faudra passer par une grande phase de révision des processus de production documentaires pour tous les services ». C’est une phrase que de nombreux collègues pourront reprendre !

Bref, une lecture indispensable pour tous ceux qui sont/seront confrontés à l’archivage des bases de données.

A propos regarddejanus

Archiviste, Record-manager et enseignant
Cet article a été publié dans archivage numérique, base de données, bonnes pratiques, calendrier de conservation, records management, versement des données. Ajoutez ce permalien à vos favoris.

3 commentaires pour Archiver une base de données n’est pas toujours la bonne solution !

  1. La question de l’articulation données / documents accroche ma lecture.
    Un commentaire diplomatique : la co-existence dans les archives de données et de documents n’est pas vraiment une nouveauté de l’informatique ; sous l’Ancien régime, on parlait de registre et de layettes (le mot dossier ne date que du XIXe s.) mais les concepts sont les mêmes.
    Un commentaire archivistique : pour l’archivage des bases de données, il y a une excellente norme, la seule qui existe à ma connaissance : ICA-Req, module 3 :
    ICA-Req – Principes et exigences fonctionnelles pour l’archivage dans un environnement électronique
    3- Recommandations et exigences fonctionnelles pour l’archivage des documents dans les applications métier, 74 p
    Cette a été traduite en français par une équipe de volontaires, sous l’égide de l’ICA (international council of archives) ; bien que lCA la garde jalousement pour ses membres, et bien que l’Afnor rejette cette traduction, la norme a été adoptée par l’ISO 16175 et est accessible.
    Un commentaire de bon sens : si l’archivage électronique n’est pas pensé en amont, je comprends qu’on en conclue qu’il faut archiver le papier mais c’est un pis aller ; c’est bien à la conception que ça se passe et intervenir après la création de la base de données relève malheureusement de la rustine.

  2. regarddejanus dit :

    @ Marie-Anne,

    Je suis d’accord que la séparation entre données et documents soit antérieur à l’usage de l’informatique et j’ai dans les fonds historiques de mon CHU des registres qui possèdent la double fonction d’index et de document (avant 1900 en général). Cependant l’informatique avec son uniformisation des formats facilite les confusions entre la fonction documentaire et la fonction indexatoire.

    Le travail cité, s’il n’applique pas formellement la norme ICA-Req, suit assez largement dans son déroulement les exigences formulées dans le module 3, telles que résumées ci-dessous.

    2.3.1 Analyser les processus métier
    1. identification des exigences de traçabilité et de preuve dans les affaires gérées par l’application métier ;
    2. identification des éléments de traçabilité et de preuve qui constitue « le document engageant à archiver ».

    2.3.2 Identifier les exigences de traçabilité des activités
    Étape 1 – déterminer globalement les fonctions métier ainsi que les activités et actions particulières effectuées en totalité ou en partie par l’application
    Étape 2 – considérer, pour chaque mission, activité, action ou processus gérés par le système, les traces que l’entreprise/organisme doit absolument conserver
    Étape 3 – pour chaque exigence de preuve, identifier le contenu ou les données qui constituent la preuve
    Étape 4 – identifier les informations additionnelles nécessaires pour que le contenu ait une valeur de preuve pérenne

    2.3.4 Identifier les liens avec le système

    2.3.5 Définir la meilleure stratégie d’archivage à partir d’une évaluation des différents scénarios

    Enfin je suis parfaitement d’accord avec la remarque finale, c’est à leur conception que l’on devrait se préoccuper du sort final des bases de données. Cependant la réalité du moment nous oblige à prendre en compte des bases de données conçues il y a plus de 15 ans (en 1978 pour les HUG à Genève) alors que les instruments archivistiques appropriés (dont ICA-Req) sont des plus récents et doivent encore s’imposer auprès des informaticiens (voire des archivistes).

    C’est pourquoi le travail de bachelor cité est exemplaire, non pas qu’il soit parfait ou normalisé, mais parce qu’il représente une situation que nous rencontrons et allons rencontrer encore régulièrement ces prochaines années.

  3. Ping : L’analyse de la production documentaire: un outil essentiel à l’évaluation archivistique des bases de données « ePortfolio Gülşen YILDIRIM

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s