Données – Transactions – Documents, Première esquisse

En 2003 paraissait une étude qui allait largement influencer les recherches sur le document numérique de ces dernières années. Sous le titre Document : forme, signe et médium, les re-formulations du numérique, le collectif de chercheurs connu sous le nom de Roger T. Pédauque proposait une analyse de la structure du document selon 3 axes : Forme-Signe-Medium, qui permettait d’identifier et de mesurer les évolutions entre le document analogique et le document numérique.

Ce triple axe est représenté par un schéma triangulaire dont l’un des derniers avatars est visivle ici: http://www.cairn.info/loadimg.php?FILE=EDC/EDC_030/EDC_030_0013/smallEDC_030_0013_img2.jpg

(Source : J.-M. Salaün, voir bibliographie)

Quelques temps après, dans un article paru dans la revue Document numérique (voir référence en fin de billet) j’ai tenté d’exploiter les résultats pédauquiens pour tenter de construire une typologie documentaire qui remplacerait pour les documents électroniques les anciennes typologies appliquées au papier, typologies qui se révélaient difficiles à exploiter dans un environnement numérique. Malheureusement, je devais conclure mon étude sur un constat d’échec.

Les différents niveaux de recouvrement sémantique liés aux documents et aux données pourraient laisser supposer qu’une typologie de documents n’a plus de sens dans un monde hypertextuel. Le découpage en « documents » étant juste une phase dans un enchaînement de transactions et/ou de traitements successifs. De ce point de vue, pour l’activité courante, seule l’information compte (en tant que données + forme), l’existence documentaire ne semblant nécessaire que pour la preuve.

Cela rejoint curieusement le concept de respect des fonds, cher aux archivistes, qui a, entre autres, pour conséquence que le document unique n’a pas (ou peu) de valeur par lui-même mais seulement par son intégration organique dans un ensemble [documentaire] plus vaste [(une série ou un fonds)]. Ce qui amène par exemple à cette question paradoxale et non résolue : une base de données est-elle un fonds d’archives ?

[Le texte entre crochet est une actualisation]

Depuis lors j’ai continué à réfléchir à propos de cette question et à collecter les réflexions que d’autres menaient parallèlement à propos de cette thématique.

Si le modèle pédauquien ne rend pas compte de cette facette, bien qu’elle ne l’exclue pas, c’est probablement qu’il a trop été centré sur le document édité et pas sur les documents pour l’action, tel que le décrit Manuel Zacklad (voir bibliographie). Or c’est ces derniers qui sont l’objet de l’archivage au sens traditionnel du terme.

De la première opposition entre données et documents, assez bien explicitée dans la communication de John Wilbanks que j’ai commentée ici, j’en suis venu à inclure un plan intermédiaire qui est celui de la transaction. Cette variable que je pensais au départ simplement explicative de la relation données/documents me semble aujourd’hui centrale. En effet, la transaction apparaît comme la cause première, soit des données, soit des documents. Les documents d’archives sont depuis longtemps définis comme étant le résultat de l’activité administrative donc de transactions au sens large.

J’ai donc constitué un tableau (voir ci-dessous) (Visio-Donnee_transaction_document_1) qui montre la dynamique de la relation entre ces trois plans, et qui montre pourquoi la maîtrise typologique des données/documents numériques n’est pas simple. Les relations entre ces trois plans suggèrent qu’en fait cette typologie doit probablement s’élaborer au niveau META. Si la notion de métadonnées est largement connue et entrée dans le langage tant des informaticiens que des archivistes (du moins ceux qui traitent des documents numériques) les notions parallèles de méta-transactions et de méta-documents ne sont pas familières, même si les notions qu’elles recouvrent (les workflows ou flux de travail et les procédures) sont déjà connues. La nouveauté réside dans le fait qu’elles doivent être conçues comme des plans systémiques qui se parlent. On peut idéalement les concevoir comme une généralisation des principes archivistique de provenance et de respect des fonds, dans le sens que leur conservation en tant que contexte, avec les objets numériques qu’ils documentent, forment un tout, et que seule la conservation de ces inter-relations permettent la compréhension $ long terme des objets numériques conservés.

Ainsi, le produit hybride que constituent les états issus de base de données, qui peuvent être soit temporaires soit constituer un document, obtiendront un statut adéquat par le fait qu’ils prennent place dans un workflow dûment documenté.

Dans ce tableau on peut définir les différents éléments comme suit :

Donnée
Objets numérique formé du triplet objet-prédicat-valeur (lien). Une donnée peut être la traduction :
–       d’un fait élémentaire, par exemple : l’eau bout à 100°C

–       d’une transaction, par exemple : X a acheté à Y tel objet à tel prix

Transaction
Echange d’objet et/ou de valeur entre 2 ou X acteurs
A donne l’objet Y à B
B donne X francs à A

Document
Trace plus ou moins pérenne d’une ou de plusieurs données et/ou d’une transaction, comme par exemple :
–       un tableau de données issues d’une expérience scientifique
–       un acte notarié d’une vente immobilière.

Dans ce sens là, le document est l’équivalent du « record » au sens anglo-saxon.

S’il n’y a pas trop de difficulté à trouver un consensus pour ces trois définitions, le côté « hybride » de l’état n’échappe à personne. Il peut être à la fois, et parfois simultanément :

  • Une vue d’une partie de la base de données, avec une fonction d’information pure (volume des ventes de ce jour)
  • Un extrait visant à la préparation d’une transaction (liste de factures non-payée à échéance en vue d’émission de lettre de rappel)
  • Un document pré-formaté, incluant des données de la base (lettre de rappel avec adresse du débiteur, montant de la facture et numéro de facture)

A partir des ces définitions on peut poser les postulats suivants :

a)    Une donnée existe potentiellement sans être portée sur un document. C’est la mémoire cérébrale non-écrite (nommé savoir implicite dans la théorie du Knowledge management)

b)    La plupart des données existent dans des systèmes informatiques, qui ne sont pas à priori des documents

c)    Une transaction peut s’effectuer sans échange de données formel (vente d’occasion, vente de bétail, la poignée de main vaut contrat)

d)    Une transaction peut produire une donnée qui n’est pas un document (reçu de bancomat -> relevé bancaire, !! flou en rapport au vol de carte !!)

e)    Un document peut contenir une/des donnée(s) qui ne sont pas des transactions (résultats de laboratoires)

f)     Plus une transaction est importante en valeur (matérielle ou immatérielle) plus nous avons tendance à la documenter

g)    Les bases de données conservent des données et des transactions. Dans ce cadre, la transaction (par ex. un changement de valeur) est elle-même mémorisée sous forme de données (= nécessité de dater les faits élémentaires (voir la question de la durabilité des données, c/o Boydens)

Ces postulats vous paraissent-ils cohérents ?

Y en auraient-ils d’autres à trouver ?

Que peut-on en tirer pour mettre en place une gestion documentaire fiable dans un environnement numérique ?

Bibliographie

Jean-Michel Salaün

La redocumentarisation, un défi pour les sciences de l’information

Études de communication, Numéro 30 (2007)

Entre information et communication, les nouveaux espaces du document

(https://papyrus.bib.umontreal.ca/jspui/bitstream/1866/1724/1/salaun-jm-redocumentarisation-etudes_de_communication.pdf)

Jean-Daniel Zeller

Documents numériques : à la recherche d’une typologie perdue…

Document numérique « Archivage et pérennisation » (ed. Hermès, Paris, Vol 8/2, 2004, pp. 101-116)

http://dn.e-revues.com/ (Résumé )

http://www.cairn.info/load_pdf.php?ID_REVUE=DN&ID_NUMPUBLIE=DN_082&ID_ARTICLE=DN_082_0101

Roger T. Pédauque

Document : forme, signe et médium, les re-formulations du numérique,

version du 08-07-2003, accessible sur :

http://archivesic.ccsd.cnrs.fr/documents/archives0/00/00/05/11/index_fr.html

Samuel Parfouru, Philippe Haïk, Sylvain Mahé et Manuel Zacklad

Analyse de la construction de documents de capitalisation de connaissances au travers de documents structurés : vers le développement d’un atelier sémiotique de composition de documents

CIDE 10, Colloque International sur le Document Numérique, septembre 2008

http://lodel.irevues.inist.fr/cide/index.php?id=161

Manuel Zacklad (2007),

Une théorisation communicationnelle et documentaire des TIC,

in Reber, B., Brossaud, C., Humanités numériques 2 : socio-informatique et démocratie  cognitive (Traité IC2, série cognition et traitement de l’information), Hermes Science Publications, Londres-Paris.

http://archivesic.ccsd.cnrs.fr/docs/00/18/01/86/PDF/theorisation_comm_et_doc_des_TIC.pdf

Isabelle Boydens,

Informatique, norme et temps,

Bruxelles, Ed. Bruyland, 1999.

A propos regarddejanus

Archiviste, Record-manager et enseignant
Cet article, publié dans archivage numérique, processus archivistique, Typologie des documents, est tagué , . Ajoutez ce permalien à vos favoris.

3 commentaires pour Données – Transactions – Documents, Première esquisse

  1. Ping : Données, transactions, documents… Cycle de vie de l’information « Fil d’ariane

  2. Ping : Freedom of Information Act – Une revue de littérature révisée | Le regard de Janus

  3. Ping : Archiver une base de données n’est pas toujours la bonne solution ! | Le regard de Janus

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s