Genre de documents et systèmes d’information Web

NOTES DE LECTURE
Les genres de documents dans les organisations
Sous la direction de Louise Gagnon-Arguin, Sabine Mas et Dominique Maurel
Presse universitaire du Québec, 2014
(chapitre 6, p. 106-128)

Aïda Chebbi a fait sa thèse sur l’Archivage du Web organisationnel dans une perspective archivistique, Université de Montréal, 2013, http://hdl.handle.net/1866/9203, auquel on peut se référer pour compléter ce qu’elle nous livre dans cet ouvrage.

Dans ce chapitre elle examine l’impact du Web sur les genres des documents préexistant et les nouveaux genres que le Web engendre.
Elle commence par le constat que « En faisant appel aux technologies du Web pour conduire leurs affaires, les organisations produisent également de nouveaux types de documents propres au Web. Ces documents doivent être capturés et gérés dans les systèmes documentaires pour les besoins et la continuité des affaires, de préservation de la traçabilité des activités en ligne des organisations, voire pour les besoins de l’histoire et de l’information. » Elle continue en disant « De nouveaux genres de documents coexistent dans les systèmes d’information organisationnels imposant des méthodes de gestion et de conservation adaptées pour mieux répondre aux besoins d’information et de preuve actuel et futurs ». […] « Toutefois les frontières entre publication et document d’archives restent bien floues et ont une incidence sur la définition des territoires de collecte. »

En signalant que les documents du Web doivent être capturés dans les systèmes documentaires, elle sous-entend que le Web n’est pas un système documentaire. Comme elle revient plus tard sur la notion du Web en tant que plateforme de publication concurremment à celle de plateforme documentaire, on voit transparaître ici ce que j’appelle le domaine documentaire et le domaine informationnel et que je détaillerai dans mon prochain billet.

Elle entre ensuite dans le détail de l’émergence des nouveaux genres de documents suscités par le Web. Commençant par des citations de la littérature, elle précise : « Grâce à l’usage des outils informatiques et des réseaux de télécommunication, les supports numériques autorisent la superposition, la multiplication et la transformation de plusieurs genres existant. […] Ce qui favorise l’a production de genres confus ou blurred genres…[…] Un même genre numérique peut parfois remplir plusieurs fonctions selon le contexte d’utilisation ».

On voit ici l’intérêt de la notion de genre car elle permet de « pister » ces glissements et d’éventuellement répondre à cette transformation de manière adéquate en matière de gestion documentaire.

L’auteure détaille ensuite plus précisément les genres Web ou cybergenres (je trouve ce dernier terme inadéquat et m’en explique plus loin). Là aussi, elle souligne les difficultés que posent le monde du Web en matière documentaire : « Les documents Web sont composites, hybrides et complexes (c’est moi qui souligne) ce qui rend difficile toute tentative d’identification ou de classification des nouveaux corpus documentaire. […] Les genres Web se caractérisent par un contenu et une forme générés à la volée. […] L’attribut « forme » n’est plus un attribut déterminant pour la distinction entre les genres Web, alors que l’attribut « but » demeure essentiel pour différencier et analyser les genres Web ».

Cette dernière remarque fonde une piste intéressante bien qu’elle souligne qu’il n’y ait pas uniformité d’opinons s’il faut considérer les « buts » du point de vue du créateur du document ou de ses utilisateurs. Il me semble que cette prépondérance du but sur la forme peut se généraliser à tous les documents numériques mais devrait faire l’objet d’une investigation plus poussée pour être vraiment opérationnelle.

Elle présente ensuite un tableau qui résume les principaux genres Web avec leur caractéristiques (transposé de genre existant, hybride, purement Web) retrouvés dans la littérature avec la référence aux auteurs.

Elle passe ensuite à une autre problématique qui est celle de l’archivage du Web. Après une introduction où elle indique que « le Web ne dispose pas des fonctionnalités essentielles au maintien de la permanence et de l’intégrité des documents qu’il véhicule (Barry, 2004) elle utilise l’enquête menée pour sa thèse pour exposer les principales propriétés des archives Web (universitaires ou gouvernementales).

Elle identifie trois catégories de documents :

  • Les documents qui ont migré sur le site Web en conservant les propriétés de la version originale du document.
  • Les documents qui présentent une forme renouvelée ayant conservé la structure et les finalités des documents similaires.
  • De nouveaux documents émergent qui semblent ne se rattacher à aucun type d’archives connu et dont le destin est à inventer.

En exploitant les résultats de ses recherches elle indique que la répartition entre les documents de gestion (relatifs aux activités de gestion administrative dans une organisation) et les documents de fonction (relatifs à la mission propre de l’organisme) s’établi sur un ratio de 30% / 70%. Cela correspond à ce qui existe en général dans les archives papier (les archives du centre hospitalier universitaire que je gère à un ratio 20% / 80%).

Plus loin elle distingue cinq principaux modes de création :

  1. Documents initialement créés sur un support papier, qui ont été numérisés et convertis en format plus approprié pour une diffusion Web (p. ex. PDF, JPEG).
  2. Documents produits par des suites bureautiques et diffusés dans leur format natif (p. ex. DOT, DOC, XLS, PPT).
  3. Documents produits par des suites multimédias (p. ex. animation Flash Player). Bien qu’ils soient produits pour le site Web, ces documents ne se présentent pas au format HTML.
  4. Documents générés par les éditeurs Web ou (5) des systèmes de gestion de contenu. Il s’agit de pages Web développées grâce à un langage de balisage.
    (pour le détail on peut se reporter au chapitre 4.2.2. de sa thèse).

Cette typologie confirme une de mes hypothèses en ce qui concerne la (les) typologie (s) de documents exposée dans mon article de 2004) qui me faisais dire que la seule typologie opérationnelle à ce jour pour les documents numérique était celle des extensions des documents, qui les assimilent aux applications qui les produisent.

Elle liste ensuite les documents Web qui constituent un genre nouveau (11 genres identifiés), complétés par ceux dégagés par les politiques d’archivage du Web (également 11 genres, relatifs plus à l’ordre des métadonnées et de la gestion des sites plutôt qu’à la typologie des documents).

En guise de conclusion, elle pose la question de la frontière entre les archives Web et la publication en ligne. Il est significatif que la plupart des pays qui ont mis en place des politiques d’archivage du Web ont confié cette tâche à leurs bibliothèques nationales (ou des institutions similaires). Elle pose explicitement la question : « Où se situent les frontière entre une publication en ligne et des archives Web dans un environnement documentaire où les documents produits et diffusés sur le Web ont un statut de document public (accessible à tous) et présentent les mêmes caractéristiques techniques et de forme ? » Elle présente certaine politiques qui répondent à cette question, sans dégager une bonne pratique universelle à ce sujet (tout en ne répondant pas de manière générale à la question, sa thèse présente d’autres développements à propos des politiques d’archivage des sites Web qui peuvent alimenter cette réflexion).

Elle dit « Pour conclure, un site Web public est un objet documentaire complexe et protéiforme, une forme documentaire à part entière dont les composantes documentaires et technologiques ainsi que les fonctionnalités sont aussi variées que différentes. […] « Souvent confondu avec son média, un site Web organisationnel n’est pas considéré comme un produit documentaire issu des activités d’une organisation. […] Même si certains de ces documents se retrouvent dans d’autres systèmes documentaires, leur édition/publication sur un site Web leur procure des propriétés de forme et de but ainsi que des fonctionnalités qui les distinguent des documents originaux, […] La valeur qu’il [le site web] représente pour l’organisme producteur et celle qui pourrait servir les besoins d’information et de recherche ne sont pas encore généralement admises. »

On peut regretter que ce chapitre soit en quelque sorte un « digest » de la thèse d’Aïda Chebbi. Bien qu’elle souligne la nouveauté intrinsèque des documents du Web en terme de genre et qu’elle pose des questions qui ouvrent des perspectives intéressantes, elle apporte peu de réponses. Une autre problématique importante à mes yeux n’est pas traitée, ce que j’appelle « l’effet portail » soit le fait que les utilisateurs accèdent via un même écran à des documents dont la nature et les statuts sont différents et « mixent » des documents institutionnels, des informations issues d’internet, des pages constituées à la volées, sans que la nature de ceux-ci ne soit explicite, ce qui ajoute à la confusion de genre qu’évoque Anne-Marie Chabin dans le chapitre initial de l’ouvrage.

A propos du cybergenre
C’est Michael Shepherd (et al.) qui a introduit le terme dans son article « The Evolution of Cybergenres » en 1998 (http://web.cs.dal.ca/~shepherd/pubs/evolution.pdf) mais il ne le défini pas précisément puisqu’il en dit ”We define cybergenre as two main classes of subgenres, extant and novel. The class of extant subgenres consists of those based on genre existing in other media, such as paper or video, that have migrated to this new medium. The class of novel subgenres consists of those genres that have developed in this new medium and have no real counterpart in another medium”. Par défaut le cybergenre est donc un genre n’existant pas antérieurement.
Shepherd ne le défini pas plus dans son article plus récent de 2004 : « Cybergenre : Automatic identification of home pages on the Web », Journal of Web Engineering, vol 3, nos 3-4, p. 236-251, http://web.cs.dal.ca/~kennedy/cybergenre.pdf, puisqu’il reprend le même schéma avec les sous-genres « existant » et « nouveau ». Il aurait donc pu se passer du préfixe « cyber » dont le sens étymologique est tiré du terme grec « kybernetes » qui a le sens de pilote et qui a été introduit par Norbert Wiener en faisant référence aux processus de rétroaction mis en œuvre en informatique. Ce préfixe a depuis été utilisé à contre-sens pour signifier toute évolution des activités humaines modifiées par l’informatique puis par Internet.
S’il devait être utilisé, le terme cybergenre ne devrait pas l’être exclusivement dans le domaine du web mais à propos de tous les documents nés numériques. A tout le moins, il mériterait une définition un peu plus consistante et cohérente.

A propos regarddejanus

Archiviste, Record-manager et enseignant
Cet article, publié dans archivage numérique, genre documentaire, Internet, Typologie des documents, est tagué , . Ajoutez ce permalien à vos favoris.

Un commentaire pour Genre de documents et systèmes d’information Web

  1. Ping : Les genres de documents dans les organisations | Le regard de Janus

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s