Coronavirus et gouvernance de l’information

La crise actuelle m’a réveillé de ma léthargie blogographique. Ce réveil a été provoqué par la publication d’un article de l’ICT Journal (lien), reprenant une enquête menée par le journal alémanique Republik (ici, traduction française Nous_avons_pris_le_nombre_de_morts_sur_Wikipedia_2020-03-20). Les deux articles soulignent la problématique du suivi de l’épidémie liée à la difficulté de transmission des informations ces services médicaux et des laboratoires vers les médecins cantonaux et l’Office fédéral de la santé publique (OFSP). Cette difficulté entraine un délai important entre le moment ou l’information est connue et celle où elle enregistrée (et donc publiée) par l’OFSP. Dans le cadre de l’épidémie actuelle, dont la virulence nécessite des prises de décision rapide, un tel délai a été qualifié, à juste titre de « situation indigne de la Suisse (Marcel Salathé, épidémiologiste à l’EPF de Lausanne).

Les articles détaillent ensuite les raisons de ce délai :

  • Une procédure de déclaration complexe et obsolète (conséquence d’une législation inadaptée)
  • Un manque de convergence entre les différents acteurs
  • Un projet d’informatisation initié en 2014 toujours pas finalisé
  • Une impossibilité de réaliser les modifications utiles alors que l’OFSP croule sous les sollicitations dues à l’épidémie.

J’avais déjà pu constater il y a une dizaine d’année, alors que j’étais responsable des archives de HUG, que le système de déclaration des maladies infectieuses ressemblait à une usine à gaz. Quand j’ai interrogé les personnes compétentes des HUG les réponses que j’ai pu obtenir peuvent se résumer ainsi (de manière un peu caricaturale) : « L’Hôpital soigne les patients ici et maintenant et n’a que faire de l’épidémiologie de la Suisse centrale et l’OFSP fait des statistiques pour l’année prochaine (autant dire « pour l’histoire ») ». Avec cet état d’esprit, on peut comprendre que l’informatisation du processus ait pris du retard.

Enfin les rédacteurs relayent quelques solutions pour sortir de ce marasme. Si elles ne sont pas dénuées de fondement et de bon sens, elles s’attachent principalement aux aspects techniques de la transmission des données épidémiologiques. Pour avoir une idée du fossé on peut comparer le même jour les données fournies par l’OFSP (ici) et celle fournie par une structure plus agile, le site corona-data ().

Il est paradoxal de constater, alors que les progrès dans le temps de mise au point de tests devient de plus en plus rapide, que le signalement épidémiologique dont un des buts principal est de faciliter la prise de décision, mette tant de peine à produire des résultats en temps (quasi) réel.

 

En quoi la gouvernance de l’information est utile

La gouvernance de l’information (GI) part du principe que l’information est une « valeur » (au sens anglo-saxon d’asset) et que l’investissement dans un système efficace rapporte (en l’état des vies et de l’argent non dépensé). Cela implique que les données doivent être de qualité et que leur gestion doit faire l’objet de politique explicite en tenant compte de tous les participants au flux des données (au même titre que la gestion financière : on pourrait dire que le manque de masques et de respirateurs s’apparente à un problème de trésorerie). Même si ce sujet a émergé ces dernières années, sa prise en compte est loin d’être réalisée dans un monde de plus en plus informatisé (preuve en est les énormes difficultés du système d’enseignement à basculer au tout numérique ou le problème récurrent des assurances maladie).

Le problème n’est de loin pas que technique, il est surtout managérial. Pour gérer un flux de données complexe (comme les données épidémiologiques) il faut que toutes les parties prenantes aient un intérêt à la qualité des données et de leur transmission. Dans ce cadre, il est nécessaire que chacun des partenaires ait un retour d’information qui lui soit utile (feedback). Au début de ma carrière hospitalière j’avais fait un voyage d’étude au Québec et j’avais agréablement surpris de constater que les établissements hospitaliers fournissaient chaque mois des statistiques (papier) au Ministère de la santé sur le nombre de cas traités par type de diagnostic. Mais le comportement des différents établissements hospitaliers était très différent. Les grands établissements urbains expédiaient très régulièrement ces statistiques car ils avaient l’assurance que le Ministère les retournerait dans un format informatique à bref délai (env. 2 mois), ce qui leur permettait de les exploiter pour leur propre gestion immédiatement. Les petits établissements locaux, n’ayant en général pas ou peu à gérer de trajectoire de patients complexe, mettaient eux beaucoup de retard à transmettre leurs données, ce qui fait que les statistiques consolidées au niveau de la Province étaient publiées de manière partielle et dans des délais long (3 ans).

Cet exemple montre l’importance d’examiner toutes les étapes (y compris le retour d’information) pour bâtir un système d’information robuste (supportant l’état de crise) et efficace. On ose espérer que la crise du coronavirus permettra (dans quelques mois) de corriger le tir et que le parlement fera l’effort de simplifier ses exigences légales et de voter les budgets nécessaires à une telle réalisation.

Publié dans gouvernance de l'information | Tagué | Laisser un commentaire

Archives de Twitter : retour à la normale (archivistique) ?

Depuis janvier 2103, la Library of Congress (LOC) n’avait plus communiqué à propos de l’archivage de Twitter (voir le dernier message sur le bloc la LOC ici :  https://blogs.loc.gov/loc/2013/01/update-on-the-twitter-archive-at-the-library-of-congress/ . J’avais exploré quelques raisons à cette problématique dans ma communication aux journées des archives de Louvain de 2016 :

La mise à disposition des archives de Twitter par la Library of Congress
Aspects méthodologiques et difficultés de process
In : Pérenniser l’éphémère. Archivage et médias sociaux, ?? (éditeurs), Actes des 16èmes journées des archives, Louvain-la-Neuve, Academia L’Harmattan, 2018, 10 p. (pp. ?). (A PARAITRE)
(lien : https://archivesic.ccsd.cnrs.fr/sic_01676403)

Le récent message de leur responsable de communication (ici : https://blogs.loc.gov/loc/category/social-media/ ) et le white paper qui y est associé (là : https://blogs.loc.gov/loc/files/2017/12/2017dec_twitter_white-paper.pdf ) jette un nouvel éclairage sur ce qu’il faut bien assimiler à une forme de black-out. J’en reprends quelques arguments.

L’archivage de la totalité du twitter public (2006-2017)
L’argument de la LOC pour archiver Twitter intégralement dès sa création tient à la volonté de documenter une pratique en émergence et en évolution rapide. Dans ce cadre, le refus initial d’une sélection est justifiée par une vision prospective qui reconnaît le fait que l’évolution d’un tel média est imprévisible et que toute sélection à priori est par conséquent dommageable. L’option était parfaitement justifiée sauf qu’elle s’est heurtée à deux obstacles majeurs :

  • L’augmentation quasi asymptotique du volume des tweets, accentuée par le doublement récent du nombre de caractères autorisés (de 140 à 280).
  • L’incapacité de construire un instrument de recherche digne de ce nom pour cet objet archivistique non identifié (OANI), voir plus bas la question du financement.

Le passage d’une politique de sélection (dès 2018)
Ayant accumulé un stock exhaustif de plus 12 ans d’activité de Twitter, la LOC s’est sentie légitimée à passer à une pratique classique de l’archivage, qui est celle de la sélection (la théorie archivistique reconnaît que seul 10% / 5% / 2% du volume des documents/enregistrements produits nécessitent une conservation à long terme, utile pour l’histoire, ou tout autre chose).

Les arguments de la LOC pour abandonner l’archivage intégral de Twitter avancé dans le white paper sont :

a)  La nature de Twitter a changé au fil du temps.

  1. Le volume de tweets et de transactions connexes a évolué et augmenté de façon spectaculaire depuis la signature de l’accord initial.
  2. La bibliothèque ne reçoit que du texte. Il ne reçoit pas d’images, de vidéos ou de contenu lié. Les tweets sont souvent plus visuels que textuels, ce qui limite la valeur de la collecte de texte uniquement.
  3. Twitter augmente la taille des tweets au-delà de ce qui avait été décrit au début de l’effort d’acquisition.

b)  La bibliothèque a maintenant les 12 premières années de tweets publics. Cette période documente la croissance d’une importante plateforme de médias sociaux.

c)  La bibliothèque ne collecte généralement pas de manière exhaustive. Compte tenu de la direction inconnue des médias sociaux lors de la planification du don, la bibliothèque a fait une exception pour les tweets publics. Maintenant que les médias sociaux sont établis, la bibliothèque met davantage en pratique ses pratiques de collecte conformément à ses politiques de collecte.

On peut bien évidemment s’interroger sur quels critères cette sélection aura lieu dans la mesure où les termes utilisés par le communiqué sont sujet à interprétation (selon la Déclaration de politique d’acquisition de la Bibliothèque et de documents connexes – https://loc.gov/acq/devpol/ ). La LOC a publié plus de 75 Collection Policy Statements et la dernière édition de celle sur le Web Archiving (sept. 2017 : https://www.loc.gov/acq/devpol/webarchive.pdf ) si elle cite les réseaux sociaux comme source potentielles, n’en dit pas plus.

Une réponse récente à une question sénatoriale (ici : https://fcw.com/articles/2017/04/05/nara-archived-tweets-mazmanian.aspx et là: https://www.archives.gov/files/press/press-releases/aotus-to-sens-mccaskill-carper.pdf ), nous rassure sur un point : les tweets du président Trump seront conservés !

La question du financement
De toute évidence, indépendamment de la question de la constitution d’un instrument de recherche adapté à une telle collection, la question majeure (d’ores et déjà lisible dans le communiqué de 2013, qui fait allusion au partenariat public/privé pour la mise à disposition de ce fond) est celle du financement de la mise à disposition des tweets de manière utile à la recherche. Le message de la LOC n’est pas plus encourageant que celui de 2013, et s’il mentionne des pistes, il ne fait état d’aucune concrétisation à court terme.

* * *

De nombreuses publications dans la presse américaine relaient ce nouvel état de fait sans vraiment en analyser les tenants et aboutissants, je vous les épargne. Je retiens cependant celui de Amanda Petrisich du New Yorker, qui va au-delà de l’annonce pour analyser de manière ironique la posture la LOC et qui surtout fait référence à l’historique même de la fonction archivistique de la LOC (ce qui ne saurait que réjouir les archivistes) (article original ici : https://www.newyorker.com/culture/cultural-comment/the-library-of-congress-quits-twitter , traduction française là : The_LOC_Quits_Twitter_2018-01_FR)

A mes yeux, il y a à ce jour trois questions qui restent non résolues :

  • Quel vont être les critères de sélection de la LOC pour déterminer ce qui sera conservé (publiquement) de Twitter à partir de 2018 ?
  • Comment et sans quel délai la LOC va-t-elle réussir à construire un outil de recherche adapté à un tel fond ?
  • Quelles modalités de collaboration public/privé la LOC va-t-elle trouver pour résoudre les problèmes de financement de cet outil de recherche ?

Pour la réponse, il semble qu’il va falloir attendre encore quelques années….

 

Publié dans archivage numérique, Internet, Média sociaux | Tagué , | Laisser un commentaire

Introduction aux humanités numériques: méthodes et pratiques

Notes de lecture
Introduction aux humanités numériques : méthodes et pratiques

Seth van Hooland, Florence Gillet, Simon Hengchen, Max de Wilde
De Boeck supérieur, Louvain-la-Neuve, 2016, 208 p.
http://www.deboecksuperieur.com/ouvrage/9782807302150-introduction-aux-humanites-numeriques-methodes-et-pratiques

Ce petit ouvrage est un manuel méthodologique concernant les outils qui sous-tendent la pratique des humanités numériques. Destiné aux étudiants en sciences humaines il est particulièrement adapté à la découverte pédagogique des connaissances de base nécessaire à cette pratique mais il sera aussi utile à « l’honnête homme » qui veut s’informer sur celles-ci en un minimum de temps, en s’épargnant des lectures absconses et parfois peu utiles. C’est non seulement un « manuel » au plein sens du terme, mais également, à travers un site internet qui le complète (pas encore opérationnel à ce jour), un outil de « prise en main » des techniques exposées.

Le premier chapitre s’attache à présenter les soubassements technologiques de l’internet qui permettent d’accéder aux informations qui peuvent servir de sources aux humanités numériques. Il présente l’essentiel du fonctionnement de ces outils sans fioritures inutiles.

Le second chapitre s’attache à décrire les modèles de structure des données de manière synthétique. Il s’agit d’une synthèse remarquable et je ne résiste pas à vous livrer les deux tableaux clé qui résument ce chapitre
Van-Hooland_p-43_reformaté
Van-Hooland_p-77_reformaté

Le chapitre trois à pour titre « Numériser les sources ». On pourrait être surpris de voir un chapitre lié à la production des sources alors que l’ouvrage s’adresse en principe à des « exploiteurs » de sources, mais cela a tout son sens tellement ces processus de numérisation ont une incidence non négligeables sur l’accessibilité et la réutilisabilité des sources numérisées par les chercheurs. Le chapitre aborde successivement :

  • la problématique de la gestion du patrimoine numérique mondial,
  • la préparation à la numérisation,
  • le processus de numérisation, les métadonnées (qui offre une synthèse particulièrement éclairante sur les questions pratiques que ces dernières posent),
  • les outils de gestion des collections (qui sont présentés dans une optique particulièrement pertinente des contraintes temporelles liées à cette gestion, exprimée par les différents temps : long / intermédiaire / court)

Le chapitre 4 « Analyser le contenu » se recentre sur les outils de traitement des humanités numériques à proprement parler. Après une introduction sur les différentes problématiques que pose le traitement automatique des langues, le chapitre présente différents outils d’analyse lexicale et linguistique à travers différents exemples, qui illustrent les problématiques exposées théoriquement dans l’introduction du chapitre.

Le dernier chapitre traite du formatage et de la publication des résultats de la recherche issus des pratiques exposées dans les chapitres précédents. Il inclut :Le chapitre trois à pour titre « Numériser les sources ». On pourrait être surpris de voir un chapitre lié à la production des sources alors que l’ouvrage s’adresse en principe à des « exploiteurs » de sources, mais cela a tout son sens tellement ces processus de numérisation ont une incidence non négligeables sur l’accessibilité et la réutilisabilité des sources numérisées par les chercheurs. Le chapitre aborde successivement :

  • la problématique de la gestion du patrimoine numérique mondial,
  • la préparation à la numérisation,
  • le processus de numérisation, les métadonnées (qui offre une synthèse particulièrement éclairante sur les questions pratiques que ces dernières posent),
  • les outils de gestion des collections (qui sont présentés dans une optique particulièrement pertinente des contraintes temporelles liées à cette gestion, exprimée par les différents temps : long / intermédiaire / court)

Le chapitre 4 « Analyser le contenu » se recentre sur les outils de traitement des humanités numériques à proprement parler. Après une introduction sur les différentes problématiques que pose le traitement automatique des langues, le chapitre présente différents outils d’analyse lexicale et linguistique à travers différents exemples, qui illustrent les problématiques exposées théoriquement dans l’introduction du chapitre.

  • l’utilisation de traitements de textes dédiés à la recherche scientifique (par exemple LATex et Markdown),
  • l’utilisation de HTML pour la publication sur le Web,
  • les enjeux et les risques de la publication dans les nuages,
  • le bon usage des cookies,
  • les contraintes légales liées à différents domaines (droit d’auteur, protection des données personnelles, droit à l’image, publication open source, etc.)

L’ouvrage est complété par une bibliographie de base et d’un index. On peut regretter que les auteurs n’aient pas compilé un index des outils informatique présentés au fil de l’ouvrage. Cela sera peut-être disponible lors d’une prochaine édition.

Ce dernier point étant la seule critique à faire à cette publication, je ne peux que recommander son acquisition à toute personne voulant se lancer dans les humanités numériques. On peut souhaiter que leurs auteurs, s’attaquent à la rédaction d’un manuel similaire traitant des méthodologies de fonds des humanités numériques (forage des données, analyse des données, outils de visualisation, etc.).

Publié dans bonnes pratiques, Données ouvertes, Humanités numériques, Open data | Tagué , , , | Laisser un commentaire

Cinquante nuances de cycles de vie

NOTES DE LECTURE
Cinquante nuances de cycles de vie – Quelles évolutions possibles ?
Gilliane Kern, Sandra Holgado, Michel Cottin,
Les Cahiers du numérique, 2015/2 (Vol. 11), p. 37-76,
http://www.cairn.info/revue-les-cahiers-du-numerique-2015-2-page-37.htm

L’article de Gilliane Kern, Sandra Holgado et Michel Cottin va certainement faire date. Leur exploration méticuleuse des différentes conceptions du cycle de vie des documents en font une synthèse remarquable et permet d’en envisager l’évolution face aux mutations engendrées par le numérique. Une seule recommandation : lisez-le au plus vite !

Je reprends ci-dessous quelques unes de leurs observations les plus pertinentes et discute en fin de parcours du développement du records continuum dont on n’a pas encore, du moins dans le monde archivistique francophone, pris toute la mesure des conséquences.

En distinguant, dans le corpus étudié (1920-2010), les quatre groupes conceptuels des précurseurs, de la théorie des trois âges, du life cycle et du records continuum, les auteur(e)s offrent une grille d’analyse particulièrement pertinente. Ainsi, après avoir disséqué finement les tenants et les aboutissants de la théorie des trois âges, en rétablissant le fait qu’elle ne se fonde pas chez des précurseurs américains mais bien dans les année 60 sous l‘impulsion d’Yves Pérotin, ils notent que si elle s’est trouvée particulièrement bien adaptée à la gestion physique d’une masse documentaire analogique en accroissement, elle est de plus en plus mise en cause par le passage au numérique, où les notions de cycle de vie et de continuum semblent plus adéquats.

« Ainsi, si le modèle des « trois âges » permet de gérer le temps long dans une perspective archivistique et un environnement analogique, ces modèles de « cycle de vie » et de « continuum » permettent une granularité plus fine (c’est moi qui souligne), axée sur le document d’activité avec son potentiel d’utilisation historique. » et « Il n’y a plus nécessairement de représentation sous forme linéaire (avec des âges ou des phases), mais plutôt des « points de captures » » (p. 61 et 62).

Cette transition est expliquée en note (elle aurait probablement gagné à être plus amplement développée dans le corps du texte) par le glissement de la notion de dossier, passant d’un regroupement physique de pièces à un regroupement logique d’activités. Ce passage permettant de faire abstraction du support analogique/numérique.

« Si l’on reprend cette conception du dossier comme une unité contextuelle (j’aurais dit conceptuelle) et non comme une unité de manutention, il sera probablement plus facile de formaliser un parcours de vie pour chacune des ressources documentaires, ceci également dans un environnement numérique » (p 68).

C’est à mon point de vue là ou les auteur(e)s se sont arrêté(e)s trop tôt en disant « ce qui compte c’est la clôture de l’affaire […] et donc du dossier afférent ». L’affirmation n’est pas fausse mais elle justement remise en cause par la théorie du records continuum. En effet, si l’on reprend le schéma d’Upward (fig. 4 de l’article), que l’on peut le lire classiquement comme un tableau à trois dimensions spatiales (synchroniques) liant ses différentes composantes, mais qui peut/doit se lire aussi dans ses dimensions temporelles (chronologique). Cela rend compte plus précisément encore de la complexification naturelle de la production documentaire de ces dernières décennies.

Dans les deux annexes ci-jointes je livre une analyse faite à titre d’exercice dans le cadre de mon certificat en archivistique, que je n’ai pas eu l’occasion de publier à ce jour, et qui rend précisément compte de cet aspect chronologique. Il se présente sous deux formats, selon que l’on suive l’ordonnancement original des dimensions explicitées par Upward et McKemmish (Le record continuum 2015), avec un ajout d’une dimension 0 que j’explicite ci-dessous; et un format dynamique qui met en évidence une vision selon les différents axes (Le record continuum.ppt).

Compte tenu de l’évolution numérique actuelle (mon schéma date de 2004) il me semble qu’une série d’éléments d’une granularité plus fine (comme indiqué plus haut) devrait être ajoutée au quadruplet de la 1ère dimension exposée par Upward. Ainsi on aurait le tableau suivant (les termes choisis pour la dimension 0 restent à discuter) :

Dimension 1 Dimension 0
Acteurs Agents intelligents (informatique)
Actes Actions élémentaires (triplets)
Traces Enregistrement / Captures
Documents Données

En explicitant correctement les rapports entre ces nouvelles paires on peut raisonnablement penser pouvoir construire une articulation qui permettrait de gérer données et documents de manière archivistiquement harmonieuse et non ambigüe, mais ce travail reste à faire. Pour quelques pistes de réflexion dans ce sens, voir :

Collecter et organiser à l’ère de l’administration électronique : Données – Documents – Transactions
Actes des 11ème Journées des archives de l’Université Catholique de Louvain (UCL)
Dématérialisation des archives et métiers de l’archiviste. Les chantiers du numérique.
Louvain-la-Neuve, 24 et 25 mars 2011, Academia-Bruyland, juin 2012, pp. 60-73.
http://www.uclouvain.be/232161.html http://www.uclouvain.be/416589.html
Accessible sur @rchivesic : http://archivesic.ccsd.cnrs.fr/sic_00723874

Les genres documentaires sont-ils dissous dans le numérique ou peuvent-ils y résister ?
In : Les genres de documents dans les organisations
Sous la direction de Louise Gagnon-Arguin, Sabine Mas et Dominique Maurel
Presse de l’université de Québec, 2015, p. 129-143.
http://www.puq.ca/catalogue/livres/les-genres-documents-dans-les-organisations-2405.html
Compte-rendu : http://transarchivistique.fr/les-genres-de-documents/

Pour ceux qui sont proches de la région genevoise, les auteur(e)s seront présent(e)s pour en discuter au Forum des archivistes genevois, le 12 octobre 2015 de 16h à 18h (http://www.forumdesarchivistes.ch/prochaines-rencontres/).

 

Publié dans archivage numérique, Cycle de vie des documents, document, données, Records continuum, records management, Théorie des trois âges | Tagué , , | Laisser un commentaire

Genres et dispositifs de médiation numérique et régimes de documentalité

NOTES DE LECTURE
Les genres de documents dans les organisations
Sous la direction de Louise Gagnon-Arguin, Sabine Mas et Dominique Maurel
Presse universitaire du Québec, 2015
(Chapitre 8, p. 145-184)

Manuel Zacklad ferme la marche de cet ouvrage avec un chapitre imposant, qui, en même temps qu’une conclusion, forme en quelque sorte un programme de travail futur de la réflexion sur les genres documentaires. Il attaque le problème sous l’angle du dispositif, ce qui permet de couvrir tous le champ documentaire y compris les nouvelles formes induites par l’information.

Il identifie 5 formes de dispositifs de médiation documentaire numérique :

  • Diffusionnelle
  • Rédactionnelle
  • Contributive
  • Attentionnelle en mode de flux
  • Transmédia

Il précise que : « un dispositif de médiation documentaire ne correspond pas à un artefact singulier, mais désigne le processus de médiation opéré par une série d’artefacts médiateurs dans un flux transactionnel reliant des réalisateurs et des bénéficiaires engagés dans une série d’actions conjointes. » Dans ce sens il adhère aux définitions du genre présentées antérieurement, qui lient les documents aux processus et aux acteurs de ces processus.

Il développe ensuite une théorie du document (partie 1) basée sur le concept de transaction qui correspond à « … des interactions productives […] entraînant la transformation d’un artefact médiateur et des personnes parties prenante pour réaliser une performance. Une organisation peut être définie comme un ensemble de programmes transactionnels récurrents constituant des flux transactionnels qui obéissent à un ensemble de conventions et de règles dans un contexte donné ».

« Quant les artefacts médiateur ont un support pérenne qui leur permet de circuler dans l’espace et le temps, ils ont potentiellement le statut de document. Mais tous les artefacts circulant ne sont pas des documents. Dans le cas le plus classique, le support doit pouvoir faire l’objet d’une transcription ou d’un enregistrement, mais surtout il doit ensuite faire l’objet d’une documentarisation. La documentarisation correspond à des à des opérations particulières qui visent à permettre la réutilisation du support dans le cadre de transactions ultérieures de la personne avec elle-même ou avec d’autre personnes, c’est–à-dire rendre possible la mémorisation et la coordination ».

Il distingue ensuite une documentarisation interne « … qui vise à mettre en cohérence et à articuler les différent fragments qui constituent le « texte » ou plus généralement la « production sémiotique » sachant que celle-ci peut être audio ou vidéo, de la documentarisation externe qui vise à mettre en relation un support avec d’autres supports, un document avec d’autre documents ». En terme archivistique nous parlerions de diplomatique et de cohérence des fonds.

« La prise en compte de l’architecture renvoie ainsi à la perspective du support. […] dans l’étude des médias numériques, il convient plutôt de parler d’un « environnement support » dans lequel s’imbriquent quatre plans indépendants, celui du terminal physique, du système d’exploitation, des applications et du réseau ». Ils sont articulés selon le modèle conceptuel suivant :

  • Le répertoire des participants contient la représentation des participants et l’organisation des connaissances associées. […] Cette organisation des connaissances permet d’exprimer la sémantique des relations entre les participants et le statut auctorial.
  • Le répertoire des fragments-correspond au stockage des fragments de production textuelle ou multimédia et à l’organisation des connaissances associées […]. Le répertoire des fragments peut être associé à une interface permettant de les manipuler indépendamment de leur « édition » dans les interfaces d’interaction.
  • L’espace d’interaction correspond aux interfaces homme-machine qui permettent l’édition et la lecture des fragments documentaires.
  • La représentation de la situation et du contexte transactionnel correspond à la définition d’un système de coordonnées permettant d’exprimer les éléments liés à la situation d’interaction (p. ex.. temporalité, localisation…) et à son contexte (p. ex. pays, langue…).

Sur cette architecture de base, Zacklad revient sur la notion de Document pour l’action (DoPA) défini comme : « des documents qui soutiennent de manière évolutive les transactions coopératives coopérative d’un collectif, dont le support est pérenne, qui sont marqués par un inachèvement prolongé, voire intrinsèque, par une grande fragmentation et par une distribution complexe des contributions des rédacteurs-lecteurs. »

« Dans le régime classique de la documentalité, […], il existe une séparation tranchée et asymétrique entre les participants à la transaction, auteurs d’un côté lecteurs de l’autre t une dissociation d la temporalité de leurs activités. A l’inverse, le régime de documentent pour l’action symétrise les rôles des participants à la transaction et les temporalités en accroissant l’interactivité.   […] Le macrorégime de documentalité du DoPA recouvre en fait une multiplicité d’évolutions du régime de la documentalité numériques » que Zacklad développe dans une deuxième partie. Tout ce qu’il dit des documents pour l’action peut être transcrit en documents d’activité tels qu’ils sont définis dans les normes sur le records management.

Le régime de distribution
Se réparti entre un microrégime de circulation documentaire et un microrégime de la publication documentaire. Exprimé techniquement par le « push » (circulation) et le « pull » (publication).

Le régime d’autonomie
Différencie les documents qui ne sont accessibles qu’en mode connecté et des documents autonomes qui peuvent être dupliqués sur le terminal et être édités en mode déconnectés.

Le régime de granularité et de fragmentation
Selon leur degré de granularité on peut distinguer trois types de granularité/fragmentation :

  • Des documents dont la version finale est censée apparaître comme ayant été écrite d’un seul tenant.
  • Des documents dont la dimension dialogale est revendiquée
  • Des documents ou des collections de micro-documents dont les fragments sont de petite taille et qui n’ont pas pour vocation d’être articulé de manière dialogale.

Le régime de référentialité
La référentialité correspond d’une part, à la facilité avec laquelle le document ou les fragments qui le compose peuvent être rendus accessibles dans un réseau [] et, d’autre part, à la permanence de cette référence.

En facilitant considérablement l’accès aux documents et aux fragments de contenus actualisés, les nouveaux régimes de référentialité du numérique sont au cœur de la fluidité documentaires des régimes de la publication et de la circulation qui conditionnent la quasi-totalité des usages actuels.

Le régime d’interactivité
L’interactivité est un attribut des documents numériques qui exploitent des programmes informatiques pour répondre dynamiquement aux actions des utilisateurs en affichant de nouveaux contenus.

Le régime de conversationnalité
Un document interactif et conversationnel, en plus d’adapter son contenu, évolue en permanence sur la base des nouvelles données et des nouveaux contenus saisis par l’utilisateur.

Zacklad donne deux tableaux qui combinent les régimes de circulation et d’autonomie, ainsi que les régimes de conversationnalité et d’interactivité, mais ne croise pas les autres régimes entre eux.

Il conclu cette partie en développant la signification des transactions en l’introduisant ainsi : « Si bien avant la naissance du numérique, tous les documents du fait de leur statut d’artefacts médiateurs ont bien une dimension transactionnelle ou communicationnelle, ils ne sont pas nécessairement interactifs ni conversationnels. La conversationnalité, qui permet la mise à jour rapide des contenus par un collectif distribué dans une logique plus ou moins dialogale au cœur de nombreux dispositifs de médiation documentaires, est une spécificité inédite des nouveaux régimes de documentalité du numérique. ».

A mon point de vue, ce qu’il appelle ici conversation et/ou dialogue ressort pour moi de ce que j’appelle infomationnel et ne ressort pas de la documentalité (que je défini il est vrai au sens fort « d’arrêt sur l’image », si possible intangible pour pouvoir assurer un régime de preuve).

Il défini plus avant les régimes des transactions coopératives.

« Quand l’activité collective relève de la coopération, nous considérons qu’elle s’inscrit dans trois régimes correspondant à trois formes de comportements collectifs stéréotypé :

  • Le régime de coopération organisée correspondant […] aux organisations formelles, dans lesquels les activités et les rôles ont fait l’objet d’une normalisation explicite […] ;
  • Le régime de coopération communautaire qui correspond aux comportements collectifs associés aux communautés de pratique […] sans formalisation a priori […] ;
  • Le régime de coopération spontanée correspondant aux comportements collectifs associés aux groupes engagés dans des activités focalisées (rapides et courtes). »

Il associe ces régimes à trois types de rationalité (en mettant en garde sur la formulation simplificatrice de ce rattachement).

  • Coopération organisée, donnant priorité au contenu selon une rationalité substantive ;
  • Coopération communautaire, donnant priorité aux apprentissages, selon une rationalité procédurale ;
  • Coopération spontanée, donnant priorité aux relations, selon une rationalité agentive.

Ce volet se termine sur une considération à propos de la synchonisation temporelle mais dont une composante est également spatiale en disant : « On croise généralement la dimension de la temporalité avec celle de l’espace en distinguant, d’une part, des interactions colocalisées versus à distance, dimension spatiale et, d’autre part synchrone versus asynchrone, dimension temporelle. »

La troisième et dernière partie tente de faire la synthèse de ce qui précède en formulant cinq dispositifs de médiation documentaire numérique.

1/ Dispositifs de médiation diffusionnelle
C’est celui qui illustre le mieux la pervasivité des supports numériques. Ce dispositif fait appel aux deux régimes de documentalité de la circulation et de la diffusion (push et pull). Ce dispositif est caractérisé par des documents à gros grain et des interactions fortement asynchrones.

Zacklad_Fig_8.4

Dans ce cadre c’est la sémantique du répertoire de fragments qui occupe la place centrale. Deux grandes modalités d’organisation des connaissances concurrentes sont mobilisées :

  • Une organisation linguistique des connaissances dans les thésaurus et les arborescences utilisées par les systèmes de GED.
  • Une indexation algorithmique à l’aide de moteurs de recherche qui peut bénéficier de l’aide de technologie sophistiquées pour les moteurs d’entreprise spécialisés.

 

2/ Dispositifs de médiation rédactionnelle
Les dispositifs qui médiatisent la rédaction coopérative, ou plus généralement la production collaborative de contenus, peuvent relever du régime de la circulation et exploitent la granularité et la conversationnalité des documents numériques.

Zacklad_Fig_8.5

 

3/ Dispositifs de médiation contributive
Les dispositifs documentaires de médiation contributive sont représentatifs des usages du Web qui exploitent simultanément le régime de la publication conversationnelle, la granularité des espaces d’interaction qui permet de les structurer et de susciter différents scénarios transactionnels et, enfin, l’interactivité et la référentialité qui permettent d’offrir des contenus multimédias interactifs tout en tirant parti du système d’hyperliens du Web.

Pour la création et la gestion des relations médiatisées, la sémantique du répertoire d’acteurs et toujours importante.

4/ Dispositifs de médiation attentionnelle en mode flux
La médiation attentionnelle en mode flux résulte avant tout d’une intensification des dispositifs contributifs et sur l’émergence de plateformes en position quasi monopolistique qui centralisent les contributions de dizaines de millions d’utilisateurs dont les principales sont à l’heure actuelle Facebook, Twitter, Google Plus, mais également YouTube envisagé sous l’angle de certains usages.

La propriété la plus marquante du dispositif de flux est la granularité très fine des contributions.

La question de savoir si les contributions à ces grandes plateformes de réseaux sociaux relèvent bien de l’ordre documentaire peut se poser. Zacklad déduit que leur nature transactionnelle les assimile bien à cet ordre. L’archivage de Twitter par la Bibliothèque du Congrès laisse entendre que la plateforme est bien reconnue comme telle. Cependant, après plusieurs années, les équipes de la Bibliothèque peinent à mettre à disposition les outils qui permettraient de les exploiter de manière archivistique.

Les différentes modalités transactionnelles font que les usages peuvent fluctuer entre des régimes transactionnels non coopératif jusqu’au régime de transaction spontané, en passant par un régime communautaire où les participants s’engagent dans la durée pour la poursuite de buts communs.

5/ Dispositifs de médiation transmédia et de transmédia ancré
Dans une logique pour partie opposées à la pression monopolistique du régime de flux, la documentalité transmédia consiste à créer de nouveaux documents granulaires et interactifs à partir du rassemblement d’une diversité de documents existants et de fragments documentaires répartis dans des environnements hétérogènes. Les évolutions actuelles mettent plutôt l’accent sur la cohérence narrative ou logique des contenus rassemblés et sur leur ouverture sur l’environnement extra-documentaire. Cette extension se fait sur la base d’une acception différente de la notion de média en tant qu’artefact médiateur inséré dans une transaction et pas au sens économique de canal de distribution.

Plus généralement, dans le contexte de la publication « orientée données », les enjeux liés aux données ouvertes (open data), dont l’intégration est facilités par la mise à disposition d’URI permettant un accès public par le Web, contribuent à faciliter l’accès à des variables élémentaires et à leur valeur actualisée.

La notion de « dispositif transmédia ancré » que Zaclad introduit ici pour la première fois, étend le transmédia documentaire en ancrant une partie du contenu dans le contexte spatio-temporel externe d’utilisation des documents. Pour ce faire, ils utilisent des références indexicales à ces situations, des déictiques ou des codes faisant directement référence à des objets extra-documentaires. Elle concerne aujourd’hui tous les documents « orientés contenus » (comme extension des documents « orientés données »), C’est-à-dire qui associent une description libre des éléments de codification. Comme exemple d’une telle évolution il cite le passage de la carte routière aux documents interactifs et conversationnels que constituent les systèmes GPS.

Bien qu’il prenne bien en compte la granularité dans le cadre de ses catégorisations, Zacklad considère que les granularités fines restent du domaine documentaire, alors que personnellement j’incline à penser que l’on passe alors dans le monde de la données et donc dans une modalité informationnelle.

Dans sa conclusion, Zacklad choisi l’exemple d’un module de formation et sa déclinaison dans les différents dispositifs de médiation théorisés plus haut, pour constater in fine : « Cependant, malgré la profusion des environnements documentaires aujourd’hui disponibles, force est de constater que l’organisation et l’architecture des connaissances sur lesquels ils s’appuient sont à la fois hétérogène, clivées et peu évolutives » (c’est moi qui souligne). Il tente une explication en disant : « Ces difficultés témoignent du fait qu’il reste encore beaucoup à faire dans la recherche et l’innovation sur les dispositifs de médiation numérique et sur les nouveaux régimes de documentalité sur lesquels ils s’appuient. […] manifestant l’absence de cadre conceptuel unifié permettant d’analyser les modalités de « documédiatisation » de l’activité collectives autrement qu’en mobilisant des catégories ad hoc […]. »

Les difficultés rencontrées dans sa volonté de conceptualisation de la totalité de la production documentaire sous toutes ses formes, effort louable s’il en est, montre indubitablement que la conceptualisation intégrant les productions documentaires et leur processus de production, qui est un présupposé de la théorie du genre, n’a pas encore atteint sa forme idéale. L’avantage de sa contribution est qu’elle couvre tout le champ mais peut-être que celui-ci devrait être segmenté en unité plus homogène pour amener à des concepts maîtrisables et opérationnels dans la gestion documentaire de tous les jours.

Publié dans archivage numérique, Données liées (linked data), Données ouvertes, genre documentaire | Tagué , , , | Laisser un commentaire

Genre de documents et systèmes d’information Web

NOTES DE LECTURE
Les genres de documents dans les organisations
Sous la direction de Louise Gagnon-Arguin, Sabine Mas et Dominique Maurel
Presse universitaire du Québec, 2014
(chapitre 6, p. 106-128)

Aïda Chebbi a fait sa thèse sur l’Archivage du Web organisationnel dans une perspective archivistique, Université de Montréal, 2013, http://hdl.handle.net/1866/9203, auquel on peut se référer pour compléter ce qu’elle nous livre dans cet ouvrage.

Dans ce chapitre elle examine l’impact du Web sur les genres des documents préexistant et les nouveaux genres que le Web engendre.
Elle commence par le constat que « En faisant appel aux technologies du Web pour conduire leurs affaires, les organisations produisent également de nouveaux types de documents propres au Web. Ces documents doivent être capturés et gérés dans les systèmes documentaires pour les besoins et la continuité des affaires, de préservation de la traçabilité des activités en ligne des organisations, voire pour les besoins de l’histoire et de l’information. » Elle continue en disant « De nouveaux genres de documents coexistent dans les systèmes d’information organisationnels imposant des méthodes de gestion et de conservation adaptées pour mieux répondre aux besoins d’information et de preuve actuel et futurs ». […] « Toutefois les frontières entre publication et document d’archives restent bien floues et ont une incidence sur la définition des territoires de collecte. »

En signalant que les documents du Web doivent être capturés dans les systèmes documentaires, elle sous-entend que le Web n’est pas un système documentaire. Comme elle revient plus tard sur la notion du Web en tant que plateforme de publication concurremment à celle de plateforme documentaire, on voit transparaître ici ce que j’appelle le domaine documentaire et le domaine informationnel et que je détaillerai dans mon prochain billet.

Elle entre ensuite dans le détail de l’émergence des nouveaux genres de documents suscités par le Web. Commençant par des citations de la littérature, elle précise : « Grâce à l’usage des outils informatiques et des réseaux de télécommunication, les supports numériques autorisent la superposition, la multiplication et la transformation de plusieurs genres existant. […] Ce qui favorise l’a production de genres confus ou blurred genres…[…] Un même genre numérique peut parfois remplir plusieurs fonctions selon le contexte d’utilisation ».

On voit ici l’intérêt de la notion de genre car elle permet de « pister » ces glissements et d’éventuellement répondre à cette transformation de manière adéquate en matière de gestion documentaire.

L’auteure détaille ensuite plus précisément les genres Web ou cybergenres (je trouve ce dernier terme inadéquat et m’en explique plus loin). Là aussi, elle souligne les difficultés que posent le monde du Web en matière documentaire : « Les documents Web sont composites, hybrides et complexes (c’est moi qui souligne) ce qui rend difficile toute tentative d’identification ou de classification des nouveaux corpus documentaire. […] Les genres Web se caractérisent par un contenu et une forme générés à la volée. […] L’attribut « forme » n’est plus un attribut déterminant pour la distinction entre les genres Web, alors que l’attribut « but » demeure essentiel pour différencier et analyser les genres Web ».

Cette dernière remarque fonde une piste intéressante bien qu’elle souligne qu’il n’y ait pas uniformité d’opinons s’il faut considérer les « buts » du point de vue du créateur du document ou de ses utilisateurs. Il me semble que cette prépondérance du but sur la forme peut se généraliser à tous les documents numériques mais devrait faire l’objet d’une investigation plus poussée pour être vraiment opérationnelle.

Elle présente ensuite un tableau qui résume les principaux genres Web avec leur caractéristiques (transposé de genre existant, hybride, purement Web) retrouvés dans la littérature avec la référence aux auteurs.

Elle passe ensuite à une autre problématique qui est celle de l’archivage du Web. Après une introduction où elle indique que « le Web ne dispose pas des fonctionnalités essentielles au maintien de la permanence et de l’intégrité des documents qu’il véhicule (Barry, 2004) elle utilise l’enquête menée pour sa thèse pour exposer les principales propriétés des archives Web (universitaires ou gouvernementales).

Elle identifie trois catégories de documents :

  • Les documents qui ont migré sur le site Web en conservant les propriétés de la version originale du document.
  • Les documents qui présentent une forme renouvelée ayant conservé la structure et les finalités des documents similaires.
  • De nouveaux documents émergent qui semblent ne se rattacher à aucun type d’archives connu et dont le destin est à inventer.

En exploitant les résultats de ses recherches elle indique que la répartition entre les documents de gestion (relatifs aux activités de gestion administrative dans une organisation) et les documents de fonction (relatifs à la mission propre de l’organisme) s’établi sur un ratio de 30% / 70%. Cela correspond à ce qui existe en général dans les archives papier (les archives du centre hospitalier universitaire que je gère à un ratio 20% / 80%).

Plus loin elle distingue cinq principaux modes de création :

  1. Documents initialement créés sur un support papier, qui ont été numérisés et convertis en format plus approprié pour une diffusion Web (p. ex. PDF, JPEG).
  2. Documents produits par des suites bureautiques et diffusés dans leur format natif (p. ex. DOT, DOC, XLS, PPT).
  3. Documents produits par des suites multimédias (p. ex. animation Flash Player). Bien qu’ils soient produits pour le site Web, ces documents ne se présentent pas au format HTML.
  4. Documents générés par les éditeurs Web ou (5) des systèmes de gestion de contenu. Il s’agit de pages Web développées grâce à un langage de balisage.
    (pour le détail on peut se reporter au chapitre 4.2.2. de sa thèse).

Cette typologie confirme une de mes hypothèses en ce qui concerne la (les) typologie (s) de documents exposée dans mon article de 2004) qui me faisais dire que la seule typologie opérationnelle à ce jour pour les documents numérique était celle des extensions des documents, qui les assimilent aux applications qui les produisent.

Elle liste ensuite les documents Web qui constituent un genre nouveau (11 genres identifiés), complétés par ceux dégagés par les politiques d’archivage du Web (également 11 genres, relatifs plus à l’ordre des métadonnées et de la gestion des sites plutôt qu’à la typologie des documents).

En guise de conclusion, elle pose la question de la frontière entre les archives Web et la publication en ligne. Il est significatif que la plupart des pays qui ont mis en place des politiques d’archivage du Web ont confié cette tâche à leurs bibliothèques nationales (ou des institutions similaires). Elle pose explicitement la question : « Où se situent les frontière entre une publication en ligne et des archives Web dans un environnement documentaire où les documents produits et diffusés sur le Web ont un statut de document public (accessible à tous) et présentent les mêmes caractéristiques techniques et de forme ? » Elle présente certaine politiques qui répondent à cette question, sans dégager une bonne pratique universelle à ce sujet (tout en ne répondant pas de manière générale à la question, sa thèse présente d’autres développements à propos des politiques d’archivage des sites Web qui peuvent alimenter cette réflexion).

Elle dit « Pour conclure, un site Web public est un objet documentaire complexe et protéiforme, une forme documentaire à part entière dont les composantes documentaires et technologiques ainsi que les fonctionnalités sont aussi variées que différentes. […] « Souvent confondu avec son média, un site Web organisationnel n’est pas considéré comme un produit documentaire issu des activités d’une organisation. […] Même si certains de ces documents se retrouvent dans d’autres systèmes documentaires, leur édition/publication sur un site Web leur procure des propriétés de forme et de but ainsi que des fonctionnalités qui les distinguent des documents originaux, […] La valeur qu’il [le site web] représente pour l’organisme producteur et celle qui pourrait servir les besoins d’information et de recherche ne sont pas encore généralement admises. »

On peut regretter que ce chapitre soit en quelque sorte un « digest » de la thèse d’Aïda Chebbi. Bien qu’elle souligne la nouveauté intrinsèque des documents du Web en terme de genre et qu’elle pose des questions qui ouvrent des perspectives intéressantes, elle apporte peu de réponses. Une autre problématique importante à mes yeux n’est pas traitée, ce que j’appelle « l’effet portail » soit le fait que les utilisateurs accèdent via un même écran à des documents dont la nature et les statuts sont différents et « mixent » des documents institutionnels, des informations issues d’internet, des pages constituées à la volées, sans que la nature de ceux-ci ne soit explicite, ce qui ajoute à la confusion de genre qu’évoque Anne-Marie Chabin dans le chapitre initial de l’ouvrage.

A propos du cybergenre
C’est Michael Shepherd (et al.) qui a introduit le terme dans son article « The Evolution of Cybergenres » en 1998 (http://web.cs.dal.ca/~shepherd/pubs/evolution.pdf) mais il ne le défini pas précisément puisqu’il en dit ”We define cybergenre as two main classes of subgenres, extant and novel. The class of extant subgenres consists of those based on genre existing in other media, such as paper or video, that have migrated to this new medium. The class of novel subgenres consists of those genres that have developed in this new medium and have no real counterpart in another medium”. Par défaut le cybergenre est donc un genre n’existant pas antérieurement.
Shepherd ne le défini pas plus dans son article plus récent de 2004 : « Cybergenre : Automatic identification of home pages on the Web », Journal of Web Engineering, vol 3, nos 3-4, p. 236-251, http://web.cs.dal.ca/~kennedy/cybergenre.pdf, puisqu’il reprend le même schéma avec les sous-genres « existant » et « nouveau ». Il aurait donc pu se passer du préfixe « cyber » dont le sens étymologique est tiré du terme grec « kybernetes » qui a le sens de pilote et qui a été introduit par Norbert Wiener en faisant référence aux processus de rétroaction mis en œuvre en informatique. Ce préfixe a depuis été utilisé à contre-sens pour signifier toute évolution des activités humaines modifiées par l’informatique puis par Internet.
S’il devait être utilisé, le terme cybergenre ne devrait pas l’être exclusivement dans le domaine du web mais à propos de tous les documents nés numériques. A tout le moins, il mériterait une définition un peu plus consistante et cohérente.

Publié dans archivage numérique, genre documentaire, Internet, Typologie des documents | Tagué , | 1 commentaire

Les genres de documents dans les organisations

Sous ce titre, Louise Gagnon-Arguin et ses collègues de l’Ecole de bibliothécaire et des sciences de l’information de Montréal publie un ouvrage collectif pour pallier un manque de textes de base à propos du genre documentaire dans le monde francophone, alors que cette thématique a pris de l’ampleur dès les années 90 dans le monde documentaire anglophone. L’ouvrage est disponible aux Presse universitaires du Québec ici: http://www.puq.ca/catalogue/livres/les-genres-documents-dans-les-organisations-2405.html

Chacun des auteurs invités, dont j’ai le privilège de faire partie, a travaillé de manière indépendante mais néanmoins assez convergentes sous la houlette de ses dynamiques rédactrices.

Je me ferai un plaisir de rédiger un billet sur chacun des chapitres de cet ouvrage, dont je recommande l’acquisition à tous les intéressé.

Vous retrouverez donc ces thèmes ces prochaines semaines.

  1. Théorie des genres et records management (Anne-Marie Chabin)
  2. Apport de grilles d’analyse de la notion de genre aux études diplomatique et archivistique des documents numériques dans les organisations (Sabine Mas)
  3. Caractérisation du genre des textes administratifs dans les environnements numériques de travail (Inge Alberts)
  4. Genres de documents et coordination des activités dans les organisations (Dominique Maurel / Sabine Mas)
  5. Genres de documents et systèmes d’information Web (Aïda Chebbi)
  6. Genre documentaire et numérique: dissolution ou résistance (Jean-Daniel Zeller)
  7. Genre de dispositifs de médiation numérique et régimes de documentalité (Manuel Zacklad)
Publié dans Diplomatique numérique, genre documentaire | Laisser un commentaire

Apport de grilles d’analyse de la notion de genre aux études diplomatique et archivistique des documents numériques dans les organisations

NOTES DE LECTURE
Les genres de documents dans les organisations
Sous la direction de Louise Gagnon-Arguin, Sabine Mas et Dominique Maurel
Presse universitaire du Québec, 2015

(chapitre 2, p. 29-48)

Dans ce chapitre, Sabine Mas complète les premières définitions apportées précédemment par Marie-Anne Chabin en présentant les différentes grilles d’analyse typologiques selon leur apparition chronologique.

Elle détaille donc la vision diplomatique, qui s’attache principalement au document, puis à l’analyse archivistique qui s’oriente plus sur les systèmes de documents, en s’appuyant sur les dix principaux éléments d’analyse des documents exposés par Gagnon-Arguin (1998 et 2001) et en soulignant le fait que cette grille a été élaborée dans un contexte papier. Enfin elle présente les différents systèmes de genres proposés par différents auteurs à partir des années 1980.

Les grilles d’analyse présentées sont celle de :

Yoshioka et Herman, qui identifient six dimensions à partir des propositions antérieures de Orlikowsky et Yates. Ces six dimensions répondent aux questions : Pourquoi ? – Quoi ? Par qui ?/Pour qui ? – Quand ? – Où ? –  Comment ? et seront développés dans les chapitre suivants.

Tyrväinen et Päivärinta qui proposent une grille de onze facettes avec un regroupement de ces facettes en quatre ensembles, basé sur le cycle de vie du document :

  • Production (But de la production – Enregistrement (consignation) des contenus – Durée de vie prévue – Structure produite)
  • Utilisation (But de l’utilisation – Période visée par les observations)
  • Traitement (Traitement pour la consultation – Changement aux documents)
  • Entreposage (Architecture du document – Critères pour définir les unités documentaires – Support)

Selon Mas, tous les auteurs récents cités reconnaissent que le passage au numérique engendre des modifications et des mises en cause des modèles proposés, sans toutefois entrer dans le détail de la nature de ces mises en cause et aux moyens d’y remédier.

Dans sa conclusion, elle indique que « la diplomatique et l’archivistique s’intéressent aux éléments universels et durables des documents et privilégient l’analyse des documents crées dans des contextes bureaucratique plus stables et structurés que les systèmes de gestion des documents numériques. » Elle estime cependant que « la notion de genre fournit des outils pour obtenir des informations de la part des acteurs dans le processus de création. […] D’où l’intérêt de compléter, à l’aide de grilles élaborées sous l’angle de la notion de genre, les grilles d’analyse des documents des organisations déjà bâtie dans un contexte archivistique. »

Bien qu’elle revienne plus en détail, en collaboration avec Dominique Maurel, sur la faisabilité d’utiliser la grille d’analyse du genre dans les chapitres suivants, je reste sur ma faim quant à sa conclusion. Premièrement, il n’y a plus lieu aujourd’hui d’opposer le contexte bureaucratique et les systèmes numériques. Ces derniers ont largement été adoptés par les administrations et les systèmes numériques sont les systèmes bureaucratiques, même si par ailleurs ils présentent des failles qu’il est concevable de combler par l’analyse des genres. Ce qui me mène à ma deuxième interrogation. Les grilles proposées, si elles ont un peu plus complètes que les grilles d’analyse archivistique, principalement en ce qui concerne le contexte de production des documents, ne me paraissent pas apporter un avantage significatif pour la gestion des documents à long terme. Elles ne semblent pas donner non plus d’avantage décisif pour traiter les nouveaux documents numériques, sous réserve des analyses portant sur les applications informatiques en tant que genre (web, messagerie, etc.), j’y reviendrai dans mes commentaires des chapitres traitant de la messagerie (Inge Alberts) ou du web (Aïda Chebbi). Dans ma pratique de constitution de calendrier de conservation, cela fait de longues années que j’intègre les questions proposées par Yoshioka et Herman dans le cadre de mes enquêtes dans les services producteurs, bien que je n’aie pas lu ces auteurs avant la publication de cet ouvrage.

Publié dans archivistique, genre documentaire, Typologie des documents | Tagué | 1 commentaire

Théorie des genres et records management

NOTES DE LECTURE
Les genres de documents dans les organisations
Sous la direction de Louise Gagnon-Arguin, Sabine Mas et Dominique Maurel
Presse universitaire du Québec, 2015

(chapitre 1, p. 7-27)

C’est Marie-Anne Chabin qui ouvre cet ouvrage avec un chapitre en deux parties qui permettent d’introduire la problématique. La première partie est consacrée à l’analyse du vocabulaire autour du genre, de la typologie, et des termes associés (type de document, famille de documents, titre ou nom des documents, etc.).

Son premier constat est que la notion de genre appliquée au document est relativement récente alors que les notions introduites par la diplomatique puis l’archivistique contemporaine sont plus anciennes. Elle met en évidence que la diplomatique s’attache principalement à la forme bien que celle-ci soit une conséquence des usages, tout en reconnaissant que le concept de forme reste flou ou trop large, et cela a pour conséquence, c’est moi qui souligne, une imprécision dommageable que le choc du numérique rend encore plus prégnant comme elle le souligne dans l’exemple suivant. « L’article 1316-1 du Code civil français introduit en 2000 pour la reconnaissance légale de l’écrit électronique, on note que le mot forme est en quelque sorte opposé à support sans que son sens soit précisé : « L’écrit sous forme électronique est admis en preuve au même titre que l’écrit sous forme papier, sous réserve. » Pourquoi ne pas avoir dit « support électronique » ? ». Il est clair qu’avec de telles ambiguïtés au sein même des textes réglementaires censés assurer la certitude du droit, on a du souci à se faire !

Le raisonnement continue par le constat que l’archivistique contemporaine s’attache aujourd’hui plus au type de document qu’à leur forme, ce qui a le mérite d’un langage clair et compréhensible. Continuant son exploration définitoire elle cite la définition du type de document du glossaire du PIAF (http://www.piaf-archives.org/espace-formation/mod/resource/view.php?id=22) : « Catégorie de documents distingué en raison de critères communs, matériels (par ex. aquarelle, dessin) ou fonctionnels (par ex. journal, livre de compte, main courante, registre de délibération …) (c’est moi qui souligne, j’y reviendrai plus loin). Elle revient aussi sur la typologie de documents sollicitée pour les tableaux de tri et de conservation pour souligner que, ici aussi, la terminologie est hésitante.

S’appuyant sur les livres de Louise Gagnon-Arguin, elle identifie les critères qui permettraient de développer une typologie opérationnelle. Parmi ceux-ci, une typologie en deux niveaux, une distinction systématique entre le « dossier de travail » et « dossier principal » (question : le dossier est–il un type de document ?), et finalement le croisement d’une thématique (domaine, processus) et une valeur (officiel vs interne). Elle cite enfin la norme ISO 15489 et la norme ICA-Req qui exposent des définitions un peu divergentes.

A travers une citation de mon article de 2008 () elle met en évidence deux points : le fait que les typologies doivent tenir compte des aspects externes (formats, support) et des aspects internes (structure, validation). Elle l’interprète en termes de fusion entre ces deux dimensions alors qu’aujourd’hui je mettrais personnellement plutôt l’accent sur la distinction ou la clarification. Sa réflexion, liée au nombre croissant de type de document (elle cite 500 à 1000 types de document dans une entreprise, je confirme jusqu’à 3000 types dans un grand hôpital universitaire) l’amène à se poser la question de savoir si le genre n’est pas plus pertinent que le type dans le monde numérique, voire dans le monde documentaire. Elle conclu cette première partie par le constat que « Les types de documents se multiplient et s’atomisent au point d’anéantir la notion même de typologie documentaire, tandis que les genres qui décriraient les caractéristiques communes de documents sur le plan de la forme, du contenu et de la fonction ne sont pas encore ou pas suffisamment définis et illustrés. »

 A mon point de vue cette multiplication des types reste néanmoins maîtrisable en utilisant les grands groupes de documents liés aux usages, tels qu’ils sont définis dans les ouvrages de Gagnon-Arguin. C’est ce que suggère également la structuration du workflow décisionnel mis en place aux Hôpitaux universitaires de Genève (Un workflow décisionnel dématérialisé : L’application GAUDI des Hôpitaux universitaires de Genève (HUG), In: Arbido, Berne, 2010, 2, pp. 56-59. Présentation initiale à la Journée professionnelle de l’AAS, Berne, Records management dans les secteurs publics et privés – points communs et différences, 28 mai 2010 : http://www.vsa-aas.org/fileadmin/user_upload/texte/ag_form/ft_2010/Zeller.pdf)

 Dans la deuxième partie de son chapitre elle entre plus précisément sur l’impact que la théorie des genres peut avoir sur le records management et l’archivistique. Le premier impact et celui de la constitution du genre documentaire, qui institue les niveaux primaire (les collections de faits), secondaire (les documents indexatoires) et tertiaire (les synthèses), on est là dans les caractères extrinsèques. Elle identifie les instruments de recherche archivistique au document secondaire. Cela l’amène à poser la question de la finalité du genre : « le genre est-il un outil externe pour appréhender la valeur d’un document produit par un autre ou est-il un cadre normatif destiné à l’auteur pour produire le document ? ». Elle développe à propos des documents numériques : «  Les données structurées, dans les bases de données, sont les héritières des registres. Les données semi-structurées sont les documents bureautiques. […] Les données non structurées sont tout le reste […] »,

Si j’adhère globalement à ce parallélisme, j’ai néanmoins une réserve sur l’assimilation des bases de données aux registres. C’était certainement vrai au début de l’informatique mais je pense que la nature des bases de données actuelles a évolué, elles sont aujourd’hui les dépositaires des données primaires et font simultanément office de registre. Pour le reste je renvoie au chapitre que j’ai écrit dans l’ouvrage où je détaille en partie ces questions (chapitre 7 : commenté dans un prochain billet).

Citant Tyrväinen et Päivärinta elle réitère le même constat : « ce qui crée un nouveau genre, c’est l’identification d’un ensemble significatif d’éléments de mise en forme et de contenu. […] Ce qui fait que cet ensemble est significatif et peut être qualifié de genre est soit sa récurrence, soit son efficacité. Le genre fonctionne comme la mode. ». Je souligne encore une fois la concomitance de la forme et du contenu, je ne suis pas certain que cela soit une fatalité ou plutôt je pense que cette liaison nécessite une discrimination fine qui n’a pas encore été clarifiée à ce jour.

Une esquisse de genre qui semblerait convenir au records management est celui proposé par InterPARES dans ces « Six functional categories of records » (http://www.interpares.org/ip2/ip2_terminology_db.cfm et le commentaire de M.-A. Chabin ici : http://transarchivistique.fr/les-six-categories-de-records-dinterpares/ ) dont M.-A. Chabin dit : « Ce qui est séduisant dans ce resserrement autour de six valeurs de l’information engageante, c’est l’accent mis sur le «genre» d’action qui supportent les documents ». Avant de conclure elle resitue le genre par rapport aux exigences de l’archivage selon laquelle la première exigence n’est pas le genre mais la valeur de conservation des documents.

Elle conclu en constatant que « ni les pratiques ni les normes de records management n’ont recours à la notion de genre. Cependant le besoin non satisfait de classification pour l’archivage de l’information numérique pléthorique incitent à s’inspirer de tous les travaux qui analysent telle ou telle facette de l’information. » Sans oublier les obstacles encore à surmonter : « Le concept de genre au-dessus ou en parallèles du type de document et de catégorie est séduisant. Conjoncturellement, toutefois, il faudrait renommer cette notion, car, dans les contextes des sciences de l’information, l’expression théorie des genres, l’équivalent de genre theory, souffre en français et particulièrement en France de la concurrence de la théorie des genres (gender theory), qui peut entraîner une confusion des genres… »

Cette ironie finale montre qu’il y a encore bien du chemin à parcourir pour préciser les différentes notions en jeu et que les vocabulaires anglo-saxon et francophone sont aujourd’hui plus source de confusion que de concordance, ce qui démontre tout l’intérêt d’une telle publication.

Publié dans genre documentaire, records management, Typologie des documents | Tagué | 1 commentaire

Genres de documents et coordination des activités dans les organisations

NOTES DE LECTURE
Les genres de documents dans les organisations
Sous la direction de Louise Gagnon-Arguin, Sabine Mas et Dominique Maurel
Presse universitaire du Québec, 2015

(chapitre 4, p. 69-88 et chapitre 5, p. 89-106)

Dominique Maurel et Sabine Mas nous offrent un article décliné en une partie théorique et une partie pratique. Le premier chapitre examine les rôles des genres de documents sur les activités dans les organisations et la deuxième partie, à l’inverse, le rôle des activités sur les genres.

Le premier concept théorique examiné est le processus d’affaire. Les auteures concluent que celui-ci implique un lien étroit entre la culture informationnelle et le contexte organisationnel.

Elles s’attachent ensuite à définir le genre de documents, par opposition au type, puis leur lien avec les communautés de discours ou de pratique dans lesquels ils sont engendrés. Comme la majorité des chapitres de cet ouvrage elles reprennent la définition proposée par Yates et Orlikowksi : types de communications socialement reconnus et caractérisés par des conventions structurelles, linguistiques et substantives, invoquées en réponse à une situation récurrente. Elles le différencient des types. Cela revient donc à constituer un ensemble de règles et de conventions qui combinent des éléments de contenu, de forme et de contexte (c’est moi qui souligne).

Citant Gagnon-Arguin, Mas et Alberts, le type (en archivistique) se distingue du genre par sa visée principalement pragmatique et classificatoire, en faisant exclusion de la dimension sociocognitive attribuée au genre ainsi que son lien à une communauté de discours. Les auteures reconnaissent cependant que, compte tenu du flou définitoire du genre, la distinction n’est pas toujours évidente. Selon les théoriciens du genre, le genre ne peut s’abstraire de la communauté de discours ou de pratiques qui le constitue et l’utilise. Les théoriciens introduisent par conséquent les notions de « système de genre » ou de « répertoire de genre » et les liant aux communautés de discours. Cela permet de constituer des typologie de genre selon certaines dimensions comme celles proposées par Orlikowski et Yates (Intention ou fonction-Pourquoi?; Contenu-Quoi?; Participants-Par qui?/Pour qui?; Moment-Quand?; Lieu-Où?; Forme de l’échange-Comment?). Cette approche dimensionnelle semble être particulièrement adaptée au monde numérique.

Le fait que les genres soient pratiqués au niveau individuel, du service, ou de l’institution, implique une gestion documentaire « négociée ». Cette négociation est permanente et est loin d’avoir atteint un niveau normalisé sauf dans certaines zones d’activités bien précises. En conclusion, les auteures notent que cette négociation quasi constante implique « dans les efforts de gouvernance documentaires des gestionnaires de documents et des archivistes doivent s’inscrire dans un délicat équilibre entre la permanence des actions à poser et l’évolution des pratiques et des dispositifs ».

Le deuxièmes chapitre expose les applications pratiques des éléments théoriques exposés précédemment, à travers l’exemple du genre programme de cours analysé dans le détail.  Citation point 1 « Plus particulièrement …le genre « plan de cours ». »  Les chercheuses ont appliqué le modèle des six dimensions exposé dans la partie théorique en posant les questions suivantes :

  1. A quoi sert le plan de cours ?
  2. Quelle information le plan de cours contient-il ?
  3. Par qui le plan de cours est-il  créé et à l’intention de qui ?
  4. A quel moment le plan de cours est-il utilisé ?
  5. Où le plan de cours est-il utilisé, où est-il diffusé ?
  6. Sous quelle forme le plan de cours est-il créé ?

Les auteures détaillent chacune de ces dimensions en fonction des informations recueillies dans leur enquête.

Elles analysent ensuite les pratiques de travail des principaux intervenants dans le processus (enseignants, administrateurs).

La pratique professorale constatée dénote des pratiques très personnalisées et peu uniformes même quand des prescriptions départementales ou universitaires existent quant à leur contenu ou à leur structure. De même, la maîtrise des versions et leurs règles d’archivage semblent assez peu maîtrisées.

Le fait que les plans de cours puissent exister en deux modalités papier/numérique et en version publiée (officielle) et annotée (par le professeur en cours de trimestre) vient compliquer encore le processus.

En ce qui concerne les administrateurs, leurs activités principales consistent à collecter et à archiver les plans de cours. Ici aussi, la méconnaissance des règles de gestion documentaire institutionnelles engendre fatalement des discrépances par rapport aux objectifs poursuivis.

Les auteures exposent ensuite les dynamiques de coordination (point 4.) et en premier lieu la coordination induite par le genre sur les activités et les pratiques. Elles soulignent deux fonctions principales de coordination. La première est la valeur de planification et de coordination des activités du plan de cours tout au long d’une séquence trimestrielle, tant pour le professeur, les intervenants externes et les étudiants (ce que l’on peut appeler le « contrat pédagogique »). La deuxième est celle qui implique les administrateurs dans la fonction de collecte et d’archivage de ces témoins important de l’enseignement. Le genre plan de cours assume par ce biais la valeur de preuve pédagogique, administrative, ou financière.

Réciproquement les auteures examinent les effets de l’évolution des pratiques et des technologies sur le genre plan de cours. Dans ce cadre elles citent la pratique instaurée par un département universitaire pour fournir sur une plateforme un gabarit de plan de cours. Cela a eu pour effet de renforcer le consensus partagé sur le contenu idéal des plans de cours tout en facilitant leur gestion (professeurs, administrateurs) et en facilitant leur accès (étudiants).

Publié dans Diplomatique numérique, genre documentaire, Typologie des documents | Tagué , | 1 commentaire