Blog today, gone tomorrow ? Sur la conservation des Weblogs

En mettant de l’ordre dans mes notes du congrès ECA 2010 j’ai retrouvé un billet de Richard Entlich que je n’ai pas exploité dans ma communication. Datant de 2004, à l’époque ou le blogging commençait son explosion (pour mesurer l’évolution de la situation, allez voir par exemple une page d’analyse récente de la blogosphère chez Technorati°: #mce_temp_url#), il expose certaines considérations prémonitoires, et d’autres que l’on peut mettre en perspectives, ce qui est l’objet de ce billet.

Le texte a été publié dans RLG DigiNews (ici) et une traduction française est disponible ici Archiver_les_Blog_RLG_2004.

Après une introduction sur l’ampleur du phénomène, que tout le monde connaît aujourd’hui, il aborde des questions proprement archivistiques. Il pointe tout d’abord la difficulté d’archiver des blogs, en rappelant leurs similarités avec les sites web en général. La principale particularité du blog, qu’il identifie dans ce contexte, est celui de la conservation liée des commentaires, qui pour certains forment l’essence même du phénomène du blogging. Avec le recul, on peut affirmer que seuls les blogs ayant réussis à avoir une certaines audience sont confrontés à cette problématique conservatoire, et ils sont proportionnellement peu nombreux, même si à l’échelle de la blogosphère actuelle, cela n’est pas négligeable en terme de volume. Cette problématique du commentaire (et du commentaire du commentaire) renvoie à une question archivistique plus profonde sur la délimitation de l’unité documentaire et me rappelle une remarque de Verne Harris (archiviste sud-africain)  qui nous disait « context never ends ». Dans le cadre du blog et de sa conservation on peut se demander si ce n’est pas une constellation de blogs connectés qu’il faudrait conserver.

La deuxième question qu’Entlich pose est celle de l’intérêt de l’archivage des blogs au sein de la communauté bibliothéconomique et archivistique. En 2004, il décrit l’état balbutiant de l’archivage du web en général. Indépendamment des problèmes techniques, qui n’étaient largement pas maîtrisés à ce moment là, il propose une piste intéressante en rattachant les blogs à la catégorie des ephemera. Ces derniers ont fait l’objet d’évaluation archivistique, ce qui lui permet de proposer des critères de collecte (en fait un seul), dont il conviendrait aujourd’hui encore de discuter. En effet, le critère qu’il propose est celui des « blogs ayant le plus d’impact », sans entrer dans le détail de ce que cela veut dire.

Dans l’état actuel des choses, il semble que le volume des billets édités se stabilise aux alentour de 1,4 millions par jour (voir la page Technorati citées plus haut). La blogosphère  a probablement atteint son niveau de stabilisation. Quelle part de ce volume doit-il être conservé et selon quels critères ? Dans la mesure où une approche quantitative devra probablement être appliquée (il apparaît en effet impossible de faire une analyse qualitative sur un tel volume) et que l’on admet que l’archivage de 5% de ce volume peut être potentiellement représentatif, on pourrait penser écrémer les blogs selon ce seul critère quantitatif. Cela impliquerait que l’on pourrait utiliser les robots moissonneurs actuellement utilisé pour les sites web en les adressant sur des blogs préalablement sélectionnés  comme étant particulièrement actifs, via des outils comme Technorati. Si cela apparaît comme techniquement réaliste, il faut cependant réfléchir à l’extrême labilité de la blogosphère qui fait qu’un site très actif aujourd’hui peut disparaître de la scène demain.

Enfin, il reste à déterminer si l’archivage de ces blogs ressort de la même logique que celle de l’archivage du web et sera donc assumée par les mêmes acteurs (en général les bibliothèques nationales) ou si d’autres acteurs devraient prendre en charge cette collecte spécifique.

A propos regarddejanus

Archiviste, Record-manager et enseignant
Cet article, publié dans archivage numérique, évaluation, critères de conservation, est tagué . Ajoutez ce permalien à vos favoris.

Un commentaire pour Blog today, gone tomorrow ? Sur la conservation des Weblogs

  1. Daniel Ducharme dit :

    Merci pour ce texte fort intéressant. Voici un scénario possible sur un aspect archivistique des blogues… : http://archivistique.wordpress.com/2010/07/20/horizon-2040-une-fiction-archivistique/

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s