Archivage de Twitter: nouvelles du front

Au moment où je me posais la question de l’archivage des intranets, début 2010, je n’ai pas eu l’opportunité d’inclure la problématique des tweets, l’annonce de son archivage par la Bibliothèque du Congrès venant de tomber. Une année après, un billet d’Audrey Watters vient opportunément alimenter la réflexion, l’original est ici (http://radar.oreilly.com/2011/06/library-of-congress-twitter-archive.htm), et la traduction là (LOC_Twitter_archives_FR).

Elle relate une discussion avec deux protagonistes de ce projet et en livre un peu plus sur les actions mises en œuvres par la Bibliothèque du Congrès pour rendre accessible ce fond assez particulier. Je relève ici deux des défis archivistiques que cet archivage pose.

  • Le premier est que sont associés aux tweets une quantité considérable de métadonnées et qu’il est vraisemblable que les futurs chercheurs veuillent y accéder pour effectuer des analyses transversales de ce corpus. Si ce problème est clairement identifié, il n’y a pas encore d’esquisse de solution proposée.
  • Le second problème est que, comme dans beaucoup de documents transitant par internet, les tweets pointent très régulièrement sur d’autres sites web. Ici le problème est double : d’une part, à cause du format court des tweets, les liens sont régulièrement exprimés en tiny URL, ce qui implique de résoudre ces adresses pour les rendre le plus accessibles à long terme ; et d’autre part, les tweets renvoyent à des sites qui ne seront pas forcément conservés. Ce dernier point soulève la question de la conservation du contexte des tweets et de leur exploitation pour la recherche. A quoi cela servirait-il d’analyser le fonctionnement de ce réseau social, si les éléments déclencheurs et le contexte cité par les suiveurs ne sont pas documentés.

Pour résoudre ces questions, à la fois techniques, archivistiques, sociologiques et historiques, la Bibliothèque du Congrès a entrepris de rassembler un groupe de chercheurs concernés pour mieux cerner leurs besoins et leurs attentes. On peut avoir une idée des résultats possibles de ce genre de recherche en consultant par exemple un article récent sur la conformité du fonctionnement des réseaux de Twitter avec le nombre de Dunbar, qui veut qu’un individu ne puisse pas gérer en moyenne plus de 150 contacts directs (http://www.numerama.com/magazine/18932-la-taille-du-cerveau-determine-le-nombre-d-amis-sur-twitter.html).

Le résultat de ces premières démarches est annoncé pour dans quelques mois, nous y reviendrons certainement.

A propos regarddejanus

Archiviste, Record-manager et enseignant
Cet article, publié dans archivage numérique, format de donnée, métadonnées, est tagué . Ajoutez ce permalien à vos favoris.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s