Cloud computing : Défis ou opportunités pour les archives ?

Le retour après le forum des archivistes d’Angers à été sur-occupé et mes billets sont restés en rade. J’ai quand même eu le temps de mettre au net ma communication du vendredi et vous la livre ici :  Cloud_computing_defi_ou_opportunite__Angers_2013. J’ai pu l’enrichir des remarques et informations qui ont émergés du débat animé qui a suivi et compléter les références aux publications citées.

Le sujet fera l’objet de réflexion et de nouvelles rencontres de la part du groupe Records Management de l’AAF et je reviendrai donc certainement sur ce thème.

Publié dans archivage numérique, Informatique en nuage - cloud computing, norme | Tagué | Poster un commentaire

Forum des archivistes français – Ouverture

Dès ce mercredi je plonge pour trois jours dans l’archivistique hexagonale profonde (programme ici). Je ne sait pas si je pourrais faire un billet pour toutes les sessions auxquelles je vais participer mais voila déjà mon programme. Les lien seront activés au fur et à mesure de ma rédaction.

Matin du 20 mars

Faut-il garder le terme "archives" ? Des "archives" aux "données"
Françoise BANAT-BERGER / Christine NOUGARET

Le "retour du sujet" et les archives. L’archivistique contemporaine est-elle postmoderne
Didier DEVRIESE

Archives, changement de paradigme ? – Le débat

Les normes internationales en matière de records management dans le développement d’une politique de bonne gouvernance,
Michel COTTIN / Arnaud JULES / Marion TAILLEFER

Mise en production d’un outil de records management
Benjamin PALERMITI

Simplifier les standards de RM pour les petites municipalités
Cristina BIANCHI

Comment penser l’archive avec un marteau ?
Aurélien CONRAUX (1215-1230)

Records management : des normes à la réalité de terrain – Le débat

Après.midi du 20 mars

Collecter pour quoi ?
Elisabeth VERRY

L’administration électronique : un levier pour l’archivage électronique ?
Françoise BANAT-BERGER

Gouvernance de l’information, un levier pour le développement de la dématique
Jean-Marc RIETSCH

Vers une nouvelle gouvernance de l’information  - Le débat

Maîtriser l’archivage électronique avec Astaré !
Céline GUYON

La Cour des comptes et le CINES implémentent le SEDA
Lorène BECHARD / Denise DESPLAN

Chargé de mission dématérialisation et e-archiviste: des ponts à construire, une porte d’entrée dans les services?
Amélie BRUN / Audrey MUTTONI

L’archivage en projet – Le débat 

Matin du 21 mars

Comment contextualiser les archives électroniques  définitives de l’État ? Méthodologie et nouveaux champs de réflexions archivistiques
Marie LAPERDRIX

Le rêve de l’automatisation ? Processus d’archivage et place de l’archiviste
Thomas VAN DE WALLE

L’archiviste face à la problématique de l’archivage électronique
Jean-Pierre DELTOUR / Coline VIALLE

Les archives numériques : vers de nouvelles méthodologies – Le débat

Après-midi du 21 mars

Les archives tunisiennes entre dictature et conservatisme, comment y accéder?
Hedi SAIDI

La spécificité des archives en établissement psychiatrique
Claudine BELLAMY / Anne–Pascale SALIOU

La présentation et l’historique du GIP ASCODOCPSY
Nathalie BERRIAU / Stephan MAZZOCUT

Le dossier patient ou le tour de l’archivistique en un seul dossier
Anne-Marie BAILLOUX / Lydiane GUEIT-MONTCHAL

Les archives de la santé : enjeux et pratiques – Le débat

Matin du 22 mars

Cloud computing : opportunité ou catastrophe pour les archives ?
Jean-Daniel ZELLER

Signature électronique et archivage à valeur probante : quelle solution ?
Philippe BAZIN

Le coffre-fort électronique : positionnement de l’offre par  rapport au marché
Laurent PREVEL

Le RGS : pour qui ? pour quoi ?
Michel THOMAS

Preuve et sécurité – Le débat

Après-midi du 22 mars

L’archivage de la matrice cadastrale numérique : réflexions sur la qualité des données et de la documentation
Françoise BANAT-BERGER / Michel JACOBSON

Évaluer, sélectionner et collecter des documents numériques non structurés
Marie-Élodie BENOIT / Hélène LHOUMEAU

L’archivage des bases de données : concepts clés, méthodologie et enjeux
Lorène BECHARD / Philippe PRAT

Présentation des modalités de collecte et de conservation des enregistrements audiovisuels du procès AZF (première instance et appel)
Nathalie REGAGNON

L’archivage numérique pérenne, retours d’expérience – Le débat

Publié dans archives, archivistique, records management | Tagué | 2 Commentaires

Conservation des documents dans le nuage – Cloud et OAIS

Les discussions récentes à propos de l’archivage dans le nuage ont plutôt tendances à se focaliser sur les questions de protection de données et de sécurité garantie (ou non) par des SLA adéquates. Il n’y par contre peu d’étude technique sur le fait que le nuage puisse répondre aux nécessités de l’archivage, par exemple en respectant les exigences du modèle OAIS. C’est l’objet d’une étude parue dans le Records Management Journal en 2011.

Jan Askhoj, Shigeo Sugimoto, Mitsuharu Nagamori, (2011) "Preserving records in the cloud", Records Management Journal, vol. 21 Iss: 3, pp. 175 – 187

L’original est ici : http://www.emeraldinsight.com/journals.htm?articleid=17003562, la traduction française ici: Conservation_des_documents_dans_le_nuage_2011.

Les auteurs constatent que la structure en couche du nuage peut répondre à certaines exigences du modèle OAIS mais que certaines parties posent problème. Ils ont élaboré un nouveau modèle qui respecte strictement le partage des tâches entre les couches en formalisant les échanges (as service) entre les couches. Examinons quelques détails de leur travail.

Après leur introduction ils décrivent les principaux points d’achoppement entre le modèle du nuage et l’OAIS dans leur chapitre 4, soit :

  • L’interdépendance des entités fonctionnelles de l’OAIS qui rend difficile leur distribution vers une prestation en nuage.
  • La nécessité pour les services producteurs de constituer des SIP bien formés, ce qui engendre des coûts tendant à retarder l’opération de versement. Avec une plateforme partage en nuage, cet obstacle est minimisé.
  • Dans la même configuration les métadonnées sont déjà présentes sur la plateforme et n’ont pas besoin d’être collées à un objet numérique versé.
  • L’OAIS ne couvre pas la gestion des étapes avant le versement/archivage (création, utilisation, gestion) alors que se constituent à ce moment du cycle de vie des métadonnées utile à la conservation à long terme.

Dans les deux chapitres suivants ils proposent un nouveau modèle en couche qui fait correspondre les couches basses aux couches PaaS (plateforme) et SaaS (service) du nuage, complétée par des couches « Conservation » et « Interaction » correspondant aux fonctionnalités de l’OAIS comme indiqué dans le schéma ci-dessous (fig. 3).

Types d'informations et couches

Types d’informations et couches

Sur cette base, le chapitre 7 détaille la circulation de l’information au sein de ce modèle, où la nouveauté est l’existence d’un « Packager » qui assure au sein de la couche conservation les échanges entre les couches sous-jacentes (PaaS et SaaS) et la couche interaction, comme indiqué dans le schéma ci-dessous (fig. 4).

Flux d'information

Flux d’information

Le modèle présenté a de quoi séduire mais il n’est à ce jour que théorique, on attendra donc avec impatience les travaux de mise en œuvre promis par cette équipe de recherche. Il faut cependant remarquer que le présupposé des auteurs est que le SAE réside sur la même infrastructure en nuages que les documents actifs originels. Cela implique que leur modèle est conçu pour un archivage à moyen terme (en entreprise ?) et que de nombreux obstacles doivent être encore levés si l’on veut concevoir un système de même nature pour l’archivage à long terme.

Publié dans archivage numérique, conservation électronique, Informatique en nuage - cloud computing, versement des données | Tagué , , , | Un commentaire

Archivage et cloud, suite …

Un bon dialogue de qualité ne peut que m’encourager.

Suite à mon dernier billet Frédéric nous a fourni un argumentaire circonstancié (ici) qui ne peut que nourrit le débat.

En premier lieu, il précise une chose que je pensais évidente mais que j’ai mal exprimé. Je suis d’accord avec lui quand il dit qu’il nous faut différencier entre les outils du cloud (qui pour la plupart existaient déjà antérieurement) et l’offre de service commerciale qui s’exprime via un marketing parfois fallacieux, à tel point que 29 % des américains croient réellement que l’informatique en nuage réside dans les cumulo-nimbus. Ce que Frédéric exprime un peu plus loin en distinguant les technologies Cloud des offres Cloud.

Garder cette précision en mémoire tout au long de notre réflexion est indispensable.

La précision sur l’avantage économique du Cloud permet d’identifier une autre distinction utile. Peut (pourrait) passer dans le Cloud tous ce qui est commun et/ou mutualisable à partir des couches les plus basses (de l’infrastructure à la plateforme au logiciel à métier ?) Comme on nous prédit actuellement un « Business as Service » . La difficulté est de discerner ce qui est vraiment commun de ce qui ne l’est pas. De manière générale, plus on normalise et plus chacun veut affirmer ses particularismes, à tort ou à raison.

Le malentendu à propos de l’offre et la contractualisation peut, provisoirement, se résoudre comme suit : il est absolument nécessaire d’avoir un accord sur le niveau de service (Service Level Agreement : SLA) adapté aux besoins. Mais force nous est de constater qu’en ce qui concerne le records management (pardon, la gestion des documents d’activités) il n’y a pas de consensus sur ce que devrait être ce SLA. C’est bien cependant le moment d’y travailler.

Les données personnelles

Nous sommes d’accord pour éviter de les mettre dans le Cloud, Mais la dernière phrase de Frédéric à ce sujet m’interroge. « Les données personnelles n’ont sans doute pas le même caractère que les archives institutionnelles … Du moins, à ce jour. » En fait, les archives en sont pleines et ce n’est pas le moindre des problèmes aujourd’hui. Pour ne citer qu’un simple exemple, mais qui est un sujet à lui tout seul : le nouveau projet de directive européenne sur la protection des données qui tend la suppression de toutes données sans usage direct est en contradiction directe avec les principes archivistiques (Voir la position de l’AAF à ce sujet).

Archives et informatique

Fréderic a raison quant il pointe que la question de l’archivage par rapport au Cloud est une question faussée mais qu’elle réside plutôt dans le changement général que l’informatique induit dans les concepts documentaires, avant même d’aborder l’archivage (excursus : si l’on a attribué Janus comme divinité tutélaire du RM c’est parce qu’il regarde à la fois le passé et l’avenir). Ainsi la notion d’archivage intermédiaire, conséquence d’une logistique papier, n’a plus vraiment de pertinence dans un monde numérique, cependant je pense que d’autre contraintes volumétriques nous obligerons à le réintroduire d’une autre manière (quelques esquisses ont été évoquées lors du colloques de février).

Ne pas voir une différence entre l’archivage intermédiaire et l’archivage définitif est un travers d’informaticien que nous connaissons bien. Il y a vraiment un fossé entre une conservation de dix, parfois de vingt ans que les systèmes informatiques bien conçus sont tout à fait capable d’assumer à ce jour (le service informatique de mon institution nous fourni toujours l’accès aux données collectées depuis 1978) et supporte probablement le fait qu’un SAE commun est une solution mais la conservation séculaire propre à l’archives définitive comporte des défis d’un autre ordre. Voir les travaux des nos collègues japonais, Preserving records in the cloud, Askhoj et al., Records Management Journal, Vol 21 Iss :3, pp 175-187, http://www:www.emeraldinsight.com/journals.htm?articleid=17003562 ) qui feront l’objet d’un autre billet prochainement.

Je suis par contre parfaitement d’accord avec lui quant au changement de temporalité entre archivage intermédiaire et définitif qui autoriserait un versement d’archives « jeunes » dans un SAE d’archives définitives alors que les données continuent de vivre leur vie dans un SAE courant et intermédiaire. La finalité de ces systèmes exigeant des modalités de gestion différentes et le versement précoce permettant d’éviter certains problèmes d’obsolescence technologique.

Un Cloud privé d’Etat

Ce n’était pas si clair que cela que c’était une hypothèse de départ. Bien sûr, c’est une solution pour éviter les questions de la préservation des données personnelles. Presque toutes les instances archivistiques qui ont émis des recommandations face à l’utilisation du Cloud ont mis de telles réserves formelles quant aux données personnelles dans les Cloud publics (ce qui veut dire commercial !!!) que la seule possibilité est effectivement le Cloud privé d’état. C’est la raison des projets Numergy et Cloudwatt en France, et c’est explicitement exprimé dans le projet de politique du nuage de l’administration fédérale suisse (http://regarddejanus.wordpress.com/2012/01/03/projet-de-strategie-de-linformatique-en-nuage-des-autorites-suisses/ ).

Désaccord sur les coûts

Encore une fois dans ce cas, la nuance entre archivage courant et définitif fait toute la différence. Pour le courant, les gains d’échelle et de souplesse seront certainement effectifs, même si on se limite à un Cloud d’état. Par contre, ces gains d’échelle s’amenuisent comme neige au soleil sur le long terme comme l’illustrent les calculs effectués par Daniel Rosenthal (Talk at Fall 2012 CNI). C’est pour cette raison que j’ai lancé un appel au colloque de février (et il semble avoir eu un écho) pour que la communauté archivistique documente le plus largement possible les coûts des projets d’archivage électronique en cours, pour que nous ayons des bases solides et documentées à ce sujet. Car si le ROI n’est pas au rendez-vous ou sera la révolution ?

Masse critique et mutualisation

Nous sommes d’accord et j’aimerais que la proposition « Les développements peuvent être mutualisés » devienne « DOIVENT être mutualisés ». C’est notre unique chance de succès et si la communauté archivistique arrive à produire des applications open source correctement conçues et facilement paramétrables en fonction des environnements variés que cela intéresse, alors nous auront une victoire d’étape importante. Mais ceci est effectivement indépendant de la problématique du Cloud.

Pour ne pas en finir avec l’Open Data

La problématique de l’open data pose la question de l’adéquation des données aux utilisateurs/citoyens en général, avant et/ou après archivage. Typiquement les formats de communication et les environnements applicatifs mis à disposition. Cette question doit être traité le plus en amont possible par les services producteurs mais cela n’exonère pas les archivistes d’y réfléchir. J’ai souvenir d’un débat animé lors d’un séminaire Erpanet il y a plus de 10 ans, sur le fait de savoir si les jeux de données archivés devaient être délivrés brut (à charge pour l’utilisateur de les installer dans des applications qui lui convienne) ou avec un post-processing préalable permettant un usage direct par des néophytes (avec le risque d’un usage mal documenté). Ce débat est encore ouvert, et complexifié par des considérations de coûts pas encore maîtrisés.

Mais Frédéric à raison, les archivistes ne doivent pas rester sur la touche dans ce domaine. Et dépasser les positions défensives (voir les requêtes commerciales sur l’état-civil) par ailleurs utiles, pour adopter une attitude plus prospective et pro-active.

Tagging et plan de classement

Il ne s’agit pas d’opposer le tagging et le plan de classement, ils ont complémentaires. Quant à avoir plusieurs plans de classement pour de mêmes objets numériques, nous avons esquissé cette discussion au colloque de février. Dans ce domaine également, il faut distinguer les constructions logiques (indépendantes des applications) et les outils applicatifs.

Ressources de calcul

L’objection de Frédéric est pertinente, le problème de gestion du réseau n’est pas spécifique au Cloud. Par contre, s’il coince dans un réseau privé, le responsable est clairement le service informatique maison qui devra assumer la correction du problème, dans le nuage, cette responsabilité peut être nettement plus diluée. Là aussi, un SLA bien conçu est plus que nécessaire et je confirme que ce n’est pas gagné même dans un réseau privé ; cela fait des mois que je talonne ma DSI pour qu’elle me fournisse une précision sur les niveaux de services attachés à nos différentes applications, sans résultat jusqu’à présent.

Conclusion provisoire sur la complexité

Oui, Frédérique a raison « l’archivage électronique notamment pour des durées de plus 10 ans, pousse les limites informatiques au-delà des considérations courantes des informaticiens ». C’est bien la raison pour laquelle il nous faut plus que jamais dialoguer sur ces questions, définir des concepts communs, partager des expériences.

Alors rendez-vous à Angers…(http://forum2013.archivistes.org/?cat=3) Le descriptif de ma communication n’y est pas encore publiée mais cela ne saurait tarder.

Publié dans archivage numérique, Big Data, Informatique en nuage - cloud computing, records management, versement des données | Tagué | 4 Commentaires

L’archivage et le Cloud : bonne ou mauvaise idée ?

Ce n’est pas tous les jours qu’un informaticien se préoccupe d’archivage, aussi ses interrogations méritent d’être prises au sérieux. Les questions sont posées par Frédéric Brégier ici. Comme lui, je ne vais pas traiter la question dans son entier (rendez-vous au forum des archivistes à Angers (http://forum2013.archivistes.org/ ) ou nous tenterons de traiter la question plus à fond) mais reprendre certains points qui font problème à mes yeux, en suivant le canevas qu’il propose. (voir également le commentaire sur Archives Online )

 « Cela (le cloud) permet …une réduction des coûts. »
Bien évidemment la concentration des ressources, qu’elles soient mutualisées à l’interne, ou sous-traitée d’une manière ou d’une autre (les DSI n’ont pas attendu le cloud pour out-sourcer certaines prestation dans des pays « bon marché »). Dans le domaine la question clé est : quel est cœur du métier. En général, les fonctions « transversales » sont considérées comme « exportables ». En ce qui concerne les archives, ce n’est certes pas le cœur de métier des organisations (archivage intermédiaire) mais c’est bien celui des archivistes (archivage définitif). Il convient de bien distinguer ces deux « moments » des archives lorsque l’on envisage une solution dans les nuages.

« …les infrastructures … sont louées à un tiers »
C’est un des principaux avantage avancé pour passer au cloud. Eviter des investissements coûteux et sous-employés pour ne payer juste ce que l’on consomme est de la bonne économie en première approche, surtout pour de petites structures dont l’informatique n’est pas forcément bien maîtrisée. Mais la location de services (quels qu’ils soient) nécessite un degré de confiance et de professionnalisme de la part des prestataires qui n’est pas toujours au rendez-vous. Je m’explique : la plupart des prestataires de cloud ne sont entré sur ce marché pour amortir leurs propres fermes de serveurs. Celles-ci sont techniquement au point en termes de continuité de service car ils en ont besoins pour leurs propres affaires. Par contre, le service à des tiers n’est pas initialement leur cœur de métier et tous les services associés n’ont pas été conçus pour des utilisateurs à hautes exigences. Ce qui nous mène au point suivant.

« Lisez votre contrat et mettez-y des clauses de localisation si nécessaire ! »
Sur le papier, tout le monde recommande ce type de comportement. La CNIL (Recommandations pour les entreprises qui envisagent de souscrire à des services de Cloud computing ), les associations professionnelles, etc. Sauf que vous contractez avec des mastodontes pour lesquels ce n’est pas l’habitude de négocier des clauses particulières (sauf à des prix exorbitant). Et à moins de faire établir des contrats-cadre au niveau politique (cela se dessine au niveau européen mais qu’en sera-t-il au niveau américain ?) même une grosse entreprise ne peut entrer en négociation. Quand bien même un prestataire vous garantirait une localisation géographiquement circonscrite, qui a les moyens de vérifier si la prestation est effectivement effectuée selon le contrat ?

Tant que des prestataires européens d’envergure ne seront pas sur le marché et si vous avez des données personnelles à gérer, renoncez au cloud !!!

Archivage, cloud et open data

Ces trois concepts recouvrent chacun des acceptions multiples qui, si on ne les précise pas, mènent à la confusion et à de mauvaises décisions.

L’archivage recouvre l’archivage courant et l’archivage définitif qui n’ont pas les mêmes exigences en termes d’accès et de pérennité. Le cloud pourrait convenir pour les archives courantes en termes d’accessibilité mais certainement pas en termes de pérennité et de coûts à long terme.

L’avantage de la mutualisation des infrastructures est indépendante du fait qu’un cloud soit privé ou public, l’important est d’avoir une masse critique suffisante pour bénéficier des économies d’échelle (elles sont quantitatives mais également qualitatives au niveau des coûts de développement de logiciels par exemple).

En ce qui concerne l’open data c’est l’accessibilité qui prime alors que l’archivage s’occupe de pérennité. Heureusement, alors que ces deux exigences sont contradictoires dans le monde analogique, elles sont surmontables dans le monde numérique pour autant que l’on respecte les normes (OAIS) en vigueur.

Métadonnées et Big Data

Là aussi les deux concepts ne sont pas interchangeables alors que la tendance est de les confondre. Les métadonnées pour être utiles ont la nécessité d’être fiables ce qui les rend coûteuses en terme d’acquisition ou de capture. Raison pour laquelle elles ne peuvent être trop nombreuses car elles ne seront alors pas documentées. A contrario les Big Data (telles qu’on nous les vend) sont la collecte automatique de traces, dont la fiabilité est tout sauf avérée (comme une adresse IP) et dont on suppose qu’un traitement algorithmique (certain disent magique) permettent de générer de l’information nouvelle. Cela représente une antinomie des archives qui cherchent à refléter au plus près l’activité du producteur.

Dans le même ordre d’idée les données ouvertes, sans les métadonnées (fiables) correspondantes ne sont qu’une boîte de Pandore susceptible de toutes les manipulations (illustrée par l’affirmation attribuée à Winston Churchill : « je ne crois que les statistiques que j’ai manipulées moi-même »).

« On pourrait même pousser plus loin en démultipliant les possibilité de classement des données numériques par les utilisateurs eux-mêmes. »
Je vois ici aussi une confusion. Le classement est de la même nature que les métadonnées, des informations fiables et validées dans un cadre conceptuel ordonné (même s’il est réducteur et donc par conséquent difficilement utilisable pour le lecteur néophyte). Le classement par l’utilisateur est de l’ordre du tagging, une étiquette que j’appose pour un besoin de « mise en lien » transitoire qui peut changer demain. C’est tant mieux parce qu’évolutif, mais cela n’a pas de prétention à la pérennité (je peux changer de point de vue avec le temps). Même les instruments de recherches sur des séries documentaires similaires ont évolués dans le temps car les conceptions des archivistes (et des sociétés qui les ont (dé)formés) ont changés.

Ressources de calcul

Un des arguments du cloud est effectivement la disponibilité des ressources à la demande. Cela est certainement vrai pour les utilisateurs moyens. Cependant, quand il s’agit de traiter de très grandes quantité de données de manière fiable le transit par le réseau devient un facteur de risque important (voir l’étude du JISC à propos du cloud et des données scientifiques, Digital Curation and the Cloud : http://www.jisc.ac.uk/media/7/C/1/%7B7C1A1FD7-44B4-4951-85A8-FC2C4CEB1564%7DCuration-in-the-Cloud_master_final.pdf .

Quant à la sémantisation des métadonnées, l’avancement dans la maîtrise des données liées est certainement encourageante mais nous n’en sommes encore qu’aux balbutiements. Pour se convaincre de la difficulté d’obtenir des données (et métadonnées) de qualité je ne peux que renvoyer à la lecture de la thèse d’Isabelle Boydens (Informatique, normes et temps. Bruxelles : Éditions E. Bruylant, 1999).

Enfin je partage entièrement la conclusion « L’archiviste doit donner une autre perspective à ses compétences, au service de ses clients, et peut-être même arrêter de parler d’archives mais plutôt de données, mieux d’information,… », qui a été largement au cœur du récent colloque sur les archives électroniques (http://www.archivesnationales.culture.gouv.fr/chan/chan/journees-colloque-archivage-electronique-2013.html ).

Et un grand sourire à propos de l’arch(at)ive de Schrödinger… tant qu’on ouvrira pas la boîte d’archives…

Publié dans archivage numérique, Big Data, Données liées (linked data), Informatique en nuage - cloud computing, métadonnées | Tagué | 5 Commentaires

Numériser un patrimoine d’exception : VIATIMAGES, une bibliothèque virtuelle d’illustrations de voyages anciens

La dernière présentation de cette session du Digitization Day 2012 consacrée à la collaboration était celle présentée par Daniela Vaj du Centre des sciences historique de la culture (SHC) de l’Université de Lausanne. Le projet Viatimage constitue une collection particulière d’image collectée dans les ouvrages de récit de voyages dans les alpes. Le corpus identifié a été estimé à 800 titres contenant 11’000 illustrations pour cette la période 1544-1860 et pour l’espace alpin suisse. Elle sera progressivement complétée avec le reste du fond identifié pour les années 1860-1900, période qui voit l’arrivée de la photographie dans les livres de voyage illustrés. Cette opération fait partie d’un projet de collaboration plus large à propos de l’arc alpin appelé Viaticalpes.

Ce sont les bibliothèques partenaires numérisent elles-mêmes les images mais elles en ont profité pour numériser également les ouvrage qui les contiennent ce qui permet de documenter la base d’image par des extraits de texte illustrant leur contexte. Les bibliothèques productrices restent responsables de la gestion  des images pour leur exploitation commerciales, Viatimages gérant la base de données et l’interface permettant d’y accéder.

Compte tenu de la spécificité de la recherche des images la base de données et surtout ses métadonnées descriptives permet la recherche selon des modalités variées soit :

  • Une description bibliographique standard
  • Une indexation de l’image via un vocabulaire contrôlé (130 descripteurs) (y compris un thesaurus géographique)
  • Une copie des commentaires de l’auteur dans l’ouvrage d’origine
  • Une géolocalisation (avec Google Earth)

Un projet est en cours pour géolocaliser sur des cartes historiques de l’époque de la publication . Pour cela chaque image doit être rattachée à sa longitude/latitude. Pour les images larges et/ou fantaisistes ces données ne sont pas toujours faciles à documenter. La démonstration de la géolocalisation est particulièrement conviviale et l’indexation « à facette » permet une navigation très souple en passant de l’image au texte ou du texte à la carte. Des projets de produits dérivés de cette base de données (guide de voyage illustré, etc.) sont progressivement réalisés pour en assurer la promotion (et peut-être le financement futur).

Daniela Vaj présentera ce projet une nouvelle fois dans le cadre de la Journée d’étude "Retours d’expériences en matière de centre de ressources numérique en SHS" les 4-5 octobre prochain à Clermond-Ferrand.(programme ici: http://lido.hypotheses.org/28). Et son collègue Christian Kaiser, géographe et informaticien de l’UNIL traitera plus en détail de la géo-localisation lors de ce même colloque.

On peut consulter les résultats sur les sites suivants :
Viaticalpes : http://www.unil.ch/Jahia/site/viaticalpes/cache/offonce/pid/53744;jsessionid=E943884B74866B76BBE2A4395D077A97.jvm1
Viatimage: http://www.unil.ch/viaticalpes/page54383.html

Publié dans archivage numérique, numérisation | Tagué , , | Un commentaire

e-codices – Bibliothèque virtuelle des manuscrits en Suisse : expériences de la pratique

Au Digitization Day 2012, Christoph Flüeler and Ramona Fritschi  de l’Institut d’études médiévales de l’Université de Fribourg (http://www.mediaevum.unifr.ch/f/index.htm) ont présenté le projet e-codices (description du projet: http://www.e-lib.ch/fr/Offres/e-codices /accès: http://www.e-codices.unifr.ch/fr).

Ramona Fritshi a initialement rappellé l’objectif du projet est de rendre accessible les manuscrits des bibliothèques suisses sur un site quadrilingue. C’est un projet collaboratif qui a progressivement regroupé près de 40 bibliothèques avec une ouverture sur des fonds à l’étranger, ce qui permet d’effectuer des reconstruction virtuelle d’ouvrages démembrés

La numérisation est centralisée à l’Abbaye de Saint-Gall, un second centre est en construction en Suisse romande (Fondation Martin-Bodmer, Cologny, Genève). L’appareil descriptif est très développé et quadrilingue (à la norme TEI) mais la description scientifique n’est disponible que dans la langue d’origine.

Le professeur Flüeler a ensuite insisté sur l’aspect collaboratif du projet, non seulement par la collaboration des bibliothèques participantes mais également via les portails, puisque les manuscrits numérisés sont accessibles via plusieurs plateformes comme : www.europeana.eu, www.theeuropeanlibrary.org, www.rechercheisidore.fr, www.worldcat.org, www.e-lib.ch, www.manuscriptorium.comwww.manuscripta-medievala.de

Plus d’information avec les liens suivants: 
Description : http://www.e-lib.ch/fr/Offres/e-codices
Accès :http://www.e-codices.unifr.ch/fr

Publié dans archivage numérique, numérisation | Tagué , , , | Poster un commentaire