Archivage et cloud, suite …

Un bon dialogue de qualité ne peut que m’encourager.

Suite à mon dernier billet Frédéric nous a fourni un argumentaire circonstancié (ici) qui ne peut que nourrit le débat.

En premier lieu, il précise une chose que je pensais évidente mais que j’ai mal exprimé. Je suis d’accord avec lui quand il dit qu’il nous faut différencier entre les outils du cloud (qui pour la plupart existaient déjà antérieurement) et l’offre de service commerciale qui s’exprime via un marketing parfois fallacieux, à tel point que 29 % des américains croient réellement que l’informatique en nuage réside dans les cumulo-nimbus. Ce que Frédéric exprime un peu plus loin en distinguant les technologies Cloud des offres Cloud.

Garder cette précision en mémoire tout au long de notre réflexion est indispensable.

La précision sur l’avantage économique du Cloud permet d’identifier une autre distinction utile. Peut (pourrait) passer dans le Cloud tous ce qui est commun et/ou mutualisable à partir des couches les plus basses (de l’infrastructure à la plateforme au logiciel à métier ?) Comme on nous prédit actuellement un « Business as Service » . La difficulté est de discerner ce qui est vraiment commun de ce qui ne l’est pas. De manière générale, plus on normalise et plus chacun veut affirmer ses particularismes, à tort ou à raison.

Le malentendu à propos de l’offre et la contractualisation peut, provisoirement, se résoudre comme suit : il est absolument nécessaire d’avoir un accord sur le niveau de service (Service Level Agreement : SLA) adapté aux besoins. Mais force nous est de constater qu’en ce qui concerne le records management (pardon, la gestion des documents d’activités) il n’y a pas de consensus sur ce que devrait être ce SLA. C’est bien cependant le moment d’y travailler.

Les données personnelles

Nous sommes d’accord pour éviter de les mettre dans le Cloud, Mais la dernière phrase de Frédéric à ce sujet m’interroge. « Les données personnelles n’ont sans doute pas le même caractère que les archives institutionnelles … Du moins, à ce jour. » En fait, les archives en sont pleines et ce n’est pas le moindre des problèmes aujourd’hui. Pour ne citer qu’un simple exemple, mais qui est un sujet à lui tout seul : le nouveau projet de directive européenne sur la protection des données qui tend la suppression de toutes données sans usage direct est en contradiction directe avec les principes archivistiques (Voir la position de l’AAF à ce sujet).

Archives et informatique

Fréderic a raison quant il pointe que la question de l’archivage par rapport au Cloud est une question faussée mais qu’elle réside plutôt dans le changement général que l’informatique induit dans les concepts documentaires, avant même d’aborder l’archivage (excursus : si l’on a attribué Janus comme divinité tutélaire du RM c’est parce qu’il regarde à la fois le passé et l’avenir). Ainsi la notion d’archivage intermédiaire, conséquence d’une logistique papier, n’a plus vraiment de pertinence dans un monde numérique, cependant je pense que d’autre contraintes volumétriques nous obligerons à le réintroduire d’une autre manière (quelques esquisses ont été évoquées lors du colloques de février).

Ne pas voir une différence entre l’archivage intermédiaire et l’archivage définitif est un travers d’informaticien que nous connaissons bien. Il y a vraiment un fossé entre une conservation de dix, parfois de vingt ans que les systèmes informatiques bien conçus sont tout à fait capable d’assumer à ce jour (le service informatique de mon institution nous fourni toujours l’accès aux données collectées depuis 1978) et supporte probablement le fait qu’un SAE commun est une solution mais la conservation séculaire propre à l’archives définitive comporte des défis d’un autre ordre. Voir les travaux des nos collègues japonais, Preserving records in the cloud, Askhoj et al., Records Management Journal, Vol 21 Iss :3, pp 175-187, http://www:www.emeraldinsight.com/journals.htm?articleid=17003562 ) qui feront l’objet d’un autre billet prochainement.

Je suis par contre parfaitement d’accord avec lui quant au changement de temporalité entre archivage intermédiaire et définitif qui autoriserait un versement d’archives « jeunes » dans un SAE d’archives définitives alors que les données continuent de vivre leur vie dans un SAE courant et intermédiaire. La finalité de ces systèmes exigeant des modalités de gestion différentes et le versement précoce permettant d’éviter certains problèmes d’obsolescence technologique.

Un Cloud privé d’Etat

Ce n’était pas si clair que cela que c’était une hypothèse de départ. Bien sûr, c’est une solution pour éviter les questions de la préservation des données personnelles. Presque toutes les instances archivistiques qui ont émis des recommandations face à l’utilisation du Cloud ont mis de telles réserves formelles quant aux données personnelles dans les Cloud publics (ce qui veut dire commercial !!!) que la seule possibilité est effectivement le Cloud privé d’état. C’est la raison des projets Numergy et Cloudwatt en France, et c’est explicitement exprimé dans le projet de politique du nuage de l’administration fédérale suisse (https://regarddejanus.wordpress.com/2012/01/03/projet-de-strategie-de-linformatique-en-nuage-des-autorites-suisses/ ).

Désaccord sur les coûts

Encore une fois dans ce cas, la nuance entre archivage courant et définitif fait toute la différence. Pour le courant, les gains d’échelle et de souplesse seront certainement effectifs, même si on se limite à un Cloud d’état. Par contre, ces gains d’échelle s’amenuisent comme neige au soleil sur le long terme comme l’illustrent les calculs effectués par Daniel Rosenthal (Talk at Fall 2012 CNI). C’est pour cette raison que j’ai lancé un appel au colloque de février (et il semble avoir eu un écho) pour que la communauté archivistique documente le plus largement possible les coûts des projets d’archivage électronique en cours, pour que nous ayons des bases solides et documentées à ce sujet. Car si le ROI n’est pas au rendez-vous ou sera la révolution ?

Masse critique et mutualisation

Nous sommes d’accord et j’aimerais que la proposition « Les développements peuvent être mutualisés » devienne « DOIVENT être mutualisés ». C’est notre unique chance de succès et si la communauté archivistique arrive à produire des applications open source correctement conçues et facilement paramétrables en fonction des environnements variés que cela intéresse, alors nous auront une victoire d’étape importante. Mais ceci est effectivement indépendant de la problématique du Cloud.

Pour ne pas en finir avec l’Open Data

La problématique de l’open data pose la question de l’adéquation des données aux utilisateurs/citoyens en général, avant et/ou après archivage. Typiquement les formats de communication et les environnements applicatifs mis à disposition. Cette question doit être traité le plus en amont possible par les services producteurs mais cela n’exonère pas les archivistes d’y réfléchir. J’ai souvenir d’un débat animé lors d’un séminaire Erpanet il y a plus de 10 ans, sur le fait de savoir si les jeux de données archivés devaient être délivrés brut (à charge pour l’utilisateur de les installer dans des applications qui lui convienne) ou avec un post-processing préalable permettant un usage direct par des néophytes (avec le risque d’un usage mal documenté). Ce débat est encore ouvert, et complexifié par des considérations de coûts pas encore maîtrisés.

Mais Frédéric à raison, les archivistes ne doivent pas rester sur la touche dans ce domaine. Et dépasser les positions défensives (voir les requêtes commerciales sur l’état-civil) par ailleurs utiles, pour adopter une attitude plus prospective et pro-active.

Tagging et plan de classement

Il ne s’agit pas d’opposer le tagging et le plan de classement, ils ont complémentaires. Quant à avoir plusieurs plans de classement pour de mêmes objets numériques, nous avons esquissé cette discussion au colloque de février. Dans ce domaine également, il faut distinguer les constructions logiques (indépendantes des applications) et les outils applicatifs.

Ressources de calcul

L’objection de Frédéric est pertinente, le problème de gestion du réseau n’est pas spécifique au Cloud. Par contre, s’il coince dans un réseau privé, le responsable est clairement le service informatique maison qui devra assumer la correction du problème, dans le nuage, cette responsabilité peut être nettement plus diluée. Là aussi, un SLA bien conçu est plus que nécessaire et je confirme que ce n’est pas gagné même dans un réseau privé ; cela fait des mois que je talonne ma DSI pour qu’elle me fournisse une précision sur les niveaux de services attachés à nos différentes applications, sans résultat jusqu’à présent.

Conclusion provisoire sur la complexité

Oui, Frédérique a raison « l’archivage électronique notamment pour des durées de plus 10 ans, pousse les limites informatiques au-delà des considérations courantes des informaticiens ». C’est bien la raison pour laquelle il nous faut plus que jamais dialoguer sur ces questions, définir des concepts communs, partager des expériences.

Alors rendez-vous à Angers…(http://forum2013.archivistes.org/?cat=3) Le descriptif de ma communication n’y est pas encore publiée mais cela ne saurait tarder.

A propos regarddejanus

Archiviste, Record-manager et enseignant
Cet article, publié dans archivage numérique, Big Data, Informatique en nuage - cloud computing, records management, versement des données, est tagué . Ajoutez ce permalien à vos favoris.

4 commentaires pour Archivage et cloud, suite …

  1. Brégier Frédéric dit :

    Je me dois de le dire : Excellent !
    Même si il y a encore quelques points où on peut discuter (voir http://archiverleternite.blogspot.fr/2013/02/archivage-et-cloud-3-le-soulevement-des.html ), je suis quasiment d’accord avec toi sur tout !
    Merci !!
    Frédéric

    • regarddejanus dit :

      Pour ce round là nous avons convenu que nous avons fait le tour. Nous reprendrons de manière plus approfondie un point ou l’autre ultérieurement, avec, je l’espère, de nouvelles informations.

  2. Marie dit :

    Sur l’archiviste et ses relations avec l’open data, un archiviste français a publié un article sur notre blog : http://archivesonline.wordpress.com/2013/03/03/open-data-et-archives-et-si-on-repartait-a-zero/

    • regarddejanus dit :

      Bonjour Marie,
      Tout à fait d’accord avec ce billet que je pourrais résumer ainsi : le respect des exigences archivistiques sur les données les rendraient particulièrement aptes à être distribuées de manière ouverte. Par contre il nous faut encore pas mal travailler pour rendre tout cela interopérable….

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s