Le présent d'hier et de demain

Réflexions sur les archives et surtout l'archivistique à l'ère du numérique

Archivage électronique à long terme: Implémentation d’une application génératrice de SIP dans un système d’information métier

Tweet about this on TwitterShare on FacebookShare on LinkedInEmail this to someone

Par Anouk Dunant Gonzenbach

Dans le cadre du projet d’archivage électronique à long terme Gal@tae, il a été nécessaire de développer une application génératrice de SIP (Submission Information Package) dans le système d’information métier du producteur de documents. Le processus général de Gal@tae est décrit dans cet article . Nous souhaitons ici nous focaliser plus particulièrement sur cette application.

L’objectif à atteindre est que le service producteur puisse sélectionner les documents qui doivent être versés aux archives définitives directement dans son système d’information et qu’en quelques clics simples le SIP soit généré et prêt à être archivé.

En plus du SIP, l’application doit produire également un fichier XMl contenant les champs de description archivistique propres au SIP. Cette description doit être ensuite intégrée dans la base de données archives (ou AIS) (illustration 1).

image

Illustration 1

  •  SIP

Le cahier des charges avait pour base la Spécification du Submission Information Package (SIP) produit par les Archives fédérales suisses (AFS). En effet, les SIP seront dans le cadre de ce projet hébergés sur la plate-forme des AFS.

Un SIP est formé de deux répertoires. Le premier, le répertoire “content”, contient les documents électroniques à archiver. Le second, le répertoire “header”, contient les métadonnées rassemblées dans le fichier “metadata.xml” ainsi qu’un répertoire “xsd” réunissant les schémas XML qui définissent la structure des métadonnées.

  •  Fichier XML de métadonnées descriptives (inventaire)

Les métadonnées de description font l’objet d’un fichier produit par le service producteur et versé en sus du SIP. Les spécifications relatives à ce fichier XML ont été développées en interne (autrement dit par nous les archivistes): il s’agit d’un dictionnaire de métadonnées nécessaires à la description de documents électroniques, à savoir les champs ISAD-G traditionnels ainsi que les métadonnées propres à la description de ce type de documents. Ce dictionnaire a ensuite été transformé en schéma XML. Un composant applicatif permettant d’extraire les données du fichier XML pour les intégrer dans la base de données métier a ensuite été développé.

L’application

Le mandataire a développé cette application pour un système d’information métier sur la base des spécifications des AFS  et du schéma XML  de métadonnées descriptives fourni par les archivistes. Quelques réunions et la mise à disposition d’exemples de SIP  ont permis d’apporter les précisions nécessaires. Le fonctionnement est le suivant:

L’interface du système d’information métier propose une fonctionnalité supplémentaire nommée “module d’archivage”. Une fois qu’un  dossier d’affaire clos, ce dossier apparaît directement dans ce module d’archivage. Un numéro lui est apposé automatiquement.

Le processus d’archivage prévoit la préparation du SIP ainsi que celle du fichier XML de métadonnées descriptives. Le masque de saisie permet une correction des métadonnées, qui apparaissent automatiquement (illustration 2).

image

Illustration 2

Une fois les métadonnées vérifiées, les fichiers SIP et XML sont prêts à être générés (illustration 3):

image

Illustration 3

Le SIP (Archivage SIP) et le fichier XML de métadonnées descriptives (Archivage AEG) sont livrés dans deux fichiers au format ZIP, qui n’ont plus qu’à être envoyés à l’institution d’archives.

Le projet a demandé 50 jours de développement, dont 25 jours pour le composant de génération du SIP (analyse des données, analyse technique du schéma du SIP et du dictionnaire de données des AEG et développement). 25 jours ont été nécessaire pour les divers essais d’installation et de configuration, la gestion et le suivi de projet avec la direction générale des systèmes d’information, les modifications en cours de projet pour le passage d’un flux connecté avec un webservice à un flux autonome avec écriture des fichiers, les ajustements en fin de projet sur l’interface web et divers autres points.

Le composant développé peut être réutilisé pour d’autres producteurs ou services de l’administration, sans qu’il ne faille reprendre l’entier du développement.

Pour réutiliser le composant, il faut tout d’abord définir le dictionnaire de données pour les attributs métiers (autres que les champs ISAD-G traditionnels) et définir l’organisation des documents dans le répertoire « content » du SIP. Ensuite, il s’agit de développer la partie spécifique du composant qui va lire les données nécessaires.  Les autres fonctionnalités – construire le fichier XML, créer l’archive, etc.- sont disponibles.

Le temps d’analyse et de développement pour l’adaptation de l’application génératrice de SIP à partir de l’application développée dans le cadre du projet dépendra de l’ampleur du contenu traité par le service producteur et des sources de données auxquelles il faudra accéder.

Ce petit billet pour témoigner de notre expérience de développement d’une application SIP creator et de son implémentation dans un SI métier. Sur la base des spécifications et des exemples fournis, il n’y a pas eu de problème particulier pour ce développement.