Le format XML et ses applications pratiques en archivistique

Christian Rémillard <christian.remillard@umontreal.ca>
ARV1052 - Typologie des documents
29 octobre 2003

Bref survol du langage XML

XML, c'est quoi (1)?

XML, c'est quoi (2)?

XML, c'est quoi (3)?

Un exemple: un mémo


De: Julia Royer
A:  Jean Valjean 
    Sylvie Picard
CC: Luc Royer 
    Jonas Dupras

Sujet: Invitation

Veuillez noter que la prochaine réunion du conseil
d'administration se tiendra le 27 septembre 2000.

SVP, nous aviser si vous ne pouvez pas y assister.

Mémo, version RTF

[...]
{\b\f2\fs38\cf1\cgrid0 De:}{\f2\fs38\cf1\cgrid0  Julia Royer
\par }{\b\f2\fs38\cf1\cgrid0 À:  }{\f2\fs38\cf1\cgrid0 Jean Valjean
\par     Sylvie Picard \par \par }{\b\f2\fs38\cf1\cgrid0 Sujet: }
{\f2\fs38\cf1\cgrid0 Invitation
\par \par }\pard nowidctlpar\widctlpar\brdrt\brdrs\brdrw10\brsp20
\par }\pard \nowidctlpar\widctlpar\adjustright {\f2\fs38\cf1\cgrid0
Veuillez noter que la prochaine réunion du conseil
d'administration se tiendra le 27 septembre 2000.
\par \par SVP, avisez-moi dans les plus brefs délais si vous ne
pouvez pas y assister.}{ \par }}

Mémo, version XML

<?xml version="1.0" encoding="iso-8859-1" ?>
<mémo>
  <auteur>Julia Royer</auteur>
  <destinataires>
     <nom>Jean Valjean</nom>
     <nom>Sylvie Picard</nom>
  </destinataire>
  <sujet>Invitation</sujet>
  <cc>
     <nom>Luc Royer</nom>
     <nom>Jonas Dupras</nom>
  </cc>
  <corps>
     <para>SVP, nous aviser si vous ne pouvez pas y assister.</para>
  </corps>
</mémo>

Mémo, sa structure en arborescence

Une vue conceptuelle du même document:

Arborescence logique de Mémo.Arborescence logique de Mémo.

Chaque boîte de cette structure forme un fragment de document, lequel peut contenir d'autres fragments.

La définition de la structure

DTD de mémo (Document Type Definition)

<!ELEMENT mémo(auteur+, destinataires, sujet, cc?, corps)>
<!ELEMENT destinataires (nom+)>
<!ELEMENT cc (nom+)>
<!ELEMENT corps (para*)>
<!ELEMENT auteur (#PCDATA)>
<!ELEMENT sujet (#PCDATA)>
<!ELEMENT nom (#PCDATA)>
<!ELEMENT para (#PCDATA)>

Chaque ligne de la DTD est une règle qui définit un bout de structure du document. Par exemple, la première ligne (ou déclaration) définit le fragment de document mémo, lequel contient, dans l'ordre, une séquence de :

Ces règles permettent de définir l'ensemble des contraintes structurelles pour un type de document. Chaque document d'un type donné devra alors être conforme (ou valide) à la DTD associée au type.

Les avantages de XML

Les formats de fichiers et la dépendance informatique

Diagramme

Ses applications en archivistique

Au menu:

Format d'encodage des documents

XML dans le traitement archivistique

Fiches de métadonnées

L'encapsulation

Victorian Electronic Records Strategy (VERS)

The Victorian Electronic Records Strategy or VERS is a framework of standards, guidance and implementation projects which is centred around the goal of reliably and authentically archiving electronic records created or managed by the Victorian government.

Tiré de: http://www.prov.vic.gov.au/vers/

Exemple d'encapsulation XML

Consulter un exemple de fichier encapsulé selon le schème VERS.

La migration vers XML

La migration consiste au passage d'un format natif d'un document au format XML.

Limites

Les formats auto-descriptifs

Dernières nouvelles d'XML...

Fin de la présentation

Des questions?