Guide d'implémentation des métadonnées gouvernementales

version 0.5 (2004-02-09T15:30:27)

Historique des versions
Version 0.12003-11-06

Résumé

Résumé : Le présent document est un guide d'implémentation des métadonnées gouvernementales. Il vise à fournir les renseignements nécessaires pour permettent leur utilisation adéquate dans les ministères et organismes du gouvernemnt du Québec. Le Guide d'utilisation des métadonnées gouvernementales réfère au @@ Profils de métadonnées pour les documents gouvernementaux. Présentation revisées suite à la réunion du 15 mai 2003 du Comité.

Statut : ébauche

Points à éclaircir:

  1. Importation des métadonnées

  2. Exemples et figures

  3. Encodage, HTML, XML, enregistrement institutionnel


Table des matières

Avant-propos
1. Introduction
1. Réflexions sur les objectifs d'un profil normalisé de métadonnées au Gouvernement du Québec
1.1. Généralités
1.2. Diversité dans les sources et les emplacements de stockage des métadonnées
1.3. Objectifs réalistes
1.4. Les archives définitives
1.5. Conséquences des objectifs retenus
1.5.1. Conséquence sur les systèmes
1.5.2. Conséquences sur les autres profils de métadonnées utilisés au Gouvernement
1.6. Notes sur le Dublin Core
1.6.1. Restriction du DC
1.6.2. Extension du DC
1.6.3. Profil dérivé du DC
1.6.4. Un objectif pour le profil GQ?
2. But et portée du guide
3. Qu'est-ce que les métadonnées?
3.1. Métadonnées internes et externes
3.2. Des métadonnées pour les ressources numériques
4. Pourquoi utiliser des métadonnées?
4.1. Question d'interopérabilité
5. Pourquoi des métadonnées gouvernementales?
5.1. Le Dublin Core Metadata Initiative
5.2. Autres initiatives
2. Le modèle de métadonnées gouvernementales
1. Relation avec Dublin Core
2. Description du modèle
2.1. Extensibilité
2.2. Caractéristiques des métadonnées gouvernementales
2.3. Le Dumb-down Principle
3. Traduction du modèle
3. Les métadonnées gouvernementales et locales
1. Éléments de métadonnées gouvernementales (ou pangouvernementales)
2. Métadonnées locales
2.1. Règles pour le développement de propriétés pour une métadonnée
2.2. Créer un enrichissement
2.3. Créer un schème d'encodage
3. Les profils
4. Implémentation des métadonnées gouvernementales
1. Première étape : connaitre ses besoins
2. Deuxième étape : se constituer un ensemble de métadonnées
2.1. Utiliser les profils existants
2.2. Personnaliser un profil
2.3. Développer un profil
3. Troisième étape : dresser un plan d'implémentation
3.1. Quelles ressources décrirent en premier
3.2. Description rétrospective et description en lots
3.3. Encodage : scénario 1
3.4. Encodage : scénario 2
3.5. Syntaxe
4. Responsabilités et mise à jour des profils
5. Remarques préliminaires
6. TITRE
6.1. Règles de saisie pour le contenu
7. Notes
Glossaire
Bibliographie

Liste des tableaux

1.1. Éléments de métadonnées Dublin Core
3.1. Éléments de métadonnées gouvernementales
4.1. Stucture pour la présentation des éléments de métadonnées
4.2. Nom et description de l'élement Titre

Liste des exemples

1.1. Métadonnées

Avant-propos

Les métadonnées gouvernementales sont un des outils de gestion documentaire préconisés par le Cadre de référence gouvernemental en gestion intégré des documents (CRGGID). Une première vision de ces métadonnées a été élaborée dans le cadre du Chantier en ingénierie documentaire sous la forme de lignes directrices @@ulink pour trois types de documents gouvernementaux : les documents de référence, les documents de transaction et les messages de courriel. Lorsque le projet de Cadre de référence gouvernemental débuta, un Comité des métadonnées, réuni sous les auspices des Archives nationales du Québec, fut formé pour explorer plus en profondeur la question des métadonnées. Les travaux menés à partir des Lignes directrices ont permis d'identifier 27 métadonnées pour la description des documents gouvernementaux lesquelles ont été regroupé dans deux profils : un profil pour les documents de référence et un profil pour les documents de transaction. Les messages de courriels ont été abandonnées, ceux-ci pouvant généralement être classés dans l'une ou l'autre des catégories précédemment citées.

Le modèle de métadonnées gouvernementales s'inspire du standard Dublin Core. Supporté par le W3 Consortium depuis 1998, le Dublin Core est devenu en 2003 une norme ISO (en voie de publication). Le standard DC est en outre le format minimum de l'Open Archives Initiatives (OAI) qui permet, via l'interopérabilité des serveurs, l'exposition et la récolte de métadonnées.

Chapitre 1. Introduction

1.  Réflexions sur les objectifs d'un profil normalisé de métadonnées au Gouvernement du Québec

1.1. Généralités

Quels objectifs doivent être visés par un profil de métadonnées normalisées pour l'ensemble du Gouvernement du Québec (nous utilisons « profil » au singulier, étant pleinement conscient qu'un tel profil serait composé de deux sous-profils, pour deux grandes classes de documents)? Voyons d'abord quelques possibilités d'objectifs et leurs faiblesses.

S'agit-il d'avoir un profil unique qui conviendrait à tous les documents gouvernementaux sans exception et qui suffirait à effectuer tous les traitements possibles sur ces documents? Non, puisqu'un tel profil serait fabuleusement complexe. En effet, les profils normalisés existants comme le MARC, les RDDA, le Dublin Core et les divers profils de type GILS sont tous justifiés pour certains types d'opération à effectuer sur les documents. Il faudrait donc forcément qu'un profil « universel » subsume tous les profils existants, d'où notre conclusion d'une trop grande complexité. Puisqu'une trop grande complexité implique la nécessité de recourir à des spécialistes pour la création et l'exploitation des métadonnées, cette approche n'a pas sa place dans le contexte du CRGGID. D'ailleurs, est-ce qu'une même personne pourrait être spécialiste d'un profil de métadonnées qui subsume le MARC et les RDDA, pour ne citer que ces deux profils?

S'agit-il d'avoir un profil universel, mais exclusivement axé vers la recherche d'information? Un tel profil ne serait en effet pas dénué d'intérêt puisqu'il permettrait la constitution d'un outil de recherche universel, une espèce de « super Google » gouvernemental permettant de repérer tout document gouvernemental, peu importe son type, sa localisation et son support. Mais la principale lacune de cette approche, en regard des objectifs du CRGGID, serait de n'offrir aucune aide (directe, en tout cas) pour satisfaire les exigences d'une gestion documentaire rigoureuse, laquelle est maintenant une obligation bien définie pour l'administration publique québécoise, en vertu de la Loi concernant le cadre juridique des technologies de l'information. En effet, de par l'universalité souhaitée d'un tel profil, il devrait forcément être très simple, par exemple, un sous-ensemble du Dublin Core (un peu comme le Gouvernement fédéral préconise pour les documents Web). Alors, les métadonnées nécessaires à une gestion documentaire conforme aux exigences de la loi précitée en serait nécessairement exclues.

Par ailleurs, une autre lacune de l'approche « profil universel pour la recherche » est que, encore une fois à cause de sa simplicité obligée, elle n'offre aucune aide pour la conservation à long terme des documents, ni pour la disposition des documents lorsqu'ils n'ont plus de valeur primaire. Or, c'est un des objectifs du CRGGID de tenir compte de ces problématiques.

1.2. Diversité dans les sources et les emplacements de stockage des métadonnées

Avant de poursuivre notre recherche d'objectifs réalistes pour un profil normalisé de métadonnées, nous devons rappeler que les métadonnées d'un même document peuvent avoir différents emplacements de stockage par rapport au document, de même que différentes personnes comme source, les deux phénomènes étant d'ailleurs reliés. Ces phénomènes résultent du fait que certaines métadonnées applicables à un document proviennent du (ou servent à renseigner sur le) contexte de création ou d'existence du document. Tant que le document demeure dans son contexte originel, il n'est pas nécessaire que les métadonnées correspondant au contexte soient intégrées dans le document lui-même. En effet, les éléments constitutifs du contexte étant accessibles tout autant que le document au moment où on le consulte, ces informations pourraient (en théorie, en tout cas) être récupérées directement du contexte plutôt que du document. Par contre, dès que l'on déplace le document hors de son contexte originel, toutes les métadonnées que l'on désire conserver doivent être extraites du contexte et placées ailleurs, par exemple dans le document lui-même ou dans une base de données (d'où il doit être possible de faire le lien avec le document, si on veut que ces métadonnées soient exploitables).

Le document papier (i.e., dont l'original légal à gérer est sur papier) a une situation particulière par rapport à l'emplacement de stockage des métadonnées. En effet, les métadonnées dont nous parlons ici sont des métadonnées ordinolingues et doivent donc forcément être stockées informatiquement, par exemple dans une fiche de base de données. Conséquemment, on pourrait dire qu'aucune métadonnée d'un document papier n'est stockée dans le document lui-même.

Puisque les métadonnées ne proviennent pas tous du même endroit, il est logique que ce ne soit pas forcément les mêmes personnes qui soient responsables de leur spécification (nous n'utilisons pas le mot « saisie » ici, puisqu'il est trop précisément lié à l'action d'entrer la spécification d'une valeur dans un ordinateur). Illustrons le phénomène avec un exemple: supposons qu'on est en présence d'un profil de métadonnées qui comporte une métadonnée « sujet » (obligatoire), et supposons qu'un système administratif produise des instances de formulaires d'un certain type; il y a fort à parier que pour la métadonnée « sujet », l'ensemble des instances doive avoir la même valeur. Il est assez clair que la meilleure personne pour spécifier la valeur de cette métadonnée n'est pas l'individu qui remplit une instance spécifique du formulaire, mais plutôt l'architecte du système d'information (ou même, du processus d'affaires sous-jacent), ou un spécialiste de l'information qui le conseille.

Pour résumer, certaines métadonnées dépendent du contexte de création ou d'existence du document; à ce titre, elles sont identiques pour tous les documents dans ce même contexte; il y a donc économie à réaliser dans la saisie de cette métadonnée en la spécifiant non pas au moment de la sauvegarde du document, mais au moment de la mise sur pied du système de création des documents; ce n'est donc pas la personne qui sauvegarde le document qui spécifie la valeur de cette métadonnée, mais bien le concepteur du système, ou un spécialiste de l'information agissant comme conseiller au moment de la conception du système. La valeur de métadonnée est donc associée au système qui crée l'instance de document, et non à l'instance spécifique; elle peut être incluse dans chaque instance, puisqu'elle est connue au moment où chaque instance est sauvegardée pour la première fois, mais ce n'est pas nécessaire; elle est connue implicitement de par le contexte de création de l'instance.

Notons que les phénomènes de diversité des sources et des emplacements de stockage des métadonnées peuvent être exploités d'au moins quatre façons pour diminuer la complexité apparente du profil au moment où monsieur tout-le-monde saisit des métadonnées:

  1. Par le non-stockage de certaines métadonnées contextuelles dans les documents eux-mêmes. Ces métadonnées n'ont donc pas à être saisies à la sauvegarde. Elles peuvent être ajoutées dans les documents au moment où ceux-ci quittent leur contexte originel, ou encore peuvent être stockées dans une base de données externe sans que l'on ait jamais à les inclure dans les documents (sinon peut-être au moment d'une exportation ou d'un versement, par exemple vers les ANQ).

  2. Par l'utilisation de métadonnées fixes n'apparaissant pas dans le bordereau de saisie mais quand même insérées dans le document lui-même à la sauvegarde.

  3. Par l'utilisation de métadonnées fixes apparaissant en lecture seulement dans le bordereau de saisie. Leur présence peut être utile pour « rassurer » intellectuellement l'utilisateur et/ou lui rappeler certaines informations qui vont faciliter la saisie des autres métadonnées.

  4. Par l'utilisation de valeurs par défaut (en fonction, par exemple, de l'identité de l'utilisateur spécifique) apparaissant comme suggestions dans le bordereau de saisie, mais pouvant être modifiée par l'utilisateur au besoin. La date du jour comme date de création d'un nouveau document est l'exemple par excellence de ce procédé.

1.3. Objectifs réalistes

Donc, que peut-on espérer et exiger d'un profil normalisé pan-gouvernemental de métadonnées? D'une part, nul doute que l'utilisabilité universelle du profil recherché pour la saisie des métadonnées est essentielle; en d'autres termes, il faut que n'importe quelle personne susceptible de produire un document institutionnel au gouvernement puisse fournir facilement les métadonnées requises d'elle, et ce sans aucune formation ou, au pire, avec une très légère formation, du genre tutoriel en ligne de quelques minutes. À notre avis, si ce principe d'utilisabilité universelle pour la saisie n'est pas respecté, l'adoption massive du profil retenu est impossible. La simplicité découlant de ce principe, d'ailleurs, a l'effet secondaire intéressant de permettre également la recherche d'information universelle. Par contre, une complexité minimale semble nécessaire pour permettre une gestion documentaire rigoureuse, exigée par la loi.

Nous avons donc, comme souvent, deux objectifs au moins en apparence contradictoires: d'une part, complexité suffisante; d'autre part, complexité minimale. Cela laisse penser qu'il faudra rechercher une solution de compromis; et également qu'il faudra probablement tabler sur de l'ingéniosité dans le déploiement du profil retenu. Concrètement, cela voudrait dire exploiter au maximum les phénomènes de diversité des sources et des emplacements de stockage des métadonnées, pour diminuer la complexité apparente du profil au moment de la saisie des métadonnées.

Notons que, comme genres d'opération devant être rendus possibles par le profil de métadonnées retenu, nous n'avons mentionné jusqu'ici spécifiquement que la gestion documentaire rigoureuse et la recherche d'information. Pourquoi ces opérations et pas certaines autres, comme la constitution automatique de catalogues dans les règles de l'art bibliothéconomiques, ou encore la constitution automatique d'instruments de recherche archivistiques? D'une part, tout document doit être géré, quel que soit son type; de plus, la gestion documentaire est la seule opération qui soit régie par la loi (pour les besoins du discours, nous nous permettons ici de voir l'ensemble de la gestion documentaire comme une seule opération, si complexe soit-elle). D'autre part, la recherche d'information occupe une place privilégiée, non seulement au sein de la gestion documentaire, mais dans tout type d'opérations relié aux documents. C'est la base même de l'exploitation et de la réutilisation de l'information, deux des finalités principales de la gestion de l'information en général.

Ces considérations nous amènent à formuler un premier objectif.

Objectif 1

Le profil recherché devra représenter un compromis de complexité entre la simplicité requise pour une utilisabilité universelle en saisie et en recherche, et la sophistication nécessaire à une gestion documentaire rigoureuse et conforme à la loi. Autrement dit, il faudra rechercher la complexité minimale qui permette une gestion documentaire adéquate. La complexité inévitable du profil retenu sera diminuée le plus possible pour l'utilisateur final par l'exploitation des phénomènes de diversité des sources et des emplacements de stockage des métadonnées.

Notons tout de suite que l'exploitation préconisée des phénomènes de diversité des sources et des emplacements de stockage des métadonnées n'implique pas nécessairement que le profil retenu n'existe que virtuellement. Il est tout à fait possible d'exiger qu'à partir d'un document quelconque, on puisse, par un jeu de pointeurs, retrouver l'entièreté des métadonnées qui lui sont associés. C'est d'ailleurs ce que nous prévoyons préconiser dans la méthodologie du CRGGID.

Que faire avec les profils existants spécialisés évoqués ci-dessus, comme le MARC et les RDDA? Il est indéniable que ces profils sont très largement utilisés dans le monde et qu'ils sont pris en charge par de nombreux systèmes informatiques, commerciaux ou autres. Le profil normalisé retenu devrait offrir la plus grande interopérabilité possible avec ces profils existants. Puisque le profil retenu ne subsumera pas l'ensemble des profils existants, il est clair que l'interopérabilité ne pourra pas être complète. Il est cependant réaliste de se fixer l'interopérabilité à sens unique, en importation, comme objectif. Cela veut dire qu'à partir des fiches descriptives conformes à l'un des profils existants, on devrait pouvoir dériver automatiquement des fiches descriptives conformes au profil normalisé. Une telle dérivation pourrait bien évidemment tabler sur les phénomènes de diversité des sources et des emplacements de stockage des métadonnées; par exemple, lors de l'exportation d'un catalogue de bibliothèque en MARC vers le profil normalisé, une valeur fixe prédéterminée et adéquate pourrait être insérée automatiquement comme valeur de la métadonnée « règle de conservation » , en supposant qu'une telle métadonnée figure dans le profil normalisé.

Nous formulons donc notre second objectif.

Objectif 2

Le profil recherché devra permettre l'interopérabilité en importation à partir des principaux profils existants (MARC, RDDA et peut-être quelques autres), c'est-à-dire la conversion automatique des fiches du profil existant vers le profil normalisé. Ces conversions pourront exploiter les phénomènes de diversité des sources et des emplacements de stockage des métadonnées.

1.4. Les archives définitives

Comment le CRGGID devrait-il se positionner par rapport à la gestion des archives définitives (ou historiques)? À notre avis, il devrait recommander des pratiques qui facilitent les versements aux ANQ prévus par la loi sur les archives, de même que les traitements qui y sont effectués. Comme on peut envisager qu'à plus ou moins long terme, les ANQ s'orienteront vers un service OAIS avec comme schème de description les RDDA (ou une variante internationale actuellement en développement, mais qui devrait vraisemblablement ressembler aux RDDA), il semble raisonnable que, dans la mesure du possible, le profil retenu soit compatible avec les RDDA, dans le sens qu'il facilite le plus possible la constitution de descriptions RDDA des fonds (ou composants de fonds) versés aux ANQ. Cependant, comme seulement 5% environ de tous les documents administratifs sont appelés à être conservés à titre d'archives définitives, une telle compatibilité ne devrait être qu'un souhait et ne devrait pas orienter très fortement les spécifications du profil retenu. Nous pouvons cependant formuler un troisième objectif.

Objectif 3

Dans la mesure du possible, le profil retenu devrait favoriser la création de descriptions RDDA des fonds versés aux ANQ.

1.5. Conséquences des objectifs retenus

1.5.1. Conséquence sur les systèmes

Il faut être conscient que l'Objectif 1 implique qu'une certaine part des efforts reliés aux métadonnées doit être déployée au moment de la conception et du développement des systèmes d'information gouvernementaux. Il affectera la conception et le développement des fonctions de saisie des métadonnées, puisque différents procédés exploitant la diversité des sources et des emplacements de stockage devront être implantés, mais également la conception et le développement des fonctions de recherche d'information, puisque celles-ci devront peut-être colliger et fusionner des métadonnées dont les emplacements de stockage sont multiples. Nous croyons que cette charge additionnelle à la conception et au développement des systèmes est inéluctable, qu'elle est le prix à payer pour concilier les deux objectifs originels contradictoires.

Cette situation n'est pas catastrophique et elle est en fait naturelle. En effet, le CRGGID s'adresse directement aux concepteurs de systèmes (responsables de la gestion documentaire, archivistes, informaticiens, etc.), et non à l'utilisateur final; il est dans l'ordre des choses qu'il contienne des lignes de conduite sur la conception et le développement des systèmes.

1.5.2. Conséquences sur les autres profils de métadonnées utilisés au Gouvernement

Ces profils doivent être interopérables à sens unique en importation avec le profil normalisé, et ce, soit directement, soit indirectement, via des fonctions d'exportation prévues dans les systèmes qui gèrent ces profils.

1.6. Notes sur le Dublin Core

Le DC est un profil de métadonnées très populaire. Il peut donc être intéressant, a priori, de viser la plus grande interopérabilité possible avec ce profil. Comment un profil normalisé devrait-il se situer par rapport au DC?

Il ne serait pas très réaliste de viser l'interopérabilité à sens unique en importation avec le Dublin Core, car le Dublin Core est un profil conçu pour la recherche universelle accessible. Il n'est pas assez riche (ne serait-ce que parce qu'aucun élément n'est obligatoire!). Pour ce qui est de l'interopérabilité à sens unique en exportation (produire des fiches Dublin Core à partir des fiches du profil retenu), il faudrait pratiquement faire exprès pour ne pas l'avoir, étant la pauvreté du DC.

1.6.1. Restriction du DC

Pourrait-on pousser l'interopérabilité en exportation à l'extrême et faire en sorte que toute fiche du profil retenu soit aussi, directement, sans aucune modification, une fiche DC? Cet état de choses pourrait être intéressant pour diverses raisons, la principale étant probablement qu'il permettrait l'indexabilité directe des fiches (ou documents), sans aucune exportation, par tout outil capable de traiter du DC.

Comment cela serait-il possible? Il faudrait que le profil retenu soit une restriction du Dublin Core, c'est-à-dire qu'il inclue toutes les règles du DC, et leur ajoute d'autres règles (ou contraintes), qui restreignent encore plus la forme auxquelles les fiches doivent obéir. Un exemple simple de contrainte additionnelle serait de rendre un des éléments du DC obligatoire; un autre exemple serait d'obliger que tel élément du DC soit saisi en respectant telle règle d'écriture spéficique, ou encore que la valeur inscrite dans tel élément du DC provienne d'une liste contrôlée particulière, par exemple un thésaurus donné.

Pour arriver à ce que le profil retenu soit une restriction du DC, il faut être extrêmement parcimonieux dans l'élaboration du profil retenu, sinon il en résulte des règles d'écriture extrêmement complexes, qu'il est très difficile d'implanter et qui peuvent même contrevenir à l'esprit du DC. En effet, supposons que l'on veuille intégrer dans notre profil un élément qui n'est pas du tout prévu dans le DC, comme par exemple, un indentifiant de règle de conservation applicable au document. Alors, il faudra décider à quel élément DC on fait correspondre, un peu artificiellement, notre nouvel élément; puis, il faudra décider une règle d'écriture qui fera en sorte que nos applications pourront identifier les occurrences de l'élément DC qui « encodent » en fait notre nouvel élément (par exemple, faire commencer la valeur par la chaîne « règle-de-conservation:" ». Une telle approche, tout en respectant la compatibilité « littérale" » au DC, n'en respecte pas l'esprit. Essentiellement, donc, si l'on veut avoir un profil qui soit une restriction du DC, il faut pratiquement s'en tenir aux éléments du DC.

1.6.2. Extension du DC

Si on part d'une restriction du DC et qu'on ajoute de nouveaux éléments, justifiés par nos besoins spécifiques, en respectant rigoureusement les règles syntaxiques générales de codage du DC, on obtient une extension du DC. Évidemment, pour les éléments du DC, il n'est pas question de changer leur nom (par exemple, de les traduire dans une autre langue). Notons que les comités du DC contrôlent farouchement la définition des extensions du DC, de sorte que pour pouvoir se proclamer officiellement comme une extension du DC, il faut l'approbation officielle des comités du DC. Pour des besoins particuliers justifiant l'ajout d'éléments, cette avenue nous semble la plus souhaitable.

1.6.3. Profil dérivé du DC

Même sans viser une extension du DC, on pourrait souhaiter s'en inspirer, au moins pour le codage syntaxique des métadonnées, de façon à favoriser la plus grande interopérabilité possible avec le DC. Il faut savoir deux choses: (1) les règles de codage syntaxique du DC en XML ne sont pas encore des normes officielles, bien qu'il existe un document qui semble faire consensus; (2) ces simples règles de codage limitent grandement la latitude de conception d'un profil de métadonnées. Par exemple, les valeurs structurées ne sont en général pas admises comme valeurs de métadonnée; cela entraîne que les métadonnées avec « propriétés » (ou « sous-valeurs ») sont très difficiles à définir. D'autre part, il n'est pas possible d'avoir des blocs répétables dans les métadonnées (par exemple, pour décrire plusieurs exemplaires d'une même ressource en une seule fiche).

1.6.4. Un objectif pour le profil GQ?

Dans l'ordre du plus souhaitable au moins souhaitable, les positionnements possibles par rapport au DC, pour ce qui est de l'interopérabilité, sont:

  1. Interopérabilité en importation. À toutes fins pratiques, impossible dans le contexte GQ, à cause de la pauvreté du DC.

  2. Restriction du DC. Serait possible, au prix de grands sacrifices (par rapport aux travaux du Chantier en ingénierie documentaire, par exemple).

  3. Extension du DC. Serait possible, mais demanderait une très grande attention dans l'élaboration du profil GQ.

  4. Profil dérivé du DC. Serait tout-à-fait possible, mais exigerait une certaine parcimonie dans l'élaboration du profil.

Cela étant dit, nous nous devons de souligner qu'à la suite des travaux du 15 juillet 2002 du Comité sur les métadonnées, aucun de ces positionnements par rapport au DC n'est possible. Si toutefois un de ces positionnements devait faire l'objet d'un objectif pour le profil GQ, de nombreuses décisions prises le 15 juillet 2002 devraient être modifiées.

2. But et portée du guide

Le présent document donne de l'information et des directives pour l'application des métadonnées gouvernementales pour la description des ressources informationnelles de tout format dans les ministères et organismes gouvernementaux. Cette application se traduit officiellement dans le monde gouvernemental par l'acte d'enregistrement institutionnel. Le guide s'adresse aux acteurs et responsables de la gestion documentaire dans les ministères et organismes gouvernementaux et à toute personne amenée à utiliser les métadonnées gouvernementales pour la création, la réception ou l'enregistrement de documents. Il doit être utilisé conjointement avec le document Profils de métadonnées pour les documents gouvernementaux. Présentation revisée suite à la réunion du 15 mai 2003 du Comité @@

Le guide se divise en trois parties. La première partie introduit le concept de métadonnée et montre l'utilité de métadonnées gouvernementales. La deuxième partie décrit le modèle gouvernemental et la troisième partie explique comment implémenter et développer les métadonnées gouvernementales sur la base ou non de profils existants. Enfin, un glossaire et une bibliographie complète le guide.

3.  Qu'est-ce que les métadonnées?

Qu’est-ce qu’une métadonnée? Le concept semble récent, pourtant, les métadonnées sont utilisées depuis longtemps. Notamment par les bibliothécaires qui, de tout temps, ont décrit leurs ressources dans des catalogues à l'aide de métadonnées. Le terme lui-même n'existait pas alors, mais des données comme titre, auteur et éditeur sont exactement le type d'information dont on parle quand il est question de métadonnées. En fait, l'on définit généralement les métadonnées comme étant « des données sur des données » ou plus clairement, des données qui nous renseignent sur d'autres données, les rends compréhensibles et permet leur utilisation pertinente. Par analogie, on peut dire que les métadonnées sont aux données ce que l’étiquette est au contenant. Ainsi, l’étiquette d’une boîte de pillules affiche certains renseignements utiles comme le nom du médicament, sa composition, la posologie recommandée, etc. Tous ces renseignements informent sur le contenu de la boîte et le décrivent de manière à permettre son utilisation adéquate. Ce sont, en quelque sorte, des métadonnées.

Les métadonnées se présente de différentes façons. Il peut s’agir de texte libre, de mots-clé ou d’informations aussi banales que le titre d’un document, sa date de création ou son auteur. Mais il se peut parfois que l'on y retrouve des informations plus complexes, comme le format d'un fichier, la résolution (s’il s’agit d’une image) ou le niveau de sécurité qui lui est attribué. Toute ressource d'information, peu importe son format (par exemple des images, des fichiers sonores, des documents papiers, etc) peut être décrite à l'aide de métadonnées.

3.1. Métadonnées internes et externes

Les métadonnées peuvent se situer à deux niveaux : internes et externes. Les métadonnées internes peuvent être générées automatiquement par une application ou saisies par l’utilisateur lui-même. Un document Word, par exemple, contient de nombreuses métadonnées générées automatiquement par l’application (le type de document, la taille du fichier, la date de création, etc.) et peut en contenir d'autres, ajoutées manuellement par l'utilisateur (à l'aide de la fonction Propriétés du menu Fichier). Quand aux métadonnées externes, on les nomme ainsi parce qu'elles sont gérées dans un système externe au contenu : par exemple, un catalogue de bibliothèque. On dit alors que les métadonnées sont externes aux ressources qu’elles décrivent.

Ce sont les deux principales façons d'utiliser les métadonnées : les inclure dans les ressources mêmes ou les enregistrer dans une fiche à part, liée d'une façon quelconque à la ressource. Il existe également une troisième façon plutôt utilisé pour la conservation ou la circulation des documents : l'encapsulation. Le document conserve son format original et est inséré dans une enveloppe XML. L'enveloppe conserve des métadonnées à propos du document, dont: des données descriptives du document (auteur, titre, date de création, etc.) le type MIME des données journalisées de l'administration de l'objet conservé (enveloppe et document) des données de conservation de l'objet.

3.2. Des métadonnées pour les ressources numériques

De façon générale, le terme de métadonnée est associé à l'environnement numérique et plus particulièrement à la description des ressources du web. Si les métadonnées existaient bien avant Internet et le Web, ce n'est qu'avec l'augmentation grandissante des ressources en ligne (bibliothèques numériques, édition électronique, etc.) que s'est développé un intérêt mondial pour des normes descriptives et de nouvelles pratiques aptes à améliorer la recherche d'information. De même pour les organismes privés et publics pour qui la masse sans cesse croissante de documents numériques créés dans leurs activités quotidiennes cause de sérieux maux de tête! Surtout que, de plus en plus, ces documents sont conservés dans leur format original, certains d'entres eux ne se matérialisant même plus sur support papier durant tout leur cycle de vie!

Les documents numériques que l'on crée à l'aide d'application bureautiques ou autre contiennent de nombreuses métadonnées implicites ou explicites, comme nous l'avons vu précédemment avec notre document Word. Dans le cas des pages web, les métadonnées sont souvent internes et se situent dans le code source lui-même. Les métadonnées d'un document HTML, par exemple, se situent généralement entre les balises <head> dans l'en-tête du document, comme le montre l'exemple suivant :

Exemple 1.1.  Métadonnées

<head> <meta name="title" content="L'Énergie au Québec"> <meta name="keywords" content="Énergie,électricité,gaz naturel,pétrole,énergie nouvelle"> <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1"> </head>

On remarque dans cet exemple que les métadonnées se divisent en deux parties. La première partie, le nom, précise la caractéristique décrite : meta name="title" . La deuxième partie, le contenu, contient l'information au sujet de la caractéristique décrite : content="L'Énergie au Québec". L'ensemble de ces deux parties constituent l'unité de base des métadonnées. On appelle cette unité de base élément de métadonnées.

4. Pourquoi utiliser des métadonnées?

Les métadonnées ont plusieurs applications que l'on peut rassembler sous deux grandes fonctions : d'une part, elles favorisent le repérage de l’information, son partage et sa réutilisation. D'autre part, elles aident à la préservation et la conservation des données. Ainsi, dans le monde papier, elles sont souvent utilisées pour décrire le contenu d'une ressource ou d'une collection, comme le font les bibliothécaires en cataloguant leurs ressources. Dans le monde numérique, les métadonnées de description aident les moteurs de recherche et d'indexation à mieux « comprendre » le contenu d'une page, ce qui augmente la précision des recherches. Dans l'exemple précédent, les métadonnées nous indiquent le titre de la page Web, quelques mots-clés (keywords) pour le moteur de recherche, le format électronique, ou type MIME, (texte/html) et le jeu de caractères (iso-8859-1) du texte.

Également, les métadonnées jouent un rôle important pour la préservation de l'authenticité et de l'intégrité des documents numériques tout au long du cycle de cycle de vie. Grâce à elles, on peut garder une trace du « parcours » d'un document et des différentes manipulations qu'il subit, notamment les opérations liés à sa conservation. Les métadonnées peuvent également servir à « sécuriser » une ressource, par exemple, en définissant pour celle-ci des droits d'utilisation. Bref, les métadonnées ont tout un tas d'utilité mais elles n'atteignent leur plein potentiel que si tous les acteurs d'un même environnement partagent une définition et une nomenclature commune. C'est ce qu'on appelle l'interopérabilité.

4.1.  Question d'interopérabilité

Un système informatique est interopérable lorsqu'il a la capacité de communiquer, ou de fonctionner, avec un autre système, que ses programmes peuvent partager des données et des ressources. Si l'on revient à nos métadonnées, cet efficacité d'échange est impossible à atteindre si, par exemple, la métadonnée « auteur » d'une ressource est appellée dans un ministère X Auteur, dans un ministère Y Créateur et dans un organisme Z Author. Ces trois entités ne pourront échanger leur information qu'après concertation et développement de passerelles de conversion. La chose est tout aussi vraie s'ils souhaitent échanger des données avec le monde extérieur. Ainsi, plus il y a d'entités qui partagent un langage commun, plus les échanges peuvent être fructueux. C'est de ce constat qu'est né le Dublin Core Metadata Initiative (DCMI) dont le modèle a inspiré les profils de métadonnées gouvernementales.

5. Pourquoi des métadonnées gouvernementales?

Une des premières utilités des métadonnées dans un contexte gouvernemental est d'assurer un meilleur contrôle des documents et plus particulièrement des documents numériques. Comme partout ailleurs, le volume de documents numériques créés, diffusés ou reçus au sein du gouvernement ne cesse de croître. Actuellement, la plupart de ceux-ci sont conservés sur des postes de travail individuels, dans des répertoires personnels. Comment faire pour éviter que des documents officiels et utilisés dans des processus d'affaires se retrouvent dans cette position? Une des solutions est de transférer la responsabilité du document hors du contrôle individuel au profit du contrôle institutionnel. On y arrive en enregistrant institutionnellement la ressource. Lors d'un enregistrement institutionnel, le document est sauvegardé dans un espace virtuel déterminé avec les données qu'il contient (son contenu) et les éléments d'informations (les métadonnées) nécesssaires à son repérage, sa conservation et sa manipulation.

Aussi, comme tous les documents gouvernementaux, les documents numériques doivent être en mesure de répondre aux exigences des lois québécoises en vigeur et plus particulièrement à La loi concernant le cadre juridique des technologies de l'information (L.Q. 2001 c.32). Cette loi, entres autres choses, établit l'équivalence fonctionnelle des documents et leur valeur juridique, quels que soient les supports. Le profil de métadonnées pour les documents de transaction permet de satisfaire aux exigences relatives à la préservation de leur valeur probante, c'est-à-dire leur intégrité et leur authenticité.

Enfin, l'espace Web est de plus en plus utilisé au gouvernement (comme partout ailleurs) pour fournir de l'information et des services au citoyens. C'est ce qu'on appelle le gouvernement en ligne ou e-governement. L’importance des métadonnées dans un tel contexte est reconnue de façon croissante par les gouvernements à l’échelle mondiale. D'abord parce que'une bonne description des ressources permet aux gens de localiser plus rapidement et plus efficacement les informations qu'ils désirent lorsqu'ils naviguent sur les sites gouvernementaux. Ensuite, parce que les métadonnées facilitent également la gestion des ressources misent en ligne et, lorsqu'elles sont utilisées de façon normalisée, favorisent l'interopérabilité.

5.1. Le Dublin Core Metadata Initiative

Le Dublin Core Metadata Initiative (DCMI) est le premier ensemble de métadonnées normalisé à avoir vu le jour. Il s'agit d'un jeu de 15 métadonnées destinées originellement à la description des pages Web. La liste de ces métadonnées fut définie en 1995 par des équipes (du monde des bibliothèques et de la publication) impliquées dans la sémantique du Web lors d'un atelier à Dublin (Ohio). Le Dublin Core (DC) n'est pas une norme mais une initiative internationale, basée sur un consensus et entièrement ouverte. Si le DC définit des métadonnées, il ne décrit pas la façon de les représenter en pratique et offre, de ce fait, une grande liberté d'utilisation..

Supporté par le W3 Consortium depuis 1998, le Dublin Core est devenu en 2003 une norme ISO (en voie de publication). Le standard DC est en outre le format minimum de l'Open Archives Initiatives (OAI) qui permet, via l'interopérabilité des serveurs, l'exposition et la récolte de métadonnées. Il a également été récemment approuvé par le National Information Standards Institute (NISO) comme standard numéro Z39.85 et par l'American National Standards Institute (ANSI) sous le numéro Z39.85-2001. Le modèle Dublin Core est à la base de plusieurs ensembles de métadonnées utilisés à travers le monde qui le reprennent intégralement ou s'en inspire.

Les 15 métadonnées Dublin Core peuvent être répartis en 3 groupes :

Tableau 1.1. Éléments de métadonnées Dublin Core

Contenu Propriété intellectuelle Administratif
Titre / Title Créateur / Creator [auteur] Date
Sujet / Subject [mots-clés]Editeur / Publisher Type
Description [résumé]Contributeur / Contributor Format
Source [référence originelle]Droits / Rights Identifiant / Identifier
Langue / Language  
Relation [autre(s) source(s) en rapport]  
Couverture / Coverage [spécification spatio- temporelle]  

5.2.  Autres initiatives

Que ce soit pour la description de leurs ressources en ligne ou de leurs documents numériques créés dans le cadre de leurs activités, un ensemble de plus en plus grand de gouvernements, (le Canada, l'Australie, le Royaume-Uni, les États-Unis, de la Finlande, etc.) utilisent les métadonnées dans une forme normalisée. Ainsi, pour mettre en place son programme de modernisation de l'État, le gouvernement brittanique publiait en mai 2003 une deuxième version du e-Government Metadata Standard en arguant du fait que la structuration et la conformité des métadonnées est nécessaire à travers l’ensemble des organismes du gouvernement. Les institutions d'archives nationales participent activement à la mise en place de métadonnées normalisées pour leur gouvernement. C'est le cas des Archives nationales du Canada et des Archives Nationales d'Australie qui ont développé chacun un ensemble de métadonnées normalisé basé sur le Dublin Core.

Chapitre 2. Le modèle de métadonnées gouvernementales

1. Relation avec Dublin Core

Le modèle de métadonnées gouvernementales est inspiré sur le modèle de Dublin Core. Pourquoi parle-t-on de modèle abstrait ?@@

Dans un contexte de e-governement, se doter de métadonnées compatibles avec Dublin Core est un choix stratégique important. Plusieurs caractéristiques du modèle DC justifient ce choix :

  • Compatibilité avec les standards internationals

    L'initiative Dublin Core a été approuvée comme norme ANSI sous le numéro Z39.85-2001 et comme norme ISO sous le numéro 15836 (elle est actuellement en voie de publication). Plusieurs gouvernements l'ont adopté, notamment les gouvernements canadien, australien et britannique.

  • Simplicité

    Le modèle est facile à utiliser.

  • Exensibilité

    On peut répéter ou qualifier des éléments pour étoffer l'information désirée. L'on peut aussi créer des extensions locales. Il est admit que le Dublin Core ne couvre pas tous les besoins, puisqu'il s'agit essentiellement de métadonnées descriptives mais l'on peut alors s'en servir comme d'un noyau pour mettre au point ses propres besoins.

  • Flexibilité

    Le modèle est suffisament général pour être utilisé dans plusieurs disiplines.

  • Indépendance vis-à-vis des systèmes

    Le Dublin Core peut être utilisé dans n'importe quel système et conserve les mêmes significations et ce, peu importe les disciplines.

2. Description du modèle

Les métadonnées gouvernementales totalisent un ensemble de 27 métadonnées destinées à décrire les ressources de tout formats et de tout supports. Certains éléments du Dublin Core sont repris intégralement, alors que d'autres ont été développées sur la même base et en s'inspirant de diverses expériences, plus particulièrement les profils de l'Australian Government Locator Service (AGLS) et du e-Government Metadata Standard (Grande-Bretagne) (e-GMS).

Le modèle est souple, puisqu'il n'impose pas un ensemble de métadonnées en particulier, à l'exception des métadonnées qui ont le statut d'obligatoire. Ainsi, on peut créer son propre ensemble ou choisir d'utiliser un des ensembles existants. Pour plus de commodité, on appelle ces ensembles des profils.

Les éléments de métadonnées gouvernementales sont basés sur trois principes fondamentaux :

  • Chaque élément est optionnel et répétable

  • Les éléments peuvent apparaître dans n'importe quel ordre

  • L'usage du vocabulaire contrôlé est possible (à l'aide des qualificatifs)

2.1. Extensibilité

Les 27 métadonnées gouvernementales sont considérés comme suffisantes pour les besoins identifiés par le Comité de métadonnées. Toutefois, le modèle gouvernemental est extensible afin de rendre compte de besoins plus spécifiques. Son extensibilité prend deux sens : on peut développer une métadonnée existante ou en créer une nouvelle en suivant certaines règles. Une métadonnée peut avoir des Propriétés. Il existe deux sortes de propriétés : l'enrichissement et le schème d'encodage. L'enrichissement permet de préciser le sens d'une métadonnée, ou d'en restreindre la portée. Il correspond à l'aspect sémantique du mot. Le schème d'encodage sert à imposer une façon d'écrire la valeur de la métadonnée. Il impose une syntaxe.

Si le modèle gouvernemental devait être représenté graphiquement de façon abstraite, voici ce dont il aurait l'air :

Modèle abstrait gouvernemental

2.2. Caractéristiques des métadonnées gouvernementales

Les éléments de métadonnées gouvernementales peuvent :

  • être répétables ou non;

  • être obligatoires, conditionnelles ou facultatives;

  • contenir une valeur littéale ou autre ( Un document structuré, par exemple, peut être le contenu d'une métadonnée. C'est le cas pour la Signature numérique )

  • posséder des propriétés. Ces propriétés peuvent être des enrichissements ou des schèmes d'encodage, où les deux.

  • être développées. On peut créér de nouveaux éléments ou de nouvelles propriétés pour des besoins spécifiques.

2.3. Le Dumb-down Principle

Le modèle gouvernemental proposé ici adhère à ce que Dublin Core appelle le Dumb-down Principle. Il s'agit d'une règle destinée à garantir que l'application des qualificatifs ne nuit pas à l'intéropérabilité. Elle stipule que les qualificatifs peuvent raffiner mais non prolonger la signification de l'élément auquel ils sont appliqués. Ainsi, on peut ignorer un qualificatif et la valeur qui en résulte, si elle perd un peu de précision, conserve son utilité pour une application informatique ou un utilisateur : « A rule for the application of Interoperability Qualifiers, which stipulates that qualifiers can refine but not extend the meaning of the element to which they are applied. Thus, ignoring a qualifier ("dumbing down" the qualifier) may cause a loss of precision, but the resulting value should still be of some use to an application or user. @@  ».

Pour en savoir plus sur les métadonnées gouvernementales, se référer au document Profils de métadonnées pour les documents gouvernementaux. Présentation revisée suite à la réunion du 15 mai 2003 du Comité

3. Traduction du modèle

Chapitre 3. Les métadonnées gouvernementales et locales

1. Éléments de métadonnées gouvernementales (ou pangouvernementales)

Comité, identification des besoins, traduction en un vocabulaire commun, métadonnées communes pour l'ensemble de l'appareil gouvernemental mais extensible.

Les métadonnées gouvernementales sont regroupés sous deux fonctions : Identification et Description. En voici la liste :

Tableau 3.1. Éléments de métadonnées gouvernementales

IdentificationDescription
TitreDomaine/objet
CréateurMot-clé
SignataireCouverture
ÉditeurProcessus
CollaborateurActivité
Tierces partiesType de document
DateProgramme/service
DestinataireRésumé
 Statut
 Identifiant
 Langue
 Format
 Localisation
 Relation
 Droits d'utilisation
 Limite d'accès
 Auditoire
 Règle de conservation
 Signature numérique

2. Métadonnées locales

Idée que l'on peut développer ou créer des métadonnées. Concept de "pool".

2.1. Règles pour le développement de propriétés pour une métadonnée

Avant de procéder au développement d'un élément de métadonnée, suivez ces quelques règles :

  • Vérifier que l'élément que vous souhaitez développer n'existe déjà pas les profils. Attention, ne pas créer d'enrichissement dans le seul but de renommer un élément. Ceci peut se faire au niveau de l'interface .

  • Consulter la liste des qualificatifs (en anglais seulement) de Dublin Core. Le point 3 présente les enrichissements recommandés et le point 4, les schèmes d'encodage. Si l'un de ces qualificatifs correspond à votre besoin, importez-le.

  • N'oubliez pas de documenter les éléments que vous développez en suivant le modèle des profils.

2.2. Créer un enrichissement

Rappelons que les enrichissements permettent de préciser le type de valeur que l'on souhaite obtenir en restreignant (ou en précisant) la signification d'un élément. Les enrichissements répondent à deux principes fondamentaux :

  • Un enrichissement partage toujours le même sens que l'élément qu'il qualifie mais avec une portée plus restreinte.

  • Un enrichissement est aussi une métadonnée qui peut être elle-même enrichie.

2.3. Créer un schème d'encodage

Les schèmes d'encodage imposent une façon d'écrire les valeurs associés aux champs. Lorsque l'on associe un schème d'encodage à un élément (ou un enrichissement), la valeur du champ sera interprétée en fonction du schème identifié. Un schème d'encodage peut-être un mot ou une expression sélectionnée à partir d'un vocabulaire contrôlé (thésaurus ou autre), une chaîne de caractères formatée selon une notation formelle (ISO, par exemple), un plan de classification, etc.

L'utilisation de schèmes d'encodage est fortement recommandé dans un but de normalisation.

3. Les profils

Notion de profils de métadonnées

Chapitre 4. Implémentation des métadonnées gouvernementales

1. Première étape : connaitre ses besoins

Selon le type de ressources que vous souhaitez indexer, vous avez à choisir entre le profil pour les documents de référence et le profil pour les documents de transaction. Les ressources peuvent être de différents formats : numérique, papier, cd-rom, etc. Votre organisation doit déterminer quels types de ressources doivent être décrites à l'aide des métadonnées gouvernementales : documents officiels, publications, documents de gestion, etc. Par exemple, tous les documents ayant une valeur légale, administrative ou financière devraient faire l'objet d'une telle description dans leur format final. De même pour les publications et les documents diffusées sur le site web de l'organisme. Enfin, il faut également décider de l'intérêt de procéder à une description rétrospective, et si oui, sur quels types de ressources. Il peut être utiles de commencer par celles qui ont une utilité présente ou future, celles qui peuvent servir de modèle pour d'autre ou qui présentent des caractéristiques communes, comme les collections de documents ou les séries (par exemple, des procès-verbaux). Enfin, il peut être justifier dans certains cas de procéder à des description en lots (pour une collection, par exemple), ou à un niveau supérieur d'agréagation (décrire le dossier plutôt que le document).

2. Deuxième étape : se constituer un ensemble de métadonnées

2.1.  Utiliser les profils existants

Selon le type de ressources que vous avez à décrire, vous choisirez l'un ou l'autre des profils gouvernementaux. Ceux-ci sont personnalisables dans une certaine mesure. La première étape serait donc de passer les profils et de les tester avec quelques ressources. Vous pouvez, par exemple, pour une ressource donnée, saisir le contenu de chaque élément d'un profil de façon informelle (à la main sur une feuille de papier ou dans un fichier texte). L'exercice devrait être fait avec différents types de documents, afin de valider le profil avec vos besoins spécifiques. Cela vous permettra de mettre en lumière les éléments problématiques, inutiles, voire même absents du profil. À partir de ces informations, vous pourrez adopter le profil tel quel s'il vous convient ou choisir de le personnaliser.

Une autre option est de créer un tout nouveau profil spécifique à votre organisation. En ce cas, vous devez être en mesure de justifier ce choix et obtenir l'approbation d'un supérieur hiérarchique. Voici quelques règles de base à suivre pour vous permettre de faire un choix :

  • Consulter le site du CIO.

  • Dans le doute, optez pour un des profils dans son intégralité. Vous verrez avec le temps s'il y a nécessité d'y ajouter ou d'y retirer certains éléments.

  • Ne tenter pas de réinventer les standards. Essayez plutôt de travailler à partir de ce qui existe. C'est plus facile, plus rapide et moins couteux.

  • Demandez-vous s'il ne serait pas plus simple d'ajouter ou de retirer certains éléments de ces profils plutôt que d'en développer un nouveau.

  • N'oubliez pas que tout développement d'éléments doit être documenté, c'est-à-dire que vous devez consigner quelque part les régles de saisie pour un nouvel élément (élément, enrichissement, schème d'encodage), de la même façon qu'un nouveau profil doit être décrit dans un document de référence inspiré du document décrivant les profils gouvernementaux..

2.2. Personnaliser un profil

Dans la plupart des cas, les profils de métadonnées gouvernementales sont tout à fait pertinents et leur utilisation est fortement conseillée. Cependant, il peut arriver qu'un ministère ou un organisme ait des besoins spécifiques dont ne peuvent rendre compte les profils existants. Il est possible également qu'en certains lieux le volume d'information circulant soit réellement trop important pour que les employés aient le temps de remplir toutes les métadonnées de l'un ou l'autre des profils. Cependant, une petite mise en garde s'impose.

Pour plusieurs, l'idée de développer un profil très court, rapide et facile d'utilisation peut sembler alléchante. Un tel choix n'est pas gagnant à long terme. En effet, moins une ressource a de métadonnées et plus les risques liés à une mauvaise gestion, à la perte ou à l'erreur sont élevés. De même, la recherche sera beaucoup moins efficace, les résultats moins précis et probants, si une ressource, et plus particulièrement une ressource numérique, à peu de métadonnées. Enfin, l'authenticité et l'intégrité d'un document numérique peuvent difficilement être préservées si l'on ne possède pas certaines informations sur celui-ci, ce qui est particulièrement important pour les documents ayant une valeur probante.

Tout bien pesé, prendre 15 ou 20 minutes pour documenter une ressource que l'on a mis des mois à créer ou qui a une valeur particulièrement grande, ce n'est pas trop long! Malgré cela, nous croyons qu'il sera toujours préférable d'adopter un profil plus restreint, utilisé uniformément, que de remplir à moitié, au gré des utilisateurs, les métadonnées d'un profil plus long.

Un profil peut être personnalisé de deux façons : en y ajoutant des éléments ou en y retirant des éléments. On peut ainsi développer des éléments existant, ou en créer de nouveaux, et retirer des éléments existants. Il est impossible cependant de retirer des éléments qui ont pour statut la mention Obligatoire. Toutefois, ceux-ci peuvent être développés.

Lorsque l'on parle de développer un élément, cela signifie ajouter des propriétés. On peut ajouter des propriétés à une métadonnée ou à un enrichissement. Il y a deux types possible de propriétés : enrichissement et schème d'encodage.

2.3. Développer un profil

Vous avez obtenu l'autorisation pour développer un nouveau profil adapté à votre organisme ou ministère. Les règles ci-dessous vous guideront dans votre démarche :

  1. Consulter le site du CIO.

  2. Assurez-vous de bien comprendre l'information (les ressources) que vous désirez décrire, documenter.

  3. Sélectionner d'abord les métadonnées obligatoires pour débuter votre nouveau profil. Vous éviterez ainsi des les oublier plus tard.

  4. Passez en revue les autres métadonnées et sélectionner celles qui vous semblent pertinentes, avec ou sans nouveaux enrichissements.

  5. Pour chaque élément, sélectionnez les propriétés disponibles qui conviennent à vos besoins.

  6. Établissez la liste des propriétés manquantes. Vérifier dans la liste des qualificatifs de Dublin Core s'il existe des éléments qui pourraient vous être utiles. Attention, assurez-vous que vos enrichissement sont conformes au Dumb Down Principle, c'est-à-dire qu'il est toujours possible de se rapporter à l'élément de haut niveau sans qu'il n'y ait perte de sens. Par exemple, une date de création reste une date.

  7. Développer vos propriétés (enrichissements et schèmes d'encodage). Attention à l'ortographe pour les enrichissements.

  8. Considerez l'ensemble : rend-t-il bien compte du contenu des ressources que vous souhaitez décrire? Correspond-t-il à vos besoins? Effectuez quelques tests sur un nombre déterminé de documents. Choissisez différents types et différents formats.

  9. Procédez aux ajustements nécessaires.

  10. Faites valider votre nouveau profil par l'autorité responsable.

3. Troisième étape : dresser un plan d'implémentation

Encodage, métadonnées internes ou externes, XML, enregistrement institutionnel, etc. À compléter.

3.1. Quelles ressources décrirent en premier

3.2. Description rétrospective et description en lots

3.3. Encodage : scénario 1

Avec enregistrement institutionnel

3.4. Encodage : scénario 2

Sans enregistrement institutionnel

3.5. Syntaxe

4. Responsabilités et mise à jour des profils

5. Remarques préliminaires

Les sections 3.2 à 3.29 présentent les 27 éléments de métadonnées gouvernementales. Les éléments sont présentés sous la forme d'un tableau comportant le nom de l'élément, sa synthaxe en HTML et en XML, sa description, son statut (obligatoire, conditionnel ou facultatif) et ses propriétés. Des lignes directrices pour le contenu de chaque élément ainsi que des exemples d'utilisation complète la présentation.

Tableau 4.1. Stucture pour la présentation des éléments de métadonnées

Nom de l'élément décrit
Nom de l'élémentLe nom de l'élément
Identifiant Dublin CoreLe nom de l'élément dans la syntaxe Dublin Core
Syntaxe HTMLLa syntaxe pour écrire le nom de l'élément en HTML
Syntaxe XMLLa syntaxe pour écrire le nom de l'élément en XML
DéfinitionUne courte description de l'élément
StatutSon statut dans les profils : obligatoire, optionnelle, conditionnelle
PropriétésLes enrichissements définis par les profils
Les schèmes définis par les profils

6. TITRE

Tableau 4.2. Nom et description de l'élement Titre

Titre
Nom de l'élémentTitre
Identifiant Dublin CoreTitle
Syntaxe HTMLDC.Title
Syntaxe XMLdc:title
DéfinitionTitre de la ressource décrite
StatutObligatoire
PropriétésEnrichissement : autre titre
Schème d'encodage : aucun

6.1. Règles de saisie pour le contenu

7. Notes

  1. Identifiant

    Il est important de bien faire la distinction entre identifiant de la ressource et identifiant de la ressource pointée dans la métadonnée est-numéro-séquentiel-de. Aussi : Enrichissement Bibliographic citation : Seront saisie dans cet enrichissement les informations relatives aux volumes et au numéro de périodique ainsi que toute autre information qui les suit, comme la date. L'ISSN ne fait pas partie de ces informations.Cet enrichissement sera répétable de manière à pouvoir enregistrer plusieurs numéros. Mais pour permettre la recherche de tous les numéros d'un même périodique à l'aide de l'ISSN, celui-ci devrait être saisi (seul) dans l'enrichissement "porte le numéro séquentiel de " de la métadonnée Relation.

    Pour éviter les erreurs de saisie, il nous semble obligatoire qu'une intervention humaine ait lieu à ce niveau. De la même façon, il pourra être nécessaire de vérifier l'identifiant inscrit sous la forme d'un URI qu'un utilisateur aura saisie. Conséquemment, il nous nécessaire de prévoir qu'un registraire ou responsable de gestion documentaire soit mandaté pour vérifier ces données. Il faut prévoir deux choses: une syntaxe et une validation humaine. La syntaxe est à déterminer par les gens au gouvernement

  2. Gabarits/trousse de démarrage

    Ce serait bien de fournir en annexe ou en fichiers attachés un gararit opérationnel d'un fiche descriptive d'une métadonnée, d'un enrichissement et d'un schème d'encodage. Ça pourrait prendre la forme d'un modèle Word.

Glossaire

DCMI

Dublin Core Metadata Initiative, l'organisation responsable de la promotion et du développement du Dublin Core.

Enrichissements

Les enrichissements peuvent être des propriétés de métadonnées ou de d'autres enrichissements. Un enrichissement est d'ordre sémantique : on restrient le sens d'un élément pour obtenir plus de précision. Exemple : autre titre est un enrichissement de Titre.

Métadonnées

Données décrivant le contexte, le contenu et la structure des documents ainsi que leur gestion dans le temps. [ ISO 15489-1 2001 ]

Propriétés

Correspond aux Qualifiers du Dublin Core. Les Qualifiers permettent de qualifier des métadonnées de deux façons : en précisant le sens (enrichissement), ou en précisant une syntaxe particulière pour un contenu (schèmes d'encodage)

Bibliographie

En savoir plus sur les métadonnées

Métadonnées, normes et standards. Ministère de la Jeunesse, de l'Éducation nationale et de la Recherche. Educnet. http://www.educnet.education.fr/default.htm .

Le Dublin Core

.

Métadonnées et gouvernements

.