Travail dirigé de Martin Sévigny, ©1996 Section précédente | Section suivante | Page d'accueil |

Annexe F - La structure de la base de données

F.1 Quelques notes

La structure complète de la base de données contenant les documents SGML et les ajouts d’information est présentée à la fin de cette annexe. De plus, la base de données vidée de son contenu se retrouve sur la disquette accompagnant ce rapport (\BASE_DON\TD.MDB). Il est donc facile de consulter la structure à l’aide du logiciel Microsoft Access.

Également, afin de bien situer le lecteur et pour compléter les informations, la prochaine section contient la description de toutes les tables de la base de données.

F.2 Description des tables

Antidictionnaire

Cette table comporte un seul champ et constitue tout simplement la liste des mots qui figurent dans l'antidictionnaire. Utilisée principalement pendant l'indexation, elle pourrait aussi être utilisée en recherche, pour mentionner à l'usager qu'un terme de recherche est un mot vide par exemple.

AttNom

Contient les noms d'attribut utilisés par la base de documents. On y retrouve également une description et un calcul de leur fréquence.

AttPoss

On retrouve dans cette table les correspondances entre un identificateur générique et les noms d'attribut qui y sont associés dans la base de documents. Il s'agit simplement d'une liste à deux colonnes de toutes les combinaisons possibles d'identificateurs génériques et de noms d'attribut.

Attributs

Cette table fait partie de la structure minimale de la base de données et contient la valeur de toutes les occurrences d'attributs dans les documents, de même que les éléments auxquels elles sont associées.

Descendants

Cette table est utilisée pour présenter le guide sommaire de la structure. On y retrouve, pour chaque identificateur générique, tous les identificateurs génériques que l'on peut retrouver dessous, d'un point de vue hiérarchique. Il s'agit donc d'un certain nombre de paires d'identificateurs génériques. À noter que si on inverse les colonnes on peut retrouver les ancêtres d'un identificateur générique.

Enfants

Similaire à la table "Descendants", mais on y retrouve seulement les identificateurs génériques qui se retrouvent immédiatement dessous d'un point de vue hiérarchique, et ce pour chaque identificateur générique.

Ensembles

Cette table est vide initialement et permet au logiciel de stocker les ensembles d’éléments utilisés dans la présentation du guide détaillé de la structure. On retrouve toutes les informations relatives à un ensemble et qui sont affichées dans le panneau d'information de la fenêtre en question.

EnsemblesTmp

Table temporaire utilisée par le logiciel lors de la création des ensembles pour le guide détaillé de la structure. Elle est vide lorsque ce module n'est pas utilisé.

EnsNoeuds

Table utilisée par le logiciel et qui contient la liste des noeuds faisant partie de chaque ensemble défini dans le guide détaillé de la structure. Il s'agit d'une correspondance simple entre un numéro d'ensemble et un numéro de noeud.

Historique

Table principale de l'environnement de recherche du logiciel, et donc vide lorsque le logiciel n'est pas en fonction. On y retrouve non seulement l'information relative à une requête de recherche, mais également les différentes parties des requêtes elles-mêmes. De plus, le texte formaté de la fenêtre de présentation des résultats s'y trouve. Cette seule table permet de gérer les bordereaux, l'historique et la présentation des résultats.

HistoriqueCopie

Table de structure identique à la précédente, mais qui est vide en tout moment sauf lorsque l'usager décide de modifier une requête déjà effectuée. À ce moment, elle est utilisée pour copier les informations originales dans une nouvelle requête qui sera par la suite modifiée.

IdenGene

Table des identificateurs génériques présents dans la base de documents. Sa structure est identique à la table "AttNom" et on l'utilise de la même façon.

Index

Table qui contient la liste des mots que l'on retrouve dans la base de documents, à l'exception de ceux qui figurent dans l'antidictionnaire. Elle fut générée par le programme d'indexation et n'est pas modifiée par la suite. S'y trouve également la fréquence des occurrences de chaque mot. À noter qu'il s'agit d'un index global, c'est-à-dire de la base de documents en entier, sans égard à l'identificateur générique contenant le mot.

IndexMontre

Table initialement vide qui sert à recevoir une partie de la table "Index". Cette partie est extraite dynamiquement par le logiciel et permet de présenter l'index d'un sous-ensemble de la base.

IndexTmp

Table temporaire utilisée par le logiciel lorsqu'un usager désire consulter un index partiel. Elle permet de remplir la table "IndexMontre" avec des valeurs extraites de la table "Index". Cette table est toujours vide sauf lors de ces opérations.

Liens

Table présente dans la structure minimale de la base et qui contient l'information sur la structure hiérarchique et hypertextuelle des documents. Il s'agit essentiellement de liens entre des éléments source et des éléments cible, qui sont de type hypertextuel ou non, et dans ce dernier cas ont un ordre.

Noeuds

Table présente dans la structure minimale et qui contient toutes les informations sur chaque élément de la base de documents (appelés noeuds). On y retrouve donc le contenu textuel lorsqu'il y en a. De plus, certaines informations furent rajoutées pour rendre l'interface plus efficace.

Occurrences

Table générée par le programme d'indexation et qui contient toutes les occurrences de tous les mots de la base de documents. La position absolue (depuis le premier mot de la base) s'y retrouve également.

Résultats

Cette table initialement vide est destinée à contenir les résultats de recherche obtenus, sous la forme de paires (numéro de la requête, numéro de l'élément). De cette façon, on peut facilement retrouver un résultat déjà obtenu.

F.3 Description détaillée de la structure

Les pages suivantes présentent des informations détaillées concernant chaque table de la base de données. Ces informations sont issues directement du logiciel Access, et c’est pourquoi leur numérotation ne suit pas les autres parties de ce document.


Travail dirigé de Martin Sévigny, ©1996 Section précédente | Section suivante | Page d'accueil |