Travail dirigé de Martin Sévigny, ©1996 Section précédente | Section suivante | Page d'accueil |

2. État de la question

2.1 Documents structurés

Les documents structurés ont fait l'objet d'une abondante littérature depuis une dizaine d'années. On leur reconnaît une grande importance et de plus en plus de recherches mais aussi d'applications y touchent d'une façon ou d'une autre. La définition de la norme SGML (Standard Generalized Markup Language, ISO 8879, voir notamment Goldfarb, 1989; Role, 1991; Wright , 1992) n'est pas étrangère à cette prolifération, mais il faut aussi souligner l'apport d'autres normes comme ODA (Office Document Architecture, ISO 8613, voir Campbell-Grant, 1990) ou HyTime (Hypermedia/Time-based Document Structuring Language, ISO 10744, voir Newcomb et al., 1991).

Les documents structurés, et en particulier ceux qui respectent la norme SGML, sont utilisés avant tout en édition, où ils simplifient certaines opérations et dont l'impact le plus important est "la factorisation du travail qu'ils entraînent dans la production de documents" (Marcoux, 1994, p. 61). Toutefois, cet auteur ajoute que l'impact sur la recherche d'information est moins bien compris, et "aucune étude n'a démontré clairement le type de bénéfices auxquels on peut s'attendre avec l'exploitation de la structure des documents pour le repérage de l'information" (p. 62).

Même si les bienfaits du repérage de l'information dans les documents structurés ne sont pas démontrés, l'idée que le repérage puisse être amélioré par l'exploitation de la structure des documents est extrêmement naturelle, et plusieurs auteurs en ont émis l'hypothèse. Comme premiers pas vers la démonstration de cette hypothèse, de nombreuses recherches récentes ont proposé différentes façons de repérer de l'information dans les documents structurés. Il est impossible d'en faire une étude exhaustive ici (étant donné le grand nombre de publications à ce sujet), mais nous voulons souligner certaines recherches afin de montrer les différentes approches utilisées.

Les travaux de MacLeod (1990a, 1990b, 1991a, 1991b et MacLeod et al., 1991) ont abordé plusieurs avenues pour l’interrogation des documents structurés. Soulignons sa proposition d’étendre les langages de commandes traditionnels (tel celui du serveur de bases de données Knight-Ridder DIALOG) afin de prendre en compte la structure. Ce langage étendu lui permettait de chercher de l’information dans des documents SGML en ajoutant des suffixes aux commandes, ces suffixes représentant des chemins dans la structure hiérarchique des documents.

Par la suite, il a conçu un langage d’interrogation et de manipulation des documents structurés semblable à SQL (Structured Query Language). Il pouvait donc non seulement interroger les documents, mais en créer, en modifier, et créer des liens entre des documents. Mentionnons qu’en interrogation, ce langage retourne toujours comme résultat un objet de la base de documents, soit un élément SGML.

Burkowski (1992a, 1992b) a également travaillé sur la définition d’un langage d’interrogation de documents structurés. Il utilise des extensions contiguës (contiguous extents) afin de représenter les documents, et les recherches utilisent ces étendues. Il a de plus implanté un système pour tester ce langage, et son interface sera discutée plus loin.

Fuller et al. (1993) ont également construit un prototype pour expérimenter avec la recherche d’information dans les documents structurés. Ils ont opté pour deux méthodes de recherche, soit le butinage et les requêtes. Ces requêtes peuvent utiliser trois niveaux d’information, soit le contenu des documents, leur structure de même que les liens entre les différentes parties des documents. Ceci nous montre qu’ils utilisent les liens hypertextuels en interrogation.

Les travaux de Kilpelainen et al. (1990) ont permis de concevoir un prototype qui va un peu plus loin, car il associe en un seul logiciel les fonctions d’écriture, d’édition et de repérage pour les documents structurés. Ils ont défini un langage d’interrogation, mais ils mentionnent qu’il n’est pas destiné aux usagers occasionnels et que plus de recherches sont nécessaires afin de l’adapter ou en trouver un nouveau qui serait accessible pour tous.

Enfin, mentionnons le langage défini par Arnon (1993), appelé Scrimshaw, qui permet non seulement de rechercher de l’information dans les documents structurés, mais également de transformer ces derniers. Il s’agit d’un langage qui s’inspire des expressions régulières et des patrons de fouille (pattern matching) mais auquel on a ajouté des fonctions de manipulation d’arbres, ce qui le rend apte à gérer des documents structurés. Sa syntaxe ne le destine aucunement à l’usager occasionnel.

2.2 Interfaces humains-ordinateurs

Le domaine des interactions humains-ordinateurs a pris son envol dans les années 1950 et constitue maintenant une discipline bien établie. Les résultats de 40 années de recherche ont permis de définir une méthodologie générale pour la conception d'interfaces utilisateurs utiles, performantes, sécuritaires, ainsi que faciles à apprendre et à utiliser. Cette méthode de développement, centrée sur les usagers plutôt que sur les systèmes, s'inspire beaucoup des principes ergonomiques (voir notamment Gould, 1988; Mayhew, 1992, chap. 18; Shneiderman, 1992). Robert et Fiset (1992) ont schématisé la méthode, à la suite d'une expérience de conception d'interface en milieu industriel; leur schéma est reproduit ici à la Figure 1: schŽma de la mŽthodologie, page 8.

La littérature sur les interfaces humains-ordinateurs pour des systèmes de repérage d'information est très abondante, bien que relativement spécifique; on retrouve notamment de nombreuses évaluations de logiciels d'interrogation.

De son côté, Marchionini (1992) a tenté de modéliser la tâche "recherche d'information" qui pour lui constitue un cas particulier de la solution de problèmes. Il distingue cinq grandes sous-tâches:

Pour Marchionini, ces sous-tâches sont reliées mais pas toujours effectuées dans le même ordre, et le processus est bien entendu itératif. De plus, il souligne que les recherches sur les interfaces ont surtout été concentrées sur l'articulation du problème (langages de recherche, méthodes de saisie de requêtes), les deux premières sous-tâches étant particulièrement laissées pour compte. L'examen des résultats (quatrième sous-tâche) semble poser un défi intéressant, surtout dans les bases de données de taille importante. Cette analyse de tâche de Marchionini peut très bien servir de base à la conception d’une interface pour un système d’interrogation de bases de données.

Il est beaucoup plus difficile de trouver de la littérature sur les interfaces pour l’interrogation de bases de documents structurés. En effet, nous n’avons recensé aucune recherche portant spécifiquement sur ce sujet. Toutefois, certains auteurs ayant travaillé sur la problématique plus générale du repérage de l’information dans les documents structurés ont quelque peu abordé les questions d’interface humains-ordinateurs.

C’est le cas pour Croft et al. (1990), qui utilisent des bordereaux de recherche spécifiques à chaque type de documents. Ces bordereaux comportent des champs où l’usager peut entrer ses critères de recherche. Cette approche s’apparente à celle utilisée par de nombreux systèmes de gestion de bases de données textuels et offre peu d’éléments d’interface particuliers aux documents structurés.

Fuller et al. (1993) se sont particulièrement intéressés à la présentation des résultats, soit la quatrième sous-tâche mentionnée par Marchionini. Pour ces chercheurs, un ensemble de noeuds (éléments de structure) constitue les résultats, mais il ne faut pas faire l'erreur de présenter seulement ces noeuds à l'usager. Dans ce cas, il manquera de l'information sur le contexte d'où proviennent ces noeuds et les relations qu'il peut exister entre les noeuds. Ils suggèrent l'utilisation d'une table des matières tronquée, c'est-à-dire où l'on présente seulement les noeuds qui se trouvent dans l'ensemble des résultats, mais en conservant leur contexte par rapport à l'ensemble de la base.

Ils ajoutent que l'ordre dans lequel présenter les résultats peut poser des problèmes. Souvent, les systèmes aiment ordonner les résultats selon un certain indice de pertinence. Mais cette approche risque de semer de la confusion chez l'utilisateur quant au contexte autour des noeuds, puisqu'ils sont présentés dans un ordre qui risque d'être différent de celui de la base de documents.

Burkowski (1991 et 1992a) a quant à lui énoncé des principes pour la conception d’un système de repérage dans les documents structurés. Ces principes concernent l’indépendance des données (l’interface doit être indépendante de la façon dont les textes sont gérés), l’utilisation des niveaux hiérarchiques (métaphore de la table des matières, requêtes exploitant la structure) et une interface très souple, afin de tenir compte de l’hétérogénéité des documents qui pourraient être gérés par un tel système.

Cette dernière notion mérite qu'on s'y attarde. En effet, pour Burkowski, les bases de documents structurés sont habituellement d'une grande complexité, mais surtout très variantes. Ceci vient du fait que généralement, et c'est le cas avec SGML, différents types de documents ne seront pas balisés de la même façon, avec les mêmes étiquettes. Il est donc essentiel que l'interface soit assez souple pour gérer différents types de documents, et que l'usager puisse l'adapter en fonction de ses besoins particuliers.

Suite à ces principes, il a conçu une interface où l’on retrouve un environnement et des agents (workers). L’environnement constitue la base de l’interface, commune à tous les logiciels, et les agents seront les éléments d’interface qui effectueront les tâches spécifiques reliées à ce système. Il a conçu des agents notamment pour la recherche en texte intégral et le butinage. Les agents constituent donc l’interface entre les requêtes des usagers et le moteur de recherche. Un des objectifs de ces agents est de "cacher" les particularités du langage de recherche aux usagers, afin de simplifier leur tâche. Une telle approche nécessite un grand nombre d’agents pour arriver à une interface relativement complète par rapport au modèle de recherche.

Une dernière remarque concernant les interfaces pour l’interrogation de documents structurés nous vient de MacLeod (1991a) qui mentionne qu’un système d’interrogation de documents structurés tel qu’il le conçoit n’est pas destiné aux usagers occasionnels. Toutefois, il faut mentionner qu’il ne propose aucun élément d’interface particulier qui pourrait justement permettre aux usagers occasionnels d’utiliser de tels systèmes.

2.3 Synthèse

Les recherches mentionnées dans les deux sections précédentes nous permettent de tirer quelques conclusions sur les grands axes de recherche dans le domaine de l’interrogation de documents structurés.

Il est évident que de nombreux efforts sont faits afin de définir des langages d’interrogation de documents structurés. Plusieurs approches différentes sont utilisées, et différentes fonctions sont permises, notamment la manipulation des documents, mais toutes ont pour objectif d’utiliser la structure des documents afin d’améliorer la qualité du repérage.

Ces études sur les langages d’interrogation ont toutes donné comme résultat un langage habituellement puissant mais d’une complexité qui rend son utilisation par des usagers occasionnels difficile. Ces langages sont donc destinés à devenir des langages de bas niveau, c’est-à-dire qui permettent d’activer le moteur de recherche, quitte à offrir d’autres éléments aux usagers pour cacher la complexité du langage. Cependant, on risque de diminuer la puissance des recherches possibles.

Il faut également noter que la plupart des études proposent des prototypes pour tester les différentes notions théoriques avancées. Ces prototypes comprennent donc une interface-utilisateurs mais rarement cette interface a-t-elle été décrite en détail. Notre apport sera sans contredit original, puisque notre recherche est orientée vers les éléments d’interface nécessaires spécifiquement pour l’interrogation de documents structurés.

Nous devons souligner que nous avons retenu certaines idées mentionnées dans cette revue de littérature pour la conception d'ERIS. La réflexion de Fuller sur la mise en contexte des résultats de recherche est intéresante, et notre module de présentation des résultats reprend certaines de ces idées. De plus, autant Burkowski que MacLeod prétendent qu'il faut éviter de mettre entre les mains des usagers occasionnels toute la complexité reliée à l'exploitation des documents structurés en recherche. Ces remarques permettent non seulement une mise en garde qui peut nous être utile pendant la conception, mais soulignent encore plus le besoin de réfléchir aux outils d'interface nécessaires pour aider ces usagers à effectuer des recherches fructueuses.

En terminant, n’oublions pas que la majorité de la littérature citée provient d'auteurs qui travaillent avant tout en informatique. Bien entendu, de nombreux spécialistes de l’information s’intéressent aux documents structurés et au repérage de l’information, mais peu s’intéressent aux outils nécessaires pour marier ces deux concepts. La réalisation de ce projet par un étudiant en sciences de l'information semble donc constituer une première.


Travail dirigé de Martin Sévigny, ©1996 Section précédente | Section suivante | Page d'accueil |