Travail dirigé de Martin Sévigny, ©1996 | Section précédente | Section suivante | Page d'accueil | |
Un travail de recherche bien mené n'est jamais complet en soi. Il mène naturellement vers des réponses, mais également vers des questions, de nouvelles pistes de recherche. Le projet présenté dans ces pages ne fait pas exception à la règle.
En effet, le lecteur attentif remarquera que la dernière recommandation de la partie précédente, soit celle de "permettre une représentation graphique des résultats et la formulation graphique des requêtes de recherche", ne fut pas vraiment exploitée dans ERIS. C'est pourquoi, en guise de conclusion, nous présentons des idées de recherche afin den connaître un peu plus sur ce sujet. Dans le but de bien souligner le caractère exploratoire des idées soulevées, nous allons les présenter sous la forme dune proposition de recherche.
Le repérage dinformation dans les documents structurés permet deffectuer des requêtes dune rare complexité syntaxique et sémantique, exploitant ainsi à la fois le contenu des documents et leur structure logique. Afin de pouvoir exprimer clairement toutes ces possibilités, la définition dun modèle tel que celui à la base de ce projet de recherche peut aider beaucoup.
Ce modèle devra prévoir un langage de recherche dinformation structurée, bien entendu complet par rapport au modèle. Par conséquent, ce langage risque fort de sacrifier la simplicité au profit de la puissance. Heureusement, rien noblige les utilisateurs de logiciels dinterrogation à utiliser ce langage; il pourrait servir seulement pour linterrogation du moteur de recherche, ce qui demande de traduire les requêtes des usagers dans ce langage, tâche pouvant être effectuée par le logiciel dinterrogation.
Plusieurs techniques peuvent être employées afin de cacher ce langage aux usagers. Dans notre projet, nous avons utilisé la plus simple à implanter et la plus connue, soit les bordereaux de saisie de requêtes. Ces bordereaux permettent aux usagers doublier la syntaxe exacte du langage de commande et dentrer rapidement les informations nécessaires.
La méthode des bordereaux sapplique très bien aux requêtes simples et modérément complexes. Nous avons constaté lors de lévaluation de notre prototype que les usagers étaient rapidement familiers avec le bordereau quon leur faisait utiliser. Très rapidement ils savaient comment lutiliser et quel genre de résultats il produirait. On pourrait très bien imaginer des bordereaux permettant des requêtes un peu plus complexes et qui seraient encore efficaces.
Toutefois, il y a deux raisons principales pour lesquelles nous ne pouvons envisager les bordereaux comme une méthode universelle pour formuler les requêtes de recherche dans les documents structurés. Tout dabord, il nest pas évident que le bordereau soit un outil efficace pour exprimer des relations hiérarchiques entre des éléments considérés comme critères de recherche. Par exemple, il est difficile dimaginer un bordereau efficace pour exprimer la requête suivante (formulée dans un langage "naturel"):
Trouver tous les chapitres qui ont au moins deux sections mais pas plus de cinq, et dont un des paragraphes contient lexpression "informatique documentaire". Le paragraphe précédent ou suivant ne doit toutefois pas contenir lexpression "bibliothéconomie". Retourner les titres de ces chapitres.
La deuxième raison pour rejeter les bordereaux comme solution universelle provient de la volonté de trouver une méthode qui présente un caractère de complétude par rapport au modèle de repérage. En effet, il faudrait arriver à obtenir un outil qui permette toutes les requêtes imaginables. Bien entendu, cela devrait être possible avec un certain nombre de bordereaux, mais certains seraient tellement complexes quil serait sûrement difficile de les utiliser.
La nature statique des bordereaux constitue leur principale limite, car il faut prévoir toutes les possibilités à lavance. De son côté, un langage constitue une approche dynamique qui permet datteindre le même objectif, cest-à-dire la complétude, mais au détriment de la facilité dutilisation, en particulier pour les requêtes complexes. Ce quil nous faut, cest un outil qui combine la simplicité dutilisation des bordereaux et le dynamisme dun langage de commande.
Pour réaliser cet outil, il faut se pencher sur le caractère même des objets manipulés par les requêtes. Les usagers cherchent de linformation, et cette information se retrouve dans des documents structurés, cest-à-dire un réseau déléments. Leur requête constitue donc lexpression dun sous-ensemble (possiblement vide) de ce réseau.
La façon la plus naturelle de présenter un réseau est par une méthode graphique. En effet, la plupart des êtres humains vont utiliser du papier et un crayon pour représenter des objets qui, avec des liens, constituent un réseau. Cest le cas des hiérarchies qui sexpriment très bien par un arbre inversé, où le noeud supérieur est présenté tout en haut et où on présente ses enfants en dessous, sur une même ligne, centrée par rapport au parent. Dailleurs, il sagissait de la méthode utilisée dans le guide détaillé de la structure et elle fut en général appréciée par les usagers.
La relation à faire est simple; comme une requête constitue lexpression dun sous-ensemble dun réseau, il faudrait pouvoir construire cette requête de façon graphique, cest-à-dire en plaçant des objets dans une fenêtre, en leur donnant des propriétés, et en construisant des relations entre ces objets. Bien entendu, les résultats de recherche devraient également être présentés de façon graphique.
Lenvironnement graphique de repérage dinformations structurées (EGRIS) devrait tenir compte des travaux sur la représentation graphique de bases de données de même que sur les méthodes graphiques de formulation de requêtes. Même si la littérature sur ces deux sujets est relativement abondante, aucune étude recensée nutilisait ces techniques dans un contexte de documents structurés.
Certains travaux méritent dêtre mentionnés au sujet de la présentation graphique de linformation. Johnson et Shneiderman (1991) ont travaillé sur des "cartes hiérarchiques" (tree maps) dans le but de présenter de linformation hiérarchique dans un plan à deux dimensions, où tout lespace est occupé. Cette méthode sest avérée efficace avec des hiérarchies comme celles représentées par lensemble des fichiers dun disque dur. Dans ce cas, tous les objets sont de même type; il faudrait voir les possibilités avec des réseaux contenant des objets hétéroclites.
De leur côté, les gens du Xerox PARC (Card et al., 1991) ont exploré le concept dun environnement dinformation ("information workspace") où linformation est présentée sous forme d'arbres à trois dimensions. Ces arbres peuvent être manipulés pour donner des vues différentes de linformation. Laspect tridimensionnel est destiné à tirer un maximum de profit de la facilité naturelle de lêtre humain à se représenter des objets dans lespace.
Rivin et ses collègues (1994) ont défini une méthode pour extraire des informations sur la structure hiérarchique dun corpus hypertextuel et ils se servent de ces informations pour situer lusager par rapport à la base quil consulte. On a notamment tenté de présenter cette structure hiérarchique à laide des arbres hiérarchiques dont on a parlé plus haut.
Hemmje (1993) a utilisé les résultats du Xerox PARC (Card et al., 1991) dans le but de présenter une base de données bibliographiques (descriptions et résumés de documents). Son approche consiste à voir la base comme un réseau de documents et de termes, chaque terme étant associé à des documents et chaque document contenant des termes. Lusager peut consulter la base de données exprimée par un arbre conique tridimensionnel, dont les noeuds sont soit des documents ou encore des termes. Il peut naviguer dans la base en sélectionnant des noeuds. Pour les requêtes, lusager doit spécifier un point de départ (entrer un terme ou choisir un document) et il effectue le reste en parcourant les arbres coniques.
Du côté de la formulation graphique de requêtes, plusieurs expériences ont été menées dans le contexte des bases de données relationnelles (voir notamment Kim et al., 1988) et certains résultats furent encourageants. Sans oublier le "Query by example" (voir par exemple Date, 1983), offert par de nombreux systèmes de gestion de bases de données relationnels. Young et Shneiderman (1993) ont également construit un prototype destiné à interroger une seule table relationnelle à laide dopérations booléennes. Ce prototype, exploitant une métaphore de flux et de filtres, a donné de bons résultats lorsque testé avec des usagers. Weiland et Shneiderman (1993) ont poursuivi dans la même veine avec une technique basée sur des agrégations et des généralisations hiérarchiques. Mais dans les deux cas, les recherches booléennes permises étaient relativement limitées.
Lidée la plus intéressante vient peut-être dune étude de Boyle et al. (1993), dont lobjectif était de présenter une base de données en biologie moléculaire. Ils ont adopté une approche à trois dimensions non seulement pour présenter les résultats, mais également pour "saisir" les requêtes. La base de données est toujours représentée par son schéma, cest-à-dire une représentation graphique des entités et des relations entre ces entités. Pour construire sa requête, lusager définit dabord un ensemble de sous-requêtes en sélectionnant des entités et en leur donnant des attributs (qui posent des contraintes). Ces attributs sont spécifiés à laide dun bordereau. Les entités ayant des contraintes sont présentées dans le schéma, et la requête constitue lensemble des sous-requêtes ainsi construites. Il semble que le fait que lusager puisse "voir" sa requête se construire soit un ajout intéressant.
Finalement, mentionnons les travaux de Shneiderman (1994) ayant pour but de concevoir des interfaces pour linterrogation dynamique et visuelle de bases de données. Lusager formule des requêtes en modifiant des valeurs de paramètres, et le logiciel répond dynamiquement en modifiant la représentation graphique des informations.
Ce bref survol de la littérature nous permettrait de démarrer la conception de linterface dEGRIS sur des bases solides. Il faudrait notamment essayer des techniques comme la représentation spatiale (trois dimensions) de linformation, les requêtes dynamiques, etc.
Deux approches pourraient être envisagées. La première consiste à présenter à lusager un schéma dun sous-ensemble de la base, et lusager construit ses requêtes en posant des contraintes sur ce schéma. Il sagit tout simplement de lapproche préconisée par Boyle et ses collègues, mais appliquée aux documents structurés. Avec cette approche, il faut notamment permettre à lusager de dabord se constituer des sous-ensembles avec lesquels il peut construire des requêtes.
Une autre approche serait de sinspirer des logiciels de dessin vectoriel, qui permettent de concevoir des images constituées dobjets. On choisit un type dobjet parmi une liste (boîte doutils) et on place cet objet dans un espace. Il nous faudrait un objet pour les éléments, pour chaque type de relation, etc. De plus, il faudrait associer des propriétés aux objets afin de spécifier des paramètres comme leur contenu textuel.
Dans les deux cas, une représentation des résultats utilisant les mêmes objets graphiques devrait être présentée et mise à jour dynamiquement, cest-à-dire à mesure que lusager modifie sa requête en supprimant ou ajoutant des objets ou en modifiant les valeurs des propriétés ou contraintes. Il faudrait également explorer lintérêt dapporter une touche tridimensionnelle à cette méthode graphique.
Avec un tel langage dinterrogation, il serait probablement possible den arriver à une complétude par rapport au modèle Marcoux; il faudrait là aussi explorer cette possibilité. De plus, il faudrait mesurer lefficacité de cette méthode de formulation de requêtes en la comparant à un langage de commande ou des bordereaux. Cette mesure devrait se faire sur différents types de requêtes, allant de requêtes très simples à dautres très complexes.
Une chose est sûre, des recherches sont nécessaires afin dexplorer les éléments dinterface qui prendraient avantage des capacités de lêtre humain de reconnaître et de manipuler des objets. Nous croyons que cela peut aller jusque dans la formulation des requêtes, et que cette méthode pourrait constituer un langage dinterrogation très "naturel", du moins pour certaines requêtes, probablement celles qui exploitent beaucoup la structure.
Ce travail de recherche a permis de constater que non seulement il faut des outils spécifiques pour linterrogation de documents structurés, mais que ces outils doivent présenter certains éléments dinterface particuliers. De plus, nous avons présenté un rôle que pourrait jouer les spécialistes dans la conception doutils de recherche.
Nous avons donc atteint nos objectifs. Toutefois, le fait que ce rapport pose autant de questions quil formule de réponses est encore plus intéressant à nos yeux. En effet, cela montre que ce domaine dactivité est rempli de défis qui restent à relever, autant du point de vue de la recherche dans les documents structurés que des éléments dinterface pour réaliser ces recherches efficacement.
Il serait tentant de voir les recommandations formulées à la fin de ce rapport comme un constat déchec du prototype. En effet, aucune de ces recommandations ne fut suivie à la lettre. Nous nous refusons dexprimer un tel constat, car ce travail devait avant tout ouvrir la voie vers des endroits très peu fréquentés en recherche, soit les interfaces pour linterrogation de documents structurés.
Maintenant que la voie est tracée, il reste à explorer les nouvelles possibilités soulevées dans ce rapport, et à les mettre en relation avec un modèle complet et bien défini pour la définition et le repérage de documents structurés. Il sagit dun calendrier de recherche fort motivant.
Travail dirigé de Martin Sévigny, ©1996 | Section précédente | Section suivante | Page d'accueil | |