Recherche

1- Le moteur de recherche plein texte

Outre l’entrée par les différents types de classement, d’autres modes d’investigations du corpus sont mis à la disposition des utilisateurs, en particulier un moteur de recherche plein texte et trois bibliothèques (voir ci-après).

Le moteur de recherche fonctionne dans le texte balisé en XML/TEI ; il répond à des requêtes sur des termes simples ou combinés, avec ou sans troncature.

Le moteur n’est pas sensible à la casse (les recherches voltaire et Voltaire donnent les mêmes résultats).

En revanche, il est sensible à l’accentuation (les recherches aime et aimé donnent des résultats différents).

Le caractère de troncature est * (*disponible cherche disponible et indisponible ; médecin* cherche médecin, médecins, médecine et médecines).

Les doubles guillemets permettent de faire porter la recherche sur une chaîne exacte de caractères ("Esprit des lois").

Par défaut, l'opérateur de recherche est AND (Histoire Buffon recherche Histoire AND Buffon, c’est-à-dire les documents qui comportent à la fois Histoire et Buffon).

L’alternative se construit avec OR (Histoire OR Buffon cherche les documents qui comportent soit Histoire soit Buffon).

On peut construire un sous-corpus grâce à l’opérateur - (Voltaire -Diderot cherche les documents qui contiennent Voltaire mais pas Diderot).

Une fois les résultats affichés, ils peuvent être triés et affinés en fonction des différentes facettes proposées par l’interface : la localisation, l’existence ou non de fragments, le classement typologique ou chronologique, la provenance, la destination, les scripteurs et les transcripteurs.

 

2- Les recherches prédéfinies

Le balisage du corpus complet en XML/TEI permet de formuler des requêtes complexes au moyen du langage informatique XQuery. Nombre de recherches mêlant traits sémantiques et matériels peuvent être envisagées, mais pour être accessible aux utilisateurs ne maîtrisant pas le langage de requêtes, l’interface devra encore être adaptée.

Pour l’instant, seules quelques requêtes prédéfinies sont proposées sous forme de pages web.

Elles donnent accès à l’ensemble des fragments textuels encodés en tant que :

  • notes de régie de Flaubert (voir)
  • commentaires de Flaubert (voir)
  • notes de renvoi de Flaubert (voir)
  • notes de classement de Flaubert (voir)
  • lapsus de Flaubert (voir)
  • lapsus présents dans le corpus (tous scripteurs y compris Flaubert) (voir)

La liste de ces requêtes est appelée à s’étoffer.

 

3- Les paniers

Pour les utilisateurs disposant d'un compte personnel, les résultats des recherches plein texte, comme toutes les unités matérielles et logiques constitutives du corpus (pages, textes, fragments et citations), peuvent être placés dans un panier accessible au sein de l’espace de travail. Le contenu de chaque panier peut être trié en fonction de différents critères, complété et tout ou partie supprimé. Il peut être exporté aux formats CSV, Excel ou PDF.

S’il contient uniquement des citations, le panier peut être utilisé pour ajouter des éléments à un agencement dans l'espace de travail.