Interopérabilité

1- Exploitation textométrique du corpus avec la plateforme TXM

Encodé en XML-TEI, le corpus Bouvard a pu bénéficier d’une importation dans la plateforme TXM qui permet de construire et d’analyser différents ensembles textuels structurés à partir de la répartition des documents en volumes dans une perspective textométrique. Lors de l’import, chaque mot des transcriptions a été automatiquement lemmatisé et annoté avec une étiquette grammaticale (avec un taux d’erreur d’environ 5%) pour offrir des moyens d’indexation supplémentaires. La plateforme permet de construire des concordances triables et exportables à partir d’une recherche de mots ou de séquences textuelles effectuée sur tout ou partie de ce corpus ; elle permet de produire des listes de fréquences de mots, lemmes, etc., ou de rechercher des cooccurrences.

Sur le portail TXM, l'accès au corpus Bouvard est restreint ; il suffit de nous contacter pour obtenir les codes d’accès.

Actuellement (mars 2019), le corpus Bouvard n'est plus accessible. Informez-nous si vous avez des besoins particuliers.

 

2- Entrepôt OAI-PMH

Pour améliorer la visibilité des ressources structurées produites par le projet Bouvard, un entrepôt OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) a été développé (http://www.dossiers-flaubert.fr/oai/). Il permet le moissonnage des métadonnées du corpus par différents moteurs de recherche et en particulier par ISIDORE (Intégration de Services, Interconnexion de DOnnées de la Recherche et de l’Enseignement), la plate-forme de recherche créée par la TGIR Huma-Num, qui collecte, indexe et enrichit les métadonnées et les données numériques structurées accessibles selon des protocoles informatiques standardisés interopérables couramment utilisés par les communautés des sciences humaines et sociales.

Lien vers la ressource sur ISIDORE.