Principes éditoriaux

 

Grâce à l’utilisation d’un encodage en XML/TEI, la transcription des documents du corpus est concurremment proposée en mode diplomatique et normalisé. Une vue supplémentaire, qualifiée d’« enrichie », permet quant à elle de manifester les transformations qu’induit le passage du mode diplomatique au mode normalisé. Enfin, une visualisation « ultra-diplomatique » est fournie sous la forme d’un fichier PDF généré à partir d’un logiciel de traitement de texte. Les quatre formats sous lesquels est proposée la transcription de chaque document sont accessibles indépendamment et directement grâce à une URL dédiée.

 

1- Transcription ultra-diplomatique et transcription diplomatique

La transcription ultra-diplomatique est celle qui répond aux objectifs scientifiques prioritaires du projet initial. Selon ce protocole, chaque transcription cherche à rendre au mieux la disposition spatiale des éléments textuels dans la page manuscrite et reproduit avec la plus grande exactitude possible ce qui est écrit :

  • une page de manuscrit donne lieu à une page de transcription comportant les mêmes retours à la ligne et respectant la localisation et la répartition des indications entre la marge et le corps du texte ;

  • les caractères soulignés ou barrés sont reproduits à l’identique (« manger ou boire ») ;

  • les ajouts sont transcrits à l’endroit où ils apparaissent sur le manuscrit, dans un corps de police inférieur de deux points à celui utilisé pour le premier jet du manuscrit ;

  • les traits de sélection, de liaison ou de renvoi sont reproduits à l’aide d’un logiciel de dessin ;

  • la présence de caractères ou de mots illisibles est matérialisée par une suite de points, barrés lorsqu’il y a lieu, respectant – autant que possible – la longueur et le nombre des éléments illisibles («  les ………… ») ;

  • dans le cas des surcharge, les caractères surchargés reçoivent une mise en forme « barré » ; ils sont suivis d’une barre oblique, puis des caractères en surcharge qui obéissent à la mise en forme des ajouts (« trouvaient/èrent ») ;

  • les lectures conjecturales sont suivies d’un astérisque (« morceler* »).

 

Les graphies particulières des scripteurs sont respectées :

  • les abréviations (outre le brévigraphe « &1 » mis pour « et », les plus usuelles chez Flaubert sont des abréviations par contraction comme « gd » mis pour « grand » ou« st » mis pour « saint », et la finale en « -ement » des adverbes souvent réduite à « -emt ») ;

  • les fautes d’orthographe (« narrines ») et les graphies archaïques (« enfans ») ;

  • les lapsus ;

  • les omissions (bourdons) et les répétitions de mots (doublons) ;

  • les majuscules manquantes ou superfétatoires, les minuscules fautives, l’absence ou la pléthore des signes de ponctuation, les signes de renvoi.

 

Pour faciliter l’identification visuelle des différentes mains présentes dans le corpus, on utilise des polices dédiées :

  • « Times new roman » pour Flaubert ;

  • « Lucida Calligraphy » pour Laporte ;

  • « French Script MT » pour Jules Duplan ;

  • « Arial » pour Louise Françoise Boyé, née Janelle (auteur des Mémoires de Mme Ludovica) ;

  • et enfin, « Monotype Corsiva » pour toutes les autres mains.

 

Il en va de même pour l’outil qui a servi au scripteur : l’encre apparaît en noir, le crayon en gris moyen.

 

On procède néanmoins à certaines restitutions usuelles destinées à faciliter la lecture sans compromettre le rendu de la page originelle :

  • les accents, les apostrophes et les traits d'union sont ajoutés ou rectifiés ;

  • les mots liés (« lemédecin ») ou coupés (« le ro man ») à tort sont corrigés ;

  • les guillemets sont uniformisés sous la forme de guillemets français.

 

Les principes listés ci-dessus ont été formulés en vue de la production des transcriptions ultra-diplomatiques. Ils sont aussi valables pour les transcriptions diplomatiques, à quelques exceptions près :

  • la mise en espace du manuscrit est moins strictement respectée (par exemple, les ajouts interlinéaires sont insérés à l’endroit où le sens les appelle) ;

  • les traits de liaison, les dessins et autres figures graphiques ne sont pas reproduits.

 

Enfin, l’utilisation de fonds de couleur permet de repérer :

  • sur fond gris, les fragments imprimés (coupures de presse, tracts, etc.) lorsqu’ils ont été collés sur un autre support ;

  • sur fond de croisillons (tartan), les fragments manuscrits entièrement barrés.

 

Mise à jour du 20-04-2020. La signification des fonds a été modifiée :

  • les fragments imprimés (coupures de presse, tracts, etc.) lorsqu’ils ont été collés sur un autre support n'apparaissent plus sur fond gris mais sur fond beige ;
  • et ce sont maintenant les fragments manuscrits barrés par des traits obliques qui reçoivent un fond de croisillons (tartan) en vue diplométique et un fond gris en vue normalisée.

Ces derniers fragments nécessitent un traitement particulier : le fait qu'ils soient matériellement barrés ne signifie pas que Flaubert voulait les supprimer. Dans le cadre de la genèse du second volume, les fragments qui portent des traits obliques ont été traités ou recopiés ailleurs. Ce type de rature spécifique sanctionne donc une élection suivie d'effet et non un rejet.

C'est pourquoi on a choisi de conserver l'affichage du contenu textuel de ces fragments en vue normalisée tout en manifestant leur caractère utilisé par un fond gris.

 

2- Transcription normalisée

La transcription normalisée, quant à elle, vise à produire un texte approchant des canons habituels de l’édition imprimée, gommant les particularités de la mise en page du manuscrit et estompant les spécificités de la graphie des scripteurs (elle conserve cependant les polices dédiées à chacun d’entre eux). Afin d’en permettre la lecture et la compréhension par les non-spécialistes, elle propose un texte :

  • linéarisé (qui ne reproduit pas les retours à la ligne induits par la matérialité de la page manuscrite et insère à leur place les ajouts interlinéaires et les renvois)

  • et régularisé (abréviations complétées, fautes d’orthographe corrigées, lapsus rectifiés, etc.).

 

La mise en place d’un affichage de la transcription en version « enrichie » [lien vers…] a permis de réduire au minimum l’utilisation de signes diacritiques. Seuls subsistent un jeu de couleurs et les crochets droits :

  • la couleur bleue est utilisée pour repérer les commentaires de Flaubert et ses notes de régie ;

  • la couleur marron est la marque d’une intervention éditoriale de niveau 2 (moyenne) ;

  • les crochets droits s’ajoutent à la couleur marron pour marquer une intervention éditoriale de niveau 3 (forte).

 

Il est en effet apparu pertinent de distinguer trois niveaux d’interventions éditoriales déterminés en fonction de la nature, de la portée et du degré de certitude des transformations induites. En affichage normalisé, les interventions éditoriales de faible importance sont transparentes. Il s’agit essentiellement de régularisations portant sur la ponctuation, la casse et les abréviations. Les interventions éditoriales de niveau 2 (couleur marron) concernent les corrections : lapsus, répétitions et la plupart des omissions. Enfin, les interventions éditoriales de niveau 3 (couleur marron et crochets droits) sont utilisées lorsque, sans elles, l’intelligibilité du texte ne pourrait être garantie ou lorsque, dans le contexte d’un fragment destiné au second volume, le texte effectivement présent sur le manuscrit ne permet pas de saisir ce que Flaubert visait (fragment in absentia ou notablement altéré). Dans ce cas de figure, l’intervention éditoriale ne touche que le fragment le plus élaboré au sein de la citation. Parmi les différentes catégories de pages présentes dans le corpus, elle ne peut donc concerner que des fragments apparaissant :

  • sur des pages préparées pour le second volume ;

  • sur des pages récapitulatives dénuées de pages préparées ;

  • ou sur des notes de lecture dénuées de pages récapitulatives et de pages préparées mais désignées pour la copie, matériellement par Flaubert (croix parenthétique ou non, soulignement, trait ou catégorie en marge, etc.) ou en raison d’une décision éditoriale.

 

Les fragments qui ne rentrent pas dans ce cadre très précis ne font donc jamais l’objet d’interventions éditoriales fortes. En distinguant ces trois niveaux, on a cherché à trouver le meilleur équilibre possible entre lisibilité du texte normalisé et manifestation des interventions éditoriales. Le résultat est un compromis dont les termes peuvent toujours être revus.

Rappelons d’ailleurs que les documents manuscrits de ce corpus n’étaient pas destinés à la publication et appartiennent à des stades génétiques qui sont parfois très éloignés d’une réelle textualisation : faire comme s’il en était autrement reviendrait à dénier au corpus son caractère essentiel de recueil de documents préparatoires. Aussi la normalisation n’est-elle pas toujours aussi complète qu’on pourrait l’attendre dans le cas d’un texte destiné à la publication. En particulier, la normalisation de la ponctuation est une entreprise complexe, nécessitant une réflexion d’ensemble sur le corpus, qui ne sera pas menée à son terme avant longtemps et qui n’est pas destinée à dénaturer le corpus édité.

 

3- Transcription enrichie

Dans la version enrichie, toutes les substitutions opérées apparaissent en clair. Grâce à l’encodage XML/TEI sont proposées côte à côte la chaîne de caractères présente sur le manuscrit (transcription diplomatique) et celle qui la remplace en mode normalisé. Cette transcription n’a pas vocation à être lue in extenso mais présente l’intérêt de manifester clairement la totalité des interventions éditoriales réalisées.

 

4- Annotation

Une annotation critique, plus ou moins développée, est accessible à différents niveaux de la transcription normalisée. Elle peut concerner un mot, un fragment textuel, une page ou un texte (voir les différentes unités constitutives du corpus [lien vers l’onglet « Unités constitutives »]). Les notes rédigées par les transcripteurs complètent les informations que donnent les métadonnées accessibles pour toutes les pages grâce à un onglet dédié (« Métadonnées »). En particulier, par l’intermédiaire de la métadonnée « Référence bibliographique exacte », chaque fragment textuel est localisé avec précision dans l’ouvrage-source dont il est extrait. En affichage normalisé, cette information est accessible directement en cliquant, soit sur la référence bibliographique lorsque celle-ci est indiquée par le scripteur, soit sur l’icône [livre] qui apparaît à droite, en bout de ligne, au survol de la souris.

 

5- Encodage XML/TEI

À venir :

  • lien vers le manuel
  • téléchargement du corpus / des fichiers.




 

1 On a choisi de rendre par l’esperluette (« & ») le caractère ressemblant à la lettre de l’alphabet grec alpha (« α ») utilisé par Flaubert.