Travailler avec des alignements en mode Moteur Simple

Le mode Moteur Simple se concentre sur la préservation de la mise en page de l'état PDF d'origine lors de la conversion en texte à chasse fixe. Le tableau suivant décrit les propriétés qui peuvent être modifiées dans ce mode.

Propriété

Description

Réglage automatique

Réglage automatique – Sélectionnez ce bouton pour que Data Prep Studio sélectionne automatiquement les paramètres optimaux pour la page type affichée. Remarque : Si vous avez changé les paramètres d’importation PDF, cette option rétablira probablement les paramètres originaux.

Espacement constant (pour moteur PDF version 4.4 ou inférieure)

Ce paramètre indique qu’une police à espacement constant (à chasse fixe ou non proportionnelle) a été utilisée dans le fichier PDF. Les polices à espacement constant sont des polices où tous les caractères sont de largeur égale. Ainsi, dans une police à espacement constant, les caractères « o » et « i » sont de largeur identique : ils occupent un même espace horizontal. Les polices à espacement constant sont aussi appelées polices à chasse fixe ou non proportionnelles. L'opposé de l'espacement constant est l'espacement proportionnel, dans lequel les caractères ont chacun une largeur différente : la lettre « o » est plus large, par exemple, que la lettre « i ».

Lors de l’importation d’un fichier PDF dans Monarch Data Prep Studio, l’application détecte l’usage de polices à espacement constant et optimise la conversion en conséquence. Il arrive toutefois que Monarch Data Prep Studio ne puisse pas détecter ces polices dans le fichier PDF. La situation est généralement due à la présence d’une combinaison de polices proportionnelles et non proportionnelles dans un même fichier PDF. Si vous savez que le fichier PDF contient des polices à espacement constant mais que les polices ne s’affichent pas correctement, sélectionnez ce paramètre pour forcer Monarch Data Prep Studio à optimiser la conversion en fonction de ce type de police. D’apparence moins attrayante peut-être, les polices à espacement constant conviennent mieux aux données tabulaires car la largeur uniforme des caractères facilite l’alignement des colonnes.

En général, les fichiers PDF à polices à espacement constant se convertissent mieux. Pour optimiser votre application génératrice de PDF pour Monarch Data Prep Studio, veillez donc à utiliser ce type de polices. Il s’agit principalement des polices suivantes : Andale Mono, Anonymous, Crystal, Bitstream Vera Sans Mono, Courier, Courier New, Elronet Monospace, Everson Mono Latin 6, Fixedsys, Lucida Sans Typewriter, Lucida Console et PrestigeFixed.

Libre (pour moteur PDF version 4.4 ou inférieure)

Cette option optimise le texte libre, par rapport au texte en colonnes ou colonnes groupées. Un document en colonnes présente un simple format de tableau. En colonnes groupées, il ressemble davantage à l’un de nos états types Monarch Data Prep Studio : Boîte à musique d’Aline (classique.pdf), par exemple. Cette option conviendrait à un document de type état académique composé à 95 % de texte, avec quelques tableaux à extraire toutefois. Remarque : L'option est parfois efficace sur les documents à colonnes lorsque les paramètres par défaut ne produisent pas un résultat acceptable.

Ancrer le texte à gauche (Moteur PDF version 4.5)

Aligne le texte à gauche de la grille PDF.

Ancrer le texte en haut (Moteur PDF version 4.5)

Aligne le texte sur le haut de la grille PDF.

Toujours aligner à gauche (Moteur PDF version 4.5)

Ce paramètre indique à l'application de toujours aligner le texte à gauche de la grille PDF.

Supprimer Espaces Blancs Gauche (moteurs PDF v4.2–4.5)

Ce paramètre indique à l'application de supprimer tous les espaces blancs à gauche lors de l'affichage de l'état.

Étirer

Ce paramètre régit l'espace utilisé lors du processus de conversion. Lors de l’analyse du fichier PDF, Monarch Data Prep Studio essaie de respecter autant que possible l’espacement du document original. Plusieurs facteurs exigent cependant l’introduction d’un plus grand espacement à la conversion. Ainsi, les données masquées du fichier PDF, bien que non visibles à l’écran, n’en font pas moins partie du fichier PDF en soi. Les colonnes aux données tronquées en sont un exemple. Même si aucune donnée ne semble manquer à première vue, Monarch Data Prep Studio convertit toutes les données du fichier PDF, et pas seulement celles visibles dans une application d’affichage PDF. Pour maintenir un alignement de colonnes adéquat, Monarch Data Prep Studio doit dans ce cas recalculer et élargir l’espacement. L’espacement original des colonnes ne suffirait en effet pas à recevoir toutes les données.

Monarch Data Prep Studio choisit généralement un espacement plus large que le fichier PDF. Dans la fenêtre d’état, le document semble étiré par rapport au fichier PDF original, mais Monarch Data Prep Studio préfère la prudence, pour éviter que les colonnes ne se chevauchent dans le document converti. Au cas où une itération ultérieure du même état (ou d’un état similaire) présenterait des valeurs de données plus larges, l’approche permet aussi la compatibilité continue du modèle.

Si vous connaissez bien vos états, vous pouvez réduire la valeur d'étirement pour les rendre plus présentables en évitant les toutes petites polices dans la fenêtre d'état ou l'exigence de défilement horizontal.

Utilisez les boutons + et – pour spécifier une valeur d’étirement.

Rogner

Sélectionnez cette option pour rogner de l’espace supplémentaire de la page PDF. Utilisez les boutons + et – pour spécifier une valeur de rognage.

Liens associés

© 2024 Altair Engineering Inc. All Rights Reserved.

Intellectual Property Rights Notice | Technical Support