Mit problematischen PDF-Dateien arbeiten

Gelegentlich kann eine PDF-Datei nicht nach Monarch Classic importiert werden. Es gibt zahlreiche Gründe dafür, häufig wurde jedoch die Textebene der PDF-Datei beim Erstellen beschädigt oder die PDF-Datei ist ein gescanntes Bild oder ein anderes eingebettetes Bild.

Bei der Arbeit mit einer problematischen PDF-Datei sollten sie als Erstes feststellen, ob diese tatsächlich Text enthält.

Bestimmen, ob eine PDF-Datei Text enthält

Eine schnelle und einfache Methode zum Prüfen, ob die PDF-Datei tatsächlich Text enthält, ist das Öffnen der Datei in Adobe Acrobat; suchen Sie danach mit der Suchfunktion nach einer Textfolge, die klar zu sehen ist. Falls der Text nicht gefunden wird, wurde die Textebene beschädigt oder ist nicht vorhanden; in diesem Fall ist das Dokument wahrscheinlich ein Bild und kann daher von Monarch Classic oder Acrobat nicht gelesen werden.

Sie können auch versuchen, mit dem Textextrahierungs-Tool von Acrobat einen Textabschnitt zu kopieren und in den Notizblock einzufügen. (Hinweis: Falls Sie mit dem Textextrahierungs-Tool und Linksklicken oder Ziehen keinen Text hervorheben können, ist der Text ein eingebettetes Bild.) Falls der im Notizblock eingefügte Text nicht dem Text in der PDF-Datei entspricht, ist die Textebene beschädigt.

Szenarien, in denen Monarch Classic eine PDF-Datei nicht importieren kann

Nachstehend finden Sie übliche Szenarien, in denen Monarch Classic eine bestimmte PDF-Datei möglicherweise nicht importierten kann, sowie Vorschläge zum Umgang mit solchen Dateien.

  • Gescannte PDF-Dateien – Falls eine PDF-Datei keinen Text enthält (was vorstehend bereits angesprochen wurde), kann sie u U. ein gescanntes oder ein sonstiges eingebettetes Bild enthalten. Ein gescanntes Bild ist die Abbildung eines Dokuments mittels Scanner; diese Abbildung wird danach in ein PDF-Dokument eingebettet. Monarch Classic kann keinen Text aus einer Abbildung extrahieren. Die einzige Möglichkeit zum Umgang mit Abbildungen ist der Gebrauch von OCR-Software (Optische Zeichenerkennung), um den Text aufzuschlüsseln und anschließend extrahieren zu können. VORSICHT: Es ist NICHT empfehlenswert OCR-Software bei wichtigen finanziellen Dokumenten zu verwenden, da die Extrahierungsgenauigkeit von Dokument zu Dokument und verwendetem OCR-Software unterschiedlich ist. Beim Gebrauch von OCR-Software können leicht kleine Fehler bei der Zeichenerkennung auftreten, die vielleicht erst durch eine sorgfältige Prüfung der Daten erkannt werden können.

  • Beschädigte PDF-Dateien – Obwohl eine PDF-Datei in Adobe Acrobat korrekt aussehen kann, könnte beim Erstellungsvorgang die Textebene so beschädigt worden sein, dass sie nicht mehr repariert werden kann. In diesem Fall kann Monarch Classic keinen Text aus dieser Datei extrahieren. Adobe Acrobat kann kleine Fehler in PDF-Dokumenten erkennen und beheben. Wenn die betreffende PDF-Datei daher in Acrobat geöffnet und mit der Menüoption „Datei|Speichern unter“ erneut als neue PDF-Datei gespeichert wird, könnte dadurch das Problem beseitigt werden.

  • Verhinderte Textextrahierung – Bei der Veröffentlichung einer PDF-Datei können Sicherheitsoptionen festgelegt werden, die eine Extrahierung des Inhalts unmöglich machen. Wenn Sie versuchen, ein PDF-Dokument zu importieren, aus dem Inhaltsextrahierungen gesperrt sind, zeigt Monarch Classic eine Meldung an, dass der „Import aus der PDF-Datei nicht möglich ist, da Textextrahierung nicht gestattet ist“. In diesem Fall müssen Sie den Herausgeber der PDF-Datei bitten, die PDF-Datei neu zu speichern und dabei Inhaltsextrahierung zu gestatten.

 

© 2024 Altair Engineering Inc. All Rights Reserved.

Intellectual Property Rights Notice | Technical Support