Beitrag von Schulze-Amme, 25.10.2007, 13:27
Texterkennung für PDF-Dateien (Windows)
In der täglichen Arbeit mit PDF-Dokumenten ist man oft mit der Tatsache konfrontiert, dass ein PDF-Dokument zur Verfügung steht, aus dem Teile des Textes für die eigene Arbeit genutzt werden könnten. Das PDF-Format lässt jedoch das Kopieren von Textpassagen nicht zu. Für das Gesamtdokument gibt es in den Professional-Versionen die Möglichkeit, Dateien zum Beispiel in Microsoft Word zu konvertieren. Das ist aber in vielen Fällen gar nicht erforderlich. In den beiden Professional-Versionen Adobe Acrobat und Scan Soft PDF-Konverter 4 steht eine OCR-(Texterkennungs-)Funktion zur Verfügung. In beiden Fällen wird eine PDF-Datei durchsuchbar gemacht. Das heißt, Text einer über die OCR-Funktion erkannten PDF-Datei kann zwar nicht geändert, jedoch markiert, mit Ctrl C kopiert und zum Beispiel mit Ctrl V in ein beliebiges Dokument eingefügt werden. In Adobe Acrobat wird die Funktion über Dokument / OCR-Texterkennung / Text mit OCR erkennen ... erreicht, im ScanSoft PDF-Konverter 4 über Speichern unter / Dateityp: Durchsuchbare PDF-Dokumente. Beide PDF-Konverter sind in ihrem Funktionsumfang etwa gleichwertig, Wer also ein preiswertes Programm erwerben möchte, sollte zum ScanSoft-PDF-Konverter greifen. Der aus meiner Sicht einzige Unterschied besteht in der Scannen-Funktion des Adobe Acrobat, die der ScanSoft-Konverter nicht zur Verfügung stellt.
Themen: E-Mail Abo | Software
|
Adobe Acrobat PDF
Tags: OCR | PDF | PDF-Konverter | Texterkennung | Text kopieren
Software
RSS 2.0