Bei der Arbeit mit Dokumenten, gescannten Büchern und PDF-Dateien ist es oft notwendig, diese zu bearbeiten. Dazu müssen Sie den Text im PDF-Format erkennen und in das reine Textformat konvertieren. Dies kann auf verschiedene Weise erfolgen.
PDF-Text erkennen
Mit einem Texteditor erstellte elektronische Dokumente werden vom kostenlosen Programm Adobé Reader problemlos erkannt. Öffnen Sie die gewünschte PDF-Datei im Programm, gehen Sie in das Menü "Bearbeiten", wählen Sie im Dropdown-Fenster die Zeile "In Zwischenablage kopieren". Erstellen Sie ein neues Dokument in Word, fügen Sie den Text aus der Zwischenablage ein, bearbeiten Sie ihn und speichern Sie ihn im gewünschten Format.
Sie können PDF-Dateien auch mit dem multifunktionalen Dienstprogramm Acrobat Reader DC konvertieren und bearbeiten. Das Softwareprodukt verfügt über eine Vielzahl von Werkzeugen für die Arbeit mit elektronischen Dokumenten.
Es sind gute Programme, aber sie können keinen Text erkennen, wenn PDF-Dokumente vor Bearbeitung geschützt oder von Papier gescannt werden. In diesem Fall benötigen Sie ein spezielles OCR-Programm.
OCR
Unangefochtener Spitzenreiter ist ABBYY FineReader, das Programm erkennt einzelne Seiten und arbeitet im Batch-Modus. Der bearbeitete Text kann in txt, doc, html und anderen Formaten gespeichert werden. Das Programm erkennt PDF-Text recht gut. Es kann einen kleinen Prozentsatz falsch erkannter Zeichen geben und das Dokument muss manuell überarbeitet werden. Das Ergebnis hängt von der Qualität der Scans ab. Dieses Programm hat einen Nachteil - es wird bezahlt.
Es gibt andere kostenpflichtige und kostenlose Programme, mit denen Sie Text von PDF in Word erkennen und konvertieren können: kostenlos - CuneiForm, Freemore OCR, FreeOCR; bezahlt - Readiris Pro, Nitro PDF Professional.
Text online erkennen
Wenn Sie nicht jeden Tag elektronische Dokumente konvertieren, müssen Sie nur einmal mit dem PDF-Format arbeiten, in diesem Fall macht es keinen Sinn, das Programm auf Ihrem Computer zu installieren. Es gibt Online-Dienste für solche Episoden. Es ist auch praktisch, sie bei der Arbeit oder auf Reisen zu verwenden, wenn kein Computer mit dem installierten Programm in der Nähe ist. Mit Online-Diensten können Sie kostenlos und schnell Text erkennen. Hier sind einige:
- Online-OCR - www.onlineocr.net
- NewOCR - www.newocr.com
- Free-OCR - www.free-ocr.com
- OCRConvert - www.ocrconvert.com
Die Online-Texterkennung hat viele positive Aspekte, aber auch Nachteile: Sie müssen sich beim Dienst registrieren; nicht alle Dienste haben eine Exportfunktion, Sie müssen den erkannten Text von der Webseite kopieren; bei einigen Diensten ist die Anzahl der verarbeiteten Dokumente begrenzt; Die Qualität des Endergebnisses hängt von der Geschwindigkeit des Internets ab.
Wie sich herausstellte, ist es nicht schwer, den PDF-Text zu erkennen, es gibt verschiedene Programme, die Sie auswählen können.