Text aus PDF extrahieren

von | 02.04.2005 | Tipps

Immer mehr PC-Benutzer verschicken wichtige Dokumente im bekannten PDF-Format von Adobe. Vorteil: Der für jedermann und für Windows, MacOS und Linux unter https://www.adobe.de kostenlos erhältliche Betrachter (Viewer) erlaubt, PDF-Dokumente anzuschauen und auszudrucken, unabhängig von der dort installieren Software. Deshalb werden mittlerweile auch viele Rechnungen oder Briefe im PDF-Format verschickt.

{bild://a124.e.akamai.net/f/124/5462/2d/images.element5.com/pimages/P533950/BIG/533950.JPG://esd.element5.com/product.html?productid=533950&affiliateid=63354:left}Wer jedoch den Acrobat Viewer nicht zur Hand hat oder einfach die in einem PDF-Dokument enthaltenen Texte weiter verarbeiten möchte, kann auf einen praktischen Service von Adobe zurück greifen: Einfach eine E-Mail mit dem betreffenden PDF-Dokument im Anhang an pdf2txt@adobe.com schicken. Adobe schickt eine E-Mail mit dem extrahierten Text zurück. Soll das PDF-Dokument in HTML umgewandelt werden, das PDF-Dokument an die Adresse pdf2html@adobe.com schicken. Die Ergebnisse werden im Zip-Format gepackt zurück geliefert. Leider kann es mitunter einige Stunden dauern, bis das Ergebnis zurück kommt – die Lösung ist also nichts für eilige Fälle.

Wer öfter PDF-Dokumente bekommt und die enthaltenen Daten extrahieren muss oder möchte, kann auf den ABBYY PDF Transformer zurückgreifen. Damit lässt sich jede PDF-Datei in die Formate Microsoft Word, Excel, HTML oder TXT umwandeln. PDFs werden effizient umgewandelt, deren Inhalt kann in Ihrer bevorzugten Microsoft Office Applikation sofort verwenden werden und Sie steigern somit Ihre Produktivität.

ABBYY PDF Transformer ist die umfassendste Lösung, um alle Arten von PDF Dateien in andere Formate umzuwandeln. Aufgrund der integrierten Adobe PDF Library und der OCR Technologie von ABBYY kann die Software alle PDFs bearbeiten, egal ob sie durch einen Scanner, ein Multifunktionsgerät, eine Applikation wie z.B. Microsoft Word oder Excel erstellt oder aus dem Internet geladen wurden. ABBYY PDF Transformer übernimmt bei der Umwandlung zu Microsoft Word, Excel und HTML auch das Layout und die Formatierung der PDF-Datei.