Some PDF v. 1.5 - PDF-zu-Word/HTML/TXT-Konvertersammlung

Erstellen und Bearbeiten von PDFs

Moderatoren: Jean, |Gordon|, Moderatoren

Antworten
Benutzeravatar
Gordon
Beiträge: 14054
Registriert: 06.01.02, 18:46

Some PDF v. 1.5 - PDF-zu-Word/HTML/TXT-Konvertersammlung

Beitrag von Gordon » 12.05.08, 18:16

Die Seite http://www.somepdf.com/ bietet einige Freewarekonverter rund um das PDF-Format, um PDF-Dateien in Word, HTML oder TXT zu konvertieren, Textdateien ins PDF-Format zu wandeln oder Bilder aus PDF-Dateien zu extrahieren. Ich fasse die 5 Tools alle in diesemThread zusammen.

Batchverarbeitung ist bei allen Tools möglich. Nur für NT-basierte BS, der PDF-zu-Word-Konverter benötigt ein installiertes Word 2000 oder höher!
Some PDF to Word Converter can help you to convert pdf to word doc and pdf to rtf, so you can edit and reuse your PDF content. Using Some PDF to Word Converter you can preserve original layout, text, images, vector drawings of your pdf file.

Some PDF to Html Converter
is a powerful tool to convert pdf to html. You can preserve original layout, links, bookmarks, images, vector drawings of your pdf file.

Some PDF to Txt Converter is a pdf to txt, pdf to text convert tool. You don't need Adobe Acrobat or Adobe Reader software to convert pdf to txt.

Some Text to PDF Converter is a powerful tool to convert text to pdf files! You don't need Adobe Acrobat or Adobe Reader software to convert text to pdf. Some Text to PDF Converter supports encryption, page orientation, font setting etc!

Some PDF Image Extract is a easily tool to extract images from pdf files. Some PDF Image Extract can easy help you to extract images in pdf files to TIFF, JPEG, BMP, GIF, PNG, TGA, PBM, PPM.
DL: http://www.somepdf.com/downloads.html (jeweils ~ 1 MB/Tool)
Zuletzt geändert von Gordon am 13.10.08, 16:54, insgesamt 1-mal geändert.
Während sich Viren leicht in schwachen Körpern ausbreiten, passiert dasselbe mit Verschwörungstheorien bei schwachen Geistern, insbesondere wenn Antikörper in Form von Bildung fehlen.

Wilhelm
Kein
Beiträge: 153
Registriert: 14.01.04, 12:23

Beitrag von Wilhelm » 14.05.08, 15:38

Vielleicht als Entscheidungshilfe: habe den PDF to Word Converter an 2 Dateien ausprobiert (eine mit und eine ohne Grafiken) und beide Male hat sich das Programm verabschiedet: "abnormal program termination."
Und schon war es wieder de-installiert.
Grüße
Wilhelm

hylli
Mitglied
Beiträge: 1750
Registriert: 05.04.06, 13:56

Beitrag von hylli » 14.05.08, 17:03

Gleiche Erfahrung!

Hylli

braindrain
Einsteiger
Beiträge: 8
Registriert: 05.11.07, 14:19

Beitrag von braindrain » 15.05.08, 10:13

Bei mir arbeitet der PDF to Word Converter zwar fleißig und ohne Absturz, aber das Ergebnis wird weder angezeigt noch abgespeichert.
-> deinstalliert

Wilhelm
Kein
Beiträge: 153
Registriert: 14.01.04, 12:23

Beitrag von Wilhelm » 15.05.08, 10:26

Allerdings produziert die Firma nicht nur Mist, denn
Some PDF Image Extract funktioniert ganz gut.

Ich habe denen eine Mail geschrieben, in der ich die Probleme mit dem Word Converter geschildert habe. Vielleicht wird's ja noch was.
Grüße
Wilhelm

Wilhelm
Kein
Beiträge: 153
Registriert: 14.01.04, 12:23

Beitrag von Wilhelm » 16.05.08, 9:11

Update auf Version 1.1!
Der Fehler im Word Converter ist behoben.

Die Resultate sind aber nicht besonders. Das Ergebnis sieht so aus, als hätte man einen Print des PDF Files mit einem OCR Programm gescannt, das mit Bildern nicht ganz klar kommt. Z.B. wird ein Text innerhalb eines Bilds in eine eigene Textbox geschrieben, also vom Bild getrennt.
Grüße
Wilhelm

Benutzeravatar
likeatim
Gründer und Administrator
Beiträge: 2675
Registriert: 24.08.01, 13:01

Beitrag von likeatim » 16.05.08, 15:11

ich glaube, genau so funktionieren diese programme auch: PDF wird Digitales Bild, das wird durch ein OCR gejagt. Für den absolten Notfall ok, aber Textstruktur, Fußnoten, etc. - die gehen alle verloren.

Benutzeravatar
Asmodis
Mitglied
Beiträge: 193
Registriert: 05.03.08, 19:06

Beitrag von Asmodis » 16.05.08, 15:16

Test Some PDF To Word 1.1: Proggie installiert, Programmverzeichnis woanders hin kopiert, Proggie wieder deinstalliert und Rechner neu gestartet. Kopie von PDF2Word läuft trotzdem, ist also standalone. Zwar lassen sich in der Registry keine Reste der Installation finden, aber im Programmordner bleiben manuell zu löschende Reste im Ordner \SomePDF zurück. Konvertierung eines PDFs mit und eines PDFs ohne Bilder erfolgt problemlos; Zielformat ist RTF (nicht veränderbar). Störend: Das konvertierte Dokument wird unmittelbar und automatisch in der Default-Textverarbeitung (also Word, OOWrite oder was auch immer) geöffnet, auch dann, wenn in der "settings.ini" der Eintrag Open Result=0 vorhanden ist. Zur Untersuchung des RTFs: Alle PDF-Ausgaben sind in separate Textfelder exportiert worden, d. h. je ein zusammenhängender Textblock bildet ein Textfeld, ein anderer das Nächste usw. Für Bilder gilt das Gleiche. Die Qualität der Bilder ist mittelmäßig und noch akzeptabel. Härtetest: Ein kopiergeschütztes 3MB-PDF wurde konvertiert, was zwar funktionierte, aber unter Word zum Absturz führte. OpenOffice hingegen öffnete das Dokument und lässt daher auch eine Weiterbearbeitung zu. Allerdings sind hier keine Textfelder mehr vorhanden, sondern nur noch Fließtext. Auch sind Leerzeilen u. ä. Layout-Elemente verschwunden, was bspw. dazu führt, dass Seitenzahlen in einem Inhaltsverzeichnis nicht mehr stimmen.

Test Some PDF To Html 1.1: Proggie installiert, Programmverzeichnis woanders hin kopiert, Proggie wieder deinstalliert und Rechner neu gestartet. Kopie von PDF2HTM läuft trotzdem, ist also standalone. Registry und Programmordner sind sauber; keine Installationsreste. Konvertierung eines PDFs mit und eines PDFs ohne Bilder erfolgt problemlos; Zielformat ist ein Ordner mit dem ursprünglichen Dateinamen. Darin liegen jetzt HTML-Texte, PNG-Bilder sowie eine Navi für das Dokument. Der Export wird automatisch im Default-Browser geöffnet. Das HTML-Dokument (Frame-CSS-Konstruktion) ist kopierbar und kann per Zwischenablage in andere Anwendungen übernommen werden. Geschütztes PDF wurde nicht getestet.

Fazit: Ich werde mir die beiden Dinger auf jeden Fall auf den USB-Stick kopieren. Sowas kann ich immer mal brauchen!

Benutzeravatar
Azazel
Beiträge: 452
Registriert: 03.03.03, 9:17

Beitrag von Azazel » 03.08.08, 3:23

Alle Programme sind derzeit bei Version 1.4!!
"Heute in 20 Jahren werdet ihr mit größerer Trauer den Dingen die ihr NICHT getan habt gegenüberstehen als denen die ihr tatet. Drum hisst die Segel, verlasst den schützenden Hafen, fährt raus in die Passatwinde, erforscht, entdeckt und erlebt euer Leben!!!" , - Mark Twain

hylli
Mitglied
Beiträge: 1750
Registriert: 05.04.06, 13:56

Beitrag von hylli » 13.10.08, 16:52

Mittlerweile bei Version 1.5

Kein Changelog gefunden?

Hylli

Benutzeravatar
jakedo
Mitglied
Beiträge: 152
Registriert: 10.09.07, 15:43

Beitrag von jakedo » 26.06.09, 0:32

Ich habe gerade den "PDF to Txt Converter" im Einsatz gehabt um mehrere Seiten Tabellen im PDF-Format in ein Format zu konvertieren, das ich in Excel importieren kann. Mit dem Ergebnis bin ich sehr zufrieden. In der Text-Datei wurden die Leerräume zwischen den einzelnen Spaltenwerten mit Leerzeichen und nicht mit Tabs aufgefüllt, die Spalten sind aber vertikal exakt untereinander und lassen sich problemlos in Excel importieren.

Ich habe vorher andere Wege probiert, aber selbst der Export aus dem Adobe Standard Paket (Text oder HTML) hat nur unbefriedigende Ergebnisse gebracht.

Danke für den Tipp! \:D/

Antworten