Announcement

**Bernhard Geyer** · 20.08.2007, 11:11

Sorry, da ist keine Textdatei!

Hast du das so definiert oder mußt du bestehende Daten übernehmen?

**mk666** · 20.08.2007, 11:21

Ist leider so vorgegeben und ich muß nun sehen wie ich damit klar komme. Das Ding kommt als blah.txt mit dem beschriebenen Inhalt so bei mir an und soll in die einzelnen Bestandteile zerlegt werden.

**ronzon** · 20.08.2007, 11:36

Hallo,
PDF Dateien fangen immer mit %PDF-... (Version) an.
Kannst mal ne PDF Datei mit einem Editor öffnen, da sieht man das.
Dies solltest Du als Startzeichen nehmen können.

Thomas .-)

**mk666** · 20.08.2007, 11:44

Ja, das ist mir auch schon aufgefallen und habe ich auch schon versucht. Allerdings scheint der BufferedReader einige Zeichen des PDFs nicht richtig auszulesen, so daß das PDF anschließend leider nicht lesbar ist. Möglicherweise auch ein Problem mit dem Encoding.

Ich bin leider mit der Verarbeitung von Dateien unter Java noch nicht sehr vertraut.

**ronzon** · 20.08.2007, 11:48

Schau mal hier .-)
http://www.javahowto.de/sprache/io/b...-kopieren.html

Thomas

**mk666** · 20.08.2007, 11:59

Die ganze Datei zu kopieren bringt mich ja jetzt nicht wirklich weiter. Ich brauch ja nur einen Teil. Sorry, ich steh wohl echt voll auf meiner Leitung.

**ronzon** · 20.08.2007, 12:04

Vielleicht ist dies ja besser :
http://informatik.unibas.ch/lehre/ws...en/15_IO_2.pdf
.-)

**Bernhard Geyer** · 20.08.2007, 12:06

Du darfst die Datei (als ganzes) nur als Binärdatei anfassen und nicht mit irgendwelchen Textreadern lesen der Codierungswandlungen durchführt.

Die länge des PDF's sollte irgendwo im PDF vermerkt sein. Dazu wirst du dich aber in die Spec einlesen dürfen.

Also wer sich das ausgedacht hat gehört auf den Mond geschossen. Es gibt tausend Fälle indenen ein Algorithmus scheidert. Wie wäre es mit %PDF in der HTML-Datei welche kein entsprechenden End-Tags beinhaltet?

**mk666** · 20.08.2007, 12:23

Originally posted by Bernhard Geyer View Post

Also wer sich das ausgedacht hat gehört auf den Mond geschossen.

Ja, das sehe ich genauso. Ist mir schleierhaft wie man auf so einen Mist kommen kann.

Ich versuche es jetzt mal per InputStream. Weiß nur noch nicht genau wie ich die Stelle finden soll, an der das PDF bzw. Image beginnt. Die PDF Specs werde ich mir auch mal zu Gemüte führen.

Danke euch soweit. Für weitere Vorschläge bin ich immer offen.

Announcement

Binärdaten aus Textdatei extrahieren

Binärdaten aus Textdatei extrahieren

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment

Comment