Announcement

Collapse
No announcement yet.

Filter für .doc Datei / Volltextsuche

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Filter für .doc Datei / Volltextsuche

    Frage zum Thema Volltextsuche.

    Ich "baue" mir eine VollTextsuche aus einer .doc-Datei...ich weiss zwar noch nicht recht wie, jedoch denke ich es ist einfacher aus einem Unicode der lesbar ist(keine Hieroglyphen) zu lesen als aus *weissNichtWieErHeisst*code zu lesen.

    Gibt es einen Filter den ich vor/hinter DataOutput/ InputStream stellen kann der mir all die Microsoft-Sonderzeichen herausfiltert?

    Ich bin für jeden Lösungsvorschlag/Tip's dankbar... auch für neue Lösungsansätze, danke!
    Matthias

  • #2
    Bau Dir doch Deine eigene Stream-Klasse, die Ein/Ausgabe-Klassen kapselt und nutze Character.isCharacter()

    Comment


    • #3
      Hallo Thomas Pöschmann

      Danke für deine Tip's. Die Idee mit dem Eigenen Filter hatte ich auch
      schon.

      Jedoch will ich nicht nur auf Word, sondern auch andere Dokumente
      zugreifen und da ich sicher nicht der Einzige bin der dieses Problem
      hat / hatte will ich das Rad ja nicht nochmal neu erfinden.

      Zudem würde das den Rahmen meines kleinen Programms sprengen da ich
      mich dann noch zusätzlich mit den diversen Formaten und deren Aufbau
      beschäftigen müsste.

      Grüss

      Comment

      Working...
      X