Frage zum Thema Volltextsuche.
Ich "baue" mir eine VollTextsuche aus einer .doc-Datei...ich weiss zwar noch nicht recht wie, jedoch denke ich es ist einfacher aus einem Unicode der lesbar ist(keine Hieroglyphen) zu lesen als aus *weissNichtWieErHeisst*code zu lesen.
Gibt es einen Filter den ich vor/hinter DataOutput/ InputStream stellen kann der mir all die Microsoft-Sonderzeichen herausfiltert?
Ich bin für jeden Lösungsvorschlag/Tip's dankbar... auch für neue Lösungsansätze, danke!
Matthias
Ich "baue" mir eine VollTextsuche aus einer .doc-Datei...ich weiss zwar noch nicht recht wie, jedoch denke ich es ist einfacher aus einem Unicode der lesbar ist(keine Hieroglyphen) zu lesen als aus *weissNichtWieErHeisst*code zu lesen.
Gibt es einen Filter den ich vor/hinter DataOutput/ InputStream stellen kann der mir all die Microsoft-Sonderzeichen herausfiltert?
Ich bin für jeden Lösungsvorschlag/Tip's dankbar... auch für neue Lösungsansätze, danke!
Matthias
Comment