Announcement

Collapse
No announcement yet.

Suchen anhand von Indizes in PDF´s

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Suchen anhand von Indizes in PDF´s

    Hallo,

    ich habe eine Applikation die mehrere Tausend PDF´s einem Anwender zur Verfü-gung stellte.

    Diese Anwendung soll eine Freitextsuche beinhalten.
    Um möglichst schnell an die Ergebnismenge zu kommen, wäre eine Indizierung die-ser Dateien sicherlich das Beste Verfahren.

    Mir fehlt zur Zeit die nötige Eingebung um eine Indizierung zu entwickeln.

    Hat von Euch jemand eine Idee oder ein Beispiel die/das mich auf den richtigen Pfad führt?

    Danke und Gruß
    Björn

  • #2
    Du mußt die PDF Verschlüsselung knacken, den enthaltenen Text auslesen und in eine Tabelle schreiben. Dazu mußt du noch den namen der Datei übergeben, oder besser das PDF in ein Blob-Feld speichern. Wenn du jetzt via SQL befehlen nach Textpasagen suchst, erhällst du auch gleich das passende PDF.
    Ein bekannter hat dieses schon mal erledigt. Ich werde aber keine Namen, oder email adressen dritter bekannt geben. Das programm war auch recht gut, es hat auch die Text passage ausgegeben, die gesucht wurde den Bereich Farbich herforgerufen und die Seite mitgeteilt, auf dieser der Text steht

    Comment


    • #3
      Wurde wirklich die Verschlüsselung geknackt?
      Wenn die PDF's nicht mit Standard-Acrobat-Sicherheit (40/128-Bit) versehen sind, so gibt es viele Programme die den Text aus PDF's auslesen können. Diverse Tools wie z.B. die <a href="http://desktop.google.de/">Desktop-Suche von Google</a> kann sowas

      Comment

      Working...
      X