Announcement

Collapse
No announcement yet.

Website parsen

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Website parsen

    Hallo zusammen,

    kann ich mit Java den Inhalt von Websites parsen und dann strkturiert als XML speichern???

    wenn ja, welche Möglichkeiten stehen dazu zur Verfügung?

    Folgende Problemstellung hab ich hierbei:

    Ich soll Daten und Links auf ner Webseite auslesen, Daten als XML speichern und die Links zum weiteren Parsen aufrufen und da wiederrum Daten auslesen.

    Aufbau der Seiten ist immer gleich

    Bin für jeden Tipp dankbar

    Viele Grüße
    Chris

  • #2
    Hi,

    Ich benutze meistens den Neko HTML Parser:

    http://people.apache.org/~andyc/neko/doc/html/index.html

    Gruß,

    Alwi

    Comment


    • #3
      Es gibt viele Open Source Web Crawler die genau das machen. Siehe
      beispielsweise:

      http://java-source.net/open-source/crawler

      Comment

      Working...
      X