Announcement

Collapse
No announcement yet.

Rundumschlag Explorerinteraktion und HTML-Analyse

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Rundumschlag Explorerinteraktion und HTML-Analyse

    Hallo,

    wie schon in der Überschrift vermerkt habe ich gleich zu 2 Themen Fragen. Beide gehören irgendwie zusammen.

    Folgendes.

    Ich möchte gerne von einer bestimmten Internetseite (wo vorher die URL nicht bekannt ist) den
    HTML-Quelltext analysieren.

    - Kann ich eine gerade aktive Internetseite per Java-Aplikation ansteuern. Mir dort den
    Quellcode holen und bearbeiten?

    - Muß ich evtl. einen eigenen Browser starten? Wenn ja wie komme ich dann an meine Daten auf der Seite ran?

    - Wie interagiere ich mit dem Explorer (kann man URLS abfragen,....)?

    - Wenn die URL bekannt ist, wie erfahre ich vom Explorer auf welcher URL er sich befindet?

    Also betrifft das eine Thema die Interaktion mit dem Explorer und das andere wie ich an den Quellcode ran komme.
    Gut das gehört auch mit ins erste Thema, soll aber seperat betrachtet werden.

    Kann mir da einer weiter helfen? Ich freu mich über jeden Tipp der mir bei der Suche nach Lösungen weiterhelfen kann.

  • #2
    Variante 1:
    Ganz pauschal würde ich empfehlen, die Java-Applikation so zu schreiben, dass sie als HTTP-Proxy in Frage kommt. Damit würde dann Dein Webbrowser (egal welcher, und wenn es ein alter Netscape ist) JEDE URL Deiner Applikation melden, die dann "auf dem Rückweg" auch den Quelltext gleich abgreifen kann. Natürlich müsste man dafür die Browser-Einstellungen ändern, aber das ist ja kein Problem.

    Wie aufwendig diese Lösung wird, ob es da bereits fix + fertige Projekte gibt oder ob man mit java.net.* praktisch bei Null anfängt weiß ich jetzt nicht. Es ist ja nur ein Vorschlag, wie man das Problem allgemein hinkriegt. Wär immerhin 100% pure Java

    Variante 2:
    Falls das zu schwierig werden sollte, man kann sicher mittels Microsoft-spezifischen APIs den Internet-Explorer überwachen (dass dieser beim Laden einer Seite eine Botschaft rausschickt, genau wie nach dem Empfang eines Quelltextes). Koppelt man ein solches Überwachungsprogramm an ein eigenes Java-Programm, dann braucht sich Dein Java-Programm erst einmal nur um die Darstellung des Quellcodes kümmern, Deine angesprochenen Probleme überläßt Du anderen Werkzeugen.

    *wink* Marc

    Comment


    • #3
      Danke für die Tipps,
      werde ich doch glatt mal ausprobieren.
      Falls noch wer Tipps hat immer her damit, bin offen für alles

      Comment

      Working...
      X