Announcement

Collapse
No announcement yet.

HTML-Dateien auswerten und Links weiterverfolgen (alles im Hintergrund)!!!!!!!!!!

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • HTML-Dateien auswerten und Links weiterverfolgen (alles im Hintergrund)!!!!!!!!!!

    Hallo,

    Mein Problem sieht folgendermaßen aus:

    Über die HTTP-API-Funktionen kann man HTML-Ressourcen (Html-,Bild-,Sounddatien) über eine Request anfordern und herunterladen.

    Jetzt habe ich aber vor ein gesamtes Web herunterzuladen beginnend bei der Homepage (zb. http://www.microsoft.com). Alle weiteren Seiten dieses Webs werden über die Links der Homepage und aus daraus resultierenden Seiten genommen. usw...

    Übergebe ich der HttpSendReqeust-Funktion nun zb. www.microsoft.com, dann wird über Redirect die Default.htm zurückgegeben.
    Das ist soweit auch in Ordnung. Aber in dieser Default.htm ist der Body leer und im Header steht: <META equiv-typ="REFRESH" content="0,index.htm"> was einer weiterleitung auf die index.htm entsprechen würde.

    Aber die HttpSendRequest-Funktion verfolgt diese Redirection nicht.
    Im IExplorer funktioniert es aber hervoragend.

    Also meine Frage:

    <b>Wie kann man mit den Interfaces des Explorers im Hintergrund (nicht sichtbar) diese URLs öffnen und dann die Links auf andere Seiten auch weiterverfolgen?</b>

    Wenn ich aDoc.open('www.microsoft.com','','','') (aDoc ist ein IHTMLDocument2-Interface) aufrufe, wird die Homepage von Microsoft geöffnet, aber in einer neuen Explorer-Instanz. Die Seite sollte aber nicht sichtbar geladen werden.

    Danke im Vorraus für die Hilfe...
Working...
X