Hallo zusammen,
ich benötige mal die Hilfe von einem RegEx-Experten Sämtliches Suchen in diversen Büchern und im Internet haben mich nicht wirklich weitergebracht(eigentlich garnicht).
Ich muss den Teil einer längeren Webseite auslesen. Ich benötige den Teil zwischen
<div class="formgrouphead"> (kommt im ganzen Dokument 3x vor, ich benötige das erste, die nächsten beiden Vorkommen müssen ignoriert werden)
und
<div class='suffix'> (kommt nur einmal vor)
Dazwischen sind ungefähr 100 Zeilen die ich benötige, um sie hinterher noch von HTML-Tags zu befreien und weiter zu verarbeiten.
Damit hab ich es versucht, laut diversen RegEx-Tools funktionieren die einzelnen Ausdrücke jeder für sich genommen auch, im Zusammenhang aber eben nicht - was sicherlich an den Hochkommas liegt, ich weiß es aber nicht(irgendwo muss bestimmt auch noch multiline o.ä. mit angegeben werden, ich bin damit aber etwas überfordert momentan ):
[highlight=vbnet]
Dim pattern As String = "(<div class="formgrouphead">)(?<para>.*)(<div class='suffix'>)"
txtStatus.Text = Regex.Match(txtOutput.Text, pattern).Groups("para").ToString
[/highlight]
Kann mir jemand sagen, wie die RegEx genau aussehen muss, um den Block aus der Seite herauszubekommen?
ich benötige mal die Hilfe von einem RegEx-Experten Sämtliches Suchen in diversen Büchern und im Internet haben mich nicht wirklich weitergebracht(eigentlich garnicht).
Ich muss den Teil einer längeren Webseite auslesen. Ich benötige den Teil zwischen
<div class="formgrouphead"> (kommt im ganzen Dokument 3x vor, ich benötige das erste, die nächsten beiden Vorkommen müssen ignoriert werden)
und
<div class='suffix'> (kommt nur einmal vor)
Dazwischen sind ungefähr 100 Zeilen die ich benötige, um sie hinterher noch von HTML-Tags zu befreien und weiter zu verarbeiten.
Damit hab ich es versucht, laut diversen RegEx-Tools funktionieren die einzelnen Ausdrücke jeder für sich genommen auch, im Zusammenhang aber eben nicht - was sicherlich an den Hochkommas liegt, ich weiß es aber nicht(irgendwo muss bestimmt auch noch multiline o.ä. mit angegeben werden, ich bin damit aber etwas überfordert momentan ):
[highlight=vbnet]
Dim pattern As String = "(<div class="formgrouphead">)(?<para>.*)(<div class='suffix'>)"
txtStatus.Text = Regex.Match(txtOutput.Text, pattern).Groups("para").ToString
[/highlight]
Kann mir jemand sagen, wie die RegEx genau aussehen muss, um den Block aus der Seite herauszubekommen?
Comment