Hallo zusammen
Als Vorstufe zur weiteren Verarbeitung per xslt/Sax/batch, muss/möchte ich ein Textdokument in Teile zerlegen.
Bsp. Mustervorgabe ein Kompendium mit Büchern | Kompendium mit Gedichten.
BUCHTITEL
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
KAPITEL
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
KAPITEL
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
etc.
oder
KOMPENDIUM
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
GEDICHT
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
GEDICHT
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
GEDICHT
etc.
Wenn nun ein Buch bsp. 12 KAPITEL hat, bin ich bsp. nur am 5. Kapitel interessiert. (following::*[5])
Kapitel 1 - 4 und Kapitel 6 - 12, müssten dann im output ausgeschlossen sein.
Zeileninhalte (bsp. Kapitel 5) müssen für die weitere Verarbeitung erhalten bleiben.
Ansätze: Regex/xslt input *.txt, output_01 *.txt
- fn:tokenize($text,'(\r\n)'), ist mir bekannt.
Für Anregungen vorab vielen Dank.
Karl_Heg
Als Vorstufe zur weiteren Verarbeitung per xslt/Sax/batch, muss/möchte ich ein Textdokument in Teile zerlegen.
Bsp. Mustervorgabe ein Kompendium mit Büchern | Kompendium mit Gedichten.
BUCHTITEL
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
KAPITEL
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
KAPITEL
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
etc.
oder
KOMPENDIUM
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
GEDICHT
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
GEDICHT
Zeileninhalt
Zeileninhalt
Zeileninhalt
Zeilen- Anzahl je nach Ausgabe varierend
GEDICHT
etc.
Wenn nun ein Buch bsp. 12 KAPITEL hat, bin ich bsp. nur am 5. Kapitel interessiert. (following::*[5])
Kapitel 1 - 4 und Kapitel 6 - 12, müssten dann im output ausgeschlossen sein.
Zeileninhalte (bsp. Kapitel 5) müssen für die weitere Verarbeitung erhalten bleiben.
Ansätze: Regex/xslt input *.txt, output_01 *.txt
- fn:tokenize($text,'(\r\n)'), ist mir bekannt.
Für Anregungen vorab vielen Dank.
Karl_Heg
Comment