Announcement

**Martin Honnen** · 14.02.2011, 17:36

Word 2003 kann doch schon Dokumente im XML-Format WordML speichern, deshalb frage ich mich, ob die geschilderten Anstrengungen mit "Textmanipulationen" notwendig sind, um XML also brauchbares Eingabeformat f�r System.Xml.XmlDocument und/oder XSLT zu bekommen.

**georgie** · 14.02.2011, 18:02

Ja, Word kann das. Was herauskommt, sieht aber strukturell ziemlich grauslich aus. Das kann ich hier nicht als Code posten, das ist zu gro�. Ich schau mal, dass ich kleines Dokument als Beispiel herstellen kann.

Davon abgesehen ist es f�r mich sehr viel einfacher, im Word Dokument via VB und dem Word Object Model zu navigieren und Ranges auszuw�hlen, als in XML. Dann w�rden sich nat�rlich nur Fragmente in XML ergeben. Und genau diese brauche ich; nat�rlich lie�en sich diese auch aus XML heraus gewinnen.

Ich hab halt mit Word & VBA (ist nicht viel anders in VB.NET) weit mehr als 15 Jahre Erfahrung, mit XML jedoch vergleichsweise eher nur rudiment�re. Mit XSL und XPATH stehe ich immer irgendwie auf Kriegsfu� :-), hab's aber schon mal in einer anderen Automatisierungsaufgabe erfolgreich angewendet (damals VB6), ebenfalls mit Unterst�tzung aus einem englisch-sprachigen Forum.

**georgie** · 15.02.2011, 12:37

Word 2003 "HTML" => xml => xslt => xhtml

Hier habe ich nun ein von Word beim Speichern erzeugtes XML (angef�gt). Es l�sst sich in Word �ffnen. Allerdings ist die XML Fatei zu gro�, um sie hier anzuf�ghen, daher nur einen Ausschnitt als Screenshot:

Da sieht man, welche Strukturen und Formatierungen aus Sicht eines Word-Anwenders welche Spuiren im XML hinterlassen. Zwei Details hier als Screenshots:

Bisher habe ich wenig Aufwand in die Analyse der Strukturen investiert. Eigentlich will ich das auch gar nicht, wenn sich das alles schon so "unappetitlich"

darstellt.

Ich m�chte also weiterhin den zuvor aufgezeigten Weg gehen. Die Text-"Umeditiererei" ist mit .Replace rfelativ einfach; man muss "nur" die "Kandidaten" herausfinden ... zu einem Gutteil schon geschehen und codiert.

Im wesentlichen fehlen nur mehr die Lists.

Anm.: leider habe ich keinen anderen Weg gefunden, inline Grafiken hochzuladen ohne dass sie gleichzeitig auch Attachments sind. Externer �ber http: erreichbarer Speicher f�r die XML-Datei steht mir im Moment auch nicht zur Verf�gung.

Attached Files

**georgie** · 15.02.2011, 13:51

Ich will noch einen Schritt versuchen: n�mlich Word zu veranlassen, die Lists in HTML zu erzeugen wie sie sein sollten. Vom Ergebnis berichte ich dann hier. Vielleicht kann ich mir dann XSLT auch sparen ? :-)

**georgie** · 15.02.2011, 18:43

Schritt f�hrt nicht zum Erfolg.

Weiter geht's in XSLT.

Announcement

Word 2003 "HTML" => xml => xslt => xhtml

Word 2003 "HTML" => xml => xslt => xhtml

Comment

Comment

Comment

Comment

Comment