Announcement

Collapse
No announcement yet.

Word XML

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Word XML

    Sehr geehrtes Forum,

    ich habe ein Problem. ich habe herausgefunden, dass wenn man Word als docx speichert und man das docx in zip tauscht es eine Ordnerstruktur gbt. Dort gibt es in dem unterordner Word ien Dokument.xml. In ideser steht mein kompletter Inhalt. Jedoch stehen viele Tags dazu was es etwas unübersichtlich macht. Meine Frage, gibt es eine XSL(T) die aus einer solchen XML eine HTML bzw eine übersichtlichere XML ohne die sinnlosen Tags herausgibt.
    Vielen Dank für eure HIlfe

  • #2
    Suche nach DocX2Html.

    Comment


    • #3
      Wiso Unsinnig? Nicht umsonst wird MS mehrere 10.000 Seiten Beschreibung gebraucht haben um dieses Schrott-Format Office OpenXML zu definieren. Ist zwar jetzt ISO, aber niemals wurde ein Format mit solcher fragwürtigen Abstimmung "abgesegnet"

      Sorry. Aber bei MS-OfficeXML musste das mal OT sein.

      Comment


      • #4
        also docx2html funktionert. Wie bekomme ich aber aus der XML eine saubere XML mit geordneten Tags und nicht jeden Absatz mit w. sondern so wie ich sie nennen möchte? mit XSL, oder? geht das nur in einem XML-Editor?

        Comment


        • #5
          Eine Transformation der w-Elementinhalte in z. B. p-Elementinhalte kann mittels XSLT bewerkstelligt werden, in einfachster Form z. B. so (setzt die Deklaration des w-Namensraumes im Stylesheet voraus):
          Code:
          ...
          <p><xsl:value-of select="w:p"/></p>
          ...

          Comment


          • #6
            da darf aber oben nix mit outputmethop html stehen? oder?
            Die verschachtelung von dem Word mit w:t, W, w:r ist ja nihct gerade einfach. was wie angesprochen werden muss. gibt es da schon eine datei docx2xml?

            Comment


            • #7
              Wenn HTML erzeugt werden soll, dann ist method="html" sinnvoll, bei XML bzw. auch XHTML ist method="xml" nötig, wobei XSLT 2.0 auch method="xhtml" kennt. Was soll docx2xml sein? Das Ziel-XML muss man sich entsprechend passend machen (XHTML, DocBook, DITA, ...).

              Comment


              • #8
                So viel Ahnung habe ich da leider nict, will sie aber haben!! Also mein Word Dokument soll als XML exportiert werden. Die XML Datei soll in eine InDesign eingeladen werden. Das sollte möglichst automatisch passieren, also das zuweisen der Tags. Das zuweisen kann man ja mit Fülltext oder mit anweisung in der XML machen. Das Problem, die XML aus Word muss erstmal für XML vorbereitet werden. also die Tags (w....) müssen für XML angepasst werden. Ich kenne eben bis jetzt nur das mit method "html". Mit XML habe ich da noch nichts gemacht, deswegen stelle ich mich da etwas hilflos an. Wie würde denn ein umwandlungsbefehl im HTMl aussehen, oder hast du mal eine Besipieldatei wo eine XML in eine andere XML gewandelt wird?
                Vielen Dank für deine Hilfe

                Comment


                • #9
                  Für die Grundlagen bietet sich der XML-Darstellungsteil von SELFHTML an. Beispiele für Transformationen sind im XSLT-Forum zu finden.

                  Comment

                  Working...
                  X