Announcement

Collapse
No announcement yet.

XML-Schema Codierungen

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • XML-Schema Codierungen

    Hallo Entwickler,

    benötige eine Bestätigung für meinen Auftraggeber, bin mir aber nicht ganz sicher.
    Daher meine Frage:

    Wenn im XML-Schema UTF-8 verwendet wird im Header,

    HTML Code:
    <?xml version="1.0" encoding="UTF-8"?>
    <xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified" attributeFormDefault="unqualified" version="2.5.0">
    Dann ist, dass daraus erzeugte XML-Dokument auch definitiv UTF-8.
    Oder kann es auch ISO-8859-1 sein?

    Weitere Frage, ist es möglich ein Schema für beide Codierung zu generieren?


    Herzlichen Dank vorab für eure Hilfe.
    Links helfen mir sicherlich auch definitiv weiter.

    Perron

  • #2
    Die Kodierung des XML-Dokuments wird üblicherweise beim Erstellen im Editor oder über eine sonstige Software festgelegt. Zudem bezieht sich die Schema-Kodierung auf die Namen der Elemente, Attribute und sonstigen Schema-Inhalte und nicht auf den eigentlichen Inhalt der späteren XML-Daten. Sollten die gewählten Namen in ISO-8859-1 nicht verfügbare Zeichen enthalten (etwa <nameϮ>Inhalt</nameϮ>), dann stehen diese Zeichen beim Speichern des XML-Dokuments mit ISO-Kodierung natürlich nicht zur Verfügung und der Editor fügt z. B. einen Unterstrich ein. Nun lässt sich das Dokument nicht mehr validieren.

    Insofern solltet Ihr Euch vorher über die Kodierung des Schemas einig werden und ggf. kritische nicht in ISO kodierbare Zeichen in Namen vermeiden. Sinnvoll ist heute eigentlich die durchgehende Verwendung von UTF-8, was nicht heißt, dass man kritische Zeichen in Namen verwenden sollte ...

    Comment


    • #3
      Erstmal Danke für die antwort Thomas.

      Wenn ich das nun richtig verstehe gibt es also keine Möglichkeit durch das Schema zusagen welche Codierung verwendet werden soll.

      Es handelt sich um ein Prüftool indem wirklich sensibel ermittelt werden soll, ob ein XML-Dokument wirklich im UTF-8 Format ist oder nicht.
      Dazu gehören auch die Tag-Inhalte.

      Daher dachte ich man könnte im Schema UTF-8 festlegen und dadurch vorraussetzen das dies auch geliefert wird.

      Comment


      • #4
        Dafür müsste AFAIK die Software selbst sorgen. Z. B. ist das XAML-Schema UTF-8-kodiert und Visual Studio schreibt XAML-Inhalte grundsätzlich UTF-8-kodiert.

        Probiere es einfach aus: Schreibe ein Schema mit Elementnamen, die "äöü" enthalten und speichere als UTF-8. Erzeuge ein XML-Dokument mit ISO-8859-1-Kodierung und Elementnamen mit "äöü" und speichere dieses. Validiere das XML-Dokument gegen das Schema, was problemlos funktionieren sollte. Mit dem in der ersten Antwort verwendeten griechischen Zeichen im Namen wird es scheitern, da es zwar in UTF-8, aber nicht in ISO-8859-1 kodierbar ist.

        Comment

        Working...
        X