Announcement

Collapse
No announcement yet.

Verwendete Buchstaben in Elementen?

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Verwendete Buchstaben in Elementen?

    hallo,
    ich weiß nicht ob sich dieses Problem überhaupt mit XSL lösen lässt, aber vielleicht hat jemand ne Idee...
    Ich habe ein Xml-Dokument, da stehen viele Texte drin.
    Nun will ich eine Datei ausgeben, die alle Buchstaben enthält, die in den Texten vorkommen, sozusagen ein "Zeichensatz".
    Ich habe nicht die geringste Idee ob und wenn ja wie das möglich ist.
    Ich suche hier keine fertige Lösung, sondern will nur wissen ob es mit XSL-eigenen Mitteln überhaupt geht und falls ja ein Stichwort/grobe Vorgehensweise. Ich denke den XSL Syntax krieg ich dann schon selbst hin.
    Damit ich nicht ganz mittellos komme, ich hätte schon eine vage Idee, die mir aber total kompliziert vorkommt: Ich gehe einfach alle Text-Elemente durch, laufe davon alle Buchstaben durch (müsste ja mit einer Schleife und substring gehen), und gucke ob es in previous-Text-Elementen oder dem anfänglichen Substring des aktuellen Text-Elements diesen Buchstaben schonmal gibt, falls nicht gebe ich ihn aus. Ausprobiert ob das geht habe ich allerdings nicht.
    Hmm hoffe da gibt es schönere Lösungen?

    gruß & thx
    sth_Weird
    Fluchen ist die einzige Sprache, die jeder Programmierer perfekt beherrscht

  • #2
    Mit XSLT 2.0 etwa so:
    Code:
    <xsl:stylesheet
        xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
        version="2.0">
        
        <xsl:output method="text"/>
        
        <xsl:template match="/*">
          <xsl:value-of select="for $c in distinct-values(string-to-codepoints(.)) return codepoints-to-string($c)"
                        separator="
    "/>
        </xsl:template>
      
    </xsl:stylesheet>
    Eventuell willst du die Zeichen noch sortieren und eventuell auch Textknoten nicht berücksichtigen, die nur "white space" enthalten.

    Comment


    • #3
      hui das ging ja schnell!
      kann es im Moment nicht gleich ausprobieren, aber ist ja super-kompakt :-)
      string-to-codepoints kannte ich bisher nicht (obwohl ich mittlerweile einiges zu xsl2 gelesen habe).
      gruß & vielen dank
      sth_Weird
      Fluchen ist die einzige Sprache, die jeder Programmierer perfekt beherrscht

      Comment

      Working...
      X