Announcement

Collapse
No announcement yet.

HTML-Tags aus String entfernen

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • HTML-Tags aus String entfernen

    hallo,

    ich habe ein einfaches thema, glaub ich :-)
    ich haben einen string der alle möglichen html tags beinhaltet. ich möchte gerne alle tags entfernen.

    ich hab folgendes versucht, was keine wirkung hatte

    string.replaceAll("|</br>||<font[^<]*>|</font>|<font />|||<b />|<a[^<]*>|</a>|<hr[^<]*>", "");

    ich verstehe den ausdruck nicht. muss ich für jedes tag einen eintrag anlegen? und wenn ja wie?

    danke und grüße

  • #2
    http://www.fileformat.info/tool/regex.htm

    Würde einen Ausdruck versuchen, der alles was zwischen <> steht entfernt
    Christian

    Comment


    • #3
      Auf die Schnelle versuch es mit

      <[^>]*>
      Christian

      Comment


      • #4
        ich würde das mit einem HTML-Parser nehmen. Dieser analysiert den text und du kannst dann über den DOM relativ einfach den "Nutztext" heraus finden. Für Java finden sich Parser wie Sand am Meer.

        Comment


        • #5
          Regular Expression

          Hallo neo_1,
          string.replaceAll("|</br>||<font[^<]*>|</font>|<font />|||<b />|<a[^<]*>|</a>|<hr[^<]*>", "");

          ich verstehe den ausdruck nicht. muss ich für jedes tag einen eintrag anlegen? und wenn ja wie?
          Der Ausdruck ist eine Regular Expression. Infos dazu gibts hier: http://java.sun.com/javase/6/docs/ap...ttern.html#sum und hier: http://www.regular-expressions.info/

          Und hier gibts eine Regular Expression, die html tags matcht. Das ist glaube ich, was Du suchst:http://www.regular-expressions.info/examples.html

          Gruß ngomo
          http://www.winfonet.eu

          Comment


          • #6
            Originally posted by ngomo View Post
            Und hier gibts eine Regular Expression, die html tags matcht. Das ist glaube ich, was Du suchst:http://www.regular-expressions.info/examples.html

            Gruß ngomo
            Wollte er nicht das Gegenteil -> eben keine Tags??
            Christian

            Comment


            • #7
              hallo an alle,

              super, danke das geholfen :-)

              <[^>]*>

              grüße

              Comment


              • #8
                Originally posted by Christian Marquardt View Post
                Wollte er nicht das Gegenteil -> eben keine Tags??
                Ja genau, und deswegen braucht er in replaceAll eine Regex die tags matcht...
                http://www.winfonet.eu

                Comment

                Working...
                X