Announcement

Collapse
No announcement yet.

Auslesen von Informationen aus XHTML-File

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • Auslesen von Informationen aus XHTML-File

    Hallo zusammen,

    bis jetzt hab ich es nur geschafft, mein XHTML-File zu Parsen! Nun möchte ich geziehlt an einzelne Informationen aus diesem File gelangen und mit diesen weiter arbeiten.
    Mein Problem dabei ist, dass ich diese nicht auslesen kann. Mein großes Problem hierbei ist, dass in diesem File alles tief verschachtelt ist und ich nicht bis dahin komme wo meine Informationen stehen!

    Hier ist ein Auszug aus meinem XHTML-File
    Code:
    <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
    <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">
       <head>
          <title>XING - Mitglieder</title>
       </head>
       <body>
          <div id="container">
             <div id="content">
                <h1 style="font-size:12px; font-weight:bold; color:#333;">
                Suchergebnisse: röttenbach
                </h1>
                <div class="col_three_ad table-list-pagination" style="margin-top:8px;">
                   <div class="col_5050_ad indent-left" style="padding-top:7px;">
                      <p class="b">
                      Ergebnisse 41-50 von 125
                      </p>
                   </div>
                </div>
                <div class="col_three_ad">
                   <table class="table-list" cellpadding="0" cellspacing="0">
                      <thead/>
                      <tbody>
                         <tr>
                            <td class="center" style="vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               <a href="/profile/Tanja_Nitsche2/N1.9.5082c1">
                                  <img src="/img/users/3/3/e/1d2b61c02.10365828_s2,3.jpg" alt="" title="" class="user-photo-list"/>
                               </a>
                            </td>
                            <td style=" vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               <a id="N1.9.5082c1" name="user-name" class="user-name" href="/profile/Tanja_Nitsche2/N1.9.5082c1">Tanja Nitsche</a>
                               <a style="text-decoration: none;" href="/go/picon">
                               <img class="icon-premium" width="9" height="9" title="Premium-Mitglied" alt="" src="/img/xing/transparent_r1.gif" style="margin-left: 2px; float: none;"/>
                               </a>
                               <br/>
                               FBR Gbr
                            </td>
                            <td style="vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               Versicherungsfachfrau
                            </td>
                            <td style="vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               <span class="hl-field">Ort</span> : <span class="hl-value">Röttenbach</span>
                            </td>
                         </tr>
                         <tr>
                            <td class="center" style="vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               <a href="/profile/Robert_Steinhaeusser/N1.9.6d28d3">
                                  <img src="/img/users/2/a/5/a63cd28c5.5654016_s2.jpg" alt="" title="" class="user-photo-list"/>
                               </a>
                            </td>
                            <td style=" vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               <a id="N1.9.6d28d3" name="user-name" class="user-name" href="/profile/Robert_Steinhaeusser/N1.9.6d28d3">Robert Steinhäußer</a>
                               <br/>
                               sepp.med gmbh
                            </td>
                            <td style="vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               Softwareentwickler
                            </td>
                            <td style="vertical-align:top; padding-top:5px; padding-bottom:5px;">
                               <span class="hl-field">Ort</span> : <span class="hl-value">Röttenbach</span>
                            </td>
                         </tr>
                      </tbody>
                   </table>
                </div>
             </div>
          </div>
       </body>
    </html>
    Meine Aufgabe ist es jetzt den Personennamen, Position, Firmennamen und Ort auszulesen! Dieser Abschnitt wiederholt sich mehrmals aber wenn ich den Bereich einmal auslesen kann sollte es kein Problem mehr sein!

    Kann mir jemand Tipps geben wie ich hier vorgehen kann bzw sagen wo ich Beispiele finde an denen ich mich orientieren kann?

    Danke

  • #2
    Mittels eine Programmes?
    Christian

    Comment


    • #3
      Ja mittels eines Programmes hatte ich vor.
      Mittlerweile meine ich aber, das es über ein XSLT-File auch gehen könnte aber das weis ich auch noch nicht genau!

      hatte bisher begonnen das komplette File in ne String zulesen und es "well-formed" zu korrigieren, damit es geparst werden kann. Soweit funktioniert auch alles.
      Aber jetzt weis ich nicht wie ich das anstellen soll, das ich auf jedes der einzelnen Tabellenspalten (<tr> ... </tr>) zugreifen kann um die gewünschten Infos daraus zu bekommen.

      Comment


      • #4
        hatte bisher begonnen das komplette File in ne String zulesen und es "well-formed" zu korrigieren,
        Ja, kann ich mich erinnern.......

        Java -> dom4j

        http://www.dom4j.org/guide.html
        Christian

        Comment


        • #5
          habs mir kurz mal angeschaut und denke das es helfen kann! mal schauen wie weit ich damit komme!

          Danke erst einmal

          Comment

          Working...
          X