Child pages
  • Szöveg kinyerése HTML dokumentumból
Skip to end of metadata
Go to start of metadata
Szervusztok!

A szöveget szeretném kinyerni egy HTML dokumentumból. A Java2 SE ben találtam HTML parsert javax.swing.text.html csomagban. Használta már ezt valaki?

--
sirkalmi
      
      
Page viewed times
#trackbackRdf ($trackbackUtils.getContentIdentifier($page) $page.title $trackbackUtils.getPingUrl($page))
  • No labels

2 Comments

  1. Unknown User (gericop)

    Én akartam használni, de ahogy elnézem, eléggé gyerekcipőben jár még... Eddig ilyen hibákat vettem észre:
    - magától nem kezeli az UTF-es kódolású oldalakat, vhogy neked kell megoldani
    - sok HTML tag attributumra hibát dob (NullPointerException) akkor is, ha az 100%-osan létezik és nem üres
    Én is akartam használni, de eddig csak a linkeket sikerült "kinyernem", mást nem.
  2. Nekem olyan célra kellett volna hogy a szöveges tartalmon szóról szóra végig tudjak menni és valamilyen feltétel függvényében változtatásokat eszközöljek rajta. De idő hiányában túl bonyolultnak találtam ezért egyszerűsítettem a feladatot így most egyelőre nem kell. :-)

    --
    sirkami