Парсим Html ! Tagsoup - с чем его едят ?

  • Автор темы Guest
  • Дата начала
Статус
Закрыто для дальнейших ответов.
G

Guest

#1
Уважаемые товарищи программисты ! Ввиду того малоприятного факта, что я нахожусь на грани суицида по причине невозможности распарсить лотусными средствами HTML-документ, решил обратиться к несравненной Java, с которой, увы, не дружен..Буквально на днях до меня дошли слухи, будто бы принцесса Java таит в себе уникальный инструмент под названием TagSoup, обладающий способностью творить неземные чудеса - успешно парсить любой HTML, в том числе сломанный..И поскольку, как я уже говорил, никогда не был приближен ко двору Java-разработчиков, надежды на собственные мозги мало, поэтому всех сочувствующих доброжелателей прошу привести мне несколько примеров использования вышеупомянутого TagSoup. Заранее благодарен.
 

fedotxxl

Well-known member
09.11.2005
614
0
#2
Для: Программер
HTML можно парсить как XML... если, конечно, HTML правильный
А какая задача? Что нужно выявить из HTML? Можно ведь просто с ним работать как с текстом
 
G

Guest

#3
Для: Программер
HTML можно парсить как XML... если, конечно, HTML правильный
А какая задача? Что нужно выявить из HTML? Можно ведь просто с ним работать как с текстом
Описание проблемы читай в моей теме "Ошибка Sax-парсера" ниже..Если можешь помочь - буду очень благодарен
 
Статус
Закрыто для дальнейших ответов.