• Курсы Академии Кодебай, стартующие в мае - июне, от команды The Codeby

    1. Цифровая криминалистика и реагирование на инциденты
    2. ОС Linux (DFIR) Старт: 16 мая
    3. Анализ фишинговых атак Старт: 16 мая Устройства для тестирования на проникновение Старт: 16 мая

    Скидки до 10%

    Полный список ближайших курсов ...

Парсим Html ! Tagsoup - с чем его едят ?

  • Автор темы Guest
  • Дата начала
Статус
Закрыто для дальнейших ответов.
G

Guest

Уважаемые товарищи программисты ! Ввиду того малоприятного факта, что я нахожусь на грани суицида по причине невозможности распарсить лотусными средствами HTML-документ, решил обратиться к несравненной Java, с которой, увы, не дружен..Буквально на днях до меня дошли слухи, будто бы принцесса Java таит в себе уникальный инструмент под названием TagSoup, обладающий способностью творить неземные чудеса - успешно парсить любой HTML, в том числе сломанный..И поскольку, как я уже говорил, никогда не был приближен ко двору Java-разработчиков, надежды на собственные мозги мало, поэтому всех сочувствующих доброжелателей прошу привести мне несколько примеров использования вышеупомянутого TagSoup. Заранее благодарен.
 
F

fedotxxl

Для: Программер
HTML можно парсить как XML... если, конечно, HTML правильный
А какая задача? Что нужно выявить из HTML? Можно ведь просто с ним работать как с текстом
 
G

Guest

Для: Программер
HTML можно парсить как XML... если, конечно, HTML правильный
А какая задача? Что нужно выявить из HTML? Можно ведь просто с ним работать как с текстом

Описание проблемы читай в моей теме "Ошибка Sax-парсера" ниже..Если можешь помочь - буду очень благодарен
 
Статус
Закрыто для дальнейших ответов.
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!