Paranoid - курс от Сodeby

Открыт предзаказ на курс от codeby "Комплекс мер по защите персональных данных, анонимности в интернете и не только" Подробнее ...


WebBrowser работа с контентом

И так, html страница была полностью загружена в control webBrowser, и теперь можно переходить к обработке полученных данных. Для этого можно использовать три основных свойства: DocumentStream, DocumentText и Document. Если Вы не знаете, как определить, момент полной загрузки страницы, то можете прочитать об этом в статье:

Основные свойства для работы с контентом

Пройденные этапы:

webbrowser control

DocumentText

Данное свойство позволяет получить исходный код страницы в виде строки.

В качестве примера рассмотрим, как получить адрес ссылки.

Сначала добавим на форму один listBox, в который будут выводиться результаты работы, то есть все полученные адреса. Парсинг будет осуществляться при помощи регулярных выражений, для этого добавим строку:

Весь код поместите в обработчике события DocumentCompleted

Результат:

получить все адреса ссылок

Создание веб страницы

С помощью DocumentText так же можно создавать и свои собственные страницы, например:

Код поместите в обработчик события button.Click

Нажать кнопку отправить.

Результат:

создание веб страницы при помощи свойства DocumentText

Чтобы убедиться, в том, что была создана именно та html разметка, которая была задана, нажимаем правую кнопку мыши в окне элемента управления webBrowser и выбираем пункт: исходный код страницы, в браузере IE пункт называется: просмотр HTML-кода, как видно разметка совпадает. При этом стоит помнить, что физически данной страницы не существует, то есть файла, как например index.html, на диске нет.

DocumentStream

В отличие от свойства DocumentText, которое построчно считывает данные и возвращает их в виде одной строки, DocumentStream, работает с потоками.

Для примера, рассмотрим, как получить исходный код страницы и сохранить его в обычный текстовый файл.

Добавьте строку

Код поместите в обработчик события DocumentComplete.

Результат:

сохранить в файл

Вывод исходного кода страницы в listBox

Если требуется, к примеру, не сохранять исходный код страницы, а просто вывести его, например в тот же listBox, то можно сделать так.

Результат:

Вывод исходного кода страницы в listBox

О свойстве Document в следующей статье.

Читайте также:


Codeby Security School от Сodeby

Это свершилось! Мы запустили свою онлайн школу по информационной безопасности 🙂 Наш первый курс о комплексе мер по защите персональных данных, анонимности в интернете и не только ... Paranoid


Похожие темы

Моделирование сети Петри на С++... Постановка задачи: Разработать программу, моделирующую работу сетей Петри, с возможностью автоматического моделирования и проверки в ручном реж...
Пространства имен в С++ Известен модульный подход к программированию, согласно которому программу нужно рассматривать как совокупность модулей, каждый из которых предст...
Как нажать на кнопку в webBrowser?... Как нажать на кнопку в окне webBrowser? Очень часто в комментариях спрашивают: как нажать на кнопку в окне webBrowser? Так как этот вопрос очень част...
Работа с элементом управления TreeView в языке c#... c# работа с элементом управления TreeView Для начала создадим Windows Forms приложение. После чего добавим на форму элемент управления TreeView, кото...
c# Как выделить диапазон ячеек в DataGridView?... Выделение диапазона ячеек в DataGridView В этой небольшой статье хочу показать на простом примере, как можно программно выделить диапазон ячеек в эле...