Как получить исходный код страницы с помощью класса WebBrowser?
В этой статье рассмотрим на простом примере, как получить исходный код страницы помощью класса WebBrowser.
Для начала создадим новый проект типа Windows Forms Application.
Затем добавим на форму кнопку и control WebBrowser (wb). Если выводить содержимое страницы не требуется, то тогда вместо элемента управления используйте класс WebBrowser.
C помощью метода Navigate загружаем страницу в веб-браузер.
private void button1_Click(object sender, EventArgs e)
{
wb.Navigate(@"указываем url адрес сайта или страницы");
} Подписываемся на событие DocumentCompleted, чтобы дождаться полной загрузки страницы.
private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
} Используем свойство DocumentText, чтобы получить исходный код всей страницы.
private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
string htmlCode = wb.DocumentText;
} Если же вам нужно получить исходный код не всей страницы, а только той части, что содержится между тегами BODY, то тогда вы можете поступить следующим образом:
private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
string htmlCodeBody = wb.Document.Body.InnerHtml;
} Если вам нужно получить исходный код страницы, который содержится между тегами HEAD, то тогда используйте следующий способ:
private void wb_DocumentCompleted(object sender,
WebBrowserDocumentCompletedEventArgs e)
{
HtmlElementCollection elmsHead;
elmsHead = wb.Document.GetElementsByTagName("head")
string htmlCodeHead = elmsHead[0].OuterHtml;
} Читайте также: