Как получить исходный код страницы с помощью класса WebBrowser?
В этой статье рассмотрим на простом примере, как получить исходный код страницы помощью класса WebBrowser.
Для начала создадим новый проект типа Windows Forms Application.
Затем добавим на форму кнопку и control WebBrowser (wb). Если выводить содержимое страницы не требуется, то тогда вместо элемента управления используйте класс WebBrowser.
C помощью метода Navigate загружаем страницу в веб-браузер.
private void button1_Click(object sender, EventArgs e) { wb.Navigate(@"указываем url адрес сайта или страницы"); }
Подписываемся на событие DocumentCompleted, чтобы дождаться полной загрузки страницы.
private void wb_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e) { }
Используем свойство DocumentText, чтобы получить исходный код всей страницы.
private void wb_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e) { string htmlCode = wb.DocumentText; }
Если же вам нужно получить исходный код не всей страницы, а только той части, что содержится между тегами BODY, то тогда вы можете поступить следующим образом:
private void wb_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e) { string htmlCodeBody = wb.Document.Body.InnerHtml; }
Если вам нужно получить исходный код страницы, который содержится между тегами HEAD, то тогда используйте следующий способ:
private void wb_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e) { HtmlElementCollection elmsHead; elmsHead = wb.Document.GetElementsByTagName("head") string htmlCodeHead = elmsHead[0].OuterHtml; }
Читайте также: