Возможно ли сохранение Html-страницы по аналогии сохранения в Web-brow

lesik_1971 · 04.09.2007

Уважаемые Дамы и Господа Специалисты,

проблема, которую мне необходимо решить состоит в следующем. Мне необходимо выкусывать информацию из разных веб-страниц по разным адресам. Пробуя сохранить эти страницы на диск для дальнейшей обработки с помощью HTTPWebRequest приводят к тому, что страницы с расширением *.jsp не содержат той информации, которая отображается на экране. И мне пришла в голову мысль, а возможно ли с помощью компонента WebBroser сохранить эту страницу в формате *.txt по аналогии как это возможно в браузере при сохранении веб-страницы, если выбрать тип файла Текстовый файл (*.txt)? Дело в том, что сохраняя таким образом файл в нем находится вся необходимая для меня информация. Возможно в C# имеются какие-либо другие средства для получения такого же результата.
Заранее спасибо за Вашу помощь.

С уважением, Алексей

Guest · 05.09.2007

А что значит, "страницы с расширением *.jsp не содержат той информации, которая отображается на экране"? Может, ты не так передаёшь параметры страницы? Или часть часть страницы формируется жава скриптом и ты её без этого не узнаёшь?

lesik_1971 · 05.09.2007

Возможно я не совсем правильно сформулировал. Вот конкретный пример:

Ссылка скрыта от гостей

В браузере мы видим таблицы с результатами игр. Мне необходимо брать эти результаты и работать с ними дальше. Для сохранения данной страницы я запрашивал ее с помощью HTTPWebRequest, HTTPWebResponse. Проблема в том, что сохраняя таким образом страницу в файл данных, которые мы видим на экране браузера, нет в сохраненной странице.
Исследовав все файлы данной страницы, которые я сохранил с помощью Internet Explorer-а, я обнаружил данные из таблицы результатов в разных файлах с расширениями *.js Если же в Internet Explorer-е сохранять страницу в "Тип файла -> Текстовые файлы", то данные результатов в этом случае есть в файле *.txt.
Можно конечно работать и с файлами *.js, но проблема в том, что таких адресов, как я привел выше, довольно много. Поэтому хотелось бы унифицировать и упростить обработку результатов.

Заранее спасибо за помощь
С уважением, Алексей

progstone · 05.09.2007

ну впринципе ты можешь использовать WinInet и сохранять js как txt либо самому формировать и обрабатывать заголовки http-запросов,по заголовку выбирать что тебе нужно и использовать WinSock.Впрочем все это реализовано на апи и больше подходит к Visual C програмированию.

только отделять текст от штмл тегов придется самому

Guest · 05.09.2007

Бери данные прямо из .js. Это же удобнее. Запрашивай страницу также HTTPWebRequest.

lesik_1971 · 06.09.2007

Спасибо огромное всем за помощь. Придется работать с *.js файлами. Я бы не сказал, что это удобнее, почему я объяснил выше. Но ничего не попишешь, придется работать с *.js файлами. А как замечательно сохраняет Internet Explorer (или любой другой браузер) страницу в текстовый файл!

Еще раз спасибо за помощь.

С уважением, Алексей

Все сервисы Codeby

Поиск

Поиск

Возможно ли сохранение Html-страницы по аналогии сохранения в Web-brow

lesik_1971

Guest

lesik_1971

progstone

Guest

lesik_1971