Возможно ли сохранение Html-страницы по аналогии сохранения в Web-brow

  • Автор темы lesik_1971
  • Дата начала
L

lesik_1971

Гость
#1
Уважаемые Дамы и Господа Специалисты,

проблема, которую мне необходимо решить состоит в следующем. Мне необходимо выкусывать информацию из разных веб-страниц по разным адресам. Пробуя сохранить эти страницы на диск для дальнейшей обработки с помощью HTTPWebRequest приводят к тому, что страницы с расширением *.jsp не содержат той информации, которая отображается на экране. И мне пришла в голову мысль, а возможно ли с помощью компонента WebBroser сохранить эту страницу в формате *.txt по аналогии как это возможно в браузере при сохранении веб-страницы, если выбрать тип файла Текстовый файл (*.txt)? Дело в том, что сохраняя таким образом файл в нем находится вся необходимая для меня информация. Возможно в C# имеются какие-либо другие средства для получения такого же результата.
Заранее спасибо за Вашу помощь.

С уважением, Алексей
 

Гость
#2
А что значит, "страницы с расширением *.jsp не содержат той информации, которая отображается на экране"? Может, ты не так передаёшь параметры страницы? Или часть часть страницы формируется жава скриптом и ты её без этого не узнаёшь?
 
L

lesik_1971

Гость
#3
Возможно я не совсем правильно сформулировал. Вот конкретный пример:

http://mlb.mlb.com/mlb/standings/index.jsp

В браузере мы видим таблицы с результатами игр. Мне необходимо брать эти результаты и работать с ними дальше. Для сохранения данной страницы я запрашивал ее с помощью HTTPWebRequest, HTTPWebResponse. Проблема в том, что сохраняя таким образом страницу в файл данных, которые мы видим на экране браузера, нет в сохраненной странице.
Исследовав все файлы данной страницы, которые я сохранил с помощью Internet Explorer-а, я обнаружил данные из таблицы результатов в разных файлах с расширениями *.js Если же в Internet Explorer-е сохранять страницу в "Тип файла -> Текстовые файлы", то данные результатов в этом случае есть в файле *.txt.
Можно конечно работать и с файлами *.js, но проблема в том, что таких адресов, как я привел выше, довольно много. Поэтому хотелось бы унифицировать и упростить обработку результатов.

Заранее спасибо за помощь
С уважением, Алексей
 
P

progstone

Гость
#4
ну впринципе ты можешь использовать WinInet и сохранять js как txt либо самому формировать и обрабатывать заголовки http-запросов,по заголовку выбирать что тебе нужно и использовать WinSock.Впрочем все это реализовано на апи и больше подходит к Visual C програмированию.

только отделять текст от штмл тегов придется самому
 

Гость
#5
Бери данные прямо из .js. Это же удобнее. Запрашивай страницу также HTTPWebRequest.
 
L

lesik_1971

Гость
#6
Спасибо огромное всем за помощь. Придется работать с *.js файлами. Я бы не сказал, что это удобнее, почему я объяснил выше. Но ничего не попишешь, придется работать с *.js файлами. А как замечательно сохраняет Internet Explorer (или любой другой браузер) страницу в текстовый файл!

Еще раз спасибо за помощь.

С уважением, Алексей