Возможно ли сохранение Html-страницы по аналогии сохранения в Web-brow

Тема в разделе ".NET", создана пользователем lesik_1971, 4 сен 2007.

  1. lesik_1971

    lesik_1971 Гость

    Уважаемые Дамы и Господа Специалисты,

    проблема, которую мне необходимо решить состоит в следующем. Мне необходимо выкусывать информацию из разных веб-страниц по разным адресам. Пробуя сохранить эти страницы на диск для дальнейшей обработки с помощью HTTPWebRequest приводят к тому, что страницы с расширением *.jsp не содержат той информации, которая отображается на экране. И мне пришла в голову мысль, а возможно ли с помощью компонента WebBroser сохранить эту страницу в формате *.txt по аналогии как это возможно в браузере при сохранении веб-страницы, если выбрать тип файла Текстовый файл (*.txt)? Дело в том, что сохраняя таким образом файл в нем находится вся необходимая для меня информация. Возможно в C# имеются какие-либо другие средства для получения такого же результата.
    Заранее спасибо за Вашу помощь.

    С уважением, Алексей
     
  2. Гость

    А что значит, "страницы с расширением *.jsp не содержат той информации, которая отображается на экране"? Может, ты не так передаёшь параметры страницы? Или часть часть страницы формируется жава скриптом и ты её без этого не узнаёшь?
     
  3. lesik_1971

    lesik_1971 Гость

    Возможно я не совсем правильно сформулировал. Вот конкретный пример:

    http://mlb.mlb.com/mlb/standings/index.jsp

    В браузере мы видим таблицы с результатами игр. Мне необходимо брать эти результаты и работать с ними дальше. Для сохранения данной страницы я запрашивал ее с помощью HTTPWebRequest, HTTPWebResponse. Проблема в том, что сохраняя таким образом страницу в файл данных, которые мы видим на экране браузера, нет в сохраненной странице.
    Исследовав все файлы данной страницы, которые я сохранил с помощью Internet Explorer-а, я обнаружил данные из таблицы результатов в разных файлах с расширениями *.js Если же в Internet Explorer-е сохранять страницу в "Тип файла -> Текстовые файлы", то данные результатов в этом случае есть в файле *.txt.
    Можно конечно работать и с файлами *.js, но проблема в том, что таких адресов, как я привел выше, довольно много. Поэтому хотелось бы унифицировать и упростить обработку результатов.

    Заранее спасибо за помощь
    С уважением, Алексей
     
  4. progstone

    progstone Гость

    ну впринципе ты можешь использовать WinInet и сохранять js как txt либо самому формировать и обрабатывать заголовки http-запросов,по заголовку выбирать что тебе нужно и использовать WinSock.Впрочем все это реализовано на апи и больше подходит к Visual C програмированию.

    только отделять текст от штмл тегов придется самому
     
  5. Гость

    Бери данные прямо из .js. Это же удобнее. Запрашивай страницу также HTTPWebRequest.
     
  6. lesik_1971

    lesik_1971 Гость

    Спасибо огромное всем за помощь. Придется работать с *.js файлами. Я бы не сказал, что это удобнее, почему я объяснил выше. Но ничего не попишешь, придется работать с *.js файлами. А как замечательно сохраняет Internet Explorer (или любой другой браузер) страницу в текстовый файл!

    Еще раз спасибо за помощь.

    С уважением, Алексей
     
Загрузка...

Поделиться этой страницей