Прочитать информацию со страницы сайта

  • Автор темы Sporco
  • Дата начала
S

Sporco

#1
Всем привет.

Пишу в этом разделе, т. к. не совсем уверен в каком эту тему нужно было бы поместить. Заранее извиняюсь, если подобная тема была, пытался найти в поиске, но не получается...

Мне нужно написать программу, которая просматривает страницу сайта и, считывая со страницы информацию, сохраняет ее в файл. Я являюсь большим любителем спортивной статистики, но делать это вручную невозможно, полную статистику одного чемпионата вести достаточно трудно, не говоря уже о десятках...

Хотелось бы попросить дать мне совет о том, что нужно изучить, какие разделы программирования, на каком языке лучше всего реализовать.

Есть мысль: допустим каким-то образом программа получает код страницы (этот аспект я не знаю как реализовать), а далее по заранее известным меткам (которые будут созданы мной после анализа исходного года) находит результат(ы) и сохраняет его(их) в файл.

Изучал я основы Delphi и C++, но именно только основы. Достаточно ли этих языков для реализации (не питаю иллюзий, что не придется прочитать уйму информации и про эти языки, но достаточно ли знание только их)? Или придется осваивать еще что-нибудь? В общем, просьба отправить в нужном направлении, ибо мои запросы в гугле, ввиду малых знаний завершились неудачей.
 

vital

Больной Компом Детектед
29.01.2006
2 432
33
#2
То что вам надо - называется парсер. Обычно их пишут на PHP как самом просто и удобном для этого(в codebase на форуме в разделе php есть пример). Но ничего не мешает написать и на дельфях. или плюсах.
в тех же дельфях..Как самый простой пример.. TWebBrowser, отправляете его на нужную страницу, получаете из него хтмл содержимое страницы, дальше регулярными выражениями выдираете, что вам там надо. Для поддержки регулярок в дельфях, я видел компоненты когда-то.
 
S

Sporco

#3
Спасибо огромное за информацию! Слово "парсер" не знал, теперь с информацией проблем нет. :)
Будем изучать. :)