• Курсы Академии Кодебай, стартующие в мае - июне, от команды The Codeby

    1. Цифровая криминалистика и реагирование на инциденты
    2. ОС Linux (DFIR) Старт: 16 мая
    3. Анализ фишинговых атак Старт: 16 мая Устройства для тестирования на проникновение Старт: 16 мая

    Скидки до 10%

    Полный список ближайших курсов ...

Как Парсить Html-код С Чужого Сайта ?!

  • Автор темы Kaufmann
  • Дата начала
K

Kaufmann

Привет! Ребят, возникло затруднение... Есть чужой сайт, страница на котором содержит:

1. Навигацию по названиям товаров в алфавитном виде (A B C D E F G H I J K L M N O P Q R S T U V W X Y Z Other)

2. Таблицу значений, подгружаемую ajax'ом, которая содержит поля с названиями и ценами товаров.

3. Постраничную навигацию по товарам, название которых начинается с выбранной буквы. (Например, выбираем букву "A", подгружается страница с таблицей товаров название которых начинается с этой буквы (выводится по 20 элементов) и постраничной навигацией (1 2 3 4 5 6 7 8 9 10 11-12)).

Так вот, пытаюсь написать скрипт который должен выполнять алгоритм:

1. Собрать все ссылки на страницы из навигации по товарам из пункта 1 и 3

2. Перейти по каждой из собранных ссылок и забрать соответствующую таблицу с названиями и ценами.

Это в теории... Но, как это реализовать на практике?!
 
M

-master-

вероятно заплатил кому-то и сделали..
 

EmptyR

Веб мастер
06.10.2010
153
0
BIT
0
А для остальных, зарисовка простая - парсинг через получение посредством PHP. PHP через fopen открываем страницу другого сайта, точнее, получаем HTML код страницы, и далее посредством регулярных выражений парсим нужные куски.
 
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!