Самый быстрый парсер

Алёна · 20.10.2020

Доброго времени суток, подскажите самую быструю библиотеку на python для парсинга
Нужно парсить сайт и скачивать фотографии

pp11 · 20.10.2020

Не думаю, что где-то есть "бенчмарк" для библиотек. Но как вариант можете использовать bs4. Примеров использования в интернете множество.

Andrei_ · 20.10.2020

Pazsh сказал(а):
Не думаю, что где-то есть "бенчмарк" для библиотек. Но как вариант можете использовать bs4. Примеров использования в интернете множество.

Нет, уклон был на быстрый
Важна скорость!
Поэтому следует выбирать между urllib, httplib и scrapy (или может какие-то ещё библиотеки есть)
Но я не знаю, что из этого выбрать

explorer · 20.10.2020

Самый быстрый, мощный, гибкий это scrapy. Но и он же более сложный в освоении. Если брать BS4, то самый быстрый парсер к нему будет lxml.
Итого:
1. Scrapy
2. Beautiful Soup + lxml

Остальное на мой взгляд менее предпочтительно.

Andrei_ · 20.10.2020

explorer сказал(а):
Самый быстрый, мощный, гибкий это scrapy. Но и он же более сложный в освоении. Если брать BS4, то самый быстрый парсер к нему будет lxml.
Итого:
1. Scrapy
2. Beautiful Soup + lxml

Остальное на мой взгляд менее предпочтительно.

Нужно парсить десятки тысяч фото, я так понимаю, выбор в пользу scrapy несколько часов точно сэкономит?

explorer · 20.10.2020

Andrei_ сказал(а):
Нужно парсить десятки тысяч фото, я так понимаю, выбор в пользу scrapy несколько часов точно сэкономит?

Время невозможно сказать сколько сэкономит. Примерную разницу можно сосчитать исключительно тестированием, причём КОНКРЕТНОГО ресурса, ибо у серверов разный ап-тайм. То есть грубо говоря взять 2 парсера, на обоих спарсить (с таймером в коде) фиксированное количество, например 200 фото. Далее простой пропорцией пересчитать на проценты результат, тогда и будет значение приближённое к реальности.

Поиск

Поиск

Самый быстрый парсер

Алёна

Newbie

pp11

Andrei_

explorer

Newbie

Andrei_

explorer

Newbie

Похожие темы

Популярный контент

HackerLab

Экосистема Codeby

HackerLab

Forum Codeby

Codeby Academy