Статья Немного об IPTV или проверка m3u с помощью Python. Часть 01

start120 · 28.01.2023

Никак не могу найти подсказку или скрипт извлекающий с сайта ссылку на потоке видео в формате m3u, для дальнейшего формирования плэйлиста. Может кто подскажет?

Johan Van · 28.01.2023

start120 сказал(а):
Никак не могу найти подсказку или скрипт извлекающий с сайта ссылку на потоке видео в формате m3u, для дальнейшего формирования плэйлиста. Может кто подскажет?

Не совсем понятно, что вы имеете в виду. Если можно, подробнее о том, что вы хотите получить и откуда. Можете даже сайт написать, чтобы было понятно, где посмотреть

start120 · 28.01.2023

Johan Van сказал(а):
Не совсем понятно, что вы имеете в виду. Если можно, подробнее о том, что вы хотите получить и откуда. Можете даже сайт написать, чтобы было понятно, где посмотреть

Хочу создать собственный плэйлист, который бы автоматически обновлялся с источников трансляций тв каналов. Известно, что почти все ресурсы транслирующие потоковое видео, часто меняют ссылку. Поэтому есть желание написать скрипт, который будет с периодичностью извлекать ссылку (и) с форматом m3u8. Найти с помощью сторонних приложений и дополнений, например, Video DawnloadHelper, не составляет труда, но вот извлечь из исходного кода страницы не получается. Для примера возьмет сайт, транслирующий Eurosport 1 :

Ссылка скрыта от гостей

- вот конкретно с него нужно получить ссылку с форматом m3u8 с помощью скрипта.

Johan Van · 28.01.2023

start120 сказал(а):
Хочу создать собственный плэйлист, который бы автоматически обновлялся с источников трансляций тв каналов. Известно, что почти все ресурсы транслирующие потоковое видео, часто меняют ссылку. Поэтому есть желание написать скрипт, который будет с периодичностью извлекать ссылку (и) с форматом m3u8. Найти с помощью сторонних приложений и дополнений, например, Video DawnloadHelper, не составляет труда, но вот извлечь из исходного кода страницы не получается. Для примера возьмет сайт, транслирующий Eurosport 1 :
Ссылка скрыта от гостей
- вот конкретно с него нужно получить ссылку с форматом m3u8 с помощью скрипта.

Попробуйте так сделать, если я правильно понял ваш вопрос:

Python:

from urllib.parse import urljoin

import requests

requests.packages.urllib3.disable_warnings()

headers = {
    "user-agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 "
                  "YaBrowser/22.11.3.838 Yowser/2.5 Safari/537.36",
    "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,"
              "application/signed-exchange;v=b3;q=0.9"
}


def iter_text(txt, url):
    links = []
    for item in txt.splitlines():
        if not item.startswith("#"):
            links.append(item.strip()) if item.startswith("http") else links.append(urljoin(url, item.strip()))
    return links if links else False


def load_m3u8(url):
    try:
        rs = requests.get(url=url, headers=headers, timeout=7, stream=True, allow_redirects=True, verify=False)
        if 200 <= rs.status_code <= 299:
            if links := iter_text(rs.text, url):
                return links
            return False
        return False
    except Exception:
        return False


def main():
    url = "https://est2.varcdn.top/Eurosport1/index.m3u8"
    if links := load_m3u8(url):
        print(links)
        for ln in links:
            print(load_m3u8(ln.strip()))


if __name__ == "__main__":
    main()

Ссылку берем тут:

Снимок экрана от 2023-01-28 21-59-41.png

Johan Van · 28.01.2023

start120 сказал(а):
Хочу создать собственный плэйлист, который бы автоматически обновлялся с источников трансляций тв каналов. Известно, что почти все ресурсы транслирующие потоковое видео, часто меняют ссылку. Поэтому есть желание написать скрипт, который будет с периодичностью извлекать ссылку (и) с форматом m3u8. Найти с помощью сторонних приложений и дополнений, например, Video DawnloadHelper, не составляет труда, но вот извлечь из исходного кода страницы не получается. Для примера возьмет сайт, транслирующий Eurosport 1 :
Ссылка скрыта от гостей
- вот конкретно с него нужно получить ссылку с форматом m3u8 с помощью скрипта.

Хотя, конечно, это все же не совсем автоматизация. Вам, как я понимаю, надо эту ссылку автоматом получать. А не заходить постоянно в инструменты разработчика.

start120 · 28.01.2023

Johan Van сказал(а):

Попробуйте так сделать, если я правильно понял ваш вопрос:

Python:

from urllib.parse import urljoin

import requests

requests.packages.urllib3.disable_warnings()

headers = {
    "user-agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/106.0.0.0 "
                  "YaBrowser/22.11.3.838 Yowser/2.5 Safari/537.36",
    "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,"
              "application/signed-exchange;v=b3;q=0.9"
}


def iter_text(txt, url):
    links = []
    for item in txt.splitlines():
        if not item.startswith("#"):
            links.append(item.strip()) if item.startswith("http") else links.append(urljoin(url, item.strip()))
    return links if links else False


def load_m3u8(url):
    try:
        rs = requests.get(url=url, headers=headers, timeout=7, stream=True, allow_redirects=True, verify=False)
        if 200 <= rs.status_code <= 299:
            if links := iter_text(rs.text, url):
                return links
            return False
        return False
    except Exception:
        return False


def main():
    url = "https://est2.varcdn.top/Eurosport1/index.m3u8"
    if links := load_m3u8(url):
        print(links)
        for ln in links:
            print(load_m3u8(ln.strip()))


if __name__ == "__main__":
    main()

Ссылку берем тут:

Посмотреть вложение 66317

Спасибо большое, ссылку берет!!!

Johan Van · 28.01.2023

start120 сказал(а):
Спасибо большое, ссылку берет!!!

Сайт с трансляцией за cloudflare:

Поэтому, просто запросами оттуда ничего не добиться. Возможно, можно попробовать selenium. Но как перехватить ссылку в нем я пока не знаю. Надо почитать документацию, если это возможно.

start120 · 28.01.2023

Johan Van сказал(а):
Хотя, конечно, это все же не совсем автоматизация. Вам, как я понимаю, надо эту ссылку автоматом получать. А не заходить постоянно в инструменты разработчика.

Все верно, теперь думаю задача по легче осталась, полученную ссылку заменять в файле плэйлиста при входе в виндовс. Я чайник в в написании скриптов на питоне, применяю шаблоны). Буду пробовать. Еще раз спасибо!

start120 · 28.01.2023

Johan Van сказал(а):
Сайт с трансляцией за cloudflare:

Посмотреть вложение 66320

Поэтому, просто запросами оттуда ничего не добиться. Возможно, можно попробовать selenium. Но как перехватить ссылку в нем я пока не знаю. Надо почитать документацию, если это возможно.

Понял, Вы ссылку через вкладку Нетворк взяли, я про перехват ссылки на потоковое видео думал. Ну инет перелопатил не нашел решение.

start120 · 28.01.2023

Я через расширение в хроме Video Download Helper беру ссылку

Johan Van · 29.01.2023

start120 сказал(а):
Я через расширение в хроме Video Download Helper беру ссылку

Я тут немного подумал над вашим вопросом и написал вот такую небольшую статью, которая, возможно, сможет решить вашу проблему: Перехват запросов с веб-страницы с помощью selenium и browsermobproxy в Python. Статья еще не опубликована. Не знаю, будет ли у вас к ней доступ или нет. Скорее всего да. Во всяком случае попробуйте или дождитесь публикации.

Все сервисы Codeby

Поиск

Поиск

Статья Немного об IPTV или проверка m3u с помощью Python. Часть 01

start120

Member

Johan Van

start120

Member

Johan Van

Johan Van

start120

Member

Johan Van

start120

Member

start120

Member

start120

Member

Вложения

Johan Van