Программирование для ИБ

Поиск одинаковых изображений с помощью Python

  • 7 787
  • 1
Наверное, почти у каждого из нас на жестком диске компьютера скапливается довольно большое количество цифровых изображений. Будь то фото или просто картинки, когда то скачанные из интернета и благополучно забытые в завалах. Порою размеры таких скоплений достигают довольно больших размеров. И одна из причин, по которым такое может случиться – это дубликаты. Сравнивать картинки вручную – то еще удовольствие. Утомительно, да и гарантии того, что не будет пропущено что-то, понятное дело нет. А что, если для этих целей использовать Python? Давайте попробуем сделать скрипт, который в автоматическом режиме проверит папку с фото, выведет в терминал пути к предположительно совпадающим изображениям и сохранит результаты проверки в текстовый файл.

000.jpg

Что потребуется?

Установим библиотеку Pillow. Именно в ней, в модуле ImageChops, есть функция difference, которая и находит разницу в...

Поиск модераторов групп ВК по картинкам GIF с помощью Python

  • 3 204
  • 0
Прочитал тут новость-инструкцию, как можно найти ссылку на страницу модератора-администратора группы. Многие пишут, что данная информация уже довольно старая. Но, тем не менее, я ее увидел в первый раз и подумал, что можно это дело слегка автоматизировать. То есть, для того, чтобы найти модератора, а иногда их несколько у группы, вовсе не обязательно искать gif на странице. Достаточно написать небольшой скрипт на Python, который будет делать это за вас. А вам останется только проверить результаты поиска.

photo-collage-example-0027_1280.jpg

Дисклеймер: Все данные, предоставленные в данной статье, взяты из открытых источников, не призывают к действию и являются только лишь данными для ознакомления, и изучения механизмов используемых технологий.

[COLOR=rgb(0...

Проверка IP-адреса в Blacklists (DNSBL) с помощью Python

  • 7 407
  • 3
«И не было спасения от спама, пока люди не придумали DNSBL!» :LOL: А если серьёзно, то DNSBL – это DNS blocklist, то есть, черные списки, которые хранятся на серверах с использованием структуры DNS. Уже из самого названия понятно, что данные списки предназначены для того, чтобы почтовые сервера проверяли их, и, на основании полученных данных формировали репутацию адреса или хоста. Попасть в эти списки легко, а вот выбраться уже тяжелее. Но, речь сейчас не о том, как удалить адрес из черного списка, а о том, как проверить, не попал ли адрес вашего домена туда, с помощью Python.

000.jpg

Попасть в черные списки легко. Тут, можно сказать, все зависит от того, кто формирует правила добавления в них адреса. И если Луна совпала с Сатурном, то может статься так, что ваш белый и пушистый домен попадет в него с очень большой легкостью. Для примера, попасть можно по следующим причинам: подозрительная активность почтового...

Получение информации о домене с помощью Python #02

  • 5 789
  • 6
Продолжим описание модулей скрипта для получения информации о домене. Первая часть данной статьи расположена здесь.

000.jpg

Дисклеймер: Все данные, предоставленные в данной статье, взяты из открытых источников, не призывают к действию и являются только лишь данными для ознакомления, и изучения механизмов используемых технологий.

Получение данных из SSL-сертификата домена

Создадим модуль ssl_check.py. С его помощью мы сможем получить данные из SSL-сертификата. Для начала импортируем в модуль нужные библиотеки:

Python:
import socket
from datetime import datetime

import OpenSSL
from OpenSSL.SSL import Connection, Context, SSLv3_METHOD, TLSv1_2_METHOD

Теперь создадим...

Получение информации о домене с помощью Python #01

  • 4 931
  • 0
Иногда полезно узнать, какие данные находятся за адресом сайта, за его доменным именем. Конечно же, есть множество сервисов, которые с радостью предоставят вам эту информацию. Но, все это нужно будет делать вручную. Думаю, что вы понимаете, что информация о домене на Whois не заканчивается. Я, на основании некоторых примеров кода, сделал свою попытку разобраться, как же можно получить данные с помощью скриптов на Python. Конечно же, никто не даст вам стопроцентного результата поиска. Вот и у меня, не всегда, получается, найти полные данные по сайту. Впрочем, не мне судить, получилось у меня что-то или нет. Давайте начинать писать код.

000.jpg

Я также как и DeathDay полностью на стороне добра, а потому:

Дисклеймер: Все данные, предоставленные в данной статье, взяты из открытых источников, не...

Принцип работы онлайн-кассы на примере АТОЛ и взаимодействие с ней через библиотеку

  • 5 601
  • 3
Привет Codeby !

main.jpg


Онлайн-касса ( ОК ), которую можно видеть сейчас в любом магазине, супермаркете, аптеке и так далее, представляет собой такое устройство. В каждой пятерочке или ашане, конечно, каждый видел подобный аппарат, кому-то приходилось нетерпеливо ожидать чека, когда времени мало, а инет в магазине видимо подтупливает)

kassa.png


Работа с этими аппаратами регламентируется 54 ФЗ "О применении контрольно-кассовой техники при осуществлении расчетов в Российской Федерации" и если кратко, то основное отличие онлайн-кассы от кассовых аппаратов, которые использовались раньше - это собственно слово "онлайн", а значит передача данных происходит через сеть и вся процедура продажи и отправки данных проходит в течении 2-5 секунд.

Весь аппарат по...

Поиск, скачивание и извлечение метаданных из документов в свободном доступе с помощью Python. #02

  • 3 709
  • 0
В предыдущей статье мы начали писать скрипт поиска проиндексированных документов на определенном сайте, скачивание этих документов и извлечение из них доступных метаданных. И все это с помощью Python. Давайте продолжим создавать код и разбирать работу функций.

02.jpg

Дисклеймер: Все данные, предоставленные в данной статье, взяты из открытых источников, не призывают к действию и являются только лишь данными для ознакомления, и изучения механизмов используемых технологий.

Загрузка найденных документов

После того, как документы будут найдены, нужно их загрузить для анализа, да и просто, если есть желание, для чтения. Иногда можно узнать много нового и...

Поиск, скачивание и извлечение метаданных из документов в свободном доступе с помощью Python. #01

  • 3 452
  • 0
В широком понимании метаданных, все уже привыкли к тому, что метаданные есть в фото, аудио или видео. Но мы редко задумываемся о том, что метаданные есть и у других типов файлов. Например, у различных форматов офисных документов. И содержаться в них может имя учетной записи, который этот документ создал, иногда электронная почта или ФИО, реже телефон. И если с фото более-менее все почти наладилось и очисткой метаданных занимаются сами сайты, куда вы его загружаете, если это не стоковое изображение, конечно, то вот с документами несколько иная картина. Редко кто заморачивется над тем, чтобы удалить метаданные из документа, перед тем, как его загрузить на сайт. А вот о том, как получить документы с нужного сайта и извлечь эти метаданные с помощью Python давайте и поговорим.

01.jpg

Дисклеймер: Все данные, предоставленные в...

Сжатие PDF тремя библиотеками и сравнение результатов с использованием Python

  • 5 347
  • 0
Как работать с PDF-файлами, а именно извлекать текст, изображения, объединять файлы в один я писал вот в этой статье. Но, помимо всех, вышеперечисленных операций, немаловажной опцией является размер полученного файла. Ведь зачастую коллекции книг или статей в PDF занимают значительный объем жесткого диска. И тогда начинаешь задумываться, а можно ли как-то уменьшить размер документов до приемлемого уровня, чтобы не пострадало при этом качество и не была нарушена структура документа. И тут на помощью нам снова приходит Python. С его помощью и использованием библиотек для работы с файлами PDF давайте попробуем это сделать.

000.jpg

Для сравнения попробуем выполнить сжатие не одной библиотекой, а тремя, одна из которых является платной, чтобы выбрать наиболее подходящий алгоритм для использования в будущих...

Статья Наведите Порядок: Автоматическая Сортировка Файлов в Python с Pathlib

  • 8 968
  • 23
У каждого из нас в какой-либо из папок скапливается большое количество файлов, рассортировать которые все никак не доходят руки. Мне приходилось наблюдать папку «Загрузки» забитую неимоверным количеством файлов, «Рабочие столы», фото на которых лежит почти друг на друге. И у меня иногда скапливаются файлы, на сортировку которых уходит время. А что, если написать небольшой скрипт на Python, который рассортирует файлы по расширениям и разложит по папкам, попутно удалив пустые директории автоматически? Давайте сделаем это.

000.jpg

Думаю, что не сделаю никаких открытий, сказав, что рассортировать файлы можно с использованием одной библиотеки pathlib, а точнее, ее модуля Path. Каюсь, до недавнего времени, почему-то не обращал на эту библиотеку должного внимания. Может быть потому, что она не представляет из себя ничего экзотического. Но, вот попалась она мне на глаза и попробовав с ней работать я понял, насколько это удобнее, когда идет...