Программирование для ИБ

Парсим сгенерированные фото с помощью Python

  • 5 717
  • 4
Для Python, думаю, существует довольно много библиотек по генерации ненастоящих данных, которые впоследствии можно было бы использовать для регистрации на сайтах, когда указывать настоящую информацию не очень хочется. Но, вот генерация фото несуществующих людей уже связана с ИИ, ML и нейронными сетями. Не думаю, что стоит реализовать такой проект в одиночку. Хотя, если знания позволяют, то почему бы и нет. Однако, мои знания математики, к сожалению, далеки от идеала. Поэтому, я решил, что лучше поискать готовые решения, которые и помогут сгенерировать фото человека, которого никогда не существовало.

0001.jpg

Сначала, и это вполне очевидное решение, я подумал использовать сервис «This Person Does Not Exist», в силу его популярности. Но, вот реализация мне не особо понравилась. Во-первых, генерируется только одно фото. И для получения еще одного нужно перезапускать процесс генерации, а значит отправлять запрос на сервер еще раз. Во-вторых, нельзя указать параметры, по которым будет генерироваться фото, вроде пола, возраста, цвета волос и т.д. И тогда я решил еще немного поискать...

Простой пример работы с Excel в Python

  • 12 014
  • 3
В данной статье я хочу показать, как можно работать с книгой Excel вне зависимости от того, установлен ли у вас Microsoft Excel или нет, а также вне зависимости от того, какую операционную систему вы используете. Библиотека, которая используется для работы с книгой, независима от наличия продуктов компании Microsoft на компьютере.

000.png

Я иногда просматриваю заказы на фрилансе. Но, просмотреть и взять заказ, это две разные вещи. Ведь для того, чтобы мне стали доступны заказы на сайте FL.ru, нужно заплатить денежку. Нет, это не плохо. Сайту тоже надо как-то зарабатывать. Но, для меня это не особо-то хорошо. Тем не менее, я смотрю заказы для того, чтобы попытаться выполнить то или иное задание и просто получить опыт, который без сомнения понадобиться мне в дальнейшем. Ведь я только начинаю программировать на Python.

Суть заказа была вот в чем. Нужно было выполнить парсинг нескольких таблиц, а данные сохранить в Excel на разных листах. Я тогда, почему-то, прошел мимо этого заказа. Но, через какое-то время вспомнил и попытался сделать что-то похожее. Нашел таблицы, которые можно попарсить на сайте...

Скачивание журналов с сайта для чтения онлайн в виде картинок и сборка их в PDF

  • 6 469
  • 0
Иногда я люблю почитать журналы. Но я уже давно их не покупал. Наверное последний купленный мой журнал был «Хакер» 2009 года. Уж не помню даже, какой выпуск. Помню, что тогда к журналам прилагался диск с программами и в этом номере был диск с дистрибутивом Linux Mandriva. Красивая была ось. Ну да суть не в этом. В последующее время я все больше предпочитал читать журналы, да и книги в электронном виде, потому, что бумажные издания несколько кусались по цене, да и кусаются сейчас. Так что, в этом плане особо ничего не изменилось. И если раньше было очень много сайтов и групп в том же ВК, где можно было скачать любой журнал почти за любой год, то с приходом авторского права все резко изменилось. Стало труднее найти свежие журналы, сайты если и находились, то через какое-то время переставали выкладывать новые из-за обращений правообладателя. А впоследствии и вовсе стали блокироваться. И я стал предпочитать скачивать журналы себе на жесткий диск. Благо места хватало. Тем более, что после прочтения его можно было сжать в архив и отправить в облако на долгосрочное хранение. Но, это, так сказать, преамбула.

Захотел я почитать свежий выпуск журнала. Не суть какого. Тут важно то, что я...

Дорабатываем сортировщик PDF и EPUB. Сортируем FB2 по датам с помощью Python

  • 3 984
  • 0
Всем привет. В двух предыдущих статьях «Сортировка книг в формате PDF по годам выпуска с помощью Python» и «Дорабатываем сортировку книг по папкам. Сортировка Epub с помощью Python» был сделан сортировщик, который раскладывает книги в форматах pdf и epub по годам выпуска. Но, есть еще формат, который был не затронут в предыдущих статьях, это fb2. У данного формата также есть метаданные, и он представляет собой файл в формате xml. А значит, извлечение метаданных из него вполне возможно, как и последующая сортировка по папкам.

Image-25_2.jpg

Что понадобиться?

Установить библиотеку для парсинга данных BeautifulSoup:

pip install bs4

Возможно, использование данной библиотеки здесь избыточно, но, именно с ее помощью получилось довольно просто получить данные из файла данного формата. Все остальные решения либо сильно усложнены, либо требуют более детального изучения. А...

Дорабатываем сортировку книг по папкам. Сортировка Epub с помощью Python

  • 3 313
  • 0
В статье «Сортировка книг в формате PDF по годам выпуска с помощью Python» я поделился кодом, с помощью которого происходит сортировка книг в формате pdf по годам выпуска. Но, нужно больше. Ведь книги есть также и в формате epub. И их довольно много. Открывать каждую – значит просто потерять кучу времени. Следовательно, нужно как-то дополнить код, который был в статье так, чтобы сортировка велась также и по формату epub.

Image-25_1.jpg

Что понадобиться?

Для работы сортировки epub нужно будет импортировать модуль:

import zipfile

А также установить, если у вас еще не установлена, библиотеку для парсинга xml, lxml:

pip install lxml

И импортировать из нее etree:

from lxml import etree

Дополняем сортировщик

Не скажу, что я сам придумал решение. Нет, я нашел его в интернете, уж даже и не помню, на каком форуме. Но, суть в том, что каждый файл в формате epub – это zip-архив. И перед тем, как что-то в нем искать, его нужно распаковать. Ну, а далее...

Сортировка книг в формате PDF по годам выпуска с помощью Python

  • 5 482
  • 8
Не знаю как у других, но у меня есть такая привычка – собирать как можно больше информации об изучаемом предмете. Не факт, что в будущем она может понадобиться, но, тем не менее, я от нее пока что не избавился. И вот, когда я начал изучать Python, конечно же, мне в голову пришла «гениальная» мысль скачать как можно больше книг по изучаемой теме. Со временем количество книг росло и, уже трудно было разобраться, что и где искать. Но хуже всего то, что не особо было понятно, свежая это книга или года эдак из 2010-го. Большинство книг, которые я скачивал (не спрашивайте где, думаю, что сами знаете) в формате pdf. И мне потребовалось как-то отсортировать их по году выпуска. Открывать вручную файл и перемещать его в нужную папку достаточно долго. Поэтому немного погуглив я понял, что нужно считать метаданные из файла, для того, чтобы получить дату создания и соответственно переместить файл в нужную папку.

Надо отметить, что сильно полагаться на данные, которые находятся в метаданных именно в том случае, если вам требуется определить точную дату, когда была выпущена книга, не стоит. Ведь в метаданных может быть указана информация о дате выхода перевода книги, тогда как книга...

Конвертируем файлы doc в docx с помощью Python

  • 7 258
  • 0
В статье «Конвертация файлов Word в PDF с помощью Python» я описал пример автоматизации, когда множество файлов Word, с помощью скрипта на Python, можно конвертировать в PDF. Но, я так же упоминал, что модуль, который используется для конвертации, не работает со старыми форматами файлов, а именно - с doc. Поэтому, для того, чтобы можно было их конвертировать в pdf, сначала нужно сохранить их в docx. Вроде бы логично, но не делать же это все вручную. Ведь файлов может быть достаточно много, а лень, она такая)

000.png

Оговорюсь, что сам скрипт не мой. Я его нашел на необъятных просторах stackoverflow.com и немного над ним поиздевался.

Что потребуется?

Для начала, операционная система Windows, а также установленный Microsoft Word. Но, думаю, что это не проблема. Ну, и установить модуль glob:

pip install glob

screenshot2.png

Скрипт конвертации

Вот, что в итоге у меня получилось:

[SPOILER="Код конвертации из...

Конвертация файлов Word в PDF с помощью Python

  • 8 849
  • 3
Не знаю, как у вас, а у меня на работе иногда возникала проблема в конвертировании файлов из формата docx в формат pdf, чтобы в последующем разместить эти файлы на сайте. А файлов, иногда, бывало довольно много, потому, требовалось каждый открыть и сохранить в нужный формат. В какой-то момент времени мне это немного надоело и я стал искать способ, как бы автоматизировать данный процесс. И выход нашелся. Я написал небольшой скрипт на python, который конвертировал файлы в pdf автоматом. То есть, выполнял работу за меня.

В общем, это небольшой пост, посвящённый автоматизации )

000.png

Что потребуется?

Для работы скрипта нужно установить модуль docx2pdf. Потому, отрываем терминал и выполняем команду:

pip install docx2pdf

Пишем функцию конвертации

Для того, чтобы конвертировать файл из формата Microsoft Word в PDF, достаточно одной небольшой функции. На входе она будет принимать директорию с файлами docx и конвертировать их по очереди. Впрочем, для того, чтобы исключить попадание конвертеру файлов, расширение которых отлично от docx, сделаем небольшое условие, которое будет проверять файл...

Скачиваем видео с Rutube с помощью Python

  • 19 099
  • 10
Рассматривая текущие реалии можно предположить, что вполне возможно, в довольно скором времени начнется миграция видеоблогеров на другие платформы для размещения своего видеоконтента. И вполне возможно, что одной из таких платформ станет Rutube. Тем более не так давно они провели презентацию, из которой стало уже понятно, что движения по платформе, хоть какие-то появились. Ну и если они еще предложат «вкусные» условия по монетизации контента, то, почему бы и нет? Но, все это лирика. И по большей части относится к разряду предсказаний или гадания на кофейной гуще. У меня же здесь немного другая цель. Я решил попробовать скачать видео с данной платформы. И ниже показываю, что у меня получилось.

rutube_title.jpg

Что понадобиться?

Для начала нужно установить библиотеку requests. Здесь все достаточно просто. Пишем в терминале редактора кода или в терминале ОС, которую вы используете, команду:

pip install requests

После того, как данная библиотека установиться, нужно будет скачать ffmpeg и прописать к нему путь в переменной среды path. Собственно скачиваем саму программу. Никакой установки она не...

Статья Python для новичка. Keylogger, который ты не найдешь в сети

  • 12 063
  • 3
Привет Codeby!

main.jpg


Знаю, что тема заезжена, но тем не менее все, что можно найти в сети по запросу "логгер на питон" - это стандартный код библиотеки, которая взаимодействует с api windows и перехватывает нажатия клавиш. В свое время я смотрел xcode на тубе и его реализация достаточно интересна и познавательна (включая весь курс). Логи клавиатуры могут быть полезны не только злоумышленникам, но и обычным IT-специалистам, которые не в курсе, что же такое там нажимают юзвери, что ломает программу - заставляя ее работать не так, как надо. Средство - такое себе, но имеем то, что имеем.

Дисклеймер: Все данные, предоставленные в данной статье, взяты из открытых источников, не призывают к действию и являются только лишь данными для ознакомления, и изучения механизмов используемых технологий.

Схема

Проблемы, которые могут возникать - это то, что обычная библиотека [COLOR=rgb(26, 188...
🚀 Первый раз на Codeby?
Гайд для новичков: что делать в первые 15 минут, ключевые разделы, правила
Начать здесь →
💼 Вакансии и заказы в ИБ
Pentest, SOC, DevSecOps, bug bounty — работа и проекты от проверенных компаний
Карьера в ИБ →

Статистика форума

Темы
52 300
Сообщения
346 496
Пользователи
160 577
Новый пользователь
TvinkMB