pentestgpt v2

  1. Сергей Попов

    Статья AI-агенты в пентесте: от 91% на CTF до провала в Active Directory

    PentestGPT v2 на Claude Opus 4.5, если верить препринту авторов (peer review не прошёл; публичная ссылка на момент написания недоступна), набирает 91% task completion на XBOW - 104 задачи по веб-безопасности. Там же заявлен root на 12 из 13 машин Hack The Box, включая Hard, и compromise 4 из 5...