Атака основана на использовании специального программного обеспечения, которое перехватывает уникальные звуковые сигналы, издаваемые клавишами при наборе текста, и анализирует эти данные для выявления конкретных слов и фраз. Чтобы атака была успешной, необходимо сначала собрать несколько образцов печатной продукции и обучить звуковые волны совпадать с определенными клавишами или словами. Запись может осуществляться с помощью скрытых микрофонов или через уже взломанные устройства, находящиеся рядом с целью, такие как смартфоны, ноутбуки и умные колонки.
Ученые отмечают, что хотя для обучения статистической модели предсказания текста по акустическим данным не требуется большого количества данных, важно записывать несколько сеансов набора текста в разных условиях. Разработанные модели учитывают временной интервал между нажатиями клавиш и могут вносить небольшое смещение в данные, чтобы компенсировать ошибки и шумы, которые могут присутствовать в записях. Это делает метод очень гибким и адаптируемым к различным условиям печати. Средняя точность метода составляет 43 %, поэтому мы склоняем шляпу перед исследователями и считаем этот метод потенциально опасным инструментом для атак в реальном мире.