Статья Метрики антифрода: как перестать мерить только по доле отклонённых операций

Дашборд антифрод-системы с бизнес-метриками Net Savings и ROC-AUC для анализа эффективности ML-моделей


Доля отклоненных операций — самый примитивный и опасный KPI для антифрода. С ним легко попасть в ловушку: ты либо блокируешь слишком много, теряя клиентов, либо пропускаешь фрод, теряя деньги. Машинное обучение в антифроде — это уже стандарт. Но оценивать его работу по классическим метрикам в отрыве от бизнеса бессмысленно.

Пора сменить фокус. Мы разберем, как правильно мерить эффективность антифрода — от технических метрик моделей до финансовых показателей. Узнаем, почему баланс между безопасностью и удобством — это вопрос денег, а не абстрактных компромиссов. И научимся строить дашборды, которые помогают принимать решения, а не просто собирают пыль.

Если тема антифрода для тебя новая и пока хочется просто «разложить по полочкам», что вообще делает такая система и от чего она защищает, начни с базового обзора. В статье «Антифрод: что это вообще и зачем нужен» собраны ключевые сценарии применения, типы мошенничества и примеры из практики — хороший фундамент, чтобы уже потом нырять в Net Savings, PR‑AUC и сложные дашборды.

Классические ML-метрики​

Машинное обучение сегодня — основа любого серьезного антифрода. Но как оценить, что нейросеть или градиентный бустинг реально работают? Все метрики и фичи, по сути, крутятся вокруг одной цели — безопасности. Не вокруг абстрактной "точности модели", а вокруг защиты денег и клиентов.

Антифрод‑метрики живут не в вакууме — за ними всегда стоят люди, которые эти цифры придумывают, настраивают и защищают на созвонах с бизнесом. Если хочется понять, чем именно занимается человек, который превращает PR‑AUC и Net Savings в осмысленные решения, загляни в материал «Антифрод-аналитика: почему этот дефицитный специалист на стыке ИБ и данных стоит от 150 000 рублей» — там по шагам разбирается, какие задачи решает антифрод‑аналитик и какие скиллы ему для этого нужны.

Главные метрики: что они на самом деле значат​

Рассмотрим, основные метрики, которыми оценивается эффективность работы антифрод-системы
Precision (Точность) & Recall (Полнота) — это вечный спор.
  • Precision — «сколько из отклонённых нами операций — реально мошеннические?»
  • Recall — «сколько реальных мошенников мы поймали из всех?»
F1-score — просто усреднение Precision и Recall. Удобно, но не панацея.

ROC-AUC — золотой стандарт для сравнения моделей. Показывает, насколько хорошо модель отличает «плохие» операции от «хороших» на всех возможных порогах срабатывания. Высокий ROC-AUC — модель хорошо ранжирует.

PR-AUC (Precision-Recall AUC) — главная метрика для антифрода. Почему? Данные сильно несбалансированы: мошеннических операций обычно 1-2%. PR-AUC фокусируется именно на классе мошенников и показывает, как модель балансирует между поимкой фрода (Recall) и минимизацией ложных срабатываний (Precision). Смотри на нее в первую очередь.

Что смотрит модель: ключевые параметры​

Теперь рассмотрим Система анализирует сотни параметров, вот основные группы:
  1. Деньги. Нехарактерно высокая сумма для конкретного клиента — красный флаг.
  2. Действие. Перевод на новый, «одноразовый» счет? Требует пристального внимания.
  3. Время. Операция в 3 ночи, когда клиент обычно спит? Подозрительно.
  4. Место и устройство. Вход в интернет-банк из незнакомой страны или с нового телефона? Сигнал к проверке.
  5. Профиль клиента. История всех операций, демография, контакты, даже записи разговоров с кол-центром.
Также антифрод-системы смотрят стандартные параметры:
  • Банковские данные: ФИО, паспорт, где живешь и где в сети, телефоны.
  • Что делали с деньгами: Все операции по счетам и картам. Покупки, переводы, снятие.
  • Разговоры: Записи бесед с банковскими клерками.
  • Где бывали: Точки доступа в сеть, где звонили, где отправляли сообщения.
  • С чем работали: Какие девайсы юзали для онлайн-банка и мобайла.
  • О вас: Ваш возраст, пол, кем работаете.

Три цвета риска: что происходит с операцией​

Далее есть типовая схема оценки надежности операции. На выходе модель присваивает операции цвет:
  • Красный. Высокий риск. Операция блокируется автоматически, дальше разбирается специалист.
  • Желтый. Средний риск. Требуется дополнительная проверка: звонок клиенту, запрос подтверждения. Может встать на паузу.
  • Зеленый. Низкий риск. Операция проходит мгновенно.
Мечтать о 100% по обоим показателям — утопия. Пример: если ты хочешь поймать вообще всех мошенников (Recall ~100%), то будешь блокировать всё подряд, включая легальные операции (Precision упадет). И наоборот: если блокируешь только очевидный фрод (высокий Precision), часть мошенников уйдет (низкий Recall). Нужен осознанный компромисс.

Бизнес-метрики и стоимость ошибок​

Гонка за высоким Recall или Precision сама по себе — тупик. Слишком жесткие настройки (упор на безопасность) гробят клиентский опыт и выручку. Слишком мягкие (ставка на удобство) ведут к прямым убыткам от фрода.

Важен баланс. Не технический, а финансовый. Фокус должен сместиться с примитивных метрик на бизнес-эффект и итоговое качество моделей. Для предприятия критично считать не только предотвращенный фрод, но и убытки от ошибочных решений системы.

Пора смотреть на антифрод как на profit center, а не на cost center. Переходим к языку, который понимает бизнес.

Когда начинаешь считать антифрод в деньгах, быстро упираешься не только в внутренние KPI, но и во внешние ограничения: регуляторы, платёжные системы, требования к борьбе с кибермошенничеством. Для понимания, как меняется поле боя на уровне государства и индустрии, полезно прочитать «Анализ второго пакета мер Минцифры: комплексный разбор инициатив по борьбе с кибермошенничеством» — там показано, какие новые правила влияют на то, как банки и финтех выстраивают антифрод‑процессы и метрики.

Стоимость ошибки: как антифрод считает деньги​

Ошибки антифрода — не просто цифры в отчете. Это реальные убытки или спасенные деньги. Давай разберем, как бизнес оценивает работу системы.

Две стороны ошибки​

False Positive (FP) — ложное срабатывание. Отклонили легального клиента.

False Negative (FN) — пропущенный мошенник. Пропустили фрод.

Бороться нужно с обеими. Но как выбрать приоритет? Считаем стоимость.

Что стоит каждая ошибка?​

Цена False Positive: разозлить своего клиента​

Когда система блокирует честную операцию:
  1. Упущенная выручка прямо сейчас. Покупка на 50 000 рублей не состоялась.
  2. Операционные издержки. 20 минут работы кол-центра, чтобы разблокировать карту. Зарплата специалиста, инфраструктура.
  3. Риск оттока клиента. Самый дорогой пункт. Клиент устал от блокировок → уходит к конкурентам. Потерян не один платеж, а весь его LTV (Lifetime Value - пожизненная ценность) — вся будущая прибыль от клиента. Это могут быть сотни тысяч рублей.
Формула грубо: (Сумма отмененной операции) + (Время поддержки * стоимость минуты) + (Вероятность оттока * LTV клиента)

Пример: Заблокировали легальный авиабилет за 80 000₽. Клиент звонит 15 минут в поддержку. С вероятностью 10% он закроет у вас счет (предположим, что его LTV — 500 000₽). Убыток = 80 000 + (15 * 100₽) + (10% * 500 000) = 80 000 + 1 500 + 50 000 = ~131 500₽ + репутационные издержки.

Цена False Negative: пропустить врага​

Когда мошенник проходит:
  1. Прямой убыток — сумма операции. Клиент оспорит транзакцию (чарджбэк), банк вернет деньги.
  2. Комиссия за чарджбэк. Эквайер (платежная система) штрафует банк или магазин. От 1 000 до 5 000₽ за случай.
  3. Операционные издержки на расследование. Юристы, специалисты по фроду тратят часы.
  4. Репутационный ущерб. Клиенты теряют доверие к безопасности. Новые клиенты боятся приходить.
  5. Штрафы регуляторов. За плохую безопасность могут оштрафовать.
Пример: Пропустили мошенническую покупку на 200 000₽. Клиент сделал чарджбэк. Прямые потери = 200 000 + комиссия 3 000₽ + расследование (5 часов работы). Итого — минимум 203 000₽ + репутационные издержки.

Ключевые бизнес-метрики​

Забудь про точность и полноту на совещании с директором. Ему нужны эти цифры:

1. Fraud Rate / Chargeback Rate
Процент мошеннических операций от всего объема. Ключевой итоговый KPI. Цель — гнать его вниз.

2. Net Savings (Чистая экономия)
(Сумма предотвращенного фрода) минус (Упущенная выручка из-за ложных блокировок)

Пример: За месяц предотвратили фрода на 10 млн₽. Из-за ложных срабатываний недополучили 2 млн₽. Net Savings = 8 млн₽. Вот реальная ценность антифрода.

3. Customer Acceptance Rate
Процент легальных клиентов, которых система пропускает. Обратная сторона FP. Низкий показатель — ты слишком агрессивен, теряешь деньги.

4. Cost of Fraud Prevention
Во сколько обходится борьба? Зарплата команды Data Science, инфраструктура, софт. Сравниваешь с Net Savings. Окупается? Отлично.

Как принимать решения?​

Теперь твой выбор между Precision и Recall — это финансовое решение.

Поднять Recall (ловить больше фрода)? Готовься к росту ложных срабатываний (FP) и их стоимости. Выгодно, если средний ущерб от фрода (FN) огромный.

Поднять Precision (меньше беспокоить клиентов)? Готовься к росту пропущенного фрода (FN). Выгодно, если LTV клиентов высокий, а фрод в среднем мелкий.

Итог: Хорошая антифрод-система не максимизирует абстрактные метрики. Она максимизирует Net Savings — разницу между спасенными и потерянными деньгами. Считай в рублях, а не в процентах.

Баланс качества и UX​

Хорошая антифрод-модель — не только про точность. Она про пользовательский опыт (UX). Как мы уже выяснили, слишком агрессивная система убьет бизнес. Слишком мягкая — приведет к убыткам. Нужен баланс.

Почему UX критичен?​

  • Сложные проверки отпугивают клиентов. Они уходят к конкурентам.
  • Постоянные блокировки — это сигнал недоверия. Клиент чувствует себя преступником.
  • Пропадает конверсия. Клиент бросает корзину, если нужно прыгать через доп. проверки.

Метрики опыта (UX-метрики)​

Следи за этими цифрами:

Friction Rate (Уровень трения). Сколько легальных операций попадает на доп. проверку? SMS, 3DS, звонок из банка. Высокий показатель — ты слишком параноик.

Customer Journey Abandonment. Сколько клиентов бросают операцию на этапе проверки? Пытались заплатить → увидели сложную верификацию → ушли. Прямая потеря денег.

Скорость прохождения. Сколько времени и шагов нужно честному клиенту, чтобы подтвердить операцию? Идеал — меньше 10 секунд и один шаг.

NPS сегмента «затронутых». Как настроены клиенты, которые прошли через проверку? Если их NPS падает — твоя система их бесит.

Как найти баланс? Практика​

Не делай всем одинаково. Применяй сегментацию:
  1. Сегментация клиентов. Для VIP — минимум проверок. Их LTV высокий, риск потерять клиента дороже возможного фрода. Для новых клиентов — стандартный или усиленный сценарий.
  2. Сегментация операций. Мелкий ежедневный платеж в кофейню? Почти без проверок. Крупный перевод на новый счет? Полный набор верификации.
  3. Step-up аутентификация. Не блокируй сразу. Используй градус ответа:
    • Низкий риск → зеленый. Пропускай сразу.
    • Средний риск → желтый. Запроси одношаговое подтверждение (SMS, push).
    • Высокий риск → красный. Блокировка и звонок оператора.
  4. A/B-тестирование. Запусти две версии антифрода для 5% трафика. Сравни, где больше убытков от фрода (FN), а где больше брошенных корзин (из-за FP). Выбери оптимальный порог.

Дашборды для команды​

Разным отделам — разные данные. Общая картина рождается на стыке.

Data Scientist'у нужна глубина: PR-AUC, стабильность скора, дрейф данных, алерты на аномалии в фичах.
Антифрод-аналитику — оперативка: матрица ошибок в цифрах, топ мошеннических схем, нагрузка на кол-центр, кейсы для ручного разбора.
Руководству и продукту — бизнес-итоги: Net Savings, Chargeback Rate, Friction Rate, доля автоматически одобренных операций.

Собирайте всех раз в неделю. Смотрите на эти срезы вместе. Решайте на месте: сдвинуть порог, переобучить модель или поменять процесс.

Из чего собирается дашборд​

Бизнес-блок. Здесь смотрим на деньги. Ключевые метрики: динамика Net Fraud Loss, Customer Acceptance Rate, ROI всей системы и соотношение спасенных сумм к ущербу от ложных срабатываний.

Блок качества модели. Здесь оцениваем работу алгоритма. Фокус на PR-AUC, Precision и Recall на рабочих порогах с прямой бизнес-интерпретацией: «такой порог дает X% ложных блокировок и Y% пропущенного фрода». Сюда же — распределение risk score по операциям.

Блок клиентского опыта (UX). Здесь измеряем удобство. Общий Friction Rate, процент отказов из-за сложных проверок, оценки NPS от клиентов, прошедших верификацию.

Операционный блок. Здесь видим нагрузку. Время обработки инцидентов, объем работы ручного отдела, количество новых данных для дообучения моделей.

Сегментация — обязательна. Без нее картина искажена. Всегда смотри метрики в разрезе: тип операции (платеж, вывод), тип клиента (новый, VIP), канал (мобилка, веб), география.

Как этим пользоваться? Ищи аномалии — внезапный рост Chargeback Rate в мобильных переводах. Оценивай изменения — как новое правило повлияло на Net Savings и Friction Rate. Определяй приоритеты — куда направить силы команды. Коммуницируй — покажи продуктологу, как антифрод бьет по конверсии, объясни саппорту источник лишних звонков.

Подводя итог​

Эффективный антифрод — это не гонка за одним процентом в метрике. Это сбалансированная система, которая максимизирует чистую экономию (Net Savings), а не абстрактную точность. Считай стоимость каждой ошибки в рублях, а не в процентах. Балансируй безопасность с клиентским опытом через сегментацию и A/B-тесты. Внедряй живые дашборды, которые говорят на языке бизнеса с каждой командой.

Забудь про «долю отклоненных». Твоя главная метрика теперь — финансовый результат. Модель должна не просто хорошо ранжировать, а реально сохранять деньги компании, не отталкивая при этом своих клиентов. Это и есть качественная работа.
 
  • Нравится
Реакции: Сергей Попов
Мы в соцсетях:

Взломай свой первый сервер и прокачай скилл — Начни игру на HackerLab