11 окт. 2024 г.·6 мин чтения

Порог доверия для автодействий: черновик, подсказка, автоотправка

Порог доверия для автодействий помогает решить, где оставить черновик, где дать подсказку, а где включить автоотправку без лишнего риска.

Где начинается опасный самообман

Опасный самообман начинается в тот момент, когда команда принимает хороший офлайн-результат за право включить действие без проверки. Для интерфейса с черновиками этого часто достаточно. Для автоотправки без человека - нет.

На тестовом наборе модель может выглядеть почти безошибочной. Но тест редко похож на живой поток. В нем меньше странных запросов, спорных случаев, опечаток и старых данных. Главное даже не это. У теста нет цены ошибки. В таблице промах - это красная строка. В работе это неверный возврат, лишнее обещание, письмо не тому клиенту или ответ с персональными данными.

Ошибка в черновике и ошибка в отправленном действии живут в разном мире. Плохой черновик обычно стоит оператору полминуты правки. Плохая автоотправка создает внешний факт: клиент уже получил письмо, заявка уже закрыта, деньги уже ушли на возврат. После этого команда чинит не текст, а последствия.

Поэтому смотреть нужно не на среднюю точность, а на стоимость редких плохих случаев. Если промах легко заметить и быстро исправить, начинайте с черновика. Если оператору трудно проверить ответ за пару секунд, даже подсказка уже рискованна. Если одна ошибка бьет по деньгам, комплаенсу или репутации, автоотправку стоит включать только в очень узких сценариях.

Почему оператор перестает проверять

Люди быстро привыкают к тому, что подсказка обычно нормальная. После десяти удачных ответов оператор перестает читать одиннадцатый внимательно. Это обычная психология, а не чья-то халатность. Интерфейс часто усиливает проблему: зеленая метка, высокий score и заметная кнопка принятия толкают к быстрому согласию.

Из-за этого человек в контуре легко превращается в формальность. Если оператор подтверждает ответ за 2-3 секунды, проверки почти нет. По риску это уже близко к автоотправке, просто с лишним кликом. В таком режиме честнее считать, что модель почти действует сама, и поднимать порог доверия для автодействий намного выше.

Три режима работы

У автодействий обычно не один режим, а три. Разница между ними не в том, насколько умна модель, а в цене ошибки и в том, кто нажимает последнюю кнопку.

Черновик подходит там, где ответ длинный, контекст неполный, а человек все равно читает текст целиком. Модель собирает факты из тикета, базы знаний и истории, пишет первый вариант и помечает спорные места. Это удобно для поддержки, продаж и внутренней переписки. Ошибка тут дешевая: сотрудник перепишет абзац, уберет лишнее, добавит тон.
Подсказка нужна, когда оператору важно принять решение быстро, но не с нуля. Система предлагает короткий ответ, категорию обращения, следующий шаг или заполненные поля формы. Такой режим работает, только если проверка занимает 5-10 секунд и сотрудник видит достаточно контекста, чтобы поймать промах.
Автоотправка годится только для узких действий с понятным правилом. Например, отправить подтверждение получения заявки, напомнить о статусе доставки или выслать инструкцию по сбросу пароля по утвержденному шаблону. Если действие затрагивает деньги, договоры, персональные данные сверх необходимого минимума или нестандартный конфликт, человека убирать рано.

Порог доверия лучше закреплять не словами вроде низкий или высокий, а простыми рамками. Для каждого режима заранее запишите, что модель может делать, чего не может и при каком сигнале обязана отступить. Обычно хватает четырех вопросов: сколько стоит ошибка, можно ли быстро отменить действие, хватает ли входных данных и сколько времени у человека на проверку.

Правило простое. Если сотрудник все равно читает ответ целиком, дайте модели черновик. Если решение реально проверить за несколько секунд, дайте подсказку. Если ошибку легко отменить, текст идет по жесткому шаблону, а риск для клиента почти нулевой, можно думать про автоотправку без человека.

Из чего складывается порог доверия

Порог доверия не берут из воздуха. Он зависит от цены ошибки в вашем процессе. Если одна неверная автоотправка стоит 500 рублей и закрывается одним извинением, это одна ситуация. Если она срывает платеж, уводит сделку или создает жалобу в комплаенс, это уже другой режим.

Оценка риска LLM обычно сводится к четырем вещам. Первая - цена одной ошибки: деньги, потерянное время команды, жалобы, штрафы, повторная обработка. Вторая - обратимость: можно ли быстро отменить действие, исправить запись или отозвать сообщение. Третья - чувствительность данных: есть ли в запросе персональные данные, финансы, медицина или внутренние документы. Четвертая - проверяемость: хватает ли сигналов, чтобы понять, что ответ уместен, полон и безопасен еще до отправки.

Если ошибка дешевая и обратимая, порог можно ставить ниже. Например, система предлагает черновик ответа оператору поддержки. Даже слабая модель часто окупается, потому что человек видит текст до отправки и правит его за несколько секунд.

Если действие необратимо, порог должен быть выше. Автоотправка клиенту, смена статуса заявки, создание бухгалтерской записи или отправка реквизитов - не место для оптимизма. Тут мало общей точности на тесте. Нужна высокая надежность именно на плохих случаях: двусмысленные письма, пустой контекст, конфликтующие данные, злые формулировки клиента.

С данными правило еще строже. Как только в потоке есть персональные или чувствительные поля, цена промаха растет даже без прямого убытка. Для российских команд это быстро упирается в 152-ФЗ, журналы действий и разбор инцидента. Маскирование PII, аудит и метки по запросам полезны, но сами по себе не дают права включать автоотправку. Они снижают ущерб, а не убирают риск.

Проверяемость часто решает больше, чем качество модели. Если система перед отправкой может сверить номер заказа, статус оплаты, историю клиента и запрещенные шаблоны, доверие растет. Если она отвечает по одному сообщению без опоры на факты, лучше оставить режим подсказки.

Как выбрать порог доверия по шагам

Один общий порог почти всегда ломает процесс. Модель может хорошо писать черновик ответа и в тот же день ошибаться в действии, где есть деньги, сроки или персональные данные. Поэтому порог доверия для автодействий задают не для всей системы сразу, а для каждого маленького шага.

Сначала разрежьте процесс на простые действия. Например, ответ клиенту лучше разделить на чтение обращения, поиск фактов, составление текста, выбор шаблона и отправку. Так быстрее видно, где ошибка просто добавит одну правку, а где создаст жалобу или утечку.

Дальше каждому действию нужен свой класс риска. Если шаг легко откатить за пару минут, риск низкий. Если ошибка меняет статус заказа, сумму, доступ или уходит наружу без шанса исправить след, риск высокий. Для таких шагов автоотправка обычно остается плохой идеей, даже если качество модели кажется высоким на тесте.

Удобно идти по простой схеме:

Для каждого действия запишите цену ошибки в рублях, времени и репутации.
Выберите метрики, которые действительно ловят риск: точность фактов, долю ручных правок, ложные срабатывания и долю успешных перехватов человеком.
Запустите режим черновика и посмотрите, сколько правок люди вносят на живом потоке.
Затем включите подсказку только для тех случаев, где ошибки редки и легко заметны.
До автоотправки допускайте лишь узкий класс задач с понятными правилами и простым откатом.

Не ставьте порог по одной цифре из модели, если не знаете, как она ведет себя на реальных запросах. У двух действий может быть одинаковый score 0.9, но разная цена промаха. Черновик письма с неверным тоном поправят за 20 секунд. Автоотправка неверного ответа клиенту потом съест часы команды.

Метрики лучше смотреть вместе. Высокая точность сама по себе мало что дает, если люди переписывают половину текста. Низкая доля правок тоже обманчива, если модель редко срабатывает, но каждый промах дорогой. Нужен живой баланс: сколько система делает верно, сколько раз мешает и сколько ошибок вы ловите до отправки.

Оставьте путь назад с первого дня. Нужны ручной перехват, быстрый откат правила, журнал решений и понятный флаг, который мгновенно возвращает режим черновика. Если трафик идет через RU LLM, встроенные audit-trails по каждому запросу упрощают разбор спорных случаев и помогают понять, где порог завышен.

Как измерять доверие на живом потоке

Не переносите старый порог

После смены модели прогоните тот же поток и пересчитайте хвост дорогих ошибок.

Сменить модель

Тестовый набор почти всегда выглядит лучше реальности. В нем меньше шумных обращений, меньше спешки и почти нет странных формулировок. В живом потоке приходят короткие реплики, злые клиенты, куски прошлой переписки и случаи, которые никто не добавил в eval.

Поэтому держите две линии проверки. Первая - стабильный тестовый набор, чтобы видеть, стало лучше или хуже после изменений. Вторая - свежая выборка из реальных обращений за неделю или две. Если модель дает 92% на тесте и 74% на проде, высокий порог доверия вы себе просто придумали.

Почему средняя точность врет

Среднее значение успокаивает слишком рано. Для черновика это терпимо. Для автоотправки без человека - нет. Если система хорошо отвечает на простые вопросы про статус заказа, но срывается на возвратах, жалобах и спорных обещаниях, смотреть надо именно туда.

Обычно достаточно пяти показателей: доли ответов без правок, доли мелких правок и полных переписываний, частоты тяжелых ошибок, доли самоотказов из-за низкой уверенности и разбивки по типам запросов. Еще полезнее хранить причины ручных правок. Не просто оператор изменил текст, а более точную причину: не понял намерение, перепутал правило, взял слишком резкий тон или придумал деталь. Через пару недель уже видно, где ломается логика, а где мешает формулировка промпта.

Любая смена промпта, модели или маршрута запроса сбивает старые оценки. Это легко пропустить, когда команда работает через единый OpenAI-совместимый шлюз и меняет модель почти без правок в коде. Через RU LLM такой переход сделать просто, но доверие нельзя переносить с одной модели на другую. Сначала прогоните старый и новый вариант на одном тестовом наборе, потом сравните их на теневом куске живого потока.

Хорошее правило простое: после каждого изменения пересчитывайте не только общий процент успеха, но и хвост ошибок. Если тяжелые промахи выросли даже немного, режим автоотправки лучше вернуть к подсказке или черновику.

Простой сценарий: ответы клиентам в поддержке

В поддержке порог доверия почти никогда не сводится к одной цифре. Один и тот же поток содержит и безопасные вопросы, и случаи, где ошибка сразу бьет по деньгам, репутации или персональным данным.

Ориентир тут простой: чем больше ответ зависит от правил компании, истории заказа и спорных деталей, тем ближе должен быть человек. Чем ближе ответ к сухому факту из системы, тем смелее можно двигаться к автоотправке.

В обычном потоке интернет-магазина автоотправка подходит для статуса заказа, времени доставки, графика работы или адреса пункта выдачи. Подсказка оператору удобна для частых вопросов, где уже есть утвержденный шаблон: обмен товара, сроки возврата, условия гарантии. Черновик лучше оставить для спорных возвратов, нестандартных жалоб и сообщений с угрозой жалобы в банк или регулятору.

Такое деление выглядит скучно, но именно оно спасает от самообмана. Модель может писать гладко почти во всех случаях и все равно быть опасной в тех нескольких процентах потока, где ошибка дорогая.

Где команды ошибаются чаще всего

Пилотируйте с данными в РФ

Маскирование персональных данных и хранение логов в РФ снижают риск на клиентском потоке.

Попробовать RU LLM

Самая частая ошибка - поиск одного общего порога для всех случаев. Так удобно в таблице и красиво в дашборде, но в жизни это ломается быстро. Ответ на вопрос про статус заказа и письмо с условиями возврата денег нельзя мерить одной планкой.

Из-за этого порог доверия получается фикцией. Для безопасных задач он слишком строгий и режет полезную автоматизацию. Для рискованных задач он, наоборот, слишком мягкий и пропускает то, что человек должен был остановить.

Вторая ошибка приходит после удачного демо. На демо данные чистые, формулировки знакомые, спорных кейсов мало. Команда видит 90-95% точности и включает автоотправку там, где модель еще держится только на везении.

Потом начинается обычный прод: клиент пишет сумбурно, вставляет номер договора в середину фразы, путает адреса, просит исключение из правил. Именно на таких сообщениях и видно, может ли система отвечать сама или пока умеет только готовить черновик.

Еще один частый сбой - привычка операторов нажимать отправить без чтения. Если интерфейс почти всегда показывает приличный текст, человек перестает проверять смысл, сроки, суммы и тон. Через пару недель ручное подтверждение остается только на бумаге.

Особенно опасно то, что команды любят средние метрики и почти не считают редкие дорогие ошибки. Один неверный автоответ с обещанием скидки, одна отправка не тому клиенту, одна галлюцинация в юридически чувствительном письме могут стоить больше, чем сотни удачных ответов.

Чаще всего бьют четыре типа промахов: ошибки в суммах, сроках и статусах; выдача лишних персональных данных; обещания, которых бизнес не давал; уверенный тон там, где модель не знает ответ.

И еще одна ошибка всплывает после смены модели или провайдера. Команда меняет маршрут, цену или base_url, получает похожие ответы на тестах и решает, что старый порог подходит. Но даже близкие модели ошибаются по-разному: одна чаще выдумывает детали, другая звучит слишком уверенно, третья хуже держит формат.

Чек-лист перед запуском

Проверьте 152 ФЗ заранее

Соберите пилот с хранением данных в РФ, маскированием персональных данных и аудитом запросов.

Начать пилот

Перед первым включением автоотправки команда должна зафиксировать границы на бумаге, а не в голове. Иначе порог доверия быстро плывет: вчера ответ считали безопасным, сегодня модель уже отправляет то, что никто не собирался доверять машине.

Нормальный старт выглядит скучно, и это хорошо. Если процесс кажется слишком простым, вы, скорее всего, убрали лишний риск, а не забыли что-то важное.

Заранее утвердите список случаев, где автоотправка запрещена при любом score уверенности. Обычно сюда попадают жалобы на деньги, юридические обещания, персональные данные и конфликтные ответы.
Пишите лог по каждому действию: что система решила сделать, почему она это сделала и какие сигналы повлияли на выбор.
Оставьте оператору право остановить поток сразу, одной кнопкой или флагом, без нового релиза и без ожидания разработчика.
Смотрите не только на успешные ответы, но и на долю откатов, ручных правок и жалоб от пользователей.
Запускайте пилот на малом трафике и заранее ставьте дату пересмотра.

Если хотя бы один пункт пока не готов, лучше оставить режим черновика или подсказки и не включать автоотправку без человека.

Хорошая практика - взять один узкий сценарий. Например, поддержка отвечает только на вопросы про статус заказа, но не трогает возвраты и не обещает сроки доставки вручную скорректированных заказов. Так вы получаете честную оценку риска LLM на живом потоке, не ставя под удар весь канал.

Что делать после пилота

После пилота смотрите не на среднюю точность, а на цену ошибки. Если модель хорошо справилась с простыми случаями, это еще не повод включать автоотправку везде. Расширяйте ее только там, где промахи редки, быстро заметны и легко отменяются.

Хороший признак для следующего шага простой: ошибка не портит деньги, договор, персональные данные или отношения с клиентом надолго. Поэтому автоотправка уместна для статусов доставки, подтверждения записи и простых напоминаний. Спорные возвраты, жалобы и нестандартные обещания лучше оставить в режиме черновика или подсказки.

Порог доверия для автодействий не ставят один раз и навсегда. Команда должна пересматривать его по дате, а не по настроению. Если меняется модель, промпт, источник данных или тип запросов, порог нужно проверить заново.

Без истории решений пилот быстро превращается в спор мнений. По каждому действию храните сигнал модельного скоринга, выбранный режим, состав входных данных и дату пересмотра порога. Такой audit-trail помогает разбирать инциденты без догадок. Он же нужен, когда бизнес спрашивает, почему система отправила ответ сама, а комплаенс просит показать логику решения.

Отдельно проверьте маршрут персональных данных. Где именно они появляются: в тексте клиента, в CRM, в логах, в бэкапах, в аналитике. Если у вас российский контур, сразу сверяйте процесс с 152-ФЗ: где хранятся логи, кто видит сырые запросы, как вы маскируете PII и сколько храните следы по операциям.

Если команде нужен единый OpenAI-совместимый эндпоинт в РФ без переписывания SDK, кода и промптов, часто смотрят на решения вроде RU LLM. В таком сценарии полезны вещи, которые не отменяют риск, но упрощают контроль: data residency, маскирование PII, AI-Law метки и аудит по каждому запросу.

Если пилот дал хороший результат, двигайтесь узко. Сначала включите автоотправку на одном типе обращений, затем проверьте месяц живого потока и только потом расширяйте охват. Такой темп не впечатляет на демо, зато обычно спасает от дорогого самообмана.