28 нояб. 2024 г.·7 мин чтения

Суммаризация звонков: как считать пользу по CRM и follow-up

Суммаризация звонков стоит оценивать не по вау-эффекту, а по заполнению CRM, качеству follow-up и скорости работы команды после разговора.

Почему вау-эффект часто обманывает

На демо суммаризация почти всегда выглядит сильнее, чем в реальной работе. После звонка появляется чистый связный текст, и команде кажется, что процесс уже стал лучше. Но приятное резюме и рабочий результат - не одно и то же.

Красивый текст сам по себе ничего не меняет. Он не заполняет CRM, не ставит задачу и не отправляет письмо клиенту. Если менеджер сказал "удобно" и сразу ушел на следующий разговор, польза осталась только на экране.

В продажах это видно быстро. Система может собрать аккуратное резюме: боль клиента, бюджет, сроки, возражения. Менеджеру нравится итог, но в CRM он не вносит этап сделки, не фиксирует дату следующего контакта и не отмечает, кто принимает решение. Через два дня уже непонятно, что обещали клиенту и кто должен сделать следующий шаг.

В сервисе картина похожая. Агент читает сводку, соглашается, что она точная, но не создает задачу на возврат, не указывает причину обращения и не отправляет follow-up с итогом разговора. Для клиента это ничего не меняет. Ему важно только одно: что команда сделала после звонка.

Оценка по принципу "вау, как хорошо написано" почти всегда уводит в сторону. Люди хвалят стиль, краткость и формулировки, потому что это заметно сразу. Намного важнее проверить, внес ли сотрудник обязательные данные в CRM, зафиксировал ли обещания и срок следующего контакта, ушел ли follow-up в тот же день и стало ли меньше звонков, где менеджер забывает договоренности.

Иногда вау-эффект даже мешает. Команда решает, что инструмент уже работает, и перестает смотреть на поведение после разговора. А польза появляется именно там.

Если после 100 звонков доля заполненных CRM-полей не выросла, а follow-up не стал уходить быстрее, значит, новой рабочей привычки не появилось. У вас просто появился красивый черновик.

Что именно должна менять суммаризация

Польза появляется не в тот момент, когда менеджер говорит "удобно", а когда после звонка меняется конкретное действие. Если команда тратит по 7-10 минут на ручное заполнение карточки, суммаризация должна убирать именно эту потерю. Если карточки остаются пустыми или follow-up уходит с задержкой, менять нужно это, а не только текст заметки.

Сначала выберите один узкий участок после разговора, где команда каждый день теряет время. Обычно это либо занесение данных в CRM, либо подготовка следующего шага. Один участок проще измерить: до внедрения ручной работы было больше, после внедрения - меньше.

Для CRM лучше заранее решить, какие поля должны появляться сразу после звонка, без дописывания от руки. Набор зависит от процесса, но смысл один: поля должны помогать следующему действию, а не просто хранить красивое резюме.

Обычно после разговора системе имеет смысл заполнять итог звонка и статус сделки, следующую дату контакта, причину отказа или паузы, продуктовый интерес, тариф или тему обращения, а также короткий риск, если клиент сомневается или ждет согласование.

Если этих полей нет, менеджер все равно слушает запись, вспоминает детали и пишет заметки заново. Тогда вау-эффект есть, а экономии нет.

Продажи и сервис лучше считать отдельно

У продаж и сервиса разные цели, поэтому одна и та же сводка не даст одинаковый эффект. В продажах после звонка нужен следующий коммерческий шаг: отправить КП, назначить демо, вернуть клиента после паузы, уточнить бюджет. В сервисе нужен другой результат: создать тикет, передать кейс второй линии, отправить инструкцию, проверить решение через день.

Простое правило работает лучше всего: для каждого типа разговора задайте один обязательный follow-up. Если был первичный лид, карточка должна получить дату следующего касания. Если клиент спорил о цене, нужен тег причины и задача на повторный контакт. Если это сервисный звонок по ошибке, нужен номер обращения и срок ответа.

Небольшой пример. Отдел продаж продает SaaS и часто теряет лиды после удачного созвона: менеджер обещает письмо, но забывает отправить его в тот же день. Здесь суммаризация полезна только тогда, когда после звонка CRM сразу получает статус, тему интереса и задачу на follow-up. Для сервиса тот же подход не подойдет. Там важнее категория проблемы, приоритет и срок следующего ответа клиенту.

Какие поля в CRM брать в расчет

Если суммаризация приносит пользу, это видно в CRM почти сразу после разговора. Менеджер меньше дописывает руками, а руководитель реже видит пустую карточку с комментарием вроде "созвон был, детали позже".

Сначала выберите небольшой набор обязательных полей. Для продаж и сервиса обычно хватает 5-6: категория темы звонка, итог разговора, следующий шаг, дата следующего контакта, ответственный и причина отказа или эскалации, если они были.

Такие поля удобны тем, что по ним потом можно считать дисциплину работы, качество follow-up и движение по сделке или обращению. Свободный текст тоже нужен, но сравнивать его между людьми трудно.

Отдельно смотрите на поля, которые объясняют исход. Если клиент отказался, запись "неинтересно" почти бесполезна. Лучше фиксировать нормальную причину: дорого, нет бюджета, уже выбрали другого подрядчика, срок не подходит. Если обращение ушло на вторую линию, сохраняйте причину эскалации, а не только сам факт передачи.

Что считать в цифрах

Смотрите не на то, насколько красиво написано саммари, а на качество заполнения карточки. Для первого замера обычно хватает четырех показателей:

доля пустых обязательных полей после звонка
доля карточек, где менеджер исправил автозаполнение вручную
доля звонков с указанной датой следующего контакта
доля записей с выбранной категорией темы и итогом разговора

Ручные исправления часто говорят больше, чем средняя оценка команды. Если менеджеры постоянно меняют категорию темы, модель путает смысл разговора. Если они переписывают следующий шаг, суммаризация плохо ловит договоренности.

Хорошая запись выглядит очень просто: тема "согласование договора", итог "клиент взял паузу до ответа юриста", следующий шаг "отправить новую редакцию", дата контакта "14 июня", ответственный "Анна". По такой карточке сразу понятно, кто и что делает дальше.

Не пытайтесь мерить все сразу. Для первого замера хватит нескольких полей, без которых команда не может двигать сделку или закрывать обращение. Этого достаточно, чтобы увидеть реальную пользу и быстро найти места, где суммаризация ошибается чаще всего.

Как измерять follow-up после разговора

После звонка польза видна в действии: клиент вовремя получил обещанное, задача не потерялась, а команде не пришлось искать детали в записи.

Для follow-up обычно хватает четырех метрик:

доля сообщений и задач, отправленных до обещанного срока
доля follow-up, где смысл письма совпал с договоренностью в звонке
число задач, ушедших в просрочку в первые 24-72 часа
среднее число напоминаний от клиента до ответа или отправки материала

Срок считается просто. Если менеджер пообещал прислать расчет до 18:00, а письмо ушло в 19:10, это просрочка, даже если клиент ничего не сказал. Лучше считать отдельно по типам обещаний: коммерческое предложение, повторный звонок, подключение специалиста, отправка записи или инструкции.

Совпадение текста проверяют не по стилю, а по смыслу. Допустим, в разговоре клиент просил две цены и срок запуска. Если в письме ушла только общая презентация, follow-up формально есть, но обещание не выполнено. Поэтому полезно хранить в CRM короткое поле "что пообещали" и сравнивать его с тем, что реально отправили.

Просроченные задачи быстро показывают слабое место процесса. Суммаризация может делать хороший конспект, но если менеджер не создал следующий шаг в CRM, пользы почти нет. На практике это выглядит так: после разговора в резюме есть договоренность, а через день клиент сам пишет: "Напоминаю, вы обещали вернуться с расчетом".

В сервисе это заметно еще сильнее. Если оператор сказал, что инженер свяжется сегодня, а клиент на следующий день снова пишет в поддержку, у вас уже есть понятный сигнал. Считайте не только сам факт ответа, но и сколько раз клиенту пришлось напомнить о себе после разговора.

Хороший признак пользы ИИ - меньше просрочек и меньше клиентских напоминаний при том же объеме звонков. Если follow-up уходит быстрее, чаще совпадает с обещанием и реже требует повторного пинка от клиента, система реально помогает. Если меняется только ощущение "стало удобнее", а цифры стоят на месте, проблема в процессе после звонка.

Как провести замер по шагам

Проверьте модели в РФ

Если нужна полная суверенность, протестируйте модели с открытыми весами в российских ЦОДах.

Тестировать модели

Если смешать все типы разговоров и сразу смотреть на десяток показателей, пилот почти наверняка даст шум. Нормальный замер строят узко: один сценарий, короткий период и несколько метрик, которые видно в CRM и в follow-up.

Для начала выберите один тип звонков. Не "все продажи" и не "весь сервис", а что-то одно: например, входящие обращения по продлению договора или сервисные звонки по статусу доставки. Обычно хватает 2-4 недель наблюдения. Этого достаточно, чтобы собрать материал и не утонуть в сезонных перекосах.

Сначала снимите базу без новой суммаризации. Пусть команда работает как обычно, а вы фиксируете текущий уровень: сколько полей менеджеры заполняют, сколько follow-up уходит вовремя, сколько задач создают без ручных правок, сколько раз руководитель возвращает карточку на доработку. Иначе вы не поймете, что именно улучшил новый процесс.

Потом сократите список метрик. В пилоте хватает 4-6 показателей. Чем длиннее список, тем проще спорить о второстепенном и тем сложнее принять решение. Обычно достаточно доли заполненных CRM-полей после звонка, времени до отправки follow-up, доли follow-up без ручной переписки с нуля, числа исправлений в карточке со стороны руководителя или QA и доли звонков, где следующий шаг вообще зафиксирован.

Дальше запускайте пилот не на всю команду, а на части операторов или менеджеров. Так проще заметить эффект и не ломать процесс сразу всем. Если в отделе 20 человек, начните с 5-7. Важно, чтобы у этой группы был похожий поток звонков, а не случайный набор сотрудников с разной нагрузкой.

Сравнивайте одинаковые разговоры. Нельзя ставить рядом теплые продажи, холодный обзвон и сервисные жалобы, а потом искать среднюю пользу. Смотрите только на сопоставимые кейсы: одинаковый канал, похожую длину звонка, один и тот же этап воронки или один класс обращений.

Если нужен простой шаблон, берите две группы на одном сценарии: одна работает по старому процессу, вторая - с суммаризацией звонков. Через 2-4 недели вы увидите не вау-эффект, а цифры: где карточки заполняют быстрее, где follow-up уходит без задержек и где менеджер меньше дописывает вручную.

Пример для продаж и сервиса

Представим компанию с двумя командами. Отдел продаж принимает входящие лиды и проводит первые созвоны. Сервисная команда отвечает на обращения действующих клиентов. Обе команды много говорят по телефону, а карточки в CRM заполняют потом, когда уже начались новые звонки.

До пилота картина обычно похожая. Менеджер по продажам помнит общий смысл разговора, но откладывает заполнение карточки на час или до конца дня. В итоге в CRM нет следующего шага, даты повторного контакта или причины интереса клиента. В сервисе проблема та же: оператор обсудил обращение, пообещал перезвонить, но не поставил задачу и не зафиксировал срок.

После звонка система сразу предлагает короткое резюме, готовые поля для карточки и задачу на follow-up. Менеджеру не нужно вспоминать разговор по памяти. Он проверяет текст, подтверждает стадию, источник лида, потребность клиента и дату следующего касания. Агент сервиса подтверждает тему обращения, приоритет, обещанный срок ответа и ответственного.

Пользу в таком пилоте видно не по фразе "резюме получилось удобным", а по тому, что меняется в учете:

больше карточек заполняют в первые 10-15 минут после звонка
в продажах чаще появляется конкретный следующий шаг
в сервисе чаще фиксируют срок ответа и обещание клиенту
задачи follow-up реже остаются без даты и владельца
руководитель тратит меньше времени на ручной разбор звонка

Например, до запуска у продаж только 55% карточек содержали следующий шаг в день звонка. После пилота показатель вырос до 84%. У сервиса доля обращений с назначенным сроком ответа выросла с 62% до 91%. Еще один полезный сдвиг: просроченные follow-up-задачи у обеих команд снизились почти вдвое, потому что система создает задачу сразу, пока разговор еще свежий.

Такой пример хорошо отрезвляет. Если резюме всем нравится, но CRM по-прежнему пустая, пользы мало. Если карточки заполняются быстрее, а follow-up не теряется, значит, суммаризация реально меняет работу, а не просто оставляет приятное впечатление после демо.

Где команды чаще ошибаются

Запустите пилот без миграции

Смените только адрес API и оставьте SDK, код и промпты как есть.

Запустить пилот

Самая дорогая ошибка проста: команда смотрит на впечатление менеджеров, а не на след в CRM. Резюме может казаться умным и аккуратным, но это еще не польза. Если поля после звонка по-прежнему пустые, статусы ставят с задержкой, а follow-up не уходит клиенту, эффект почти нулевой.

Часто картину портит смешение разных типов разговоров в один отчет. Новые лиды, повторные продажи и тяжелые сервисные кейсы дают разную структуру диалога. Если считать их вместе, цифры становятся шумными: на коротких продажах резюме заполняется легко, а на сервисных звонках много исключений, эмоций и деталей, которые ИИ трактует хуже.

Еще один частый промах - оценивать только качество текста и не считать время на ручную правку. Менеджер может получать неплохое резюме, а потом еще 4-6 минут поправлять причину обращения, следующий шаг и срок ответа. На дашборде все выглядит красиво, а в реальной смене люди тратят почти столько же времени, сколько раньше.

Что ломает замер

Чаще всего замер ломают пять вещей:

один общий набор звонков вместо отдельных выборок по продажам и сервису
оценка по принципу "нравится или не нравится" вместо доли заполненных CRM-полей и скорости внесения записи
учет follow-up по факту создания задачи без проверки, ушло ли письмо, сообщение или обещанный звонок
попытка вытащить из одного разговора слишком много полей сразу
отсутствие метрики по ручным исправлениям после автозаполнения

Жадность к полям особенно мешает в начале. Лучше стабильно заполнять 3-5 полей, которые действительно влияют на работу команды: итог звонка, следующий шаг, срок, причина обращения, ответственный. Когда модель пытаются заставить угадывать все сразу, падает точность там, где ошибка стоит дороже всего.

В продажах это видно быстро: задача на follow-up создана, но клиенту никто не отправил КП. В сервисе ошибка тише: резюме сохранилось, но оператор переписал половину текста и забыл поставить срок ответа. Нормальный пилот ловит именно такие разрывы. Если CRM заполняется быстрее, правок меньше, а follow-up реально уходит, система помогает. Если вырос только вау-эффект, пилот стоит пересчитать.

Короткий чек-лист перед запуском

Оставьте текущий стек

RU LLM дает один OpenAI-совместимый эндпоинт и не требует менять ваш процесс.

Попробовать сервис

Если запустить пилот без базовых правил, суммаризация почти всегда кажется полезнее, чем есть на самом деле. Команда видит аккуратный текст после разговора, но не может доказать, изменились ли CRM, follow-up и скорость работы.

Перед стартом закройте пять простых пунктов:

снимите базовый замер до пилота: хотя бы 2-4 недели без ИИ
закрепите список обязательных полей и единые правила заполнения
задайте точный срок для follow-up, а не формулировку вроде "быстро после звонка"
раз в неделю проверяйте выборку из 20-30 разговоров вручную
соберите отчет, который сразу показывает пустые поля и просроченные задачи

На практике этого уже достаточно, чтобы оценка пользы ИИ стала честной. Например, если после запуска время на заполнение карточки упало на 40%, а доля follow-up в срок не выросла, значит, проблема не в качестве суммаризации, а в том, что команда не встроила ее в рабочий ритм.

Хороший пилот выглядит прозаично: меньше пустых полей, меньше забытых обещаний клиенту, меньше ручной рутины после разговора. Если этого нет, вау-эффект быстро пройдет.

С чего начать в вашей команде

Начните не с самой "умной" модели, а с самого дорогого сбоя в процессе. Если пропущенный follow-up срывает повторный звонок, сделку или обещание клиенту, там и нужен первый пилот. В продажах это часто этап после демо или расчета. В сервисе - обращения, где сотрудник должен поставить задачу, срок или следующий контакт.

Хороший старт выглядит скучно, и это нормально. Сначала команда выбирает один поток звонков, где можно быстро увидеть разницу в CRM. Например, сколько разговоров заканчиваются корректно заполненным статусом, назначенной задачей и понятным следующим шагом. Если после внедрения сводки менеджеры реже забывают эти поля, польза уже видна.

Назначьте одного владельца правил. Это не "человек по ИИ", а тот, кто отвечает за схему CRM после звонка: какие поля обязательны, когда ставить follow-up, что считать ошибкой. Без такого человека вы быстро упретесь в споры о том, плохо сработала модель или сотрудники просто по-разному ведут карточки.

Дальше нужен честный тест на одном и том же наборе звонков. Возьмите 50-100 записей, где есть и простые, и спорные случаи. Прогоните их через 2-3 модели и сравните не красоту текста, а то, что меняется в работе:

заполнились ли нужные CRM-поля без ручных правок
появился ли корректный follow-up
снизилось ли число пропущенных задач
сократилось ли время на разбор звонка
совпадает ли итог с тем, как размечает команда

Если в пилоте важно сравнить несколько моделей в одинаковых условиях и при этом хранить данные внутри РФ, это удобно делать через RU LLM. Сервис дает один OpenAI-совместимый эндпоинт, так что команда может менять модели без переписывания SDK, кода и промптов, а логи и бэкапы остаются на серверах в РФ.

Масштабировать решение стоит только после роста по выбранным метрикам. Если сводка звучит убедительно, но CRM по-прежнему пустая, пользы мало. Если доля корректных follow-up выросла хотя бы на 15-20%, а руководитель тратит меньше времени на ручную проверку, пилот можно развивать дальше.

Часто задаваемые вопросы

Почему красивое саммари еще не значит, что инструмент полезен?

Потому что сам текст ничего не меняет в процессе. Польза появляется только тогда, когда после звонка CRM получает нужные поля, задача создается сразу, а клиент вовремя получает обещанный follow-up.

Какую метрику лучше взять первой?

Начните с доли заполненных обязательных полей сразу после звонка. Этот показатель быстро показывает, стала ли команда меньше писать руками и перестала ли откладывать карточки на потом.

Какие CRM-поля имеет смысл считать в пилоте?

Для первого пилота обычно хватает 5–6 полей: тема звонка, итог разговора, следующий шаг, дата следующего контакта, ответственный и причина отказа или эскалации, если она была. Берите только те поля, без которых команда не может двигать сделку или закрывать обращение.

Нужно ли считать продажи и сервис отдельно?

Не смешивайте их в один отчет. В продажах смотрите, появился ли коммерческий следующий шаг, а в сервисе — создалась ли задача, срок ответа и причина обращения.

Как понять, что follow-up действительно сработал?

Смотрите на срок и на смысл. Если менеджер пообещал расчет до вечера, письмо должно уйти до вечера, а не на следующий день; если клиент просил две цены и срок запуска, письмо должно содержать именно это, а не общую презентацию.

Сколько должен длиться нормальный замер?

Обычно хватает 2–4 недель на одном типе звонков. За это время вы успеете снять базу, прогнать пилот и увидеть, меняются ли дисциплина в CRM и скорость follow-up.

Можно ли сразу запускать пилот на всех типах звонков?

Нет, лучше выбрать один узкий сценарий. Когда вы берете входящие лиды, продления и сервисные жалобы вместе, цифры шумят, и вы не понимаете, где суммаризация реально помогает.

Что показывают ручные правки после автозаполнения?

Они показывают, где модель ошибается по смыслу. Если менеджеры часто меняют категорию, следующий шаг или срок, значит, автозаполнение не ловит договоренность и пока не экономит время.

Когда можно считать пилот успешным и расширять его?

Масштабируйте только после роста по выбранным метрикам. Если карточки заполняются быстрее, пустых полей стало меньше, а просроченных follow-up тоже меньше, пилот можно расширять; если выросло только ощущение удобства, рано.

Как сравнить несколько моделей на одинаковых звонках и не вынести данные из РФ?

Возьмите один и тот же набор из 50–100 звонков и сравните модели по CRM-полям, ручным правкам, времени до follow-up и числу пропущенных задач. Если вам нужно держать данные внутри РФ и при этом быстро менять модели без переписывания кода, удобно использовать единый OpenAI-совместимый шлюз вроде RU LLM.