Success Story - rus
NLP Research Group CC Prompter

Семантическая сегментация диалогов

Описание: чтобы автоматизировать процесс построения сценариев ведения диалога операторов контактного центра с клиентами компании, а также впоследствии автоматически оценивать качество работы операторов контактного центра, необходимо провести рубрикацию набора диалогов операторов и клиентов, выделить основные темы, а также распознать последовательности тем в диалогах операторов с абонентами. Планируется использовать сегментацию текста на семантически связанные куски при помощи моделей тематического моделирования.

Контекст: в контактном центре работает большое количество операторов, необходимо понимать качество их работы, так как их эффективность и эффективность продаж напрямую зависит от их следования сценарию. Валидация вручную - довольно долгий и ресурсоемкий процесс, необходимо автоматизировать его и предложить методику оценки качества.

Решение: на основе реплик внутри диалогов КЦ было построено множество тем. Была построена модель, которая раскладывает весь новый диалог на реплики, а реплики маркирует соответствующими темами. Затем была построена "карта" диалогов с наиболее качественными продажами - идеальный скрипт оператора. Для новых диалогов последовательность реплик сверялась с идеальной картой и измерялось "качество" диалога.

Итоги:
  • Выделена 41 тема;
  • Качество выделения тем: 75% точности в среднем;
  • Интеграция в BI Банка по оценке качества операторов;
  • Повышение конверсии и доли успешных диалогов.

Для построения модели были использованы:
  • Диалоги операторов контактного центра с клиентом;
  • Информация об успешности проведенного диалога;
  • Априорное экспертное знание о темах;
  • Асессорская разметка.

Результаты моделирования:
  • Набор тем для диалогов операторов и клиентов;
  • Граф перехода между темами для успешных и неудачных диалогов;
  • Инструмент тематической сегментации реплик диалога.

Заказчик: Финансы, Банкинг

Технологический стек:  Тематическое моделирование, Синтаксические связи, Нейросетевые модели сегментации текста, BigARTM, PyTorch, gensim, nltk, Python.