Контекст: у компании много корпоративных клиентов-заемщиков, по которым необходимо постоянно отслеживать кредитные риски, чтобы правильно управлять портфелем клиентов. Один из способов оценки возможных рисков - это упоминания о специфичных событиях заемщика в новостном потоке (например, о смене генерального директора). Анализ новостного потока возможно автоматизировать для роста эффективности.
Решение: была предложена модель тегирования новости на основе 17 основных возможных рисков. При помощи модели для каждого корпоративного клиента строился индекс, демонстрирующий реальный уровень риска по всем новостям.
Итоги:
Интеграция в бизнес-процесс отдела анализа кредитного портфеля банка:
- Автоматизация 60% персонала, осуществляющего поиск релевантной информации;
- Снижение нагрузки на аналитика до 70% по различным категориям риска;
- Повышение точности прогнозов отдела на 15%;
- Увеличение числа подробных отчетов о портфеле в 2 раза;
- Составление семантического ядра для 80% компаний-клиентов.
Для построения модели были использованы:
- Новостной поток по выбранной компании-заемщику;
- Набор заданных банком рисков;
- Разметка новостей согласно рискам от аналитиков.
Результаты моделирования:
Модель оценки вероятности наличия рисков для заданной компании-заемщика на основании предшествующих новостей.
Заказчик: Финансы, Банкинг
Технологический стек: Python, nltk, gensim, PyTorch.