Потенциал компьютерной лингвистики в решении задач бизнес-аналитики
Сканер из пакета для сока, фреза из зажигалки, плот из пластиковых бутылок… Идеи нетривиального использования обычных предметов предлагались не только для развлечения телезрителей в рубрике «Оч.умелые ручки», но и часто находят успешное применение в реальной жизни.
Ярким примером тому – технологии, которые изначально были созданы для военных целей и теперь используются в быту: СВЧ-излучение, предназначалось для радаров ПВО, а теперь используется для приготовления пищи; нитинол – металл «с памятью» (при нагреве возвращающийся к исходной форме) – применяется в военной технике, но более широкое применение нашёл в системах автоматического выключения электрочайников.
В информационной безопасности, как и в любой другой сфере деятельности, взгляд на предмет под другим углом может привести к неожиданным решениям актуальных задач. Участие в обеспечении информационной безопасности бизнес-процессов Сбербанка натолкнуло нас на мысль о том, что механизмы лингвистического анализа, которые входят в состав систем предотвращения утечек информации (DLP-систем) можно использовать и как средство информационной безопасности, и как инструмент бизнес анализа.
Оценка состояния проекта, исследования удовлетворенности клиентов и лояльности сотрудников, анализ продаж банковских продуктов – это изучение человеческих взаимодействий, в рамках бизнес-процессов, которые осуществляются посредством переговоров, то есть, языка. А значит, могут стать предметом лингвистического анализа, который позволит получить данные для выработки эффективных управленческих решений.
Получение полных данных и их эффективный анализ при помощи компьютерной лингвистики – задача, сопряженная с рядом сложностей, которые актуальны и для традиционных задач безопасности, решаемых при помощи DLP-систем: неполнота контроля каналов, синтактическая и семантическая неопределенность, сложность анализа речи и графически представленной информации, квантование информации. Мы следим за появлением новых технологий и подходов, позволяющих преодолеть эти сложности, пилотируем те из них, которые видятся нам наиболее перспективными, и надеемся в скором будущем получить эффективный инструмент бизнес-анализа, построенный на методах компьютерной лингвистики.
Как можно использовать компьютерную лингвистику в анализе бизнес-процессов?
1. Построение воронки продаж
Начнем с самого важного процесса в бизнесе – взаимодействия с клиентами. Благодаря лингвистическому анализу можно будет определить, на какой стадии находится взаимодействие с конкретным покупателем продукта или услуги – на стадии запроса информации, получения предложения, одобрения предложения, отправки требуемых для какого-то вида сделки документов или согласования драфта договора. Это позволит построить воронку продаж (рис.1.)
Рис. 1. Пример воронки продаж
Воронка продаж позволяет сравнивать эффективность работы различных офисов продаж или отдельных менеджеров и находить сложные места в их взаимодействии с клиентами. Воронка продаж обычно строится на основании данных менеджеров, которые самостоятельно в CRM-системе переключают этапы взаимодействия с клиентом. Основное преимущество использования лингвистического анализа при построении воронки продаж будет заключаться в автоматизации этого процесса. Если этап и продукт будут определяться автоматически, значит можно будет оперативно привлечь к общению с клиентом лучших специалистов по тому или иному продукту или этапу взаимодействия.
Аналогичным образом, лингвистический анализ может помочь и при обработке жалоб, и при оказании технической поддержки или при работе любой другой тикет-системы. DLP-система может анализировать контент, генерируемый в ходе взаимодействия эксперт-клиент, и автоматически переадресовывать сообщения конкретной направленности и/или эмоциональной окраски на специалистов с соответствующими компетенциями. Результатом такой работы станет повышение скорости, объективности взаимодействия с клиентами и рост удовлетворенности клиентов.
2. Исследование удовлетворенности клиентов
Удовлетворенность клиентов – это оценка, которую дают клиенты компании, исходя из опыта приобретения и использования предлагаемых продуктов или услуг. Так они выказывают готовность прибегать к услугами этой компании в будущем, а также рекомендовать её знакомым.
Удовлетворенность часто оценивается с помощью анкетирования (по телефону или онлайн). Отдача от таких опросов часто не сопоставима с затраченными на их проведение человеческими и временными ресурсами. При этом часть опрашиваемых игнорирует анкеты, часть – выбирает ответы случайным образом, у кого-то вопросы вызывают негатив или желание пошутить.
В условиях тотального распространения социальных медиа пользователи продуктов и услуг предпочитают делиться своим мнением в соцсетях, на форумах или адресовать свои отзывы напрямую компании. Существует класс систем, которые с помощью лингвистических методов анализируют медиа-пространство. Эти системы находят статьи, комментарии, посты, касающиеся того или иного лица или бренда, и определяют эмоциональный фон высказывания. Исходя из количества и соотношения таких публикаций, формируется интегрированный показатель отношения широкой аудитории к компании, что в какой-то мере коррелирует с оценкой удовлетворенности клиентов.
Если научить этому приёму DLP-систему, то получится отслеживать, в каком ключе идет взаимодействие с клиентами в том или ином филиале или отделении компании и, как следствие, насколько клиенты довольны или недовольны качеством предоставляемых продуктов и услуг. Причем информацию можно будет получать автоматически, не вкладывая деньги в периодические «исследования удовлетворенности клиентов».
Относительно высокий процент негатива в отношении конкретных филиалов или продуктов позволит вовремя зафиксировать проблему и предложить управленческие решения для её устранения.
3. Исследование отношения сотрудников
Основная задача кадровой политики компании – создать и сохранить такую команду, которая будет двигать бизнес вперёд. Для того чтобы понять, какой именно метод поможет сохранить коллектив в «боевом состоянии», компании проводят анализ удовлетворенности сотрудников.
Этот процесс можно оптимизировать с помощью механизмов лингвистического анализа. Для этого можно настроить словари, касающиеся различных факторов пребывания сотрудников в данной организации (отношение к условиям труда, характеру работы, качеству менеджмента, уровню компенсации, карьерным возможностям). При этом в системе настраивается критический уровень позитива и негатива в целом по организации и в разрезе отдельных подразделений, который она должна фиксировать.
Подобным образом можно отслеживать отношение сотрудников к событиям и явлениям в жизни организации.
4. Оценка состояния проекта
Практика показывает, что проекты, участники которых не согласуют действия друг с другом, проходят пять стадий развития: шумиха, неразбериха, поиск виновных, наказание невиновных и награждение непричастных. Анализ взаимодействия участников проекта, возможно, смог бы переломить эту ситуацию.
Если построить карту коммуникаций по конкретному проекту (например, в виде графа связей, как на рис.2.), может оказаться, что над проектом работали совсем не те люди, которые за него отчитывались.
Рис. 2. Граф связей участников проекта
По количеству и толщине граней, исходящих из каждой вершины графа, становится ясно, кто осуществляет больше всего коммуникаций по проекту. Эти сотрудники, скорей всего, обладают наиболее полной информации о текущем статусе проекта, возникающих проблемах и путях их решения. Карта коммуникаций, построенная с помощью механизмов лингвистического анализа, даст реальную картину текущих процессов, выявит проблемы, которые требуют немедленного решения, и покажет лидеров, которые действительно стараются довести проект до ума.
Лингвистический анализ способен повысить эффективность управления – увеличить скорость принятия решений, уменьшить затраты на анализ ситуации, получить адекватную картину положения дел в компании и т.д. Однако для этого сначала придётся решить ряд существующих проблем.
Проблемы лингвистического анализа
Неконтролируемые каналы передачи информации
Увеличение доли шифрованного трафика, применение компьютерной стеганографии, использование в рабочих целях личных устройств (без механизмов контроля) – информацию, которая передаётся по всем этим неконтролируемым каналам, невозможно проанализировать, а значит получить полную картину происходящего.
Синтаксис и многозначность
Сложность автоматического синтаксического анализа и многозначность отдельных слов и целых выражений хорошо демонстрирует следующее упражнение. Возьмем любой текст и переведем его с помощью автоматического переводчика, сначала в одну сторону, а затем обратно (рис.3.).
Рис. 3. Перевод сказки «Репка» сначала с русского на английский, а потом обратно при помощи Google Translate
Увы, пока машины делают синтаксический анализ не так успешно, как люди. А дополнительную путаницу вносят омонимы («кран», «лук»). То же самое можно сказать про эмоционально окрашенные фразы, юмор, сарказм. Их не всегда понимают люди, что уж говорить о машинах.
Хотя, справедливости ради, стоит сказать, что, в корпоративных коммуникациях лексическая многозначность значительно снижена за счет того, что используемые термины лежат в области конкретного вида деятельности и в рамках принятой культуры делового общения. Например, фраза «в банке» обладает меньшей смысловой неопределенностью, если речь идет о финансовой деятельности, или «угроза», если речь идет об информационной безопасности.
Анализ изображений и речи
Кроме обычных текстов мы часто передаем информацию посредством голоса или всевозможных графиков, диаграмм, графов и т.п. С преобразованием устной речи в текст дела обстоят хорошо. Для решения этой задачи появляются все новые технологии, например, приложение Siri от корпорации Apple. Но сами устные коммуникации – весьма специфичны, т.к. обладают свойством квантования информации (о котором речь пойдет ниже). А вот эффективных технологий для распознавания и «понимания» информации, представленной в графическом виде, пока не существует.
Квантование информации
Электронные письма содержат много информации, они структурированы и связаны в цепочки. Поэтому их легко обрабатывать и анализировать. Чего не скажешь о преимущественно коротких и бессвязных сообщениях в мессенджерах и социальных сетях. Такой формат общения позволяет сообщать подробности, только когда это действительно необходимо (что максимально приближено к обычному устному общению). Анализ отдельных «маленьких» кусочков информации, отправленных в одном сообщении, редко представляет интерес, а собрать вместе все сообщения получается далеко не всегда.
Сложность заключается даже не в том, чтобы собрать все «маленькие» сообщения переписки вместе и проанализировать их в совокупности, а в том, что без дополнительной информации, которая обсуждалась ранее, возможно, по другим каналам – невозможно будет правильно классифицировать текст. О каком продукте, этапе сделке, проекте и т.п. идет речь, если это уже обсудили ранее и теперь подразумевают, но не называют. Это возможно только при комплексном анализе коммуникаций людей по всем возможным каналам, что вновь возвращает нас к проблеме неконтролируемых каналов передачи информации.
Как вариант решения этой проблемы, можно уменьшить число неконтролируемых каналов, регламентировать порядок взаимодействия с клиентом и предоставление ему определенных, контролируемых «точек входа», контролировать используемые на корпоративных устройствах приложения, заставить использовать на мобильных устройствах MDM-решения, способные перенаправлять трафик на анализ. Однако решения, которое позволяло бы полностью нивелировать проблему неконтролируемой передачи корпоративной информации, пока не найдено. Поэтому мы продолжаем работать над этим вопросом, что в конечном итоге позволит нам реализовать идею применения лингвистического анализа в бизнес-аналитике.
Заключение
Изобретатели давно заметили, что при решении новых задач человеческий мозг часто опирается на уже существующие решения. В нашем случае мы столкнулись с обратным процессом: изучение свойств и возможностей DLP-систем в рамках обеспечения информационной безопасности навело нас на мысль о том, что средствами лингвистического анализа можно будет решать и другие, не относящиеся к кибербезопасности, однако не менее важные для бизнеса вообще и Сбербанка в частности, задачи.
Изменение технологий и предпочтений клиентов, выход на рынок финансовых услуг купных технологичных компаний заставляют искать новый потенциал для развития. В этих условиях умение анализировать имеющуюся информацию и оперативно принимать на ее основе стратегические решения приобретает огромную важность.
Улучшение качества обслуживания клиентов, упрощение и улучшение продуктов, модернизация системы управления персоналом, построение системы перекрестных продаж – ключевые задачи стратегии развития Сбербанка. Использование компьютерной лингвистики может быть эффективным инструментом для их решения, так как это уже существующий «обкатанный» инструмент, который надо только по-новому настроить.
Благодаря лингвистическому анализу скорость обработки информации увеличится, что в итоге приведет к финансовой выгоде. Повысится объективность анализа: у бездушной машины нет друзей, родственников и врагов. Нераскрытый пока потенциал DLP-систем позволяет полагать, что в недалеком будущем, когда будут найдены технологии и подходы для решения существующих сейчас проблем лингвистического анализа, таких как неполнота контроля каналов, синтактическая и семантическая неопределенность, сложность анализа речи и графически представленной информации, квантование информации, появятся системы анализа корпоративного трафика более широкого профиля, решающие наряду с задачами безопасности, задачи бизнес-анализа.
Игорь АГУРЬЯНОВ,
ведущий инженер отдела обеспечения процессов SOC Сбербанка
Сергей ЗИНОВКИН,
главный инженер отдела обеспечения процессов SOC Сбербанка
Опубликовано 14.09.2017