Потенциал компьютерной лингвистики в решении задач бизнес-аналитики

Логотип компании
Потенциал компьютерной лингвистики в решении задач бизнес-аналитики
Получение полных данных и их эффективный анализ при помощи компьютерной лингвистики – задача, сопряженная с рядом сложностей, которые актуальны и для традиционных задач безопасности, решаемых при помощи DLP-систем: неполнота контроля каналов...

Сканер из пакета для сока, фреза из зажигалки, плот из пластиковых бутылок… Идеи нетривиального использования обычных предметов предлагались не только для развлечения телезрителей в рубрике «Оч.умелые ручки», но и часто находят успешное применение в реальной жизни.

Ярким примером тому – технологии, которые изначально были созданы для военных целей и теперь используются в быту: СВЧ-излучение, предназначалось для радаров ПВО, а теперь используется для приготовления пищи; нитинол – металл «с памятью» (при нагреве возвращающийся к исходной форме) – применяется в военной технике, но более широкое применение нашёл в системах автоматического выключения электрочайников.

В информационной безопасности, как и в любой другой сфере деятельности, взгляд на предмет под другим углом может привести к неожиданным решениям актуальных задач. Участие в обеспечении информационной безопасности бизнес-процессов Сбербанка натолкнуло нас на мысль о том, что механизмы лингвистического анализа, которые входят в состав систем предотвращения утечек информации (DLP-систем) можно использовать и как средство информационной безопасности, и как инструмент бизнес анализа.

Оценка состояния проекта, исследования удовлетворенности клиентов и лояльности сотрудников, анализ продаж банковских продуктов – это изучение человеческих взаимодействий, в рамках бизнес-процессов, которые осуществляются посредством переговоров, то есть, языка. А значит, могут стать предметом лингвистического анализа, который позволит получить данные для выработки эффективных управленческих решений.

Получение полных данных и их эффективный анализ при помощи компьютерной лингвистики – задача, сопряженная с рядом сложностей, которые актуальны и для традиционных задач безопасности, решаемых при помощи DLP-систем: неполнота контроля каналов, синтактическая и семантическая неопределенность, сложность анализа речи и графически представленной информации, квантование информации. Мы следим за появлением новых технологий и подходов, позволяющих преодолеть эти сложности, пилотируем те из них, которые видятся нам наиболее перспективными, и надеемся в скором будущем получить эффективный инструмент бизнес-анализа, построенный на методах компьютерной лингвистики.


Как можно использовать компьютерную лингвистику в анализе бизнес-процессов?

1.      Построение воронки продаж

Начнем с самого важного процесса в бизнесе – взаимодействия с клиентами. Благодаря лингвистическому анализу можно будет определить, на какой стадии находится взаимодействие с конкретным покупателем продукта или услуги – на стадии запроса информации, получения предложения, одобрения предложения, отправки требуемых для какого-то вида сделки документов или согласования драфта договора. Это позволит построить воронку продаж (рис.1.)


Рис. 1. Пример воронки продаж

Воронка продаж позволяет сравнивать эффективность работы различных офисов продаж или отдельных менеджеров и находить сложные места в их взаимодействии с клиентами. Воронка продаж обычно строится на основании данных менеджеров, которые самостоятельно в CRM-системе переключают этапы взаимодействия с клиентом. Основное преимущество использования лингвистического анализа при построении воронки продаж будет заключаться в автоматизации этого процесса. Если этап и продукт будут определяться автоматически, значит можно будет оперативно привлечь к общению с клиентом лучших специалистов по тому или иному продукту или этапу взаимодействия.

Аналогичным образом, лингвистический анализ может помочь и при обработке жалоб, и при оказании технической поддержки или при работе любой другой тикет-системы. DLP-система может анализировать контент, генерируемый в ходе взаимодействия эксперт-клиент, и автоматически переадресовывать сообщения конкретной направленности и/или эмоциональной окраски на специалистов с соответствующими компетенциями. Результатом такой работы станет повышение скорости, объективности взаимодействия с клиентами и рост удовлетворенности клиентов.

2.      Исследование удовлетворенности клиентов

Удовлетворенность клиентов – это оценка, которую дают клиенты компании, исходя из опыта приобретения и использования предлагаемых продуктов или услуг. Так они выказывают готовность прибегать к услугами этой компании в будущем, а также рекомендовать её знакомым.

            Удовлетворенность часто оценивается с помощью анкетирования (по телефону или онлайн). Отдача от таких опросов часто не сопоставима с затраченными на их проведение человеческими и временными ресурсами. При этом часть опрашиваемых игнорирует анкеты, часть – выбирает ответы случайным образом, у кого-то вопросы вызывают негатив или желание пошутить.

            В условиях тотального распространения социальных медиа пользователи продуктов и услуг предпочитают делиться своим мнением в соцсетях, на форумах или адресовать свои отзывы напрямую компании. Существует класс систем, которые с помощью лингвистических методов анализируют медиа-пространство. Эти системы находят статьи, комментарии, посты, касающиеся того или иного лица или бренда, и определяют эмоциональный фон высказывания. Исходя из количества и соотношения таких публикаций, формируется интегрированный показатель отношения широкой аудитории к компании, что в какой-то мере коррелирует с оценкой удовлетворенности клиентов.

            Если научить этому приёму DLP-систему, то получится отслеживать, в каком ключе идет взаимодействие с клиентами в том или ином филиале или отделении компании и, как следствие, насколько клиенты довольны или недовольны качеством предоставляемых продуктов и услуг. Причем информацию можно будет получать автоматически, не вкладывая деньги в периодические «исследования удовлетворенности клиентов».

            Относительно высокий процент негатива в отношении конкретных филиалов или продуктов позволит вовремя зафиксировать проблему и предложить управленческие решения для её устранения.

3.      Исследование отношения сотрудников

            Основная задача кадровой политики компании – создать и сохранить такую команду, которая будет двигать бизнес вперёд. Для того чтобы понять, какой именно метод поможет сохранить коллектив в «боевом состоянии», компании проводят анализ удовлетворенности сотрудников.

            Этот процесс можно оптимизировать с помощью механизмов лингвистического анализа. Для этого можно настроить словари, касающиеся различных факторов пребывания сотрудников в данной организации (отношение к условиям труда, характеру работы, качеству менеджмента, уровню компенсации, карьерным возможностям). При этом в системе настраивается критический уровень позитива и негатива в целом по организации и в разрезе отдельных подразделений, который она должна фиксировать.

Читайте также
Одной из самых критичных инженерных систем центра обработки данных (ЦОД) можно назвать систему электроснабжения. На нее вместе с системой бесперебойного питания может приходиться до 25% от общей стоимости. Поэтому, прежде чем приобрести то или иное решение, бизнес тщательно взвешивает не только его преимущества, но и недостатки, а также связанные с ним риски.

Подобным образом можно отслеживать отношение сотрудников к событиям и явлениям в жизни организации.

4.      Оценка состояния проекта

Практика показывает, что проекты, участники которых не согласуют действия друг с другом, проходят пять стадий развития: шумиха, неразбериха, поиск виновных, наказание невиновных и награждение непричастных. Анализ взаимодействия участников проекта, возможно, смог бы переломить эту ситуацию.

Если построить карту коммуникаций по конкретному проекту (например, в виде графа связей, как на рис.2.), может оказаться, что над проектом работали совсем не те люди, которые за него отчитывались.


Потенциал компьютерной лингвистики в решении задач бизнес-аналитики. Рис. 2

Рис. 2. Граф связей участников проекта

По количеству и толщине граней, исходящих из каждой вершины графа, становится ясно, кто осуществляет больше всего коммуникаций по проекту. Эти сотрудники, скорей всего, обладают наиболее полной информации о текущем статусе проекта, возникающих проблемах и путях их решения. Карта коммуникаций, построенная с помощью механизмов лингвистического анализа, даст реальную картину текущих процессов, выявит проблемы, которые требуют немедленного решения, и покажет лидеров, которые действительно стараются довести проект до ума.

Лингвистический анализ способен повысить эффективность управления – увеличить скорость принятия решений, уменьшить затраты на анализ ситуации, получить адекватную картину положения дел в компании и т.д. Однако для этого сначала придётся решить ряд существующих проблем.

Проблемы лингвистического анализа

Неконтролируемые каналы передачи информации

Увеличение доли шифрованного трафика, применение компьютерной стеганографии, использование в рабочих целях личных устройств (без механизмов контроля) – информацию, которая передаётся по всем этим неконтролируемым каналам, невозможно проанализировать, а значит получить полную картину происходящего.

Синтаксис и многозначность

Сложность автоматического синтаксического анализа и многозначность отдельных слов и целых выражений хорошо демонстрирует следующее упражнение. Возьмем любой текст и переведем его с помощью автоматического переводчика, сначала в одну сторону, а затем обратно (рис.3.).


Рис. 3. Перевод сказки «Репка» сначала с русского на английский, а потом обратно при помощи Google Translate

Увы, пока машины делают синтаксический анализ не так успешно, как люди. А дополнительную путаницу вносят омонимы («кран», «лук»). То же самое можно сказать про эмоционально окрашенные фразы, юмор, сарказм. Их не всегда понимают люди, что уж говорить о машинах.

Хотя, справедливости ради, стоит сказать, что, в корпоративных коммуникациях лексическая многозначность значительно снижена за счет того, что используемые термины лежат в области конкретного вида деятельности и в рамках принятой культуры делового общения. Например, фраза «в банке» обладает меньшей смысловой неопределенностью, если речь идет о финансовой деятельности, или «угроза», если речь идет об информационной безопасности.

Анализ изображений и речи

Кроме обычных текстов мы часто передаем информацию посредством голоса или всевозможных графиков, диаграмм, графов и т.п. С преобразованием устной речи в текст дела обстоят хорошо. Для решения этой задачи появляются все новые технологии, например, приложение Siri от корпорации Apple. Но сами устные коммуникации – весьма специфичны, т.к. обладают свойством квантования информации (о котором речь пойдет ниже). А вот эффективных технологий для распознавания и «понимания» информации, представленной в графическом виде, пока не существует.

Квантование информации

Электронные письма содержат много информации, они структурированы и связаны в цепочки. Поэтому их легко обрабатывать и анализировать. Чего не скажешь о преимущественно коротких и бессвязных сообщениях в мессенджерах и социальных сетях. Такой формат общения позволяет сообщать подробности, только когда это действительно необходимо (что максимально приближено к обычному устному общению). Анализ отдельных «маленьких» кусочков информации, отправленных в одном сообщении, редко представляет интерес, а собрать вместе все сообщения получается далеко не всегда.

Сложность заключается даже не в том, чтобы собрать все «маленькие» сообщения переписки вместе и проанализировать их в совокупности, а в том, что без дополнительной информации, которая обсуждалась ранее, возможно, по другим каналам – невозможно будет правильно классифицировать текст. О каком продукте, этапе сделке, проекте и т.п. идет речь, если это уже обсудили ранее и теперь подразумевают, но не называют. Это возможно только при комплексном анализе коммуникаций людей по всем возможным каналам, что вновь возвращает нас к проблеме неконтролируемых каналов передачи информации.

Как вариант решения этой проблемы, можно уменьшить число неконтролируемых каналов, регламентировать порядок взаимодействия с клиентом и предоставление ему определенных, контролируемых «точек входа», контролировать используемые на корпоративных устройствах приложения, заставить использовать на мобильных устройствах MDM-решения, способные перенаправлять трафик на анализ. Однако решения, которое позволяло бы полностью нивелировать проблему неконтролируемой передачи корпоративной информации, пока не найдено. Поэтому мы продолжаем работать над этим вопросом, что в конечном итоге позволит нам реализовать идею применения лингвистического анализа в бизнес-аналитике.

Заключение

            Изобретатели давно заметили, что при решении новых задач человеческий мозг часто опирается на уже существующие решения. В нашем случае мы столкнулись с обратным процессом: изучение свойств и возможностей DLP-систем в рамках обеспечения информационной безопасности навело нас на мысль о том, что средствами лингвистического анализа можно будет решать и другие, не относящиеся к кибербезопасности, однако не менее важные для бизнеса вообще и Сбербанка в частности, задачи.

Читайте также
За пять лет своей работы новый стартап «Октава ДМ» на базе легендарного завода в Туле стал лидером по выпуску высокотехнологичной электроакустической аппаратуры благодаря современным достижениям и инновациям. Пятьдесят наименований продукции под брендом «Октава» поставляется как на внутренний рынок, так и в страны СНГ и БРИКС. А сегодня это еще и ведущий производитель по импортозамещению микрофонной техники общепромышленного назначения в России.

Изменение технологий и предпочтений клиентов, выход на рынок финансовых услуг купных технологичных компаний заставляют искать новый потенциал для развития. В этих условиях умение анализировать имеющуюся информацию и оперативно принимать на ее основе стратегические решения приобретает огромную важность.

Улучшение качества обслуживания клиентов, упрощение и улучшение продуктов, модернизация системы управления персоналом, построение системы перекрестных продаж – ключевые задачи стратегии развития Сбербанка. Использование компьютерной лингвистики может быть эффективным инструментом для их решения, так как это уже существующий «обкатанный» инструмент, который надо только по-новому настроить.

Благодаря лингвистическому анализу скорость обработки информации увеличится, что в итоге приведет к финансовой выгоде. Повысится объективность анализа: у бездушной машины нет друзей, родственников и врагов. Нераскрытый пока потенциал DLP-систем позволяет полагать, что в недалеком будущем, когда будут найдены технологии и подходы для решения существующих сейчас проблем лингвистического анализа, таких как неполнота контроля каналов, синтактическая и семантическая неопределенность, сложность анализа речи и графически представленной информации, квантование информации, появятся системы анализа корпоративного трафика более широкого профиля, решающие наряду с задачами безопасности, задачи бизнес-анализа.

Игорь АГУРЬЯНОВ

Игорь АГУРЬЯНОВ,

ведущий инженер отдела обеспечения процессов SOC Сбербанка

Сергей ЗИНОВКИН

Сергей ЗИНОВКИН,

главный инженер отдела обеспечения процессов SOC Сбербанка

Смотреть все статьи по теме "Информационная безопасность"

Опубликовано 14.09.2017

Похожие статьи