ИИ-расшифровщик русской речи: готовый продукт или создание собственного?

Изображение создано нейросетью ShutterstockAI

Какие инструменты помогают автоматизировать расшифровку совещаний? Какие российские коммерческие инструменты доступны для транскрибации разговоров? С чего начать свою разработку? В чем отличие отечественного рынка от глобального в использовании open-source-движков? Может ли появиться на рынке отраслевой ИИ-транскрибатор?

Совещания, созвоны, переговоры – три столпа современной корпоративной культуры. Будущее эффективных коммуникаций с коллегами, партнерами и подрядчиками лежит в ИИ-перспективе и создании кастомных продуктов на основе передовых технологий.

Представьте: у вас большой проект, в успехе которого заинтересованы многие стороны. Количество контактов с партнерами и клиентами зашкаливает. Каждое слово – на вес золота, ведь все договоренности, задачи и планы нужно фиксировать, любое отклонение чревато огромными проблемами в масштабах проекта и компании в целом.

Важно не просто записывать все эпизоды деловой коммуникации, но и быстро «переводить» запись в наглядный набор конкретных тезисов, планы действий или фиксированные статусы по текущим задачам. Одно дело, когда такие задачи возникают спорадически: тогда их можно закрывать ручным трудом. Совсем другое – обрабатывать конвейер коммуникаций на проекте. Если совещание идет час, то его обработка руками – это минимум два-три часа сверху. Затраты времени посчитать нетрудно.

Инструменты для автоматизации расшифровки способствуют улучшению совместной работы команд, предоставляя письменный отчет о дискуссиях, обеспечивая общую информированность и соответствие целям проекта.

Повышаются доступность и уровень вовлеченности удаленных сотрудников и команд в процессы обсуждения. Это уменьшает недопонимание, которое часто прослеживается в письменных сообщениях.

Автоматизированная расшифровка устраняет необходимость ручного ведения записей, позволяя участникам сосредоточиться на обсуждаемой теме, что повышает продуктивность встреч. Экономится значительное время, снижается административная нагрузка, отпадает необходимость найма дополнительного персонала или привлечения сторонних организаций.

Наконец, обеспечивается точная и однозначная фиксация всего хода заседаний, что гарантирует ясность и снижает риски неправильного трактования высказываний участников. Хотя технологии пока имеют некоторые ограничения, особенно при работе с низкокачественными аудиозаписями или различными акцентами, но всё больше повышаются точность и надежность работы инструментов.

В чем проблема?

Поясним: конечно, кто ищет, тот всегда найдет, – инструменты транскрибации разговоров, в том числе в формате совещаний, вполне доступны. Собственно, можно пойти путем загрузки ролика с совещанием на YouTube для автогенерации субтитров. При всех оговорках и вопросах к качеству с итогом вполне можно работать. Но, помимо вопросов к удобству и качеству, это не решает проблему конфиденциальности.

Доступны и российские коммерческие инструменты:

«Планерка»,
Аny2text,
Teamlogs,
«Писец» и т. п.

Они показывают неплохие результаты. Но чем серьезнее разговор в рамках проекта, тем меньше возможностей его безрисковой выгрузки «на сторону», то есть в приложение стороннего вендора.

С чего начать свою разработку?

Чтобы создать собственный сервис, нужны:

облачное пространство,
открытый ИИ-движок на open source с поддержкой русского языка.

Далее по шагам:

Точка старта: разворачивание движка на собственных вычислительных мощностях.
Создание качественного интерфейса, включающего поиск по тексту расшифровки и навигацию, позволяющую, перемещаясь по тексту, перемещаться по видео и, наоборот, перемещаясь по видео, перемещаться по тексту расшифровки.
Запуск сервиса для пилотной группы пользователей с целью получения обратной связи.

Как показал наш опыт, на самом старте модель можно и не дообучать. Возможностей open-source-движка для наших целей в рамках проекта пока вполне хватает. А вот для дальнейшего обучения под конкретную компанию и ее задачи уже необходима команда специалистов по МL (Macine Learning – машинное обучение). Далеко не каждый бизнес готов в это вкладываться, ведь зарплата каждого такого специалиста – 300-350 тыс. рублей.

Первым результатом такого проекта будет транскрибация в виде сплошного текста, без разделения на докладчиков. Следующие задачи для разработки – разбивка текста по ролям (диаризация) и резюмирование итогов. Для этого функционала как раз и понадобится привлечение профильных специалистов по машинному обучению. На выходе компания получит продукт, разработанный с учетом ее специфики, а возможно, и всей отрасли.

Ключевые тенденции

Во всем мире к 2025 году организации из списка Global 2000 направят более 40% основных ИТ-расходов на инициативы, связанные с ИИ, что приведет к значительному росту инноваций в продуктах и процессах. Этот сдвиг подчеркивает роль ИИ как движущей силы инноваций. А к 2026 году глобальные расходы на ИИ, включая программное обеспечение, оборудование и услуги, превысят $300 млрд.

Будущее сегмента определяют несколько ключевых тенденций и инноваций:

Интеграция ИИ-моделей с open source-компонентами и их дальнейшим «обучением» получит значительное распространение, позволяя предприятиям повысить производительность и экономическую эффективность за счет объединения этих моделей с их частными (или внешними) данными в режиме реального времени. По этому пути уже пошли в Sibnn: они разрабатывают open-source-движок, а его «дообучение» оставляют на стороне заказчиков.
Распространение API упростит создание сложных приложений на основе ИИ, повышая производительность в различных отраслях. К ним относится целый спектр пользовательских инструментов: микросервисы для анализа поведения клиентов, управления запасами, персонализированных маркетинговых и офисных инструментов, включая ИИ-транскрибаторы.
Мультимодальный генеративный ИИ. Это переход к «умным» решениям, объединяющим работу с текстом, речью и изображением, что позволяет получать более контекстуально релевантные ответы. Эта инновация способна изменить впечатления от работы в компаниях за счет синтеза таких разных видов данных, как речь, текст и визуальные подсказки.

Русский путь

Что касается отечественного рынка, то он поддерживает глобальный тренд на использование open-source-движков через парадигму импортозамещения, однако отличается от него индивидуальным развитием продуктов непосредственно бизнесом.

Путем создания собственных решений в этом направлении пойдет множество компаний в РФ. Ну а в том, что касается решения проблемы удовлетворения спроса на этот класс ИТ-инструментов, – здесь всё зависит от самой компании и ее задач.

Существенно этот рынок могут изменить «Яндекс» или «Сбер», особенно если позволят разворачивать свои системы транскрибации на ресурсах заказчиков, в первую очередь корпоративных. В этом случае заказчики смогут встраивать эти инструменты в свои информационные системы. Скорее всего, рано или поздно оба вендора именно так и поступят.

Читайте также

Могут ли российские ноутбуки заменить ушедшие бренды?

Смогли ли отечественные и китайские производители бизнес-ноутбуков в полной мере заменить HP, Dell, Lenovo? Если нет, то чего им не хватает? На прошедшем круглом столе IT-World, проведенном при спонсорской поддержке компании «Рикор», мы обсудили эти и многие другие острые вопросы, ответы на которые попытались найти вместе с представителями компаний — производителей электроники.

Остальные компании будут разрабатывать собственные узкопрофильные ИИ-транскрибаторы как нишевой B2B-продукт, без широких продаж массовому пользователю, максимально развивая и углубляя инструмент в область собственной экспертизы.

Следующим этапом может стать появление на рынке отраслевых ИИ-транскрибаторов, которые будут востребованы в определенных нишах.

Журнал IT Expert [№ 08/2024] Подписка на журналы

Опубликовано 23.07.2024

Об авторах

Иван Болгар

Директор по развитию компании CorpSoft24

Искусственный интеллект AI Распознавание Разработка ПО

Предыдущая
Как работает система аналитики для управления разработкой и тестированием ПО?

Следующая
Разработчики систем ИИ смогут претендовать на гранты размером до 50 млн рублей

Новостная лента

Главное за неделю

Нажимая на кнопку, я принимаю условия соглашения.

Соглашение об использовании сайта

Внимательно прочитайте настоящее Соглашение, прежде чем начать пользоваться Сайтом. Вы обязаны соблюдать условия настоящего Соглашения, заходя на Сайт и используя сервисы, предлагаемые на Сайте. В случае, если Вы не согласны с условиями Соглашения, Вы не можете пользоваться Сайтом или использовать любые сервисы, предлагаемые на Сайте, а также посещать страницы, размещенные в доменной зоне Сайта. Начало использования Сайта означает надлежащее заключение настоящего Соглашения и Ваше полное согласие со всеми его условиями.

1. Термины и определения

1.1. Компания - Общество с ограниченной ответственностью «ИТ Медиа» (ООО «ИТ Медиа»).

1.2. Пользователь - лицо, получающее доступ к сервисам и информации, размещенным на Сайте.

1.3. Сайт – веб-сайт Компании, размещенный в сети Интернет по адресу https://www.it-world.ru.

1.4. Соглашение - настоящее Соглашение между Пользователем и Компанией, устанавливающее правила использования Сайта, включая графические изображения, элементы дизайна и средства индивидуализации, текстовую информацию и документацию, программы для ЭВМ и файлы для скачивания, любые иные произведения, объекты и материалы Сайта, а также условия и правила размещения Пользователем информации и материалов в соответствующих открытых разделах Сайта.

2. Общие положения и условия

2.1. Любые материалы, файлы и сервисы, содержащиеся на Сайте, не могут быть воспроизведены в какой-либо форме, каким-либо способом, полностью или частично без предварительного письменного разрешения Компании, за исключением случаев, указанных в настоящем Соглашении. При воспроизведении Пользователем материалов Сайта ссылка на Сайт обязательна, при этом текст указанной ссылки не должен содержать ложную, вводящую в заблуждение, уничижительную или оскорбительную информацию. Перевод, переработка (модификация), любое изменение материалов Сайта, а также любые иные действия, в том числе удаление, изменение малозаметной информации и сведений об авторских правах и правообладателях, не допускается.

2.2. Действующая редакция настоящего Соглашения размещена в сети Интернет на Сайте по адресу: https://www.it-world.ru/about/agreement.php. Компания вправе в любое время в одностороннем порядке изменять условия настоящего Соглашения. Такие изменения вступают в силу по истечении 2 (двух) дней с момента размещения новой версии Соглашения в сети Интернет на Сайте. При несогласии Пользователя с внесенными изменениями он обязан удалить все имеющиеся у него материалы Сайта, после чего прекратить использование материалов и сервисов Сайта. Ваше регулярное посещение данного Сайта считается вашим убедительным принятием измененного соглашения, поэтому Вы обязаны регулярно просматривать настоящее Соглашение и дополнительные условия или уведомления, размещенные на Сайте.

3. Обязательства Пользователя

3.1. Пользователь обязуется не предпринимать действий, которые могут рассматриваться как нарушающие российское законодательство или нормы международного права, в том числе в сфере интеллектуальной собственности, авторских и/или смежных правах, а также любых действий, которые приводят или могут привести к нарушению нормальной работы Сайта и сервисов Сайта.

3.2. Любые средства индивидуализации, в том числе товарные знаки и знаки обслуживания, а равно логотипы и эмблемы, содержащиеся на страницах Сайта, являются интеллектуальной собственностью их правообладателей. Пользователю Сайта запрещено воспроизводить или иным способом использовать указанные средства индивидуализации и/или их элементы без предварительного письменного разрешения соответствующих правообладателей.

3.3. Компания стремится обеспечить, однако не контролирует и не гарантирует конфиденциальность и охрану любой информации, размещенной на Сайте или полученной с Сайта. Компания принимает разумные меры в целях недопущения несанкционированного разглашения размещенной Пользователем на Сайте информации третьим лицам, однако не несет ответственность в случае, если такое разглашение было допущено. В этой связи, передача информации на Сайт означает согласие Пользователя на любое воспроизведение, распространение, раскрытие и иное использование такой информации. Размещая информацию и материалы, включая, фотографии и изображения, Пользователь также гарантирует, что обладает всеми правами и полномочиями, необходимыми для этого, с учетом условий настоящего Соглашения и что такое размещение не нарушает охраняемые законом права и интересы третьих лиц, международные договоры и действующее законодательство Российской Федерации.

3.4. Пользователь самостоятельно несет ответственность за любую информацию и материалы, размещенные им на Сайте. Компания не инициирует размещение указанной информации, не выбирает получателей информации, не влияет на содержание и целостность размещаемой информации, а также в момент размещения Пользователем информации на Сайте не знает и не может знать, нарушает ли такое размещение действующее законодательство Российской Федерации, однако Компания вправе отслеживать, просматривать и/или удалять любую информацию и материалы, размещенные Пользователем на Сайте. При размещении любой информации и материалов Пользователь не становится соавтором Сайта и отказывается от каких-либо претензий на такое авторство в будущем. Компания не выплачивает Пользователю авторского или любого иного вознаграждения, как в период, так и по истечении срока действия настоящего Соглашения.

3.5. В случае предъявления третьими лицами претензий Компании, связанных с нарушением Пользователем условий настоящего Соглашения, а равно с размещенной Пользователем информацией на Сайте, указанный Пользователь обязуется самостоятельно урегулировать такие претензии, а также возместить Компании все понесенные убытки и потери, включая возмещение штрафов, судебных расходов, издержек и компенсаций.

3.6. Компания не несет ответственности за посещение Пользователем, а также любое использование им внешних ресурсов (сайтов третьих лиц), ссылки на которые могут содержаться на Сайте. Компания не несет ответственности за точность, надежность, достоверность и безопасность любой информации, материалов, рекомендаций и сервисов, размещенных на внешних ресурсах. Использование внешних ресурсов осуществляется Пользователем добровольно, исключительно по собственному усмотрению и на свой риск.

3.7. Компания стремится к обеспечению достоверности информации, размещенной на Сайте, однако не несет ответственности за любые неточности и/или недостоверность информации, а равно сбои в работе предоставляемых через Сайт сервисов. Пользователь согласен с тем, что Компания не несет ответственность и не имеет прямых или косвенных обязательств перед Пользователем в связи с любыми возможными или возникшими потерями, или убытками, связанными с любым содержанием Сайта, интеллектуальной собственностью, товарами или услугами, доступными на нем или полученными через внешние сайты или ресурсы либо иные ожидания Пользователя, которые возникли в связи с использованием размещенной на Сайте информации или ссылки на внешние ресурсы. Ни при каких условиях, включая, но не ограничиваясь невнимательностью или небрежностью Пользователя, Компания не несет ответственности за любой ущерб (прямой или косвенный, случайный или закономерный), включая, но не ограничиваясь потерей данных или прибылей, связанной с использованием или невозможностью использования Сайта, информации, файлов или материалов на нем, даже если Компания или ее представители были предупреждены о возможности такой потери. В случае, если использование Сайта приведёт к необходимости дополнительного обслуживания, исправления или ремонта любого оборудования, а равно восстановления данных, все связанные с этим затраты оплачиваются Пользователем самостоятельно.

3.8. Вся представленная на Сайте информация предоставляется «как есть», без каких-либо гарантий, явных или подразумеваемых. Компания полностью, в той мере, в какой это разрешено законом, отказывается от какой-либо ответственности, явной или подразумеваемой, включая, но не ограничиваясь неявными гарантиями пригодности к использованию, а также гарантиями законности любой информации, продукта или услуги, полученной или приобретенной с помощью этого Сайта.

3.9. Пользователь согласен, что все материалы и сервисы Сайта или любая их часть могут сопровождаться рекламой. Пользователь согласен с тем, что Компания не несет какой-либо ответственности и не имеет каких-либо обязательств в связи с такой рекламой.

4. Условия обработки и использования персональных данных. Принимая условия настоящего Соглашения Пользователь выражает свое согласие на:

4.1. Предоставление своих персональных данных, включающих имя, номера контактных телефонов; адреса электронной почты; место работы и занимаемая должность; пользовательские данные (сведения о местоположении; тип и версия ОС; тип и версия Браузера; тип устройства и разрешение его экрана; источник откуда пришел на сайт пользователь; с какого сайта или по какой рекламе; язык ОС и Браузера; какие страницы открывает и на какие кнопки нажимает пользователь; ip-адрес) своей волей и в своем интересе.

4.2. Цель обработки персональных данных:

предоставление Пользователю услуг Сайта;
направление уведомлений, касающихся услуг Сайта;
подготовка и направление ответов на запросы Пользователя;
выполнение регулярной информационной рассылки;
направление информации о продуктах и услугах Компании, а также рекламно-информационных сообщений, касающихся продукции и услуг Компании и ее партнеров.

4.3. Перечень действий с персональными данными, на которые Пользователь выражает свое согласие:

сбор, систематизация, накопление, хранение, уточнение (обновление, изменение), использование, обезличивание, передача третьим лицам для указанных выше целей, а также осуществление любых иных действий, предусмотренных действующим законодательством РФ как неавтоматизированными, так и автоматизированными способами.

4.4. Компания обязуется принимать все необходимые меры для защиты персональных данных Пользователя от неправомерного доступа или раскрытия.

4.5. Настоящее согласие действует до момента его отзыва Пользователем путем направления соответствующего уведомления заказным письмо с уведомлением на адрес Компании.

5. Прочие положения

5.1. Использование материалов и сервисов Сайта, а равно размещение на нем материалов Пользователя, регулируется нормами действующего законодательства Российской Федерации. Все возможные споры, вытекающие из настоящего Соглашения или связанные с ним, подлежат разрешению в соответствии с действующим законодательством Российской Федерации по месту нахождения Компании.

5.2. Признание судом какого-либо положения Соглашения недействительным или не подлежащим принудительному исполнению не влечет недействительности иных положений Соглашения.

5.4. Бездействие со стороны Компании в случае нарушения кем-либо из Пользователей положений Соглашения не лишает Компанию права предпринять соответствующие действия в защиту своих интересов и защиту авторских прав на охраняемые в соответствии с законодательством материалы Сайта позднее.

Пользователь подтверждает, что ознакомлен со всеми пунктами настоящего Соглашения и безоговорочно принимает их.

По всем вопросам, связанным с нарушением авторских прав Компании, незаконного использования материалов Сайта или размещением ложной, вводящей в заблуждение информации о Компании, просим обращаться по  следующим контактным данным:

ООО «ИТ Медиа» ИНН 7802426999, КПП 781301001,
Санкт-Петербург, ул Большая монетная, 16 / К. 30 литера А, пом. 14-Н №30