Система «Таймлист» решает важную для многих компаний задачу расшифровки записей встреч и совещаний, создания протоколов и резюме. О ее создании и развитии рассказывает Игорь Винокуров, директор по продукту «Таймлист» и номинант на премию Data Award.
- Как появился продукт «Таймлист»?
Продукт появился в результате совместной деятельности компании «1С» и других партнеров. В мае 2023 года было объявлено о создании новой структуры под названием «Таймлист», которая будет заниматься разработкой программного обеспечения для тайм-менеджмента и организации работы предприятий.
Основной нашей задачей является разработка программных продуктов для корпоративного тайм-менеджмента на платформе и в экосистеме «1С». Эти решения призваны стать альтернативой зарубежному ПО, которое покинуло российский рынок из-за геополитических причин.
- В чем суть созданного решения?
Наш искусственный интеллект занимается транскрибацией, и далее это можно всячески анализировать. Система использует ИИ для создания точных стенограмм и автопротоколов встреч, что позволяет компаниям экономить время и ресурсы, ранее тратимые на ручное протоколирование. Мы можем обрабатывать аудио- и видеофайлы любых форматов, предоставляя качественную расшифровку разговоров по спикерам и понятные протоколы.
Решение интегрируется с популярными платформами, такими как «1С:Документооборот» и «Битрикс24», что позволяет быстро превращать информацию из стенограмм в рабочие документы без ручных действий сотрудников.
- Какие бизнес-боли компаний решаются?
Самое главное – это экономия времени: ручное ведение протоколов может занимать много времени, особенно при расшифровке длинных аудиозаписей. Автоматизация позволяет сократить это время до нескольких минут, освобождая сотрудников для более важных задач. При этом ИИ-системы минимизируют риск ошибок, которые могут возникнуть при ручной расшифровке. Это обеспечивает точное и надежное документирование результатов встреч.
Также важно эффективное управление задачами: автоматизированные протоколы позволяют быстро определить ключевые моменты, поручения и сроки, что упрощает управление проектами и повышает производительность команды. Кроме того, автоматизация исключает необходимость в дополнительном персонале для ведения протоколов, что снижает операционные затраты компании.
- Какой математический аппарат использован для создания «интеллектуальной начинки» системы?
Наша команда постоянно совершенствует алгоритмы для повышения качества транскрибации. Для обеспечения максимально удобного доступа к информации разработан ряд специализированных модулей.
Модуль проверки ошибок обеспечивает детальную проверку текста на наличие ошибок после первоначальной транскрибации. Модуль для проверки специфических терминов корректирует терминологию и выбирает правильные термины в соответствии с контекстом. Модуль оценки качества аудио и его улучшения автоматически оценивает, насколько запись пригодна для расшифровки и применяет несколько видов нормализации для повышения качества записей. Сейчас он находится в стадии бета-тестирования. Модуль детоксификации по запросу пользователя заменяет нецензурную лексику и токсичные формулировки. Он также находится на стадии бета-тестирования. Модуль официализации по запросу пользователя меняет исходный текст расшифровки на официальный текст. Модуль разделения текста на абзацы разбивает текст спикеров на короткие фрагменты с учетом их смысла. Модуль диаризации разделяет общую стенограмму одноканальной записи на отдельных спикеров.
Генеративная языковая модель для автопротоколирования совещаний «Таймлист» была обучена и продолжает обучаться на тысячах реальных кейсов встреч российских компаний. В алгоритмы, используемые для создания протокола, постоянно вносятся корректировки на основе обратной связи от пользователей и экспертных знаний команды – нашего «естественного» интеллекта.
- Каковы показатели точности расшифровки, насколько им может доверять тот, кто не присутствовал на встрече и не слышал все вживую? И как система воспринимает специфический сленг?
Система демонстрирует высокую точность расшифровки речи, достигая уровня 97% и выше. Для тех, кто не присутствовал на встрече, точность расшифровки позволяет доверять полученному протоколу, поскольку он включает в себя не только текст, но и тайм-коды, что позволяет легко найти нужные моменты в аудиозаписи.
Что касается восприятия специфического сленга, то система позволяет добавлять уникальные термины для более точного распознавания речи, что может включать специфический сленг или профессиональные термины. Это помогает улучшить точность расшифровки в контексте конкретной отрасли или компании.
- Как быть, когда спикеров много? За счет чего разделяются реплики?
Когда в записи участвует множество спикеров, модуль диаризации играет ключевую роль в разделении их реплик. Диаризация речи – это технология, которая позволяет присвоить имена голосам в аудиопотоке, определяя, кто говорит в каждый момент времени.
Разделение реплик происходит за счет распознавания различий в голосах, таких как тембр, тональность, и другие акустические характеристики. Эти различия позволяют системам диаризации точно присвоить каждую реплику соответствующему спикеру.
Диаризация может работать как с записями, сделанными на диктофон, так и с записями в аудитории. Качество аудио может влиять на точность диаризации, но современные системы, способны обрабатывать различные типы аудиоданных.
- Какие эффекты наблюдают заказчики?
Достигается оптимизация совещаний. Система автоматизирует процесс протоколирования и транскрибации встреч, что улучшает коммуникацию между сотрудниками.
Точная расшифровка аудиозаписей минимизирует ошибки и недопонимания. Это помогает в фиксации ключевых идей, задач и договоренностей, что способствует повышению ответственности сотрудников за выполнение обсужденных пунктов. Происходит улучшение корпоративной культуры: четкие записи совещаний превращают слова участников в реальные действия, что укрепляет доверие внутри команды. Кроме того, стенограммы и протоколы могут быть использованы как ценная база знаний, интегрируемая с другими системами для извлечения дополнительной бизнес-ценности.
- Приведите примеры конкретно достигнутых результатов.
Наши пользователи из «ГПБ Комплект» отмечают, что с помощью «Таймлиста» они четко получают конкретные поручения для конкретных людей, что улучшает управление задачами и исключает ситуацию, когда после долгих обсуждений не принимается никаких решений. В «РЖД-Технологии» использования нашего решения помогает формировать закрытую базу знаний, которая становится ценным активом для компании. Это позволяет сотрудникам получать расшифровки в удобном формате и использовать их для дальнейшей работы.
- Каковы особенности решения?
В первую очередь, это высокая точность транскрибации. За счет использования передовых алгоритмов ИИ достигается действительно высокая точность расшифровки аудиозаписей, что минимизирует ошибки и гарантирует достоверность информации. Не менее важно автоматическое протоколирование: система автоматически генерирует протоколы встреч, что экономит время и ресурсы.
Немаловажно, что «Таймлист» может быть использован как в облачной, так и в локальной версии, что делает его подходящим для компаний разных размеров и отраслей. И стоит отметить централизованное хранение информации: все данные о прошедших встречах хранятся в одном месте, что облегчает поиск и анализ информации.
- В каких направлениях будет развиваться продукт?
Мы планируем развивать свой продукт в нескольких ключевых направлениях. Во-первых, это развитие модуля Q&A. Будет расширено использование технологий обработки естественного языка для создания генеративного модуля, который позволит автоматически отвечать на вопросы на основе содержания встреч. Этот модуль будет интегрирован с чат-ботами для автоматизации ответов на повторяющиеся вопросы.
Во-вторых, будем предоставлять аналитику по различным типам встреч. Это позволит получать более детальную информацию и оптимизировать процессы внутри компании.
В целом, «Таймлист» будет развиваться в комплексное решение для управления знаниями и коммуникацией в компании, превращая каждое совещание в ценный источник информации для дальнейшего анализа и принятия решений.