В некоторых случаях системе нужно вести диалог с пользователем и распознавать его ответы. Для этого требуется не только собственно программный комплекс для распознавания голоса, но и приложение для синтеза речи. Причем распознавание не должно зависеть от пола и тембра голоса говорящего, а также от шумового фона телефонного звонка.
Одну из таких систем, VoiceNavigator, российский разработчик систем распознавания голоса «Центр речевых технологий» внедрил в «ТрансКредитБанке» с помощью системного интегратора «Компьюлинк».
VoiceNavigator содержит три модуля: синтеза речи (VitalVoice), распознавания ответов клиентов (PhoneCom) и аутентификации клиента по тембру голоса (VoiceKey). Продукт интегрируется с любой телефонной станцией, которая поддерживает протокол MRCP, а сценарий для диалога определяется на специально выделенном для этого веб-сервере в формате VoiceXML. Перечисленные стандарты позволяют использовать для построения системы распознавания голоса компоненты и инструменты различных производителей. Поддержка стандартов также позволяет быстро интегрировать полностью российский продукт со станциями таких производителей, как Genesys и Avaya.
Следует отметить, что система не распознает слитную речь и умеет вести диалог только по заранее заданному сценарию. Именно составление этого сценария и является наиболее сложной частью внедрения проекта, поскольку требует взаимодействия клиента и разработчика, чтобы получившееся решение работало эффективно. Например, трудно добиться безошибочного распознавания названий всех российских городов — их слишком много, и часто возникает проблема в различении похожих названий, например городов Томска и Омска.
Большая часть работы над проектом была выполнена интегратором, который не только установил VoiceNavigator у клиента, но и модернизировал телефонную станцию банка, внедрив Avaya Voice Portal 5.0. Специалисты «Компьюлинка» самостоятельно составили сценарий работы системы распознавания, от ЦРТ потребовались только минимальные доработки. Развертывание системы было выполнено за четыре месяца.
Сейчас реализован только пилотный проект системы, которая позволяет клиенту определить адрес ближайшего банкомата. Тестирование выполнялось на двух фокус-группах — внутренней и внешней. Даже для внешних пользователей удалось достигнуть распознавания названий городов в 95% случаев. Для уточнения оставшихся 5% названий система переспрашивала, правильно ли она поняла продиктованный адрес. Важным элементом тестирования была проверка психологической реакции пользователей на распознавание: система предупреждала, что в определенный момент она переходит в режим управления голосом. «Внедрение систем распознавания голоса стоит осуществлять постепенно, — полагает Алексей Рыбаков, руководитель отдела внедрения ЦРТ. — Непродуманные действия могут оттолкнуть пользователей от подобной системы самообслуживания, и результат получится отрицательным».
Синтезатор речи VitalVoice используется для информирования клиентов о состоянии счета, изменении кредитных ставок и предложении новых услуг. Использование для этих целей стандартной системы класса IVR (Interactive Voice Response) оказалось неэффективным. «Пока дикторы записывали необходимые изменения голосового меню, — пояснила Ирина Гармаш, начальник службы клиентской поддержки «ТрансКредитБанка», — данные уже успевали устареть». Впрочем, результаты первых экспериментов так понравились руководству банка, что сейчас планируется внедрение третьего модуля VoiceKey, который «узнает» клиентов по голосу. Этот модуль банк собирается использовать для быстрой идентификации важных клиентов в системе дистанционного банковского обслуживания и для защиты интернет-платежей. Сейчас в «ТрансКредитБанке» до 80% звонков обслуживает существующая система самообслуживания, и банк рассчитывает увеличить этот показатель за счет внедрения описанных выше интеллектуальных речевых технологий.