Обычно в качестве основных приложений компьютерной телефонии, предполагающей интеграцию телефона и компьютера (CTI) понимают что-то типа рабочего места электронного секретаря, в функции которого входит автоматическая маршрутизация звонков и речевой корреспонденции с подключением к базам данных для организации быстрого реагирования на запросы. Однако, сегодня доля таких - активных средств на рынке компьютерной телефонии реально не превышает 30%, а остальные 70% образуются за счет, так называемых, пассивных систем. Долгое время такие приложения, а именно: регистрация звонков, фильтрация сигналов, архивирование телефонных разговоров в присутственных местах (медицинские учреждения, пожарные части, правоохранительные органы, финансовые учреждения, аэродромные службы и т.п.) не относились к компьютерной телефонии - все операции выполнялись на аналоговом уровне путем использования чисто аппаратных решений. Сегодня, после появления, кстати впервые именно в России, компьютерных систем регистрации, использующих не традиционные ленточные магнитофоны, а дисковые накопители различных типов, данная область компьютерной телефонии получила мощный импульс к развитию.
Компьютерная система записи звуковых сообщений, предназначается для многоканального накопления в упакованном цифровом виде аналоговых звуковых сигналов определенного диапазона частот. Регистрирующая система должна обеспечивать запись в защищенном режиме информации, поступающей по теоретически неограниченному числу каналов; оперативное прослушивание любого канала с произвольного места, причем одновременно с многоканальным накоплением; архивирование информации на дисковых накопителях с возможностью фрагментарной, выборочной записи и копирования; предоставление удобных средств работы с записями в архиве (прослушивание, фильтрация, редактирование и т.п.). Кроме этого предполагается, что в зависимости от области применения суммарный объем записи может варьироваться от нескольких часов до нескольких месяцев.
Ряд компаний и организаций вкладывают сегодня значительные средства в высокотехнологичные системы PBX (внутренняя телефонная система) или, иначе, УАТС (учрежденческая автоматическая телефонная станция), предоставляющие широкий спектр вариантов по управлению и обработке самых разнообразных звонков. Однако, в действительности, множество потенциальных возможностей таких систем остается невостребованными и не используются по причине сложности - размещение средств доступа к данным возможностям на экране компьютера в виде панели, напоминающей пульт управления видеомагнитофона позволяет значительно облегчить процесс работы.
Включение компьютера в уже совсем не новую технологию регистрации телефонных разговоров - это не просто добавление нового элемента в старую технологическую цепочку, а возможность получить интегральный эффект от координации всех приложений, имеющих отношение к телефонии. Поэтому технологии, на основе которых строятся сегодня CTI, кроме естественной масштабируемости должны позволять организовывать доступ к базам данных, системам идентификации, основанным на использовании разнообразных биометрических методов, геоинформационным системам и т.п.
В Академии МВД была создана единая технология DEX (Digital EXpert), задача которой состоит в выполнении на основе цифровой экспертизы различного рода функций распознавания: визуального, речевого и т.п., а также построении интегрированных многофункциональных комплексов. В основу данной технологии был положен принцип деления на разные уровни взаимодействия: межпроцессорный уровень, связь по периферийной шине, взаимодействие с локальной сетью и уровень глобального взаимодействия. Все уровни строятся только на основе стандартных протоколов транспортного уровня, типа SCSI, IPI или IPX, без использования каких-либо системных инструментальных средств и операционных сред. Результатом применения данной технологии стало не только создание системы компьютерной телефонии, но и работающих в тесной связке с ней систем дактилоскопического анализа, мобильной связи и СУБД, позволяющей обрабатывать сложные многокритериальные запросы.
Одним из функциональных пакетов, использующих данную технологию является DEXVOX, предназначенный для автоматической записи и обработки телефонных разговоров и факс/модемных сообщений, одновременно поступающих по теоретически неограниченному числу каналов. Время записи содержательной части разговора системы за счет масштабирования может составлять от одной недели до нескольких месяцев. Полное перечисление возможностей и сфер применения данной системы затрудняется ее спецификой, поэтому на этом можно закончить и перейти к изложению общих принципов функционирования пассивной системы компьютерной телефонии DEXVOX.
Составные части пассивного компонента компьютерной телефонии
Полная технологическая цепочка обработки телефонных вызовов содержит пять основных блоков: подключение к линии, сжатие, распознавание речи, компьютерная регистрация и преобразование "текст-речь". Первые четыре блока образуют пассивный компонент компьютерной телефонии и только добавляя пятый мы имеем дело с активной телефонией, наиболее часто упоминающейся сегодня в прессе. На рис. 1 представлена общая архитектура организации многоканального телефонного обслуживания в рамках одной организации.
(1x1)
Рис. 1. Архитектура многоканальной системы регистрации на базе DEXVOX.
Сигнал от АТС проходит через PBX или УАТС и попадает на телефонный аппарат сотруднику. Попутно идет перенаправление сигнала в сеть, объединяющую многоканальные устройства регистрации - DEXVOX/T и блоки анализа телефонных разговоров - DEXVOX/A или DEXVOX Players. При перенаправлении разговоров, поступающих одновременно с 32 и более каналов (максимально требуемая на сегодняшний день конфигурация составляет 1000 каналов) в локальную сеть происходит оцифровка всего звукового потока целиком, его сжатие и запись. Блок регистрации (DEXVOX Recorder) автоматически осуществляет запись информации в режиме непрерывного, круглосуточного функционирования по принципу 7-24-365. Каждый блок DEXVOX/T способен обрабатывать от 32 до 64 каналов, поблочно записывая информацию в реальном масштабе времени непосредственно на диск, используя для этого только команды периферийного контроллера. На рис. 2 приведена архитектура такого блока, построенного на базе стандартной материнской платы с любым процессором Intel. Выполнение задач по распознаванию речи, поддержка импульсного и тонального набора, а также сжатие звука, например по GSM 6.10 (6.20), осуществляется параллельно в режиме многопроцессорной обработки.
(1x1)
Рис. 2. Архитектура модуля DEXVOX Recorder.
При попадании в блок анализа происходит выделение и обработка необходимых фрагментов разговоров, прослушивание и маркировка. Работа блока DEXVOX/A может осуществляться в одном из трех режимах: оперативном, реального времени и по запросу. Со своего рабочего места оператор в соответствии с делегированными ему полномочиями имеет прямой доступ к любому из зарегистрированных разговоров, проводя анализ в режиме прослушивания сквозных каналов, работы с каталогами сквозных каналов и прослушивания разговоров. Масштабирование в системе осуществляется путем простого подключения дополнительного блока регистрации и/или анализа.
Как видно из рис. 2, все основные функции компьютерной телефонии присутствуют в системе DEXVOX, мало того, в ней уже имеются зачатки активной системы - во время разговора абоненты могут обмениваться паролями или посылать тоновые сигналы, что используется в дальнейшем для установки меток. С точки зрения работника организации, данная система является источником вызова, который может установить имя объекта путем фильтрации через компьютерную систему и сортировки, идентифицирующей специалиста, способного наиболее квалифицированно обработать поступивший звонок или выполнить иные функции в соответствии со своими должностными обязанностями. Система контролирует отсев звонков, используя полную, а не выборочную, регистрацию, помогает на основе специальных методов выявить эмоциональное состояние абонента. Все это происходит автоматически, без привлечения оператора, предусматривая вмешательство эксперта только в случае необходимости.
Важной отличительной особенностью любой программной системы является простота и наглядность интерфейса - любые попытки разработчиков навязать пользователю сложные правила взаимодействия, облегчающие жизнь программиста, а не оператора системы обречены на провал. Система DEXVOX имеет достаточно наглядный и простой интерфейс в виде виртуальной панели управления, напоминающей пульт бытового магнитофона (рис. 3).
(1x1)
Рис. 3. Главная панель управления.
На панели расположены переключатели сквозных каналов, управляющие клавиши: громкость, воспроизведение, перемотка, маркировка. В качестве элементов индикации используется амплитудный график текущего разговора, показатель текущего времени, указатель длительности, АОН, индикаторы даты и текущего маркера. Как видно, элементы управления достаточно просты и наглядны, в результате время освоения системы измеряется несколькими часами, что, учитывая широкий рынок применения данных комплексов и специфику их использования оказывается как нельзя кстати.
Среди одной из интересных функций системы DEXVOX можно назвать фильтрацию и выделение информации, содержащей конфиденциальные сведения. Ясно, что, в зависимости от конкретного приложения, критерии конфиденциальности могут быть разные, поэтому, несмотря на кажущуюся простоту в системе предусмотрена возможность настройки фильтров (рис. 4). Пользователь может, например, задавать словарь "наиболее интересных" терминов и словосочетаний, подлежащих выделению, определять порядок реагирования по факту выявления утечки информации или подключать к анализу разговоров дополнительные системы.
(1x1)
Рис. 4. Установка фильтров.
Базы данных уже давно были тесно связаны с телефонией, например телефонный номер может быть ключом, используемым для разных целей, а анализатор голоса, действующий в составе фильтра, позволяет в режиме реального времени, еще во время разговора сформировать обращение к нужному разделу соответствующей базы данных. Непосредственно в системе DEXVOX можно организовать работу с каталогами доступных архивов, расположенных либо на локальном жестком диске, устройстве магнитооптической записи или на любом из накопителей включенных в локальную сеть. При работе с каталогом можно выбрать из него запись нужного разговора, выделить фрагмент, скопировать его в любой другой доступный архив или удалить. Кроме этого можно организовать прослушивание разговоров из архивов в режиме непрерывного или фрагментарного воспроизведения, организовать "перемотку" или зацикливание прослушивания.
Несмотря на свой специфический характер система DEXVOX является открытой и поддерживает стандарты TAPI и TSAPI, обеспечивающие более тесную интеграцию с телефонными книгами и другими сетевыми ресурсами уже используемыми пользователем, что улучшает выполнение, например, таких операций как установка приоритетов очередности телефонных вызовов. Следование стандартам не было, как это часто бывает самоцелью - только ради получения дополнительных баллов при сопоставлении с альтернативными коммерческими системами. Многие точки, где проходят установки данной системы уже достаточно хорошо компьютеризированы, у ряда заказчиков давно используются локальные сети различных конфигураций и типов протоколов, поэтому следование стандартам является вполне естественной и логичной стратегией.
Послесловие
Система DEXVOX уже позволила повысить эффективность работы группы сотрудников ряда подразделений, отвечающих за прием звонков, поступающих по линиям "02" и содержащих информацию по разного рода правонарушениям, угрозам, сообщениям с мест преступлений и т.п. Благодаря гибкости система умеет работать с существующим оборудованием и базами данных без дорогостоящих модернизаций, интегрируясь с другими приложениями, например, с текстовыми процессорами или программами работы с устройствами передачи факсимильной информации. Система обладает возможностью развития в соответствии с требованиями заказчика, что предполагает не только наращивание в размерах, но и включение новых свойств и функций.
Используемая в системе технология позволяет создавать масштабируемые комплексы компьютерной телефонии, способные записывать весь поток поступающих звонков. Средства анализа и редактирования сообщений дают возможность работать с массивами информации, накопленными за достаточно продолжительный период времени, заведомо превышающий требуемый в современных приложениях. Уместно заметить, что вся аппаратная часть выполнена российскими специалистами на отечественных печатных платах. Как следствие этого, совсем на другом уровне решаются вопросы сертификации, надежности, сопровождения и ценообразования - по самым скромным подсчетам система имеют стоимость в 5-10 раз ниже немногочисленных зарубежных аналогов. Кроме этого, исповедуемый в зарубежных системах принцип "зашивания" в микросхемы алгоритмов, выполняющих только определенные функции часто приводит к излишнему разрастанию комплекса, требуемого для решения конкретных практических задач.
В качестве перспективных приложений, использующих технологию DEX сегодня, по заказам ряда пользователей, ведутся работы над мультимедийными задачами, предполагающими обработку не только разговоров, но и изображений (например лица человека или его отпечатков пальцев), а также видеоматериалов.
Владимир Минаев, Академия управления МВД России, (Москва).