Интеграция телефона и компьютера: новая технология заставляет менеджеров и администраторов локальных сетей объединить две информационные среды. А вы готовы к революции в средствах связи?
Что в голосе тебе моем?
Никто не станет отрицать, что у администраторов сетей забот полон рот, и, похоже, вскоре к списку их обязанностей прибавится еще одно хлопотное дельце. Имя ему телеком; можно и по-другому - компьютерная телефония или компьютерно-телефонная интеграция (computer-telephony integration, CTI), или как-нибудь иначе в том же духе.
Но дело не в названии, все упирается в то, что в вскоре без этой новой технологии не сможет обойтись ни одна офисная сеть. А когда переход будет завершен - произойдет это довольно скоро, - мысль о раздельных вычислительной и телефонной системах будет такой же странной, как сейчас мысль об офисе без факс-аппарата.
ЧТО ТАКОЕ CTI?
Компьютерно-телефонная интеграция - это набор аппаратных и программных средств, позволяющих применить вычислительные ресурсы офисного компьютера к телефонной сети общего пользования. Данная технология позволит существенно повысить продуктивность даже самой маленькой конторы.
Рассмотрим вначале несколько примеров приложений CTI. В газетном разделе тематических объявлений можно публиковать не номера почтовых ящиков, а добавочные номера телефонов; позвонив по одному из них, заинтересованное лицо может прослушать записанное заранее сообщение, в котором суть предложения описана более подробно, чем на странице газеты. Система компьютерной телефонии, установленная в редакции, соединит даже абонентов с подателями объявлений, разумеется, за плату.
Менеджер отдела технического обслуживания при каком-нибудь автосервисе, звоня по телефону с тоновым набором, вносит изменения в базу данных, для того чтобы оставить голосовое сообщение о готовности автомобиля или запросить подтверждение, когда речь идет о дорогостоящем ремонте. В свою очередь, владелец автомобиля, позвонив дилеру, по номеру техпаспорта автомобиля узнает о его готовности. Система также может быть использована для получения разрешения на ремонт и для передачи менеджеру информации о согласии клиента.
Биржевым брокерам компьютер помогает отслеживать состояние портфеля акций наиболее активных участников торгов; при достижении заранее обговоренного уровня цен, система может сама позвонить клиенту и известить его о происходящем, а при необходимости - оставить голосовое сообщение. Если система дозванивается до самого клиента, она предлагает соединить его с брокером: "Нажмите 1, если вы хотите переговорить с брокером, нажмите 2, если вы хотите оставить для него сообщение".
ЗНАКОМИМСЯ БЛИЖЕ
Большинство приложений CTI работают с телефонами с тоновым набором (dual-tone multifrequency, DTMF, или Touch-Tone). DTMF-это более общее и более правильное наименование для телефонов, в которых используется технология распознавания частот. Touch-Tone - фирменное название марки DTMF-телефонов производства AT&T; оно было придумано в отделе маркетинга этой компании в 60-х годах. Так же как Scotch tape компании 3M или салфетки Kleenex производства Kimberly-Clark, название Touch-Tone стало широко использоваться для наименования всех изделий данного типа, независимо от марки.
В стандарте DTMF каждому из четырех горизонтальных и трех вертикальных рядов клавиш на клавиатуре телефона присваивается своя частота, существует и четвертый вертикальный ряд, используемый военными; клавиши этого ряда обозначаются A, B, C, D.
Как и клетки электронной таблицы, каждая клавиша телефона имеет собственный идентификатор. В данном случае это частота; схемные решения для распознавания таких частот были разработаны примерно 30 лет назад.
Распознавать пульсовой набор гораздо сложнее, чем DTMF. Щелчки, соответствующие разрыву цепи, часто сливаются с шумами на линии. Надежные платы на базе ISA, которые могут реагировать на пульсовой набор так же уверенно, как на DTMF, появились всего несколько лет назад.
ПОДКЛЮЧЕНИЕ
Телефонные линии берутся в аренду у местной телефонной компании. Для небольшой компании или работающего на дому пользователя может хватить и одной-двух внешних линий. Каждая линия имеет свой собственный номер и представляет собой отдельную аналоговую цепь, соединяющую абонентский телефон (дома или в офисе) с ближайшей телефонной станцией. На телефонной станции этот номер оцифровывается и передается дальше.
В небольших компаниях часто используется система ручной коммутации, в которой все входящие линии заведены на все телефоны; у каждого такого телефона одна оранжевая кнопка удержания линии ("Hold") и несколько, по числу входящих линий, белых кнопок. При подобной системе коммутации сотрудников обычно зовут к телефону громким криком: "Сэм, возьми четвертую линию!"
Количество линий, доступных для любой комбинации входящих и исходящих звонков, равно числу линий, арендованных у телефонной компании. Если в организации имеется дополнительное устройство связи (например факс), то приходится либо арендовать еще одну линию (тогда соответствующий номер будет приписан к этому устройству), либо подключать устройство к уже арендованным линиям (тогда устройство будет делить линии с остальными абонентами).
По мере того как компания растет, ей требуется все больше внешних линий. В определенный момент становится выгодным оцифровывать и уплотнить все эти линии в одну цепь в пределах самой организации до точки выхода. Стоимость оборудования, необходимого для оцифровки, уплотнения и разделения каналов, компенсируется выигрышем за счет использования одной широкополосной линии.
Необходимая в таком случае аппаратура получила название учрежденческой телефонной станции (private branch exchange, PBX); в нее может встраиваться разное программное обеспечение. Линия с высокой пропускной способностью - "канал T-1" - поддерживает 24 соединения одновременно. (В Европе и Японии этот канал называется E-14, его емкость составляет 30 соединений).
При установке подобной аппаратуры к учреждению подводятся две обычные витые пары (такие же, как при использовании для двух отдельных аналоговых линий); одна пара - для входящих звонков, другая - для исходящих.
Важное экономическое значение имеет определение числа необходимых линий по числу установленных в офисе телефонов. Удовлетворительное эмпирическое правило состоит в том, чтобы на каждые 100 телефонов было 24 канала (одна линия T-1). Компаниям, весьма интенсивно использующим телефонную связь, может понадобиться много линий, а фирмы, для которых использование телефона не столь актуально, могут обойтись и меньшими ресурсами.
По мере того как в организации появляются приложения CTI, использующие линии без участия человека и даже без использования телефона, данное соотношение существенно изменяется. В учрежденческих АТС можно программным образом запретить подачу сигнала готовности для исходящего звонка, если при этом окажется занятой последняя линия. Тем самым снижается вероятность того, что абонент, пытающийся позвонить в офис, не сумеет этого сделать.
Многие приложения CTI могут быть также запрограммированы таким образом, чтобы при уменьшении числа свободных каналов ниже допустимого предела, не производился даже запрос на предоставление канала для исходящего звонка. Администратор сети и администратор связи должны совместно решить, какая пропускная способность системы способна удовлетворить потребности организации.
Система Centrex занимает промежуточное положение между системой ручной коммутации и PBX. При использовании этой системы телефонная станция сдает в аренду часть каналов связи, а функции PBX выполняются самой телефонной станцией. Система Centrex выполняет большинство основных функций PBX.
Если у компании есть несколько отдельных помещений, расположенных неподалеку друг от друга, выгода от использования Centrex очевидна: часть номеров может быть приписана к одному помещению, а часть - к другому. В этом случае связаться с коллегой, сидящим в соседнем здании, так же просто, как позвонить по внутреннему телефону.
Недостатков у Centrex хватает. Во-первых, оборудование для данной системы нельзя купить, его можно только арендовать; во-вторых, для многих новых приложений CTI необходимо, чтобы сервер приложений CTI был соединен с PBX кабелем последовательного обмена, а это реально только если оба они находятся в помещении компании; в-третьих, компания может воспользоваться новыми функциональными возможностями PBX только после того, как телефонная станция произведет соответствующую модификацию оборудования (но, думается, к тому времени эти функциональные возможности уже утратят свою "новизну").
ОТ СЛОВ К ЦИФРАМ
Если посмотреть на детскую головоломку, в которой надо пронумерованные точки соединять прямыми линиями в соответствии с нумерацией, то глазу предстанет невразумительная мешанина точек и цифр. Но немного усердия - и мешанина превратится в картинку; мы воспринимаем последовательность коротких прямых отрезков как изображение гладкой кривой, тем самым обеспечивается правильная "трансляция" картинки.
Рисунок 1.
Аналоговое представление человеческого голоса. Нижняя половина картинки
- зеркальное отражение верхней.
Оцифровка голоса основана на сходной идее. На Рис. 1 показано аналоговое представление человеческого голоса. Нижняя половина картинки - просто зеркальное отражение верхней. Представьте, что остальная часть изображения поделена на 8000 частей. Если поставить точки в местах пересечения всех секущих линий с кривой, то по этим точкам можно будет впоследствии воссоздать оригинал, не глядя на картинку.
По существу, именно таким образом и оцифровывается голосовой сигнал. Его "дискретизируют", то есть разбивают на 8000 частей в секунду, и определяют, какому из 256 дискретных уровней (от 0 до 255) соответствует амплитуда сигнала на каждом интервале.
Поскольку в одном байте содержится восемь бит, а скорость выборки составляет 8000 дискретов в секунду, для передачи речи требуется 64 Кбит/с. (Запомним это число - оно будет необходимо всякий раз, как придется рассчитывать пропускную способность).
В некоторых алгоритмах сжатия речи принимается во внимание только разность амплитуды между соседними точками. Эта разность оцифровывается по восьмиуровневой шкале (от 0 до 7) и для ее запоминания требуется лишь четыре бита. Другие алгоритмы сжатия основаны на разрежении дискретизации. В обоих случаях, однако, качество передачи голоса резко снижается, особенно при постороннем шуме или когда два человека говорят одновременно.
ISDN, T-1, ДАЛЕЕ ВЕЗДЕ
Конечно, 64 Кбит/с - это довольно много, однако телефонные компании готовы обеспечить такую пропускную способность. Для начала можно завести у себя базовый интерфейс обмена Basic Rate Interface (BRI) сети ISDN, состоящий из двух каналов B и одного канала D (канал B - голосовая линия с пропускной способностью 64 Кбит/с, а канал D добавляет еще 8 Кбит/с для всякой установочной, синхронизирующей и управляющей информации). По мере роста организации можно докупить еще несколько каналов BRI, а потом перейти на первичный интерфейс обмена Primary Rate Interface (PRI), состоящий из 23 каналов B и одного канала D.
Несмотря на то, что ISDN - стандарт международный, он не лишен определенных недостатков. Нельзя, например, самостоятельно "комбинировать" соседние каналы в одну скоростную линию (хотя подобную услугу реально заказать за отдельную плату). Кроме того, канал D зачастую остается свободным; для пользователей PRI это не так уж существенно, однако для тех, кто использует BRI, такая потеря может оказаться весомой. Поэтому для нуждающихся в передаче больших объемов информации линия T-1 более привлекательна.
Северная Америка |
Европа и Япония |
||
T-1C | 48 | E-2 | 120 |
T-2 | 96 | E-3 | 480 |
T-3 | 672 | E-4 | 1920 |
T-4 | 4032 | E-5 | 7680 |
* Для E-3 и более скоростных линий требуется оптоволокно или СВЧ |
Канал T-1 состоит из 24 голосовых каналов (по 64 Кбит/с) и канала на 8 Кбит/с для установки, синхронизации и управления. Простые арифметические действия (умножение 64 000 на 24 и прибавление 8000) дают 1.544 Мбит/с; это и есть пропускная способность канала T-1.
T-1 - это североамериканский стандарт. В Европе и Японии применяется стандартный канал E-1 (в его состав входят 30 голосовых каналов и более широкий управляющий канал). Пропускная способность E-1 составляет 2.048 Мбит/с.
Несомненное достоинство T-1 и E-1 заключается в том, что их суммарная пропускная способность не разбивается на 64-килобитные каналы. Пользователь, желающий использовать 100 модемов по 14.4 Кбит/с каждый, имеет возможность подключить их к одной линии T-1 с пропускной способностью 1.544 Мбит/с (причем ресурс линии даже при такой нагрузке не будет исчерпан до конца). Для некоторых компаний, возможно, не будет достаточно и этого. В Таблице 1 перечислены другие скоростные линии.
Стоимость линии T-1 определяет местная телефонная компания. Чаще всего одна линия T-1 стоит столько же, сколько 8-12 аналоговых линий.
ЭЛЕМЕНТЫ РАСШИРЕНИЯ ДЛЯ КОМПЬЮТЕРНОЙ ТЕЛЕФОНИИ
Среди крупнейших пользователей CTI - крупные телефонные узлы (call center), специальные организации или отделы компаний, в которых операторам приходится отвечать на большое число телефонных звонков. Центры телефонного обслуживания часто организуются для бронирования авиабилетов или гостиничных номеров, а также для торговли по почте.
Некоторые компании используют отдельные телефонные номера для привилегированных клиентов (постоянных пассажиров авиакомпаний, крупных покупателей, а также клиентов, заплативших за дополнительное обслуживание). Часто для совершенствования ценовой политики, торговые компании рассылают по почте каталоги, имеющие разные названия и содержащие одни и те же продукты с разными ценами. Телефонные компании могут помочь в подобного рода деятельности.
Если компания настолько велика, что в ней имеется несколько центров телефонного обслуживания, то можно использовать механизм автоматического распределения звонков (automatic call distribution, ACD), чтобы направлять звонки в тот центр, где в данный момент очередь необслуженных вызовов меньше всего. Механизм ACD подходит и для обычных, и для привилегированных клиентов.
Функция определения набранного номера (dialed number identification service, DNIS) позволяет агенту определить, какой номер набрал данный клиент. Это необходимо, чтобы правильно представляться, снимая трубку (например, "Стол обслуживания Gold Card" или "Спасибо за звонок в компанию Alpha").
Общеизвестно, что автоматическое определение номера (АОН) используется для идентификации абонента. Однако при использовании цифровой связи (ISDN или T-1) возможно получить гораздо более подробную информацию - вместе с телефонным номером сообщаются и географические координаты телефонной станции, обслуживающей данного абонента (знание этих координат позволяет, используя ACD, переключить разговор на ближайшего к абоненту регионального дилера). Но и без ACD техника АОН позволит агенту, отвечающему на телефонный звонок, определить, где находится ближайший к клиенту пункт продажи товаров или бюро услуг.
АОН также дает возможность просмотреть карточку клиента в процессе разговора с ним. Мы пока не привыкли к тому, чтобы телефонные агенты банка или какой-нибудь другой компании, снимая трубку, называли нас по имени. CTI сделает подобное приветствие обычным делом.
Возможности АОН и идентификации звонящего, однако, не безграничны. Если в офисе, откуда исходит звонок, используется ручная коммутация или даже система Centrex, то одному и тому же человеку могут быть приписаны разные номера. Если звонок исходит из компании, где установлена учрежденческая телефонная станция, то АОН сможет показать только основной номер, таким образом, один и тот же номер может соответствовать разным лицам. Компании, использующие АОН, непременно должны учитывать данные обстоятельства.
ЧТО МОЖЕТ ДОБАВИТЬ ПОЛЬЗОВАТЕЛЬ
Возможности CTI производят сильное впечатление, но ими дело не ограничивается: это ведь только то, что предоставляет со своей стороны телефонная компания. Компания-пользователь легко может добавить к этому мощь своих компьютеров и получить совсем уж выходящие из ряда вон результаты.
Первые приложения CTI, появившиеся несколько лет назад, немедленно столкнулись с перегрузками в шине ISA. Необходимые для звонка 64 Кбайт/с оказались за пределами возможностей ISA. Даже MCA, EISA или PCI (которой, собственно, тогда еще не было) не решили этой проблемы.
Пришлось отказаться от этих шин вовсе. Вместо них было предложено использовать Multivendor Integration Protocol (MVIP). В данном стандарте, разработанном компанией Natural MicroSystems (Нэтик, шт. Массачусетс) и принятом во многих ранних разработках CTI, различные платы, встроенные в один и тот же персональный компьютер, соединялись ленточным кабелем, проходившим по верху адаптеров. Кабель содержал восемь пар проводов, по каждой из которых можно было передавать данные со скоростью 2 Мбит/с. Внутри каждой пары выделялись 32 канала; тем самым, шина MVIP обеспечивала одновременную работу 256 голосовых каналов.
Сегодня шина MVIP по-прежнему популярна, однако появился и новый стандарт Signal Computing System Architecture (SCSA), разработанный компанией Dialogic (Парсипанни, шт. Нью-Джерси). SCSA начинается там, где кончается MVIP. Это открытый стандарт, сочетающий в себе мощное аппаратное обеспечение и обычный прикладной интерфейс API.
В состав стандарта входит шина Signal Computing Bus (SCbus), которая вместо 32 каналов MVIP предлагает 2048 временных слотов, тем самым обеспечивая ресурс, достаточный для нормальной передачи видеоинформации (full-motion video), высококачественной передачи звука и еще многого другого, что пригодится для будущих мощных приложений.
А ДЛЯ НАСТОЛЬНЫХ СИСТЕМ ЭТО ХОРОШО?
Конечно, очень приятно знать, что аппаратура обеспечивает все необходимые возможности, однако в них немного смысла, если они недоступны пользователю настольной системы. Вычислительная сеть и телефонная сеть - это, как правило, две независимые кабельные системы, часто идущие параллельно друг другу.
Обе основные компании на рынке систем для настольных машин, Microsoft и Novell, имеют свои собственные решения. Технология Novell, под названием Telephony Services API (TSAPI) - прикладной программный интерфейс телефонных услуг, стала плодом совместных усилий с AT&T. TSAPI реализована как загружаемый модуль NLM на базе сервера; в этой технологии голосовые данные попадают в настольную систему по сетевым кабелям.
В типичных решениях на базе TSAPI, учрежденческая телефонная станция связывается с серверами при помощи кабеля последовательного обмена. Информация о входящих звонках, например, получаемая от систем АОН (кто звонит) и DNIS (кому звонят), передается на сервер, и звонок переключается на адресата. Сервер производит быстрый поиск по базе банных, чтобы определить рабочую станцию адресата и, при необходимости, находит карточку клиента по его телефонному номеру. Полученная информация поступает на рабочую станцию в течение нескольких секунд: на деле это соответствует первому или второму гудку телефона.
Техническое решение Microsoft, получившее название Telephony API (TAPI) - телефонный прикладной программный интерфейс, осуществляет интеграцию на уровне настольной системы. PBX передает звонок и информацию от систем АОН и DNIS на настольный телефон, как это обычно и делается. В некоторых случаях телефон и компьютер соединяются кабелем последовательного обмена, в других случаях телефонная линия подключается непосредственно к адаптеру, а уже потом к телефону (как в модемах).
Поиск по базам данных и экранный интерфейс производится программным обеспечением рабочей станции, которое может быть использовано и для осуществления более сложных функций, например переключения звонков и организации конференций.
Оба решения имеют свои достоинства и недостатки. Если звонок адресован центру телефонного обслуживания, где неважно, к какому агенту он попадет, то предпочтительнее использовать TSAPI. Здесь можно произвести поиск по базе данных и одновременно найти наиболее доступную рабочую станцию, а потом уже переключить звонок.
С другой стороны, голосовые данные, передаваемые по компьютерной сети, будут участвовать в конкуренции за ее ресурсы, которых часто не хватает. В системе TAPI все звонки не выходят за рамки телефонной кабельной системы.
TAPI - технология для рабочих станций, поэтому она не требует дополнительных затрат (она включена и в Windows 95, и в Windows NT Workstation). Однако администратору необходимо следить за тем, чтобы все данные компании хранились на сервере, а не на рабочих станциях. Платы, выполняющие сложные функции, вроде преобразования текста в речь (text-to-speech, TTS), стоят около 5000 долларов. Установить такую плату на сервер вполне возможно с финансовой точки зрения, однако устанавливать их на рабочие станции было бы безумием.
ЗАЧЕМ НУЖНА CTI?
Из всех вышесказанных комментариев на Конференции и выставке по компьютерной телефонии (Computer Telephony Conference and Exhibition), прошедшей в Далласе этой весной, наиболее часто с удовлетворением отмечалось, что на рынке наконец-то появились соответствующие продукты. Прежние выставки скорее напоминали конференции разработчиков, где производители демонстрировали пробные образцы и искали стратегических партнеров. Некоторые продукты знаменовали собой появление важных направлений развития.
На нынешней выставке наиболее часто встречались интегрированные приложения типа "все в одном". Выставлялось огромное множество привлекавших всеобщее внимание продуктов, позволяющих одновременно просматривать голосовую почту, факсы и электронную почту на экране монитора. (Значительный выигрыш в производительности достигается при использовании приложений, воспроизводящих вначале срочные сообщения, что особенно чувствуется после кратковременного отсутствия).
Было представлено много продуктов для отсылки факсов (fax-back). Однако это были уже не те программы, к которым мы привыкли, поскольку новые версии, подобно функции mail-merge, позволяют добавлять в факсы информацию, затребованную клиентом.
Например, система fax-back в брокерской конторе может не только идентифицировать абонентов при помощи АОН, но и зачитывать или отсылать факсом котировки на момент закрытия торгов. В последнем случае факс будет формироваться "на лету". Кроме того, клиент может получить самые последние рекомендации относительно любых акций компании, введя соответствующий символ по DTMF.
Другая широкая категория продуктов, представленных на выставке, - преобразование текста в речь и распознавание речи. Большинство плат, используемых для TTS, все еще выдают "речь пьяного сапожника" (термин, используемый в промышленности для обозначения отсутствия интонаций в ранних разработках TTS). Немалым достижением за последний год стало то, что теперь можно выбирать между "пьяным" мужчиной и "пьяной" женщиной. Разумеется, главная проблема, стоящая перед разработчиками, состоит в постановке ударений в предложениях и абзацах, без которых речь лишена интонаций.
В распознавании голоса свои задачи. Системы путаются в местных диалектах; определенную трудность представляют проблемы вроде слитного произношения слов (например, большинство людей произнесут словосочетание "юг горы" с одним "г" - получится "югоры"); осложнения возникают и для некоторых омонимов (кстати, как отличить предлог "для" в предыдущем предложении от деепричастной формы глагола "длить"?); помимо этого, существуют слова типа "клоп" и "клуб", с ними тоже приходится трудновато, если только звонящий не обладает идеальной дикцией.
Но все это не значит, что время для CTI еще не пришло. Вовсе нет! Это значит, что простор для деятельности необъятен. Думается, с использованием быстрых машин и многозадачных операционных систем кое-какие проблемы удастся решить; например, программа проверки грамматики, запущенная в процессе диктовки, поможет устранить ошибки, связанные с омонимами.
Тот факт, что совершенствуя CTI, мы прокладываем себе дорогу в будущее, очевиден. Без CTI представить новую техническую эпоху невозможно.
Стив Калман - совладелец в TigerTeam (Лордз Вэлли, шт. Пенсильвания), компании, занимающейся переводом на новые Windows-платформы. С ним можно связаться через CompuServe по адресу: 76702,3564.
ПОЧЕМУ НУЖНО ИМЕННО 8000 ДИСКРЕТОВ В СЕКУНДУ?
Что в голосе тебе моем?
Когда телефонная связь была полностью аналоговой, и никаких проводов, кроме медных, не было, поток сигналов между двумя телефонными станциями уплотнялся в широкополосный коаксиальный кабель. Чтобы обеспечить максимальное использование кабеля, голосовые сигналы фильтровались, так чтобы остались только звуки в пределах диапазона в 4000 циклов в секунду.
Уже довольно ранние исследования Bell Labs показали, что большинство голосов группируются в диапазоне около 1000 циклов в секунду, причем мужские голоса несколько ниже этой частоты, а женские - несколько выше. Выше 2000 циклов попадают индивидуальные оттенки, благодаря которым голоса можно узнавать, правда на разборчивость речи это практически не влияет.
Частотами выше 3500 циклов обладают очень немногие голоса, поэтому все, что выше 4000 циклов в секунду, может быть отброшено без ущерба для воспроизведения речи. (Добавим еще, что Audiometer, прибор для проверки слуха, работает на частотах от 500 до 4000 циклов). Этот отфильтрованный сигнал затем сдвигался по частоте и передавался по кабелю. На приемном конце выполнялось обратное преобразование.
В результате применения теоремы Найквиста, согласно которой исходный аналоговый сигнал можно полностью реконструировать по цифровой кодировке в том случае, если частота дискретизации вдвое превышает максимальную частотную составляющую кодируемого сигнала, скорость оцифровки равна 8000 циклов в секунду. Поскольку максимальная частота, содержащаяся в фильтрованном телефонном сигнале, составляет 4000 циклов в секунду, частота дискретизации, не ухудшающей качество, составляет 8000 циклов в секунду.