по IP и дадим некоторые советы относительно выбора "лучшего в своем роде" решения.
Все голосовые вызовы IP-телефонии похожи друг на друга тем, что в какой-то момент (обычно на самом продолжительном участке маршрута вызова) речь передается по сети IP - локальной, глобальной или Internet.
При этом почти все принципы традиционной телефонии переворачиваются "с ног на голову". Коммутируемая сеть передачи речи предоставляет выделенный маршрут для каждого вызова, который гарантирует минимально необходимую для передачи голоса пропускную способность. В сети IP (по крайней мере, если она не оптимизирована специально для передачи голосового трафика) такая гарантируемая сетью модель вызова не действует. Пакеты проходят путь от отправителя до получателя через путаницу маршрутизаторов и соединений с различной скоростью по различным маршрутам, за которые они к тому же вынуждены конкурировать с другими пакетами. Каждый маршрутизатор знает только о следующем транзитном узле в цепи маршрутизации. Сеть в целом не предоставляет никаких гарантий относительно скорости доставки данных, порядка пакетов и даже относительно самой доставки.
С точки зрения компьютерных специалистов, такая сеть имеет чрезвычайно элегантную архитектуру. Сеть IP может быть построена из достаточно "неинтеллектуальных" (а значит, дешевых) компонентов. Она может наращиваться в любых своих частях, и при этом не нуждается в жестком централизованном планировании или инфраструктуре управления. До некоторой степени такая сеть является даже "самовосстанавливающейся" - если взять и вынуть какой-либо маршрутизатор, то пакеты найдут путь в обход него.
Платой за такую элегантность решения является некоторая степень неопределенности. Картину трафика в ячеистой гетерогенной сети IP трудно предсказать. Алгоритмы расчета оптимальных маршрутов поглощают значительную часть вычислительной мощности (всевозможные варианты известной "проблемы коммивояжера"). Найденное решение ко времени его воплощения может оказаться неверным - "наилучший маршрут" уже в следующий момент времени может быть другим.
Умные головы в отрасли связи предлагают разные способы решения этих проблем. Они изобретают распределенные стратегии самомаршрутизации на базе теории "нейронных сетей". Они создают "управляемые сети IP" с целью обеспечения необходимой пропускной способности для голосового трафика. Они вводят сегменты магистрали ATM для маршрутизации на большие расстояния и виртуальной коммутации. Они разрабатывают сверхбыстрые маршрутизаторы с приоритетом для голосовых пакетов. И, наконец, они придумывают стандартизованные протоколы "с фиксацией маршрута", с помощью которых конечные точки и привратники IP-телефонии могут задать виртуальный путь прохождения вызова через "газовое облако" IP.
Пока эти предложения не реализованы, продуктам для IP-телефонии приходится иметь дело с такими проблемами, как переменная задержка в сети, множество маршрутов, непредсказуемая конкуренция за пропускную способность. Эффективные решения сочетают сложную предварительную обработку со сжатием для сокращения объема передаваемых данных, сохранения качества воспроизводимого звука и подавления эффекта переменной задержки.
Ниже мы перечисляем, что пользователь вправе ожидать от "лучших в своем роде" решений.
1. Устранение всех нежелательных компонентов из входного аудиосигнала. Нет никакого смысла передавать данные, делающие речь менее четкой. После оцифровки речи устраните эхо из динамика в микрофон, комнатное эхо и непрерывный фоновый шум (например, шум от вентиляторов), а также отфильтруйте шумы переменного тока на низких частотах звукового спектра.
H.323 позволяет создать надежные решения для организации коммуникаций по ненадежным сетям с переменной задержкой. При условии соответствия стандарту устройства с различными возможностями могут и взаимодействовать друг с другом. Например, терминалы с видеосредствами могут участвовать в аудиоконференции. Иллюстрация предоставлена DataBeam.
Эффективное эхоподавление и уменьшение шумов абсолютно необходимо в любой конфигурации с "открытым микрофоном" с громкоговорителем на базе ПК - как для традиционной, так и для IP-телефонии. Эти функции все в большей мере реализуются аудиокомпонентами ПК, так что сама система IP-телефонии может их и не иметь. Шлюзам IP-телефонии требуется выполнять меньший объем предварительной обработки, нежели конечным решениям, потому что УАТС и телефонная сеть обеспечивают фильтрацию и уменьшение шумов.
2. Подавление пауз в речи; распознавание остаточного фонового шума (внешних шумов) и кодирование для восстановление на дальнем конце; то же самое для опознаваемых сигналов. Нет никакого смысла тратить пропускную способность на передачу "звука повисшей тишины". Паузы лучше всего полностью подавлять на ближнем конце. Для сохранения окружающих звуков смоделируйте фоновые шумы, чтобы система на дальнем конце могла восстановить их для слушателя. Проанализируйте DTMF и другие сигналы и замените их на короткие коды для восстановления на дальнем конце (или для непосредственной обработки). Возможные проблемы: из-за того, что функция подавления пауз активизируется, когда громкость речи становится ниже определенного порога, некоторые системы обрезают начала и концы слов (в периоды нарастания и снижения энергии речи).
3. Сжатие голосовых данных. Сжать оцифрованный голос можно разными способами. В идеале решения, используемые для IP-телефонии, должны быть достаточно быстрыми для выполнения на недорогих DSP или ЦПУ, сохранять качество речи и давать на выходе небольшие массивы данных.
Современные продукты для IP-телефонии применяют самые разные кодеки, стандартные и нестандартные. Конкурентами являются кодеки GSM (13,5 Кбит/с) и кодеки ITU серии G, использование которых предусматривается стандартом H.323 на связь по IP. Единственным обязательным для применения кодеком в H.323-совместимых продуктах остается G.711: выдаваемые им массивы данных составляют от 56 до 64 Кбит/с - слишком много для практической Internet-телефонии, но как раз то, что надо для высококачественной голосовой связи по локальным сетям. В качестве дополнительных высокопроизводительных кодеков стандарт H.323 рекомендует G.723 и G.729 - последние способны сжимать оцифрованную 16-разрядную ИКМ-речь длительностью 10 мс всего в 10 байт. G.729 уже получил широкое распространение в системах передачи голоса по IP; его поддерживают несколько производителей продуктов для IP-телефонии, а также множество тех, кто ничего не заявлял о своих планах относительно этого стандарта.
4. Нарезание сжатых голосовых данных на короткие сегменты равной длины, их нумерация по порядку, добавление заголовков пакетов и передача. Хотя TCP/IP поддерживает пакеты переменной длины, их использование затрудняет достижение устойчивой и предсказуемой межсетевой маршрутизации в голосовых приложениях. Маршрутизаторы быстро обрабатывают небольшие пакеты и рассматривают обычно все передаваемые по одному и тому же IP-адресу пакеты одного размера одинаковым образом. В результате пакеты проходят по одному маршруту, так что их не надо переупорядочивать (см. ниже).
5. Прием и переупорядочивание пакетов в адаптивном "буфере ресинхронизации". Интеллектуальная обработка потерь или задержек пакетов. Главной целью здесь является преодоление влияния переменной задержки между пакетами. Решение этой проблемы состоит в буферизации достаточного числа поступающих пакетов (при отложенном их воспроизведении) с тем, чтобы воспроизведение было непрерывным, даже если время между поступлением пакетов сильно разнится. Лучшие продукты для IP-телефонии моделируют производительность сети и регулируют размер буфера ресинхронизации соответствующим образом - уменьшая его (сокращая задержку перед воспроизведением), когда сеть ведет себя предсказуемым образом, и увеличивая в противоположной ситуации.
Что случится, если один или более пакетов не поступит в разумный промежуток времени? Большинство систем проигнорирует потерянные пакеты при воспроизведении (и удалят их, если они все же будут получены). На практике потеря одного пакета - обычно фрагмента речи длительностью 10 мс - никак не скажется на четкости речи. Потеря (или чрезмерная задержка) нескольких последовательных пакетов будет восприниматься как "пропуск".
СТАНДАРТЫ
Большинство наиболее популярных продуктов для IP-телефонии в процессе своей эволюции включили все компоненты вышеприведенной стратегии. В настоящее время они реализуют ее уникальным образом, т. е. они не совместимы друг с другом. Несмотря на то что последнее время кодек G.729 завоевывает все большую популярность, он представляет собой лишь один из необходимых элементов для того, чтобы устройства IP-телефонии различных производителей могли работать друг с другом. Стандарты нужны также для управления пропускной способностью, для сигнализации, подачи вызова и т. п. Еще важнее наличие стандарта, в соответствии с которым различные коммуникационные IP-устройства могли бы передавать друг другу информацию о своих возможностях, - это позволит им обмениваться сведениями о взаимоприемлемых коммуникационных протоколах.
H.323 описывает кодеки для сжатия голоса и видео, протоколы для транспорта пакетизированного голоса и протоколы для согласования параметров, подачи вызовов и сигнализации. Терминалы могут установить соединения "точка-точка" друг с другом напрямую или при посредничестве привратника. В тех случаях, когда привратник затрудняет работу, терминалы могут попросить преобразовать соединение через привратника в соединение "точка-точка". Иллюстрация предоставлена DataBeam.
В конце 1996 года ITU ратифицировал комплексный стандарт H.323, целью принятия которого было согласование всех требований к IP-телефонии, видеоконференциям и конференциям данных как в конфигурациях "точка-точка", так и "группа-точка". H.323 определяет стандарты для четырех типов устройств: терминалов, шлюзов (устройств, осуществляющих преобразование протоколов, например H.323 в H.320), привратников (систем, управляющих вызовами и пропускной способностью, которые не являются обязательными, хотя терминалы H.323 должны их использовать, если таковые имеются в сети) и MCU (многоточечными устройствами управления, служащими для организации конференций и широковещания).
Чтобы быть полностью совместимым с H.323, терминальное устройство IP-телефонии должно поддерживать по крайней мере один стандартный аудиокодек (G.711) и факультативно несколько других (G.711, G.729), а также протокол реального времени (Real Time Protocol) для передачи аудио - он обеспечивает стандарт на упорядочивание и обработку пакетов в случае ненадежных соединений. Голосовые терминалы H.323 должны быть совместимы с H.245 для обмена и согласования параметров, со стандартом на подачу вызова Q.391, а также с протоколом RAS для взаимодействия с привратниками. H.245 является чрезвычайно сложным стандартом, поскольку, помимо всего прочего, он рассматривает видеоконференции и конференции документов; урезанная версия под названием H.245 Profile 1 для голосовых терминалов находится пока на стадии обсуждения.
Терминалы H.323 (и "почти H.323") уже появились - так, NetMeeting компании Microsoft уже включает его, как, впрочем, и Internet Phone компании Intel. Создатели продуктов для инфраструктуры IP-телефонии планируют со временем ввести поддержку H.323. Как много времени это займет, зависит от нескольких неизвестных величин. Современный стандарт чрезвычайно сложен даже без видеоконференций и конференций данных.
Однако проблемы скорее всего будут разрешены уже в ближайшее время. Telogy Networks (создатель системы Golden Gateway для стандартных DSP) и RADVision (разработчик первого полного платформенно-независимого стека протоколов H.323) подписали протокол о намерениях начать адаптацию своего программного обеспечения. Такого рода объединение сил должно ускорить появление на рынке работоспособных решений.
Что вам требуется купить?
Правильное планирование позволит вам получить некоторые из ключевых преимуществ IP-телефонии прямо сейчас и в то же время занять выгодную позицию для последующего внедрения быстро совершенствующей технологии. Опираясь как на собственный опыт нашей лаборатории, так и на опыт работы демонстрационного зала на выставке Computer Telephony Expo'98, мы готовы дать рекомендации относительно того, что вам потребуется приобрести для IP-телефонии в ближайшие полгода.
1. Сегодня. Получите бюджет для факсимильной связи по IP-телефонии у оператора шлюза. Такие операторы предоставляют "точки входа" в сеть в крупнейших городах США и мира. Позвонив на ближайшую точку входа и набрав PIN и номер абонента, вы сможете отправить факс с большой скидкой по сравнению со стандартной платой за международные звонки.
Это позволяет получить экономию немедленно. Никакого специального оборудования не нужно. Качество будет тем же самым или даже лучше, чем то, которого вы можете добиться при прямом звонке. Кроме того, такое соединение может функционировать быстрее. Вдобавок вы сможете таким образом подготовить свое начальство и коллег к шагу 2.
2. В ближайшие три месяца. Купите комплект IP-факсов (или IP-совместимых факс-серверов) для своих региональных офисов. Некоторые IP-факсы требуют наличия "всегда готового" соединения между локальной сетью и Internet и передают факсы почти в режиме реального времени. Другие используют серверы электронной почты Internet в качестве посредников, так что они могут задействовать промежуточный коммутируемый доступ в Сеть через пользовательский бюджет Internet с динамической IP-адресацией. В любом случае вы сможете передавать факсы между офисами практически без дополнительных затрат с высокой степенью надежности. Многие IP-факсы могут также передавать факсимильные сообщения в общедоступную телефонную сеть для доставки по телефонным номерам по соседству с конечными точками - по сути, вы получаете бесплатную факсимильную связь между крупными городами, в которых находятся ваши офисы.
Факсимильная связь по Сети работает столь хорошо, что было бы глупо не приобрести то или иное аппаратное обеспечение для снижения затрат на передачу факсов между офисами. Если только у вас нет многочисленных офисов, то вы вряд ли станете отказываться от своего бюджета в сервисном бюро для передачи факсов удаленным адресатам вне офисов.
3. Сегодня. Получите бюджет у провайдера голосового шлюза IP. Благодаря этим операторам альтернативной связи вы можете позвонить по Сети с любого телефона по цене около 5 центов за минуту внутри США и 9 центов в минуту за океан (такие низкие цены возможны обычно только при условии приобретения бюджета на традиционную междугороднюю связь у оператора, в чьем ведении этот шлюз находится).
Дешевые голосовые звонки можно осуществлять по IP без каких-либо дополнительных затрат на оборудование. Вызовы передаются обычно по управляемой сети IP (а не по неуправляемой Сети), так что качество звука довольно высоко, а задержки минимальны. Настоящая же причина приобретения подобного бюджета состоит в том, что таким образом вам будет легче убедить свое начальство и коллег в том, что IP-телефония представляет собой вполне работоспособное решение. Если вам приходится убеждать в необходимости приобретения шлюза стоимостью 1000 долларов за порт для передачи голоса по вашей глобальной сети, трудно придумать более весомый аргумент, чем возможность снять трубку, набрать номер и продемонстрировать качество передачи голоса по IP со словами: "И такая связь по управляемой сети обходится в 0,05 доллара в минуту, а ведь она может вообще не стоить нам ни копейки".
4. В ближайшие три месяца. Запланируйте оснастить свой центр обслуживания средствами Internet. При наличии электронных каталогов на базе Web вы можете еще более агрессивно продавать свои товары за счет предоставления кнопок "обратного звонка" для планирования регулярных телефонных звонков от агентов по продажам. Полностью интегрированные средства "обратного звонка" предоставляются гибридными серверами Web/телефонии, связанными с системой автоматического распределения вызовов. Функции посредника для "обратного звонка" из Web могут быть доверены независимому провайдеру - это устранит или по крайней мере отсрочит необходимость приобретения соответствующего оборудования.
"Обратный звонок" из Web является надежным средством для связи с заказчиками, когда они готовы что-то купить. Ввиду того, что навигация по Web и одновременный разговор по телефону требуют наличия двух соединений (для ПК и телефона), "обратный звонок" по обычной телефонной сети наиболее полезен при продажах не частным лицам, а организациям. С другой стороны, он не зависит от качества Internet-телефонии.
5. В ближайшие шесть месяцев. Если ваша компания располагает региональными офисами, подключенными через управляемую глобальную сеть TCP/IP, то самое время начать заниматься голосом по IP. Наилучший способ сделать это - приобрести платы для голоса по IP для имеющихся коммутаторов или присмотреться к VoIP-совместимым телефонным системам на базе ПК. Новые продукты от Comdial и других производителей предоставляют традиционные средства связи по обычным телефонным сетям (аналоговым линиям, ISDN, T-1 и т. д.), а также встроенные кодеки и интерфейсы с локальной сетью для передачи речи и факсов по IP.
Оснастив имеющийся коммутатор платами VoIP, вы можете поэкспериментировать с голосом по IP без больших затрат. Если вам необходима новая телефонная система, то приобретение VoIP-совместимой системы обойдется недорого; одновременно этот шаг позволит вам вступить на путь перехода к Internet-телефонии и даст мощную CTI-совместимую телефонную систему/коммуникационный сервер. По сравнению с подходами на базе применения шлюзов, превращение VoIP в "другую магистраль телефонной системы" имеет такие реальные преимущества, как управляемость, программируемость и удобство доступа.
Джон Яиншигг - главный редактор Teleconnect Magazine. С ним можно связаться по адресу: johnj@teleconnect.com.