Все те же ответы
Опыт компьютерных компаний
Рецепты успешного управления миллионом страниц
Как управлять интрасетью, имеющей миллион страниц

При обслуживании очень крупных внутренних Web-узлов специалистам отделов информационных технологий приходится решать проблемы, связанные с аппаратурой, программным обеспечением и постоянно меняющимися системами управления.

Когда в интрасети компании Northern Telecom появилась миллионная страница, ее администраторы наконец осознали всю серьезность положения. Конечно, они и раньше знали, что сеть расширяется - в конце концов именно они публиковали шаблоны, создавали связи с базами данных и добавляли серверы, чтобы не отстать от потребностей пользователей, - но не отождествляли ее с корпоративным ресурсом, объясняет Билл Холтц, вице-президент Northern Telecom по глобальным корпоративным службам.

Как только сотрудники отдела ИТ поняли, какое значение приобрела интрасеть, говорит Холтц, они начали применять стандартные процедуры управления сетью. Так, они регулярно создавали резервные копии и вели строгий контроль за трафиком, при котором в случае необходимости администраторы сразу получают сигнал, что пора подключать дополнительные серверы.

В компании Nortel для проверки каналов сетевые администраторы связи рассылают несколько Web-"агентов", однако это практически единственная операция сетевой поддержки, имеющая непосредственное отношение к Web. В обязанности отдела ИТ входит и поддержка в рабочем состоянии маршрутизаторов и каналов связи. Ведется измерение пропускной способности корпоративной сети и степени ее загруженности, а также трафика, проходящего через прокси-сервер в World Wide Web. Кроме того, отслеживаются число и местонахождение серверов Web, количество страниц и состав основных работающих приложений.

Хотя рабочим группам компании разрешено устанавливать свои собственные Web-серверы, отдел ИТ старается учитывать имеющиеся серверы - особенно потому, что он осуществляет резервное копирование в масштабах всего предприятия. Трафик интрасети в 1996 г. удвоился; по мнению Холтца, то же произошло и в прошлом году.

Судя по всему, такая стратегия управления работает: интрасеть CorWeb компании Nortel разрослась до 1200 серверов, обслуживающих 45 тыс. пользователей, которые имеют доступ к 1,5 млн документов. Если учесть, что CorWeb существует восемь лет (она зародилась еще во времена бета-тестирования браузера Mosaic центра NCSA и Web-сервера компании Apache), то получается, что ежегодно содержание этой интрасети возрастало на 187 500 страниц.

Другие сети Web развиваются по аналогичному сценарию. Пользователи приняли интрасети на вооружение, и теперь объем содержания многих из них приближается к рубежу миллиона страниц. Успех потрясающий, однако расширение сетей сопровождается непрерывным ростом трафика, повышением требований к системам хранения и необходимостью регулярного пересмотра инфраструктуры сети. Меньше всего администраторам инрасетей хотелось бы, чтобы "узкие места" сети или устаревающее оборудование замедляли информационный поток. Поэтому когда объем информационного наполнения инрасети достигает уровня в миллион страниц, сетевым администраторам приходится пересматривать ее архитектуру. Именно это произошло в компании Sun Microsystems, которая перешла с ПК на сетевые компьютеры (СК).

В Sun индексация содержимого интрасети заняла четыре дня - главным образом, из-за большой рассредоточенности Web-серверов, объясняет исполнительный директор по информации Билл Радучел. По его оценке, сеть SunWeb содержит более двух миллионов страниц. После того как большинство из 36 тыс. пользователей интрасети компании Sun перешло на СК, появилась возможность хранить Web-страницы централизованно.

Web-мастера вырабатывают некоторые общие приемы работы. Холтц и его коллеги, например, следуют старой доброй практике сетевого администрирования. Когда дело касается содержания, они передают свои полномочия другим. Как и в компании Nortel, администраторы отдела ИТ компании GE Information Service (GEIS) позволили пользователям интрасети обновлять и освежать ее содержимое. Более того, в GEIS пошли еще дальше. Когда в интрасети Global Village этой компании разрывается канал связи, отдел ИТ получает соответствующий сигнал. Однако эту проблему должен решать администратор, занимающийся содержимым сети, поясняет Вабни Вабни, менеджер по новым технологиям. "Наша интрасеть независима, однако управляется централизованно", - говорит он.

Программисты отдела ИТ управляют корпоративной Web-сетью компании GEIS с помощью средств собственной разработки, что типично для крупных интрасетей. Например, GEIS разработала свое средство для мониторинга доступа. Администраторы интрасети хотели бы иметь возможности определения характера использования сети и измерения скорости реакции.

Средство мониторинга собственной разработки автоматически уведомляет администраторов об изменениях состояния сети, таких как замедление трафика пользователей до установленного уровня или достижение определенного числа онлайновых пользователей. Сетевые администраторы фиксируют, с какой частотой достигаются такие значения параметров и при необходимости добавляют серверы или расширяют пропускную способность.

Компания Coopers & Lybrand также избрала путь разработки собственных средств для контроля за расширением своей интрасети, в которую входят примерно 120 Web-серверов и 80 серверов Domino корпорации Lotus Development. Сотрудники отдела ИТ совместно с консалтинговой фирмой разработали ПО Surveyor - приложение Domino, которое автоматически генерирует результаты анализа тенденций использования сети, собирает данные относительно ответных действий и выдает статистику.

"Наш опыт показал, что большинство коммерческих средств администрирования недостаточно хорошо адаптировано к Domino, так что нам пришлось разработать свое собственное средство, - объясняет Трейси Беверли, директор по службам интрасети. - Нам нужна солидная статистика, показывающая, какие бизнес-подразделения больше других пользуются интрасетью и как именно". Файлы регистрации, например, помогают определить, нужны ли компании зеркальные копии часто используемых узлов или требуется установить более быстрые конвейеры для удаленных офисов, которым часто необходим доступ к конкретным базам данных. "Большинство наших пользователей - удаленные, так что мы сильно им навредим, если не обеспечим достаточную скорость работы", - говорит Беверли.

В сети Global Village компании GEIS наметилась тенденция к применению виртуальных страниц, что характерно для многих крупных интрасетей. Когда интрасеть достигает размера нескольких тысяч, десятков тысяч или даже сотен тысяч статических страниц, начинается переход на динамические страницы. Самые крупные интрасети генерируют большинство страниц "на лету", добывая информацию из корпоративных баз данных, имеющих в качестве интерфейса Web-браузер.

Разработчик интрасети Бретт Монелло из компании Silicon Graphics (SGI) считает, что как только размер интрасети достигает уровня примерно в четверть миллиона страниц, их необходимость нуждается в проверке. В компании SGI доморощенное средство проверки каналов связи, разработанное Монелло, функционирует непрерывно. Чтобы охватить всю интрасеть Silicon Junction, обслуживающую более 10 тыс. сотрудников SGI и имеющую полмиллиона статических страниц, этому средству требуется около недели. "Я не хочу ограничивать количество страниц, однако меня интересует, какой процент запросов может быть удовлетворен через Web и насколько эффективно", - объясняет Монелло.

Среди прочего, Монелло прибегает и к такой тактике: он стремится удерживать число подготовленных, или "законсервированных", отчетов на низком уровне. Пользователи генерируют большинство Web-страниц динамически, извлекая сведения из подключенных к Web корпоративных баз данных и получая, таким образом, самую свежую информацию. Они могут извлечь, например, личные данные из кадровых баз данных или получить информацию о продукте от группы маркетинга, а затем ввести полученные данные в шаблоны по своему усмотрению. По подсчетам Монелло, вместо примерно 7 тыс. "законсервированных" отчетов, которые обычно хранятся в локальной сети, в сети Silicon Junction содержится лишь около 500 отчетов, а остальные генерируются по мере необходимости.

В компании Boeing администраторы интрасети исповедуют такую же философию. Корпоративная Web-сеть компании протянулась по всему земному шару и соединяет примерно 110 тыс. служащих со штаб-квартирой компании в Сиэттле. В Web-сети Boeing имеются более 350 тыс. статических страниц, но она чрезвычайно динамична, объясняет Дик Джеймс, заместитель менеджера по программе.

До слияния с корпорацией McDonnell Douglas компания Boeing имела 545 Web-серверов, сейчас - примерно вдвое больше. Появление интрасети не изменило практики сетевого администрирования. "Наличие Web просто выявило те проблемы, которые у нас были всегда", - говорит Джеймс. Техническая библиотека следит за связями с помощью постоянно работающего средства Mom Spider. В остальном, проблемы поддержки работоспособности интрасети такие же, как и в других сетевых инфраструктурах: тиражирование данных между серверами, проведение регулярного резервного копирования, прокладка дополнительных оптоволоконных кабелей и др.

Все те же ответы

Сетевые администраторы компании Hewlett-Packard еще в 1989 г. полностью перешли на протокол TCP/IP. В этой компании разделяют мнение специалистов Boeing; "Один из уроков, который следует извлечь из работы с крупной интрасетью, состоит в том, что сеть будет непрерывно расширяться", - объясняет Джо Шнейдер, менеджер службы технологической инфраструктуры НР в Форт-Коллинз.

В настоящее время интрасеть компании HP связывает более 400 узлов по всему миру и поддерживает более 100 тыс. ПК, примерно 20 тыс. рабочих станций Unix и 2 тыс. Web-серверов. Хотя инфраструктура сети удовлетворяет предъявляемым к ней требованиям, количество документов Web, как говорит Шнейдер, наверняка превысило миллион. Это служит основанием для налаживания жесткого контроля за тем, в каких целях используются пропускная способность и средства хранения информации. "Мы наблюдаем увеличение разнообразия методов применения и типов информации, - говорит Шнейдер. - Например, то, что два года назад было документом FTP объемом 2 Кбайта, теперь представляет собой HTML-код объемом 20 Кбайт".

Как и для его коллег, для Шнейдера основные проблемы управления - это технология и содержание. "Попытки учесть все факторы, связанные с поддержкой, перерастают в постоянную проблему, особенно когда вы предоставляете доступ в World Wide Web", - утверждает он. Например, процессы конфигурирования серверов имен в сети и управления ими могут повлиять на производительность Web-сервера.

"Однажды неправильно сконфигурированный сервер DNS на внешнем узле компании НР создал некую проблему, которую пользователь воспринял как неисправность браузера", - рассказывает Шнейдер. Пользователю интрасети не нужно знать физический источник данных, которые могут поступать из экстрасети компании HP или даже с корпоративного Web-узла. Поэтому аспекты управления Internet-узлом связаны с производительностью интрасети, и их необходимо контролировать.

Сильной стороной интрасети является количество общедоступного материала, поставляемого пользователями. Компания Autodesk распределяет работу по поддержке интрасети между менеджером содержимого и техническим менеджером, причем оба могут делегировать свои обязанности и дальше. Менеджер содержимого, например, управляет 255 Web-мастерами, каждый из которых поддерживает узел отдела. Отдел ИТ управляет этой распределенной моделью, однако не руководит тем, как должна выглядеть страница.

Для компании Autodesk вполне обычны объемные графические документы, а ее сеть построена на базе нескольких серверов UltraSPARC компании Sun. Эта инфраструктура надежна: в кампусе штаб-квартиры проложены оптоволоконный и медный кабели и используются стандарты 10Base-T и 100Base-T. Удаленные офисы связаны с глобальной сетью каналами со скоростью передачи не меньше 128 кбит/с.

Когда внутренняя интрасеть стала слишком громоздкой, говорит Стивен Литрас, проектировщик интрасетей, отдел ИТ установил несколько зеркальных серверов. Вскоре их насчитывалось 16, и компания Autodesk модернизировала свою сеть, инсталлировав прокси-серверы, чтобы кэшировать данные и существенно поднять скорость доступа. Сетевые администраторы установили серверы из комплекта, разработанного компанией Netscape Communications, в том числе - сервер для рабочих групп Collabra и Netscape Directory Server для управления корпоративной Web-сетью. В качестве поисковой машины применяется продукт Search97 компании Verity, однако многие средства администрирования разработаны самими штатными сотрудниками.

В задачи отдела ИТ входит контроль за использованием сети и подключение по мере необходимости дополнительных Web- и прокси-серверов. Отдел также тестирует программы для управления, чтобы найти такую, с помощью которой администраторы интрасети смогут автоматически перераспределять данные между серверами для лучшей балансировки нагрузки.

Опыт компьютерных компаний

К числу пионеров создания интрасетей, которые расширяются очень высокими темпами, относятся также компании, работающие в области высоких технологий.

В интрасети корпорации Digital Equipment, за четыре года накопилось около миллиона документов. Для поддержки Web-сети эта компания пользуется своим собственным оборудованием, особенно поисковой машиной Alta Vista. Все ее 55 тыс. сотрудников имеют доступ к интрасети, в которой работают 1400 серверов, тогда как год назад их было всего 400. Alta Vista просматривает сеть и составляет индексы еженедельно, а архивирование содержимого осуществляется в Digital ежедневно. "Это позволяет нам планировать расширение", - объясняет Кэтлин Уорнер, директор подразделения Internet/Intranet Deployment.

Различные бизнес-подразделения компании Digital управляют своими собственными серверами и их содержанием и поддерживают функционирование каналов связи. Уорнер считает, что примерно 60% страниц интрасети Digital - динамические; к ним относятся приложения обработки транзакций, мультимедийные данные и Java-аплеты.

Следуя той же тактике, которую служба GEIS избрала для управления своей обширной интрасетью, группа ИТ компании Digital ведет поиск нарушенных связей и при обнаружении проблем посылает по электронной почте сообщения Web-мастеру бизнес-подразделения. Бизнес-подразделения могут оплачивать внутренние сервисы информационной системы и получать круглосуточную поддержку, однако за содержимым собственных Web-серверов должны следить сами.

Компания Netscape имеет интрасеть, запущенную в эксплуатацию в 1994 г. "Я не уверен, что можно определить, сколько у нас страниц, поскольку каждый может запустить Web-сервер", - говорит Грегори Сэндс, старший менеджер по продуктам компании Netscape. В этой имеющей множество Web-мастеров компании правит бал отдел ИТ. Он поддерживает службы центрального каталога, чтобы облегчить применение средств мониторинга и удовлетворить потребность пользователей в пропускной способности.

Первые Web-серверы появились в глобальной сети корпорации Microsoft в 1995 г.; после выпуска браузера Internet Explorer их использование резко выросло. Интрасеть компании достаточно многогранна; в нее входят различные компоненты - от административного MSWeb до Web-узлов отдельных рабочих групп. Microsoft обладает солидной физической сетью и культурой электронной почты. "Сначала все превратили свои настольные машины в Web-серверы, - говорит Фрэн Коттвиц, менеджер по программам группы ИТ компании Microsoft, имеющей свою собственную сеть ITGWeb. - Потом эта деятельность поутихла".

Отдел ИТ поощряет Web-мастеров компании Microsoft размещать страницы на центральном сервере, где проще осуществить резервное копирование и зачастую больше места. Кроме того, централизованное управление Web-сетью даст отделу ИТ возможность распространять новые версии ПО с помощью Web-технологии и оптимизировать функции поиска. Неудивительно, что эти Web-мастера разрабатывают собственные средства администрирования, которые могут когда-нибудь стать коммерческими продуктами, достаточно мощными для простого управления миллионом страниц.


Рецепты успешного управления миллионом страниц

  • Передавать другим создание содержимого и обслуживание
  • Добросовестно проводить архивирование
  • Пользоваться хорошим "агентом" или средством индексирования и надежной поисковой машиной
  • Отслеживать пропускную способность и прогнозировать потребности
  • Установить стандартную каталожную структуру
  • Предвидеть возможные проблемы: использовать одно из Web-ориентированных средств сетевого мониторинга для контроля за использованием интрасети

Как управлять интрасетью, имеющей миллион страниц

Многие задачи управления интрасетью совпадают с задачами общего сетевого администрирования: отслеживание трафика и балансировка нагрузки, резервное копирование и защита от нарушений безопасности и вирусов. При решении специфических для Web проблем администраторы интрасети поначалу полагались на средства собственной разработки, однако сейчас все шире становится выбор коммерческих продуктов.

Например, компания Aziza (отделение компании Objectivity, производителя объектных баз данных) разработала свой комплект Web-средств Aziza специально для работы с крупными узлами. Она встроила в него такие функции, как тиражирование, с помощью которого осуществляется распределение нагрузки на несколько серверов. В комплект Aziza входит консоль, позволяющая отображать данные в четырех видах: иерархическом, физическом, представления проекта для авторов и представления для пользователей, показывающего их местонахождение в Web-сети. Консоль связывается с любым Web-сервером и использует поисковую машину компании Verity, поясняет Бетти Уоткинс, директор по маркетинговым коммуникациям компании Aziza.

Эта компания может также при необходимости создавать виртуальные серверы. Для обеспечения большей эффективности работы все тиражированные серверы являются равноправными. Администратор может тиражировать базу данных на несколько серверов. Если часть системы выходит из строя, средство Aziza распределяет нагрузку, а позднее осуществляет синхронизацию данных.

Мэттью Лонерган, Web-мастер бизнес-школы Стэнфордского университета, считает комплект Aziza решением проблемы контроля за версиями, связанной с наличием слишком большого числа редакторов содержимого. "Когда возникают конфликты при редактировании, выигрывает тот, кто последним сохраняет версию документа, - считает Лонерган. - Средство Aziza преобразует всю эту смесь версий в базу данных и дает нам реальные возможности управления, присущие таким базам, - блокировку записей, контроль за версиями и четкий интерфейс". Лонерган протестировал разные средства, однако ни одно из них не обладало мощностью, достаточной для управления средой, которая включает в себя 1100 пользователей и сочетание Unix- и Windows NT-машин.

Средство What'sUp Gold компании Ipswitch обладает теми качествами, которые нужны компании Autodesk для мониторинга трафика в обширной интрасети, говорит Стивен Литрас, проектировщик интрасетей. Литрасу нравится это средство, потому что оно поддерживает разные протоколы. Версия What'sUp Gold 3.5, выпущенная недавно, поддерживает протокол IPX, выводит на экран статистику использования сети через браузер и изображение структуры сети. Конечно, с помощью систем управления старшего класса, типа OpenView компании Hewlett-Packard, можно делать то же самое, однако их возможности управления не настолько детальны, чтобы работать с крупной интрасетью компании Autodesk, считает Литрас.

В интрасети канадского Министерства иностранных дел и международной торговли содержатся материалы объемом 6 Гбайт, которыми управляют с помощью системы управления документами Basis компании Information Dimensions. "Самую серьезную проблему представляет собой реальное управление информацией - как мы отслеживаем ее, какие устанавливаем правила управления, - объясняет Дайана Краузе, заместитель директора по информационным источникам офисов в Оттаве. - Как и многие Web-узлы, наш сначала был небольшим, а затем разросся. Однажды мы поняли, что слишком далеко зашли, чтобы возвращаться назад, и нам было необходимо убедиться в его хорошей работе".

Комплект Basis предоставляет центральную консоль с функциями управления документами, хранит файлы в своей базе данных и переводит документы в Web-форму, допускающую доступ к ним через браузер. Правительственные учреждения Канады установили базу данных Basis примерно три года назад и внедрили Web-представление около года назад, когда в эксплуатацию вошла интрасеть.

Диапазон документов, содержащихся в этой базе данных, - от консульских инструкций и текстов экономических саммитов до руководств по кадровым вопросам и страхованию служащих. В ней хранятся также сообщения электронной почты, многие из которых имеют документальные приложения большого объема, говорит Краузе. По ее оценкам этой информацией пользуются примерно 9 тыс. пользователей в правительственных учреждениях Канады во всем мире. "Поиск в базе данных теперь осуществляется легче, быстрее и продуктивнее, а результаты проще загрузить".

Средство Astra SiteManager компании Mercury Interactive помогает Web-мастеру Марку Виванко отслеживать все возрастающий объем документов и отчетов, генерируемых пользователями службы TriTech Services, отделения компании Merryll Lynch. Виванко использует функции отображения Web-сети и управления ею главным образом для того, чтобы идентифицировать и "вычищать" дубликаты и избыточные файлы. "За хороший рыночный день мы генерируем так много динамических отчетов, что у нас кончается дисковое пространство, если мы пытаемся хранить их в архиве слишком долго, - объясняет Виванко. - С помощью Astra SiteManager я могу сканировать весь узел, идентифицировать объекты (даже Java-аплеты) и проверять все связи", - продолжает он. Виванко использует также преимущества открытого интерфейса API средства Astra SiteManager для разработки встраиваемых модулей для приложений TriTech.

Компания Mercury Interactive следит за настроениями производителей браузеров. Ее продукт Astra SiteManager совместим со встраиваемыми модулями, особенно со средством NetIntellect компании WebManage Technologies, предназначенным для анализа регистрационных файлов и составления отчетов. Администраторам интрасетей средство NetIntellect 2.1 дает такую информацию, как количество посетителей, моменты пикового использования и наиболее часто просматриваемые страницы и файлы.