Специалисты по сетям сегодня активно внедряют средства искусственного интеллекта для решения задач, связанных с эксплуатацией сетевых систем. А каково влияние ИИ на сетевой трафик и инфраструктуру?
Ответ зависит в основном от того, планируют ли на предприятии размещать системы ИИ в собственном ЦОДе, и какого рода это будут системы. Если речь о генеративном ИИ, работа с облачными моделями подходит не всем, учитывая опасения возможной утечки корпоративных данных. За последнее время появился ряд инициатив наподобие Google Gemini, в рамках которых готовые большие языковые модели предлагается обучать на данных конкретных предприятий в их собственных ЦОДах.
В случае, если внедряется подобная «облегченная» большая языковая модель, предприятию понадобится ограниченное количество специализированных серверов для задач ИИ — как правило, один кластер на графических процессорах. Nvidia пропагандирует Infiniband в качестве технологии быстрых межсоединений для подобных кластеров, однако на предприятиях ее используют мало — в основном лишь в крупных дата-центрах, ориентированных на ИИ.
Хотя считается, что Infiniband наилучшим образом подойдет для GPU-кластера, внедрять эту технологию, возможно, не потребуется, поскольку предприятиям обычно не нужно обслуживать огромное количество пользователей систем ИИ, особенно если они применяются в основном как усовершенствованный инструмент аналитики. Средствам аналитики нужен быстрый доступ к базам данным — исходя из этого спланированы многие корпоративные сети. Аналогичное требование будет и у ИИ-инструментов, но для его выполнения вполне может хватить возможностей Ethernet.
И все же, внедрение ИИ определенным образом повлияет на планирование сети, ведь ИИ-кластер это все равно что огромное количество новых пользователей — после получения всего объема данных из корпоративного репозитория для обучения он должен иметь оперативный доступ к самой свежей информации, чтобы выдавать верные ответы на вопросы. Соответственно, такому кластеру нужен высокоскоростной тракт передачи данных, не влияющий на другие рабочие процессы. Особенно важно это для предприятий с несколькими центрами обработки данных — в этом случае, вероятно, придется увеличить пропускную способность каналов, соединяющих разные ЦОДы.
При этом маршруты обмена данными с ИИ-кластером должны быть как можно более короткими, а соединения — максимально быстрыми. Важно проследить, чтобы трафик ИИ не создавал помех традиционным крупным потокам, например, данным систем аналитики и отчетности.
Итак, ИИ-кластер обычно размещают там же, где выполняются крупные аналитические приложения (но не там, где форматируются результаты их работы), так как ему понадобится доступ к тем же базам. Для соединения систем в кластере и для связи с базами данных понадобятся мощные каналы Ethernet. Но перед внедрением нужно учесть особенности работы с ИИ и соответствующий трафик — основания для самостоятельного хостинга систем ИИ и соответствующей модернизации сети есть не всегда.
В любом случае, внедрение ИИ приведет к увеличению объема трафика, но это не всегда означает необходимость капитальной перестройки сети датацентра.