Если раньше Nvidia была просто поставщиком графических чипов, то теперь генеральный директор Дженсен Хуанг отнес ее к категории поставщиков вычислительных сервисов полного стека, допустив также превращение самого себя в некую виртуальную субстанцию.
Амбиции Nvidia растут, а сама компания уходит в облако, предоставляя своим клиентам как аппаратное, так и программное обеспечение в качестве сервиса. В ходе конференции GTC Fall Хуанг продемонстрировал ряд новых продуктов для любителей игр, но большая часть его выступления была посвящена описанию инструментов, которые Nvidia предлагает ИТ-директорам для ускорения вычислений на предприятии.
Речь идет об аппаратных компонентах для промышленного проектирования в новом графическом процессоре Ada Lovelace RTX; о чипе, который будет управлять беспилотными транспортными средствами, пока его пассажиры заняты развлечениями; а также о платформе пограничных вычислений IGX для автономных систем.
Впрочем, одним только оборудованием дело не ограничилось. Было представлено также программное обеспечение (для разработки лекарств, биологических исследований, обработки естественного языка и создания метавселенных для промышленности), услуги, в том числе в сфере консалтинга и кибербезопасности, а также программное обеспечение и инфраструктура, предлагаемые в качестве облачного сервиса.
Хуанг акцентировал внимание на демонстрации процессора, выполнявшего в реальном времени рендеринг фотореалистичных сцен с естественными световыми эффектами, искусственном интеллекте, который плавно заполнял недостающие кадры для сглаживания и ускорения анимации, и способе обучения больших языковых моделей искусственного интеллекта. Реакцию на указания мы наблюдали с учетом контекста. Качество демонстраций было настолько правдоподобным, что Хуанг после своего выступления язвительно заметил: «Не удивляйтесь, если окажется, что и я сам – искусственный интеллект».
Действительно, ИТ-директорам следует обратить серьезное внимание на новые облачные сервисы Nvidia, открывающие перед организациями дополнительные возможности без увеличения затрат на оборудование. В условиях, когда стоимость аппаратных средств продолжает расти, а увеличивать плотность транзисторов в чипе производителям становится все труднее, многим придется столкнуться с серьезными вызовами.
«Закон Мура мертв, – заявил Хуанг, имея ввиду сделанный Гордоном Муром в 1965 году прогноз, согласно которому количество транзисторов в микросхемах будет удваиваться через каждые два года. – И ожидание дальнейшего удешевления чипов с течением времени, к сожалению, осталось в прошлом».
Проблемы производителей чипов обусловлены многими факторами, в том числе трудностями с получением жизненно важных инструментов и растущей стоимостью сырья, включая газ неон (поставки которого пострадали из-за войны в Украине) и кремниевые пластины, из которых изготавливаются чипы.
Себестоимость продукции растет стремительными темпами, признал Хуанг. Ответом Nvidia на растущие затраты стала разработка программного обеспечения, оптимизированного таким образом, чтобы клиенты получали от процессоров максимальную отдачу. Это должно помочь восстановить баланс между ценой и производительностью. Будущее за комплесным ускорением аппаратного стека, считает Хуанг. Действительно, эффективность вычислений зависит не только от чипов — она формируется в результате согласованного функционирования чипов и программного обеспечения.
Компания Nvidia объявила, что уже работает над оптимизацией программного обеспечения обучения большой языковой модели NeMo для нового чипа H100, недавно запущенного в серийное производство. H100 – первый чип на основе архитектуры Hopper, представленный компанией на конференции Spring GTC в марте. К другим платформам глубинного обучения, оптимизируемым для H100, относятся Microsoft DeepSpeed, Google JAX, PyTorch, TensorFlow и XLA.
NeMo – один из двух продуктов, которые Nvidia решила продавать в качестве облачного сервиса. Вторым является Omniverse.
NeMo Large Language Model Service позволяет разработчикам обучать и адаптировать большие языковые модели, созданные Nvidia, для обработки или прогнозирования реакции, представленной на естественном языке и в виде компьютерного кода. Связанный с ним сервис BioNeMo LLM делает нечто подобное для белковых структур, прогнозируя их биомолекулярные свойства.
И наконец, последнее новшество Nvidia в этой области заключается в построении модели, учитывающей миллиарды параметров, и точной ее настройке с помощью нескольких сотен дополнительных условий, с тем чтобы чат-бот мог выдавать ответы, более точно соответствующие определенному контексту. Например, в случае настройки на интернет-провайдера в ответ на вопрос, каковы условия аренды, будет выдана информация о том, что модем можно арендовать за 5 долл. в месяц. Для компании по прокату автомобилей – предложение по аренде экономичных, компактных и полноразмерных автомобилей, а для агентства по управлению недвижимостью – цены на аренду квартир, от маленьких студий до объектов с тремя спальнями.
Такая настройка выполняется за несколько часов, в то время как обучение модели с нуля занимает месяцы. К настроенным моделям можно обращаться с помощью «маркера запроса», объединяя их с исходной моделью. Предприятия имеют возможность создавать модели локально или в облаке, а начиная с октября поддерживается и доступ к ним в облаке Nvidia через API.
Основой другого набора облачных сервисов, предлагаемых компанией, является платформа Nvidia Omniverse. Она поддерживает три ключевые функции. Во-первых, возможность получать и хранить трехмерную информацию о мирах. По словам Хуанга, реализовано это в виде современной базы данных в облаке. Во-вторых, способность подключать устройства, людей и программных агентов к соответствующей информации и друг к другу. И в-третьих, предоставление обзорного окна в новый мир, что опять-таки позволяет говорить о движке для моделирования.
Моделирование может относиться как к реальному миру (если предприятия создают цифровых двойников производственных мощностей или продуктов), так и к вымышленному, используемому для обучения сенсорных сетей (с помощью Omniverse Replicator), роботов (Isaac Sim) и самоуправляемых транспортных средств (Drive Sim) путем подачи на вход смоделированной информации датчиков.
Облако Omniverse Nucleus Cloud предоставляет общее хранилище Universal Scene Description для 3D-сцен и данных, которые можно использовать для совместной работы в Интернете, а масштабируемый инструмент Omniverse Farm выполняет рендеринг сцен и генерирует синтетические данные с использованием Omniverse.
Промышленный гигант Siemens уже сейчас использует платформу Omniverse для создания производственных цифровых двойников. В настоящее время Nvidia работает над предоставлением соответствующих услуг своим клиентам с использованием Omniverse Cloud.
Omniverse Farm, Replicator и Isaac Sim уже доступны в контейнерах и облачных экземплярах Amazon Web Services, оснащенных графическими процессорами Nvidia. Что же касается других приложений Omniverse Cloud, предлагаемых в качестве управляемых сервисов Nvidia, здесь клиентам придется подождать. В настоящее время компания принимает только предварительные заявки.
Чтобы помочь предприятиям использовать свои новые продукты и услуги, Nvidia формирует дополнительные каналы. Поставщик управленческих консалтинговых услуг Booz Allen Hamilton предлагает организациям новый сервис кибербезопасности Cyber Precog, который построен на базе платформы кибербезопасности Nvidia Morpheus, обрабатывающей данные с использованием искусственного интеллекта, а компания Deloitte намерена предлагать корпоративные сервисы на основе программного пакета Nvidia Omniverse.
Работая совместно с консультантами и системными интеграторами над внедрением своих IaaS- и SaaS-сервисов, Nvidia не собирается прекращать продажу оборудования полностью. По словам Хуанга, некоторые организации (как правило, стартапы или те, что используют свою инфраструктуру лишь эпизодически) отдают предпочтение аренде, тогда как крупные и устойчивые предприятия предпочитают иметь собственную инфраструктуру.