DeepSeek, появившийся в конце января соперник ChatGPT из Китая, во многих странах быстро вышел в топ самых скачиваемых приложений Apple App Store, поскольку он бесплатно предоставляет те же возможности. Более того, пользователи отмечают, что в каких-то случаях ответы DeepSeek превосходят по качеству ChatGPT. Кто стоит за DeepSeek и почему он произвел такой фурор?

DeepSeek — стартап, чей основной инвестор компания High-Flyer до его появления объявляла о планах сформировать независимую группу по исследованиям в области универсального искусственного интеллекта. Известно, что High-Flyer владеет патентами на кластеры чипов для обучения моделей ИИ.

Чатбот основан на двух больших языковых моделях, DeepSeek R1 и DeepSeek-V3, созданных на базе моделей с открытым кодом Llama и Qwen. В DeepSeek R1 встроены механизмы самопроверки, благодаря чему модели удается избегать некоторых нелепых ошибок, присущих другим чатботам — видимо, за счет этого качество ответов и воспринимается лучшим. В самой DeepSeek утверждают, что R1 в ряде стандартных тестов превосходит OpenAI o1 — модель первого поколения, на которой был изначально основан механизм «рассуждения» ChatGPT.

Но главным преимуществом DeepSeek называют меньшую стоимость обучения по сравнению с ChatGPT и другими интеллектуальными чатботами — по предварительным оценкам, оно обошлось на порядок дешевле. Как утверждают в самой DeepSeek, обучение китайского бота проводилось на чипах Nvidia H800, менее мощных и дорогих, чем новейшие H100, экспорт которых в Китай запрещен американским правительством.

Меньше ресурсов DeepSeek требует и при работе. Судя по опубликованным создателями чатбота на GitHub докладам, это достигнуто за счет ряда новаций, в том числе механизма компрессии кэша, позволяющего расходовать меньше памяти, и системы прогнозной оптимизации, с помощью которой при работе модели минимизируется вычислительная нагрузка. Благодаря экономии ресурсов модели DeepSeek хорошо подходят для выполнения на смартфонах и других потребительских устройствах — для них в компании разработали варианты системы с меньшими возможностями.

На известие о преимуществах DeepSeek с точки зрения затратоэффективности фондовый рынок отреагировал резким снижением акций крупных участников рынка систем ИИ, включая производителей чипов Nvidia и AMD.

Эксперты, между тем, подвергают сомнению и оценки стоимости обучения DeepSeek, и тот факт, что оно проходило с помощью недорогих процессоров — есть неподтвержденные сообщения о том, что компания все-таки располагает чипами H100, которые могли быть получены в обход экспортных ограничений.

А Financial Times пишет, что поскольку аттестация DeepSeek проводилась китайским регулятором Интернета, ответы чатбота «воплощают основные ценности социализма». Если спросить об этом у самого DeepSeek, он с готовностью признает, что старается «предоставлять информацию, способствующую конструктивному диалогу, отвечающему целям и задачам китайской модели социализма».

Через некоторое время после запуска на волне взлета популярности DeepSeek компания объявила о том, что на ее сервисы была устроена массированная атака, повлиявшая на работоспособность чатбота. В связи с этим возможность регистрации была ограничена, но впоследствии появились сообщения о восстановлении.