Главный конкурент ChatGPT: почему китайский чат-бот DeepSeek внезапно стал таким популярным и обрушил рынок
Почему все говорят о DeepSeek
В понедельник, 27 января 2025 года, китайская компания DeepSeek заявила, что ее популярное приложение подверглось кибератаке. Это заставило разработчика временно ограничить регистрацию новых пользователей. Атака произошла после того, как приложение DeepSeek AI Assistant взлетело на вершины App Store и Play Store, став самым высоко оцененным бесплатным приложением в США.
В DeepSeek сообщили, что начали расследование проблемы, а через два часа мониторинга компания заявила, что стала жертвой «масштабной вредоносной атаки». Хотя возможности новых пользователей были ограничены, уже существующие могли входить в систему как обычно. Затем приложение возобновило регистрацию.
Вчера гонка за доминирование в сфере искусственного интеллекта резко обострилась, когда «технологические акции» США рухнули на один триллион долларов после того, как китайская фирма представила свой чат-бот. Крупный техноинвестор Марк Андрессен назвал это моментом запуска спутника для мировых сверхдержав, но в области искусственного интеллекта.
DeepSeek называют главным конкурентом OpenAI и его ChatGPT, что пошатнуло веру инвесторов в ИИ-бум в США. Новинка обеспечивает ту же производительность, но при меньших ресурсах и стоимости. Президент США Дональд Трамп заявил, что выход стартапа на рынок должен стать «звонком для наших отраслей, который должен пробудить нас и заставить сосредоточиться на борьбе за победу». Он также отметил, что «читал о Китае» и его компаниях, в частности о той, которая придумала «более быстрый и гораздо менее затратный метод ИИ».
Что стоит узнать о DeepSeek
Приложение DeepSeek — это помощник на основе искусственного интеллекта, похожий на более привычный чат-бот ChatGPT. Некоторые технологические инвесторы были впечатлены тем, как быстро стартапу удалось создать свою разработку примерно за пять миллионов долларов, в то время как другие ИИ-компании тратят миллиарды на те же результаты. Успех модели с низким бюджетом может поставить под угрозу лидерство США на этом рынке.
В этом нет ничего удивительного, считает эксперт в сфере технологических новинок Крис Смит. По его словам, стоит ожидать, что другие компании из сегмента ИИ будут соответствовать модели o1. OpenAI уже готова представить o3 в ближайшее время.
Новость о том, что обучение DeepSeek R1 возможно всего за три-пять процентов ресурсов, необходимых OpenAI для аналогичного прогресса с ChatGPT, вызвала волнение во всем мире.
Как DeepSeek обошла дороговизну разработки ИИ
Одна из проблем с текущим программным обеспечением ИИ касается стоимости разработки и использования продукта. Создание продвинутых моделей вроде o1 может стоить десятки миллионов. Для этого процесса требуются высокопроизводительные графические карты (GPU), которые обеспечивают необходимую вычислительную мощность и энергозатраты.
Поэтому готовые продукты, такие как ChatGPT o1, не могут быть доступны бесплатно без ограничений; компаниям вроде OpenAI нужно покрывать расходы и получать прибыль. Однако даже санкции США против Китая не стали помехой, чтобы DeepSeek ошеломила мир. В стартапе знали, что не смогут конкурировать с OpenAI, и не имели доступа к тому же количеству графических процессоров. Поэтому компания применила другой подход, найдя свои способы обучения продвинутой модели рассуждений.
Технологию контролируемой тонкой настройки (SFT) заменили обучением с подкреплением (RL), что дало более быстрые и дешевые результаты. SFT полагается на демонстрацию ИИ способов решения проблем путем предоставления доступа к данным, чтобы ИИ знал, какие ответы давать.
RL опирается на модель ИИ, пытаясь найти ответы с помощью системы вознаграждений, а затем предоставляя ИИ обратную связь. RL позволило DeepSeek улучшить «рассудочные» способности R1 и преодолеть недостаток вычислений. Однако на ранних этапах R1 требовалось некоторое обучение SFT, когда ИИ контролируют люди.
Как DeepSeek меняет рынок
Инновации, разработанные DeepSeek, можно скопировать, чтобы достичь аналогичных прорывов. Ранние версии их чат-бота показали, что китайский стартап тоже мог скопировать работу по разработке ChatGPT. Однако был придуман более эффективный способ обучения ИИ с использование всего около 50 000 графических процессоров, 10 000 из которых были графическими процессорами Nvidia, купленными до введения экспортных ограничений со стороны США.
По мнению Смита, после того, как методы, подобные DeepSeek R1, будут использоваться для разработки ChatGPT и Gemini, стоимость доступа к расширенному ИИ снизится для премиум-пользователей. Это станет ключевым выигрышем для потребителей. Западные ИИ-компании просто не смогут поддерживать высокие цены и конкурировать с DeepSeek R1 и его преемниками.
Однако эксперт подчеркивает, что модели DeepSeek будут демонстрировать предвзятость в сторону Китая. Это все еще часть программного обеспечения, которая должна подчиняться местным законам о цензуре.