29.01.2025, 13:50

Главный конкурент ChatGPT: почему китайский чат-бот DeepSeek внезапно стал таким популярным и обрушил рынок

Дональд Трамп уже назвал китайскую модель искусственного интеллекта тревожным звоночком.

Артем Кузелев

Теги:

Экономика

Технологии

Искусственный интеллект

Технологии будущего

Главный конкурент ChatGPT: почему китайский чат-бот DeepSeek внезапно стал таким популярным и обрушил рынок

Unsplash

Содержание статьи

Почему все говорят о DeepSeek

В понедельник, 27 января 2025 года, китайская компания DeepSeek заявила, что ее популярное приложение подверглось кибератаке. Это заставило разработчика временно ограничить регистрацию новых пользователей. Атака произошла после того, как приложение DeepSeek AI Assistant взлетело на вершины App Store и Play Store, став самым высоко оцененным бесплатным приложением в США.

Unsplash

В DeepSeek сообщили, что начали расследование проблемы, а через два часа мониторинга компания заявила, что стала жертвой «масштабной вредоносной атаки». Хотя возможности новых пользователей были ограничены, уже существующие могли входить в систему как обычно. Затем приложение возобновило регистрацию.

Вчера гонка за доминирование в сфере искусственного интеллекта резко обострилась, когда «технологические акции» США рухнули на один триллион долларов после того, как китайская фирма представила свой чат-бот. Крупный техноинвестор Марк Андрессен назвал это моментом запуска спутника для мировых сверхдержав, но в области искусственного интеллекта.

В понедельник Nvidia, ведущий производитель компьютерных чипов, на которых работают модели искусственного интеллекта, уступила место Apple как самой дорогой листинговой компании в США после того, как ее акции упали на 17%. Это снизило рыночную стоимость компании почти на 600 миллиардов долларов. Материнская компания Google потеряла 100 миллиардов, Microsoft — семь миллиардов.

DeepSeek называют главным конкурентом OpenAI и его ChatGPT, что пошатнуло веру инвесторов в ИИ-бум в США. Новинка обеспечивает ту же производительность, но при меньших ресурсах и стоимости. Президент США Дональд Трамп заявил, что выход стартапа на рынок должен стать «звонком для наших отраслей, который должен пробудить нас и заставить сосредоточиться на борьбе за победу». Он также отметил, что «читал о Китае» и его компаниях, в частности о той, которая придумала «более быстрый и гораздо менее затратный метод ИИ».

Что стоит узнать о DeepSeek

Приложение DeepSeek — это помощник на основе искусственного интеллекта, похожий на более привычный чат-бот ChatGPT. Некоторые технологические инвесторы были впечатлены тем, как быстро стартапу удалось создать свою разработку примерно за пять миллионов долларов, в то время как другие ИИ-компании тратят миллиарды на те же результаты. Успех модели с низким бюджетом может поставить под угрозу лидерство США на этом рынке.

Unsplash

В этом нет ничего удивительного, считает эксперт в сфере технологических новинок Крис Смит. По его словам, стоит ожидать, что другие компании из сегмента ИИ будут соответствовать модели o1. OpenAI уже готова представить o3 в ближайшее время.

«Необычно в DeepSeek то, что китайская компания сделала свои модели открытыми, так что любой разработчик может получить доступ и изучить их. Более интересна исследовательская работа R1, опубликованная DeepSeek, в которой утверждается, что эта высокотехнологичная модель была обучена за малую часть стоимости o1 OpenAI».

Крис Смит эксперт по технологиям

Новость о том, что обучение DeepSeek R1 возможно всего за три-пять процентов ресурсов, необходимых OpenAI для аналогичного прогресса с ChatGPT, вызвала волнение во всем мире.

Как DeepSeek обошла дороговизну разработки ИИ

Одна из проблем с текущим программным обеспечением ИИ касается стоимости разработки и использования продукта. Создание продвинутых моделей вроде o1 может стоить десятки миллионов. Для этого процесса требуются высокопроизводительные графические карты (GPU), которые обеспечивают необходимую вычислительную мощность и энергозатраты.

Unsplash

Поэтому готовые продукты, такие как ChatGPT o1, не могут быть доступны бесплатно без ограничений; компаниям вроде OpenAI нужно покрывать расходы и получать прибыль. Однако даже санкции США против Китая не стали помехой, чтобы DeepSeek ошеломила мир. В стартапе знали, что не смогут конкурировать с OpenAI, и не имели доступа к тому же количеству графических процессоров. Поэтому компания применила другой подход, найдя свои способы обучения продвинутой модели рассуждений.

Технологию контролируемой тонкой настройки (SFT) заменили обучением с подкреплением (RL), что дало более быстрые и дешевые результаты. SFT полагается на демонстрацию ИИ способов решения проблем путем предоставления доступа к данным, чтобы ИИ знал, какие ответы давать.

Unsplash

RL опирается на модель ИИ, пытаясь найти ответы с помощью системы вознаграждений, а затем предоставляя ИИ обратную связь. RL позволило DeepSeek улучшить «рассудочные» способности R1 и преодолеть недостаток вычислений. Однако на ранних этапах R1 требовалось некоторое обучение SFT, когда ИИ контролируют люди.

«Кроме того, DeepSeek сделала доступ к R1 намного дешевле, чем ChatGPT, что является значительным достижением. Если добавить к этому открытый исходный код моделей, становится понятным, почему DeepSeek так рванула в магазинах приложений».

Крис Смит эксперт по технологиям

Как DeepSeek меняет рынок

Инновации, разработанные DeepSeek, можно скопировать, чтобы достичь аналогичных прорывов. Ранние версии их чат-бота показали, что китайский стартап тоже мог скопировать работу по разработке ChatGPT. Однако был придуман более эффективный способ обучения ИИ с использование всего около 50 000 графических процессоров, 10 000 из которых были графическими процессорами Nvidia, купленными до введения экспортных ограничений со стороны США.

По мнению Смита, после того, как методы, подобные DeepSeek R1, будут использоваться для разработки ChatGPT и Gemini, стоимость доступа к расширенному ИИ снизится для премиум-пользователей. Это станет ключевым выигрышем для потребителей. Западные ИИ-компании просто не смогут поддерживать высокие цены и конкурировать с DeepSeek R1 и его преемниками.

Однако эксперт подчеркивает, что модели DeepSeek будут демонстрировать предвзятость в сторону Китая. Это все еще часть программного обеспечения, которая должна подчиняться местным законам о цензуре.