«Не терять деньги и не получать огромную прибыль»: чем известен Лян Вэньфэн, создатель чат-бота DeepSeek
Маленький, но гордый стартап
Последние годы разработчики искусственного интеллекта в США опасались, что крупнейшие технологические компании Китая могут сместить их с лидирующих позиций. Однако оказалось, что Кремниевой долине угрожает малоизвестный стартап. На этой неделе основанная менее двух лет назад DeepSeek возглавила продажи магазина приложений iOS с новейшим чат-ботом, что потрясло рынки. В глобальной ИИ-гонке это назвали «моментом спутника».
Американские техногиганты узнали, что разработать и обучить модель искусственного интеллекта уровня ChatGPT от OpenAI можно менее чем за шесть миллионов долларов. Для сравнения Microsoft, основной партнер OpenAI, планирует инвестировать в 2025 году в ИИ-инфраструктуру около восьмидесяти миллиардов долларов.
Так кто же стоит за DeepSeek и как этому предприимчивому человеку удалось добиться впечатляющих и революционных результатов за столь короткий срок?
Миллениал, который не гонится за прибылью
Основанная в мае 2023 года, компания DeepSeek — стартап Ляна Вэньфэна, миллениала-предпринимателя, занимавшегося хедж-фондами. Часть его успеха, по-видимому, объясняется тем, что он задумал свой проект как чисто исследовательскую организацию, а не коммерческое предприятие, ориентированное на прибыль.
Деятельность DeepSeek финансируется хедж-фондом High-Flyer Capital, который Лян основал в 2015 году. После изучения электронной информационной инженерии в Чжэцзянском университете предприниматель отказался от работы программистом у крупных разработчиков программного обеспечения и сосредоточился на своем интересе к ИИ.
Несколько лет назад Лян собрал большую коллекцию графических процессоров Nvidia (GPU). По слухам, к 2021 году он приобрел 10 000 чипов. По его же словам, им двигала не бизнес-логика, а простое любопытство.
Своевременное любопытство Лян Вэньфэна
В 2022 году Джо Байден установил контроль за экспортом полупроводников в Китай, что должно было стать препятствием для доступа к оборудованию, необходимому для быстрой разработки ИИ. Мощный чип H100 от Nvidia был и вовсе запрещен к поставкам. Компания разработала для рынка КНР менее мощные чипы H800, на которых DeepSeek и начала обучать свою модель.
В 2023 году и это оборудование запретили для экспорта в Китай, о чем Лян говорит: «Деньги никогда не были нашей самой большой проблемой, сложнее эмбарго на высококлассные чипы».
Личное участие в разработке
Известно, что Лян лично участвует в исследованиях DeepSeek, при этом он предпочитает нанимать местных специалистов, а не тех, кто учился за рубежом. Это делает успех стартапа еще более поразительным, так как до последнего времени США лидировали в гонке ИИ с Китаем, доминируя и в производстве чипов, и в обучении первоклассных талантов.
Запуск мощной модели DeepSeek свидетельствует о том, что китайские ученые нашли способ обойти ограничения со стороны США. По мнению некоторых экспертов, это может стать причиной дальнейшего ужесточения контроля со стороны Америки.
Однако есть те, кто скептически относится к препятствиям, которые могут мешать развитию DeepSeek. Так, Александр Ванг, американский предприниматель в области искусственного интеллекта, отмечает: «В китайских лабораториях больше H100, чем люди думают». По его мнению, у стартапа Ляна есть запас передовых чипов, которые он не раскрывает публично из-за санкций США.
Слагаемые успеха DeepSeek
Карен Хао, журналистка, исследующая сферу искусственного интеллекта, считает, что успех DeepSeek обусловлен небольшим размером компании: «Она внедряла инновации благодаря, а не вопреки своим ограничениям». Кроме того, стартап известен тем, что хорошо платит лучшим талантам. Компания начала переманивать разработчиков из более крупных компаний, той же Nvidia.
Что касается самого Ляна Вэньфэна, он продолжает оставаться загадкой для широкой публики, так как держится в стороне от внимания.