Китайский AI-дисруптор DeepSeek делает ставку на некрупную команду 'молодых гениев' для превзойдения американских гигантов

DeepSeek, китайский стартап по искусственному интеллекту (AI), который удивил технологический мир мощной моделью AI, разработанной на крошечном бюджете, делает ставку на своё тайное оружие - 'молодых гениев', чтобы соперничать с обладающими огромными ресурсами американскими гигантами, согласно источникам и китайским СМИ.

26 декабря, базирующаяся в Ханчжоу компания выпустила свою модель большого языкового объёма (LLM) DeepSeek V3, которая была обучена с использованием меньшего количества ресурсов, но всё равно соответствует или даже превосходит в некоторых областях производительность моделей AI её крупных американских конкурентов, таких как Facebook Meta Platforms и создатель ChatGPT OpenAI. Этот прорыв считается значительным, так как он может предложить путь для Китая превзойти США в области AI, несмотря на ограниченный доступ к передовым микросхемам и финансовым ресурсам.

DeepSeek не немедленно отреагировал на запрос на комментарий в пятницу.

У вас есть вопросы по самым актуальным темам и тенденциям со всего мира? Получите ответы с помощью SCMP Knowledge, нашей новой платформы с подборкой контента с объяснениями, ЧаВо, анализами и информационными графиками, представленной нашей награжденной командой.

Логотип DeepSeek отображается на смартфоне. Фото: Изображения Shutterstock alt=Логотип DeepSeek отображается на смартфоне. Фото: Изображения Shutterstock>

За стоящим этого прорыва стоит скромный основатель компании и начинающая исследовательская группа, согласно анализу авторов, указанных в техническом отчёте по модели V3, и карьерным веб-сайтам, интервью с бывшими сотрудниками, а также местными СМИ. Технический отчёт V3 приписывается команде из 150 китайских исследователей и инженеров, кроме 31-членной команды исследователей по автоматизации данных.

Стартап был выделен в отдельное подразделение в 2023 году хедж-фондом High Flyer-Quant. Предпринимателем за DeepSeek является основатель High-Flyer Quant Лянг Вэнфэн, который изучал AI в Университете Чжэцзян. Имя Лянга также указано в техническом отчёте.

В интервью с китайским онлайн-медиа 36Kr в мае 2023 года Лянг заявил, что большинство разработчиков в DeepSeek либо недавние выпускники, либо те, кто только начал свою карьеру в области AI, что соответствует предпочтению компании к способностям перед опытом при найме новых сотрудников. 'Наши основные технические должности занимают в основном недавние выпускники или те, у кого один-два года опыта работы', - сказал Лянг.

Среди широкого круга талантов DeepSeek выделяются Гао Хуазуо и Цзен Вандинг, которые по мнению компании внесли 'ключевые инновации в исследования архитектуры MLA'.

Гао окончил Пекинский университет (PKU) в 2017 году по физике, в то время как Цзен начал обучение на магистерской программе в Институте AI Пекинского университета по почте и телекоммуникациям в 2021 году. Оба профиля показывают другой подход DeepSeek к талантам, так как большинство местных стартапов в области AI предпочитают нанимать более опытных и утверждённых исследователей или за границей образованных докторов наук со специализацией в области информатики.

Другие ключевые члены команды включают Гуо Дая, защитившего докторскую степень в 2023 году в Университете Сунь Ятсена, а также Чжу Цихао и Дай Дамай, оба недавние доктора наук из PKU. Однако одним из самых известных талантов DeepSeek является бывший сотрудник по имени Луо Фули. Она попала в национальное центральное внимание после того, как основатель Xiaomi Лей Цзюн, по сообщениям СМИ, предложил ей ежегодный пакет в размере 10 миллионов юаней (1,4 миллиона долларов США), однако последние сообщения в СМИ указывают, что Луо пока не приняла предложение. Магистр по образованию из PKU, Луо была названа 'AI-чудом' китайскими СМИ.

Модель V3 DeepSeek была обучена за два месяца с использованием примерно 2000 менее мощных микросхем Nvidia H800 всего за 6 миллионов долларов США - 'шутливый бюджет', по мнению Андрея Карпати, члена основной команды OpenAI - благодаря сочетанию новых архитектур и техник обучения, включая так называемое Многоголовое латентное внимание и DeepSeekMoE.

Человекоподобный робот использует инструменты ИИ на этой иллюстрации. Фото: Изображения Shutterstock alt=Человекоподобный робот использует инструменты ИИ на этой иллюстрации. Фото: Изображения Shutterstock>

Возглавляя команду AI-волшебников в компании, является скромный основатель DeepSeek Лянг, который кажется сдержанным, но обладает интуицией и вниманием к техническим деталям, согласно бывшему сотруднику, который говорил с Post на условиях анонимности, так как не имел права публично выступать.

В групповых обсуждениях Лянг иногда предлагал решения своим молодым членам команды, используя свои обычные подсказочные фразы, а не указания. Многие раз, члены команды, принимавшие предложения Лянга, обнаруживали, что они срабатывают, - сказал сотрудник, добавив, что Лянг выглядит скорее как наставник, чем как босс в бизнес-организации.

Этот материал первоначально появился в South China Morning Post (SCMP), самом авторитетном источнике новостей о Китае и Азии уже более столетия. Для большего количества материалов SCMP, пожалуйста, посетите приложение SCMP или страницы Facebook и Twitter SCMP. Авторские права 2025 South China Morning Post Publishers Ltd. Все права защищены.

Выберите действие

Китайский AI-дисруптор DeepSeek делает ставку на некрупную команду 'молодых гениев' для превзойдения американских гигантов