DeepSeek, китайский стартап по искусственному интеллекту (AI), который удивил технологический мир мощной моделью AI, разработанной на крошечном бюджете, делает ставку на своё тайное оружие - 'молодых гениев', чтобы соперничать с обладающими огромными ресурсами американскими гигантами, согласно источникам и китайским СМИ.
26 декабря, базирующаяся в Ханчжоу компания выпустила свою модель большого языкового объёма (LLM) DeepSeek V3, которая была обучена с использованием меньшего количества ресурсов, но всё равно соответствует или даже превосходит в некоторых областях производительность моделей AI её крупных американских конкурентов, таких как Facebook Meta Platforms и создатель ChatGPT OpenAI. Этот прорыв считается значительным, так как он может предложить путь для Китая превзойти США в области AI, несмотря на ограниченный доступ к передовым микросхемам и финансовым ресурсам.
DeepSeek не немедленно отреагировал на запрос на комментарий в пятницу.
У вас есть вопросы по самым актуальным темам и тенденциям со всего мира? Получите ответы с помощью SCMP Knowledge, нашей новой платформы с подборкой контента с объяснениями, ЧаВо, анализами и информационными графиками, представленной нашей награжденной командой.
Логотип DeepSeek отображается на смартфоне. Фото: Изображения Shutterstock alt=Логотип DeepSeek отображается на смартфоне. Фото: Изображения Shutterstock>
За стоящим этого прорыва стоит скромный основатель компании и начинающая исследовательская группа, согласно анализу авторов, указанных в техническом отчёте по модели V3, и карьерным веб-сайтам, интервью с бывшими сотрудниками, а также местными СМИ. Технический отчёт V3 приписывается команде из 150 китайских исследователей и инженеров, кроме 31-членной команды исследователей по автоматизации данных.
Стартап был выделен в отдельное подразделение в 2023 году хедж-фондом High Flyer-Quant. Предпринимателем за DeepSeek является основатель High-Flyer Quant Лянг Вэнфэн, который изучал AI в Университете Чжэцзян. Имя Лянга также указано в техническом отчёте.
В интервью с китайским онлайн-медиа 36Kr в мае 2023 года Лянг заявил, что большинство разработчиков в DeepSeek либо недавние выпускники, либо те, кто только начал свою карьеру в области AI, что соответствует предпочтению компании к способностям перед опытом при найме новых сотрудников. 'Наши основные технические должности занимают в основном недавние выпускники или те, у кого один-два года опыта работы', - сказал Лянг.
Среди широкого круга талантов DeepSeek выделяются Гао Хуазуо и Цзен Вандинг, которые по мнению компании внесли 'ключевые инновации в исследования архитектуры MLA'.
Гао окончил Пекинский университет (PKU) в 2017 году по физике, в то время как Цзен начал обучение на магистерской программе в Институте AI Пекинского университета по почте и телекоммуникациям в 2021 году. Оба профиля показывают другой подход DeepSeek к талантам, так как большинство местных стартапов в области AI предпочитают нанимать более опытных и утверждённых исследователей или за границей образованных докторов наук со специализацией в области информатики.
Другие ключевые члены команды включают Гуо Дая, защитившего докторскую степень в 2023 году в Университете Сунь Ятсена, а также Чжу Цихао и Дай Дамай, оба недавние доктора наук из PKU. Однако одним из самых известных талантов DeepSeek является бывший сотрудник по имени Луо Фули. Она попала в национальное центральное внимание после того, как основатель Xiaomi Лей Цзюн, по сообщениям СМИ, предложил ей ежегодный пакет в размере 10 миллионов юаней (1,4 миллиона долларов США), однако последние сообщения в СМИ указывают, что Луо пока не приняла предложение. Магистр по образованию из PKU, Луо была названа 'AI-чудом' китайскими СМИ.
Модель V3 DeepSeek была обучена за два месяца с использованием примерно 2000 менее мощных микросхем Nvidia H800 всего за 6 миллионов долларов США - 'шутливый бюджет', по мнению Андрея Карпати, члена основной команды OpenAI - благодаря сочетанию новых архитектур и техник обучения, включая так называемое Многоголовое латентное внимание и DeepSeekMoE.
Человекоподобный робот использует инструменты ИИ на этой иллюстрации. Фото: Изображения Shutterstock alt=Человекоподобный робот использует инструменты ИИ на этой иллюстрации. Фото: Изображения Shutterstock>
Возглавляя команду AI-волшебников в компании, является скромный основатель DeepSeek Лянг, который кажется сдержанным, но обладает интуицией и вниманием к техническим деталям, согласно бывшему сотруднику, который говорил с Post на условиях анонимности, так как не имел права публично выступать.
В групповых обсуждениях Лянг иногда предлагал решения своим молодым членам команды, используя свои обычные подсказочные фразы, а не указания. Многие раз, члены команды, принимавшие предложения Лянга, обнаруживали, что они срабатывают, - сказал сотрудник, добавив, что Лянг выглядит скорее как наставник, чем как босс в бизнес-организации.
Этот материал первоначально появился в South China Morning Post (SCMP), самом авторитетном источнике новостей о Китае и Азии уже более столетия. Для большего количества материалов SCMP, пожалуйста, посетите приложение SCMP или страницы Facebook и Twitter SCMP. Авторские права 2025 South China Morning Post Publishers Ltd. Все права защищены.
Авторские права (c) 2025. Издательство South China Morning Post Publishers Ltd. Все права защищены.