DeepSeek из Китая выпускает долгожданную новую модель искусственного интеллекта

Китайский стартап DeepSeek выпустил новую модель искусственного интеллекта с "радикально сниженными" издержками в пятницу, более чем через год после того, как он поразил мир недорогой моделью рассуждений, которая соответствовала возможностям американских конкурентов.

Гонка в области искусственного интеллекта усилила соперничество между Китаем и Соединенными Штатами, причем Белый дом в четверг обвинил китайские организации в массированных попытках похищения технологий искусственного интеллекта. Пекин назвал эти обвинения "необоснованными".

DeepSeek из Ханчжоу взорвал рынок в январе прошлого года с генеративным чат-ботом на основе своей модели рассуждений R1, подорвав предположения о доминировании США в стратегическом секторе.

"V4 поддерживает ультра-длинный контекст", - говорится в заявлении компании на платформе социальных медиа WeChat, причем в отдельном объявлении на X это было названо "мировым лидером... с радикально сниженными расходами на вычисления и память".

V4 поддерживает длину контекста в один миллион "токенов" - небольших компонентов текста, включая слова или знаки препинания, что ставит его на один уровень с Gemini от Google.

Длина контекста определяет, сколько информации может воспринять модель для выполнения задач.

Новый V4 выпущен в двух версиях, DeepSeek-V4-Pro и DeepSeek-V4-Flash, при этом последняя является "более эффективным и экономичным выбором", поскольку имеет меньшие параметры.

По "мировому знанию", эталону для рассуждений, V4-Pro уступает только последней модели Gemini, сообщила DeepSeek.

"Предварительная версия" открытой модели теперь доступна, сообщила компания, не указав, когда будет выпущена окончательная версия.

- 'Точка перегиба' -

Эксперты считают, что прибытие V4 является "точкой перегиба" с точки зрения аппаратных средств и издержек.

"Это решает давние проблемы медленной производительности и высоких издержек, связанных с длинными контекстами, что является настоящей точкой перегиба для отрасли", - сказал АФП Чжан И, основатель технологической исследовательской фирмы iiMedia.

"Для конечных пользователей это принесет широкие доступные выгоды. Например, если поддержка ультра-длинного контекста станет стандартной функцией, обработка длинных текстов ожидается выйти за пределы исследовательских лабораторий и войти в основные коммерческие приложения", - добавил он.

V4-Pro имеет 1,6 триллиона параметров, в то время как V4-Flash имеет 284 миллиарда параметров, которые улучшают способность моделей принимать решения.

Модель также была "оптимизирована" для популярных продуктов искусственного интеллекта, таких как Claude Code, OpenClaw, OpenCode и CodeBuddy, - говорится в заявлении DeepSeek.

Она также может работать на микросхемах китайского технологического гиганта Huawei, добавила компания.

Huawei - на которую были наложены санкции США с 2019 года из-за национальной безопасности - заявила в пятницу, что полный спектр ее продуктов AscendSuperPoD поддерживает серию V4 от DeepSeek.

Последний выпуск DeepSeek является "вехой" для китайских фирм, сказал ветеран аналитик индустрии искусственного интеллекта Макс Лиу.

"Это хорошо для всей отечественной индустрии искусственного интеллекта. Он может предоставить лучшие модели для отечественных пользователей, и мы теперь можем ожидать гораздо большего - больше продуктов и более конкурентного рынка", - сказал он.

"Это не менее потрясающе, чем когда DeepSeek впервые появился", если его новая модель действительно соответствует производительности ведущих моделей из западных лабораторий, добавил он.

- 'Момент Спутника' -

Прошлогодний так называемый "шок DeepSeek" вызвал распродажу акций, связанных с искусственным интеллектом, и раздумья о бизнес-стратегии в том, что также описывается как "Момент Спутника" для отрасли.

Чат-бот работал на уровне ChatGPT и других лучших американских продуктов, но компания заявила, что для его разработки потребовалось значительно меньше вычислительной мощности.

Однако его внезапная популярность вызвала вопросы о конфиденциальности данных и цензуре, поскольку чат-бот часто отказывался отвечать на вопросы о чувствительных темах, таких как события 1989 года на площади Тяньаньмэнь.

Инструменты искусственного интеллекта DeepSeek широко применяются китайскими муниципалитетами, медицинскими учреждениями, финансовым сектором и другими предприятиями.

Это произошло частично из-за решения DeepSeek сделать свои системы открытыми и их внутренние механизмы общедоступными - в отличие от собственных моделей, продаваемых OpenAI и другими западными конкурентами.

Однако Белый дом обвинил китайские фирмы в стремлении "украсть" американскую технологию, в преддверии ожидаемого саммита между Дональдом Трампом и Си Цзиньпином в Пекине в следующем месяце.

"У США есть доказательства того, что иностранные организации, в первую очередь в Китае, проводят кампании по промышленному извлечению, чтобы украсть американские технологии искусственного интеллекта", - сказал советник по науке и технологиям Трампа Майкл Кратсиос в сообщении на X.

Извлечение является распространенной практикой в разработке искусственного интеллекта, часто используемой компаниями для создания более дешевых, небольших версий своих собственных моделей.

"Обвинения США совершенно необоснованы", - заявил официальный представитель китайского МИД Го Цзякун на пресс-конференции в Пекине. "Это клевета против достижений китайской индустрии искусственного интеллекта".

ll-sam-mya/dan

Выберите действие

DeepSeek из Китая выпускает долгожданную новую модель искусственного интеллекта

Комментарии