DeepSeek сегодня представила DeepSeek-R1-0528, обновленную версию своей крупной языковой модели R1, которая, по их словам, теперь конкурирует с O3 от OpenAI и Gemini 2.5 Pro от Google (NASDAQ: GOOG).
Китайская компания по искусственному интеллекту отметила улучшенные алгоритмические оптимизации после обучения и усиленный конвейер вычислений, что привело к повышению точности рассуждений с 70% до 87.5% на сложных логических задачах, снижению уровня галлюцинаций и улучшению производительности кодирования атмосферы. DeepSeek выделила победы в математике, программировании и общих выводах, позиционируя R1-0528 как равного ведущим западным моделям.
Этот релиз следует за недавним открытием DeepSeek Prover-V2, специализированного движка для рассуждений, и происходит на фоне ряда китайских достижений в области искусственного интеллекта - Qwen 3 от Alibaba (NYSE: BABA) и Ernie 4.5/X1 от Baidu (NASDAQ: BIDU), оба похваляющиеся гибридной силой рассуждений. DeepSeek утверждает, что их комбинация открытой разработки и равенства производительности дает им уникальное преимущество в глобальном исследовании искусственного интеллекта.
Инвесторы и партнеры должны обратить внимание, потому что приближение DeepSeek-R1-0528 к лучшим LLM-моделям может ускорить внедрение предприятий в Азии и за ее пределами, стимулировать спрос на облачные вычисления и усилить конкуренцию в быстро развивающемся ландшафте искусственного интеллекта. Поскольку западные и китайские модели соперничают за первенство, такие бенчмарки будут формировать стратегические ставки на талант, инфраструктуру и международное сотрудничество в области искусственного интеллекта.
Сейчас R1-0528 доступен на Hugging Face, рынок будет следить за его принятием стартапами и исследовательскими лабораториями, потенциальными сделками по лицензированию и дальнейшими успехами в открытой дорожной карте DeepSeek.
Эта статья впервые появилась на GuruFocus.