Выберите действие
avatar

#переведено ИИ

Исследователи создали открытый конкурентный аналог модели 'reasoning' OpenAI под названием s1 за менее чем $50

0
96 просмотров

Исследователи по искусственному интеллекту из Стэнфорда и Университета Вашингтона смогли обучить модель искусственного интеллекта 'reasoning' за менее чем $50 в облачных вычислениях, согласно новой научной статье, опубликованной в прошлую пятницу.

Модель, известная как s1, показывает результаты, сравнимые с передовыми моделями рассуждения, такими как o1 от OpenAI и r1 от DeepSeek, на тестах по математике и программированию. Модель s1 доступна на GitHub вместе с данными и кодом, использованными при ее обучении.

Команда за моделью s1 заявила, что создала модель искусственного интеллекта с помощью дистилляции, процесса извлечения возможностей 'reasoning' из другой модели искусственного интеллекта путем обучения на ее ответах. Исследователи утверждают, что s1 получена путем дистилляции из одной из моделей рассуждения Google, Gemini 2.0 Flash Thinking Experimental. Дистилляция - это тот же подход, который использовали исследователи из Беркли для создания модели искусственного интеллекта для примерно $450 в прошлом месяце.

Для некоторых идея того, что несколько исследователей без миллионов долларов за спиной все еще могут инновировать в области искусственного интеллекта, кажется захватывающей. Однако s1 вызывает реальные вопросы о комодификации моделей искусственного интеллекта. Где находится ровик, если кто-то может близко воссоздать многомиллионную модель, потратив относительно копейки?

Неудивительно, что крупные лаборатории искусственного интеллекта не довольны. OpenAI обвинила DeepSeek в неправомерном сборе данных из своего API для целей дистилляции модели.

Исследователи, стоящие за моделью s1, стремились найти самый простой подход для достижения высокой производительности в рассуждениях и 'test-time scaling', то есть дать модели искусственного интеллекта больше времени на размышления перед ответом на вопрос. Это были некоторые из прорывов в модели OpenAI o1, которые DeepSeek и другие лаборатории искусственного интеллекта пытались воспроизвести с помощью различных техник.

В статье о модели s1 утверждается, что модели рассуждения могут быть дистиллированы с помощью относительно небольшого набора данных с использованием процесса, называемого контролируемой доводкой (SFT), при котором модель искусственного интеллекта явно инструктируется имитировать определенные поведения в наборе данных. SFT, как правило, дешевле, чем метод обучения с подкреплением большого масштаба, который использовала DeepSeek для обучения своего ответа на модель OpenAI o1, R1.

Google предоставляет бесплатный доступ к Gemini 2.0 Flash Thinking Experimental, хотя и с ограничениями по количеству запросов в день, через свою платформу Google AI Studio. Однако его условия запрещают обратный инжиниринг моделей для разработки услуг, конкурирующих с собственными предложениями искусственного интеллекта Google. Мы обратились к Google за комментарием.

S1 основана на небольшой готовой модели искусственного интеллекта от китайской лаборатории искусственного интеллекта Qwen, принадлежащей Alibaba, которая доступна для бесплатной загрузки. Для обучения s1 исследователи создали набор данных из 1000 тщательно подобранных вопросов, сопоставленных с ответами на эти вопросы, а также с процессом 'рассуждения' за каждым ответом из Google Gemini 2.0 Flash Thinking Experimental.

После обучения s1, которое заняло менее 30 минут с использованием 16 графических процессоров Nvidia H100, s1 продемонстрировала высокую производительность на определенных бенчмарках искусственного интеллекта, согласно исследователям. Никлас Мюннигофф, исследователь из Стэнфорда, который работал над проектом, сказал TechCrunch, что он может арендовать необходимые вычисления сегодня за примерно $20.

Исследователи использовали хитрый трюк, чтобы заставить s1 перепроверить свою работу и увеличить 'время размышлений': они сказали ей подождать. Добавление слова 'подожди' во время рассуждения s1 помогло модели прийти к немного более точным ответам, согласно статье.

В 2025 году Meta, Google и Microsoft планируют инвестировать сотни миллиардов долларов в инфраструктуру искусственного интеллекта, часть которых пойдет на обучение моделей искусственного интеллекта следующего поколения. Такой уровень инвестиций может быть все еще необходим для того, чтобы продвигать границы инноваций в области искусственного интеллекта. Дистилляция показала себя как хороший метод для дешевого воссоздания возможностей модели искусственного интеллекта, но она не создает новых моделей искусственного интеллекта, значительно превосходящих то, что доступно сегодня.

Эта статья изначально появилась на TechCrunch по адресу https://techcrunch.com/2025/02/05/researchers-created-an-open-rival-to-openais-o1-reasoning-model-for-under-50/

Поделись своим мнением

avatar
 
ООО "Профинансы ИТ решения"
Юридический адрес: 123112, Российская Федерация, г. Москва, Пресненская набережная, д.12, этаж 82, офис 405, помещение 4
ОГРН: 1227700402522
ИНН: 9703096398
КПП: 770301001
Расчётный счет 40702810710001115701
Корреспондентский счет 30101810145250000974
БИК банка 044525974
Банк АО "ТИНЬКОФФ БАНК"
Информация на данном сайте представлена исключительно для ознакомления и самостоятельного анализа инвестором. Не является индивидуальной инвестиционной рекомендацией. Не является рекламой ценных бумаг определенных компаний. Графики стоимости ценных бумаг отражают историческую динамику цены и не могут быть гарантией доходности в будущем. Прошлые результаты инвестиционной деятельности не гарантируют доходность в будущем. Числовые показатели взяты из официальных финансовых отчетов представленных компаний. ООО «ПРОФИНАНСЫ ИТ РЕШЕНИЯ» не несет ответственности за возможные убытки инвестора в случае использования представленной на сайте информации в своей инвестиционной стратегии, покупки и продажи указанных на сайте ценных бумаг.