ПЕКИН/ШАНХАЙ (Рейтер) - Исследовательское подразделение Huawei по искусственному интеллекту отвергло утверждения о том, что версия его крупной модели языка Pangu Pro скопировала элементы из модели Alibaba, говоря, что она была самостоятельно разработана и обучена.
Подразделение, названное Лабораторией Ноев Ковчег, выпустило заявление в субботу, на следующий день после того, как сущность по имени HonestAGI опубликовала англоязычную статью на платформе для обмена кодом Github, сказав, что модель Pangu Pro Moe (Смесь экспертов) Huawei показала "выдающуюся корреляцию" с Qwen 2.5 14B Alibaba.
Это указывает на то, что модель Huawei была получена путем "переработки" и не была обучена с нуля, говорится в статье, вызвавшей широкие обсуждения в сферах искусственного интеллекта онлайн и в китайских технологических СМИ.
В статье говорится, что их результаты указывают на потенциальное нарушение авторских прав, фальсификацию информации в технических отчетах и ложные утверждения о вложениях Huawei в обучение модели.
Лаборатория Ноев Ковчег заявила в своем заявлении, что модель "не основана на наращивании обучения моделей других производителей" и что она "внесла ключевые инновации в архитектурное проектирование и технические особенности." Она является первой крупномасштабной моделью, полностью построенной на чипах Ascend Huawei, добавлено в заявлении.
Также отмечается, что разработочная команда строго соблюдала требования лицензии с открытым исходным кодом для использования стороннего кода, не уточняя, какие модели с открытым исходным кодом были использованы в качестве образца.
Alibaba не сразу ответила на запрос Рейтер о комментариях. Рейтер не смог связаться с HonestAGI или узнать, кто стоит за этой сущностью.
Выпуск открытой модели R1 китайского стартапа DeepSeek в январе этого года поразил Силиконовую Долину своей низкой стоимостью и спровоцировал интенсивную конкуренцию между технологическими гигантами Китая для предложения конкурентоспособных продуктов.
Qwen 2.5-14B был выпущен в мае 2024 года и является одной из моделей семейства малых моделей Qwen 2.5 Alibaba, которые могут быть развернуты на ПК и смартфонах.
Хотя Huawei вошла на рынок крупных языковых моделей рано с выпуском оригинальной модели Pangu в 2021 году, с тех пор она воспринималась как отстающая от конкурентов. Она опубликовала свои модели Pangu Pro Moe на китайской платформе для разработчиков GitCode в конце июня, стремясь увеличить принятие ее технологии искусственного интеллекта, предоставив бесплатный доступ разработчикам.
В то время как Qwen более ориентирован на потребителя и предлагает услуги чат-ботов, такие как ChatGPT, модели Pangu Huawei, как правило, более широко используются в правительственных структурах, а также в финансовом и производственном секторах.
(Сообщение Че ПанЛиам Мо и Бренда Го; Редактирование Эдвина Гиббс)