Выберите действие
avatar

#переведено ИИ

Google может обучать поисковый ИИ с использованием веб-контента после выхода из ИИ

news_image
0
18 просмотров

(Блумберг) -- Google может обучать свои специализированные поисковые продукты ИИ, такие как обзоры ИИ, на контенте во всем вебе, даже когда издатели выбрали отказаться от обучения продуктов ИИ Google, заявил в суде вице-президент продукта компании в пятницу.

Это происходит потому, что контрольные механизмы Google для издателей, желающих отказаться от обучения ИИ, касаются работы Google DeepMind, лаборатории ИИ компании, сказал вице-президент DeepMind Эли Коллинз. Другие организации в компании могут дополнительно обучать модели для своих продуктов.

Если взять модель ИИ Gemini и поместить ее внутрь поисковой организации, поисковая организация имеет возможность обучаться на данных, на которые издатели отказались обучать, верно? спросила Диана Агилар, адвокат Департамента юстиции.

Верно для использования в поиске, ответил Коллинз.

Google кратко излагает ответы на поисковые запросы с использованием своего ИИ вверху результатов, что может привести к тому, что пользователи не нажимают на независимые веб-сайты для получения ответов - это тенденция, которая ущемляет их доходы, заявили веб-издатели. Google использует данные с тех же сайтов для генерации информации, на которой основаны ответы ИИ.

Издатели могут отказаться от использования своих данных в поисковом ИИ только если они отказываются быть проиндексированными для поиска, пояснил Google. У Google есть отдельный способ для издателей управлять своим контентом в Поиске с помощью устоявшегося стандарта веб-файлов robots.txt, сообщил представитель Google в заявлении. Robots.txt - это файл, встроенный в веб-сайты, который сообщает ботам, созданным компаниями ИИ и индексаторами веб-страниц, могут ли они обходить сайт.

Google вызвал Коллинза на свидетельский стенд в рамках трехнедельного судебного процесса в федеральном суде в Вашингтоне, проводимого для определения того, как Google должен восстановить конкуренцию в онлайн-поиске. В прошлом году судья округа США Амит Мехта признал, что техгигант незаконно монополизировал рынок поиска и сейчас взвешивает набор предложенных антимонопольными службами изменений для решения его контроля.

Департамент юстиции призывает суд заставить Google продать свой широко используемый браузер Chrome и предоставить ключевые данные, которые он использует для генерации результатов поиска. Агентство также просит судью Мехту запретить Google платить за то, чтобы быть по умолчанию поисковой системой в других приложениях и устройствах - ограничение, которое распространится на его предложения ИИ, включая Gemini, от которого, по мнению правительства, скоропостижно извлекла пользу незаконная доминирование компании в поиске.

Агилар, адвокат Департамента юстиции, спросила Коллинза, знал ли он, сколько дополнительных данных доступно поисковой организации Google помимо контента, на котором обучались его модели ИИ Google DeepMind. Когда Коллинз ответил, что не знает, Агилар предъявила документ от 26 августа 2024 года под названием Поиск GenAI <> Gemini v3.

Согласно этому документу, Google удалил 80 миллиардов из 160 миллиардов токенов - фрагментов контента - после фильтрации материала, на котором издатели отказались разрешить использовать Google для обучения его ИИ. В документе также перечисляются данные поисковых сессий, или данные, собранные во временной период, в течение которого пользователь взаимодействовал с поиском Google, а также видеоролики YouTube, как данные, которые могут усилить модели ИИ Google.

После просмотра документа Мехта попросил Коллинза прояснить. 80 миллиардов из 160 миллиардов токенов, 50% удаляется издателями, отказавшимися?

Это верно, ответил Коллинз.

Позже адвокат Google попытался показать, что доминирование технологической компании в поиске не мешает другим компаниям по искусственному интеллекту жестко конкурировать, предоставляя точные, актуальные результаты в реальном времени в своих сервисах чатботов. Если пользователь, например, спрашивает у чатбота ИИ результаты спортивных соревнований, Коллинз засвидетельствовал, что чатбот, скорее всего, вернет правильный ответ, потому что компания, создавшая бота, имела коммерческое соглашение с поставщиком результатов спортивных соревнований - ей не нужно было полагаться на веб-индекс.

Но также было показано, что Google исследовал, как его модели ИИ могут значительно улучшиться за счет данных, которые он уже собрал за годы эксплуатации самого популярного поискового движка в мире, также показаны свидетельства. В другой момент во время перекрестного допроса Коллинза адвокат Департамента юстиции Агилар показала вице-президенту Google документ информационного совещания, предназначенный для Демиса Хассабиса, генерального директора Google DeepMind.

В комментарии Хассабис размышлял о том, чтобы обучить неопределенную модель ИИ Google с огромным объемом поисковых данных - включая рейтинги поиска - чтобы увидеть, насколько больше модель ИИ улучшится за счет данных по сравнению с той, которая не была обучена ими.

Google, построила ли модель, используя поисковые данные? спросила Агилар у Коллинза.

На мой взгляд, это не так, ответил он.

Но по крайней мере г-н Хассабис считал бы интересным посмотреть на это? настаивала она.

Да, сказал Коллинз.

(Обновлено комментарием Google в шестом абзаце.)

2025 Bloomberg L.P.

Поделись своим мнением

 
ООО "Профинансы ИТ решения"
Юридический адрес: 123112, Российская Федерация, г. Москва, Пресненская набережная, д.12, этаж 82, офис 405, помещение 4
ОГРН: 1227700402522
ИНН: 9703096398
КПП: 770301001
Расчётный счет 40702810710001115701
Корреспондентский счет 30101810145250000974
БИК банка 044525974
Банк АО "ТИНЬКОФФ БАНК"
Информация на данном сайте представлена исключительно для ознакомления и самостоятельного анализа инвестором. Не является индивидуальной инвестиционной рекомендацией. Не является рекламой ценных бумаг определенных компаний. Графики стоимости ценных бумаг отражают историческую динамику цены и не могут быть гарантией доходности в будущем. Прошлые результаты инвестиционной деятельности не гарантируют доходность в будущем. Числовые показатели взяты из официальных финансовых отчетов представленных компаний. ООО «ПРОФИНАНСЫ ИТ РЕШЕНИЯ» не несет ответственности за возможные убытки инвестора в случае использования представленной на сайте информации в своей инвестиционной стратегии, покупки и продажи указанных на сайте ценных бумаг.