Схватка между установленными поставщиками онлайн-контента и новичками в области искусственного интеллекта снова накаляется, поскольку ИИ-движимые модели больших языков поглощают информацию в гонке за доминирование на фронтире веба.
Последней войной по скрэпингу ИИ является противостояние между Reddit (RDDT) и ИИ-стартапом Anthropic (ANTH.PVT), компанией, поддерживаемой технологическими гигантами Amazon (AMZN) и Google (GOOG, GOOGL), создавшей языковую модель ИИ Claude.
Reddit утверждает в новом иске, что Anthropic намеренно скрэпил персональные данные пользователей Reddit без их согласия, а затем использовал их данные для обучения Claude.
Reddit заявил в своем иске, что Anthropic 'позиционирует себя как белый рыцарь индустрии ИИ', аргументируя, что 'на самом деле это не так'.
Представитель Anthropic заявил, что в прошлом году они заблокировали своих ботов на сайте Reddit, согласно иску. Но Reddit утверждает, что Anthropic продолжил обращаться к серверам Reddit более ста тысяч раз.
Anthropic также защищает себя от отдельного иска от музыкальных издателей, включая Universal Music Group (0VD.F), ABKCO и Concord, обвиняя Anthropic в нарушении авторских прав на песни Бейонсе, Роллинг Стоунз и других артистов в процессе обучения Claude текстам более 500 песен.
Соперничество между Reddit и Anthropic добавляется к растущему числу знаковых случаев, когда правообладатели пытаются защитить свои произведения от действий технологических фирм.
Вопрос, лежащий в основе всех этих исков: Могут ли компании по искусственному интеллекту использовать защищенный авторским правом материал для обучения генеративным моделям ИИ без разрешения владельца этих данных?
Суды еще не пришли к определенному ответу. Тем не менее, в феврале прошлого года окружной суд США по Делаверу вынес решение в польз правообладателя Thomson Reuters в деле, которое может повлиять на то, какие данные могут законно собирать модели обучения.
Суд удовлетворил запрос Thomson Reuters о резюмировании, говоря, что ее конкурент Ross нарушил ее авторские права, используя резюме исков для обучения своей модели ИИ.
Суд отклонил аргумент Ross, что он мог использовать резюме на основании концепции добросовестного использования, позволяющей использовать авторские права для новостей, преподавания, исследований, критики и комментариев.
Добросовестное использование
Одним из крупных игроков, заметно присутствующих в некоторых из этих конфликтов, является OpenAI (OPAI.PVT), создатель чатбота ChatGPT, который управляется Сэмом Альтманом и поддерживается Microsoft (MSFT).
Комедиантка Сара Сильверман обвинила компании в нарушении авторских прав в иске, копировании материала из ее книги и 7 миллионов пиратских произведений для обучения своих систем ИИ. Сайт для родителей Mumsnet также обвинил OpenAI в скрэпинге своей базы данных в шесть миллиардов слов без согласия.
Но, возможно, самым заметным делом, нацеленным на OpenAI, является иск от The New York Times (NYT), который в 2023 году подал иск, обвиняя OpenAI и Microsoft в незаконном использовании миллионов опубликованных историй газеты для обучения языковых моделей OpenAI.
Газета заявила, что ChatGPT, обученный на миллионах ее статей, иногда генерирует ответы на запросы, которые тесно отражают ее оригинальные публикации.
На прошлой неделе OpenAI назвала иск 'необоснованным' и обжаловала последний приказ судьи в этом деле, требующий у AI-разработчика сохранить данные, сгенерированные ChatGPT.
OpenAI и Microsoft используют защиту, аналогичную той, что была поднята в других спорах об авторском праве на обучение ИИ: что контент, общедоступный в The Times, подпадает под доктрину добросовестного использования и, следовательно, может использоваться для обучения их моделей.
Getty Images пытается подорвать это же аргумент в исках в США и Великобритании, поданных в 2023 году против стартапа по генерации изображений Stability.
В понедельник в Великобритании началось судебное разбирательство. Компания Stability утверждает, что использование в обучении своей технологии Stable Diffusion защищено доктриной добросовестного использования (или, как это известно в Великобритании, fair dealing) на защищенные авторским правом материалы Getty.
Эта же защита имеет черты оправдания, которые Google аргументировал в течение последних двух десятилетий, чтобы бороться с исками, утверждая, что нарушил авторские права, извлекая информацию в результатах для запросов пользователей.
В 2005 году Авторское общество подало на Google в суд из-за миллионов книг, которые технологический гигант сканировал и предоставлял онлайн-пользователям в виде отрывков. Google не платил за защищенную информацию, но предоставлял буквально куски авторских произведений в результатах поиска.
Апелляционный суд США по второму кругу обосновал в своем решении, что сканирование проекта Google проверяло пределы добросовестного использования, но было трансформационным и, следовательно, защищено в соответствии с законом о добросовестном использовании.
В 2016 году Getty Images подал на Google иски по аналогичным обвинениям, утверждая, что Google нарушил его авторские права и антимонопольное законодательство, отображая высокоразрешенные изображения Getty в результатах поиска Google.
Практика, по мнению Getty, способствовала пиратству и удерживала потенциальных клиентов от посещения его сайта и оплаты контента.
Google и Getty заключили мировое соглашение до судебного разбирательства. В рамках соглашения Google согласился более явно отображать информацию об обладателях авторских прав, а также заключить лицензионное соглашение с Getty и удалить кнопку просмотра изображения из поиска Google, что затруднило загрузку изображений высокого качества.
Google может быть причастен к новым войнам по скрапингу ИИ в рамках исторического антимонопольного дела против монополии Google в области поиска, которое в прошлом году выиграло Министерство юстиции США.
Минюст аргументировал перед судьей, рассматривающим меры по устранению монополии Google, что поисковый гигант может еще более укрепить свое господство, обучив свою модель ИИ Gemini на своем обширном индексе интернет-контента.
Нажмите здесь, чтобы узнать последние новости в области технологий, которые повлияют на фондовый рынок
Читайте последние финансовые и бизнес-новости от Yahoo Finance