реклама
Новости Software

Марк Цукерберг лично разрешил обучать ИИ-модели Llama на пиратских материалах

Гендиректор Meta Марк Цукерберг (Mark Zuckerberg) лично разрешил подразделению Meta, ответственному за разработку моделей искусственного интеллекта Llama, использовать для их обучения массив данных, содержащий полученные незаконным путём книги и статьи. Об этом стало известно из документов, опубликованных в рамках судебного процесса писателя Ричарда Кадри (Richard Kadrey) против Meta.

 Источник изображения: Tingey Injury / unsplash.com

Источник изображения: Tingey Injury / unsplash.com

Данный процесс — лишь одно из ряда дел, в рамках которых разрабатывающие системы ИИ технологические гиганты обвиняются в обучении моделей на защищённых авторским правом материалах без разрешения авторов. Ответчики традиционно уверяют, что их действия отвечают норме о добросовестном использовании контента — эта доктрина позволяет пренебрегать авторским правом для создания новых произведений и продуктов, если они в значительной мере отличаются от оригинала. Многие правообладатели с такой позицией не согласны.

В новой порции рассекреченных документов (PDF) приводятся показания представителей Meta: выяснилось, что Марк Цукерберг лично одобрил использование компанией массива LibGen для обучения Llama. Проект LibGen, позиционирующий себя как агрегатор ссылок, в действительности предоставляет доступ к защищённым авторским правом работам, которыми управляют крупные издатели. В его отношении неоднократно подавались судебные иски, с него взыскивались десятки миллионов долларов за нарушения авторских прав, и в итоге проект был вынужден закрыться. Цукерберг, говорится в документах, одобрил использование LibGen для обучения как минимум одной модели Llama вопреки опасениям, которые выражали рядовые сотрудники и члены руководства Meta. Приводится внутренняя служебная записка, в которой отмечается, что работа с LibGen получила одобрение после «эскалации до MZ» — под этой аббревиатурой, очевидно, подразумевался глава компании.

 Источник изображения: Igor Omilaev / unsplash.com

Источник изображения: Igor Omilaev / unsplash.com

Сторона истца 8 января подала в суд заявление, в котором содержатся новые обвинения. В частности, утверждается, что Meta могла попытаться скрыть это деяние и удалить сведения об использовании материалов LibGen — это предположительно сделал инженер Meta Николай Башлыков (Nikolay Bashlykov), который написал скрипт, удаливший из книг в обучающем массиве информацию об авторских правах. Meta также якобы удалила сведения об авторских правах и соответствующие метаданные из статей научных журналов в данном массиве. Более того, Meta нарушила авторские права, скачав массив LibGen через протокол BitTorrent — в этот момент компания не только скачивала, но и одновременно «раздавала» эти данные, фактически распространяя пиратские материалы, утверждает сторона истца. Глава отдела генеративного ИИ в Meta Ахмад Аль-Дахле (Ahmad Al-Dahle) дал разрешение скачивать данные LibGen через BitTorrent, хотя инженер Башлыков указывал, что это «может быть юридически недопустимо».

Дело ещё далеко до завершения. Пока оно касается только ранних моделей Llama, а не последних выпусков. И если Meta убедит суд в добросовестном использовании материалов, он может встать на сторону компании — в 2023 году несколько истцов так и не смогли доказать факта нарушения авторских прав, и их иски к Meta были отклонены.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
window-new
Soft
Hard
Тренды 🔥
Halo на PS5, ремейк Final Fantasy VII на Xbox и Gears of War осенью: инсайдер рассказал, чего ждать от Xbox в 2025 году 43 мин.
Глава Larian: игроки Baldur’s Gate 3 установили через встроенный менеджер уже 100 миллионов модов 3 ч.
Bandai Namco уточнила, когда пройдёт закрытое тестирование Elden Ring Nightreign — запись уже открыта 3 ч.
После ослабления модерации наметился массовый исход пользователей из Facebook и Instagram 4 ч.
«Не поверил бы, не будь это Ubisoft»: новая дата релиза Assassin’s Creed Shadows пришлась на 30-летие одного из самых страшных терактов в истории Японии 4 ч.
От новичков до ветеранов первого «Ведьмака»: в CD Projekt Red рассказали, кто разрабатывает The Witcher 4 7 ч.
На TikTok в США нашёлся новый покупатель за 10 дней до возможного запрета сервиса 8 ч.
Марк Цукерберг лично разрешил обучать ИИ-модели Llama на пиратских материалах 8 ч.
Глава X заявила о возвращении рекламодателей в соцсеть, но сторонняя статистика не согласна 8 ч.
Nvidia показала в деле ИИ-бота R2X, который поможет в использовании ПК — без ошибок не обошлось 9 ч.
Китайцы показали на CES 2025 летающий мотоцикл — для него заявлено 40 минут полёта, но без доказательств 2 ч.
Boeing готова доставить исследовательский дирижабль на Титан, который будет работать годами 2 ч.
MSI показала СЖО, внутрь которой можно вставить пластиковую фигурку или другой предмет 3 ч.
IceGiant представила тихие жидкостные кулеры, которые работают вообще без помпы 4 ч.
В Китае заработала крупнейшая в мире гидроаккумулирующая электростанция мощностью 3,6 ГВт 4 ч.
США отправят на Луну «пылесос» для сбора образцов грунта 5 ч.
Nokia завершила продажу Франции Alcatel Submarine Networks 5 ч.
Выручка Foxconn взлетела на 42 % благодаря продажам ИИ-серверов 6 ч.
Анонсирован смартфон Redmi Note 14 для глобального рынка в версиях с 5G и 4G по цене от €200 6 ч.
Штаб-квартира на острове, ЦОД — на материке: Малайзия и Сингапур подписали соглашение о создании особой экономической зоны JS-SEZ 6 ч.