Обзор СМИ

Meta скачала более 80 ТВ пиратских книг с торрентов для обучения моделей искусственного интеллекта

10 февраля 2025, 10:36Новости162

Цей матеріал також доступний українською

В прошлом месяце Meta признала, что использовала торренты для загрузки большого набора данных, известного как LibGen, содержащий десятки миллионов пиратских книг

  • Ссылка скопированаlink copied

Судебное дело писателей против Meta раскрыло новые подробности использования пиратских копий книг, в том числе из российской библиотеки LibGen, для обучения моделей искусственного интеллекта компании.

В прошлом месяце Meta признала, что использовала торренты для загрузки большого набора данных, известного как LibGen, содержащий десятки миллионов пиратских книг. Об этом пишет Ars Technica.

Теперь были впервые были обнародованы неотредактированные электронные письма Meta, которые указывают, что компания загрузила «по меньшей мере 81,7 терабайта данных из нескольких теневых библиотек через сайт Anna’s Archive, в том числе по меньшей мере 35,7 терабайта данных по Z-Librar. В нем также указано, что «Meta также ранее загрузила 80,6 терабайта данных из LibGen».

«Масштабы незаконной торрент-схемы Meta впечатляют», — отмечают писатели. Они утверждают, что «намного меньшие акты пиратства данных — только 0,008 процента от количества защищенных авторским правом произведений, скопированных Meta, привели к тому, что судьи направили дело в прокуратуру США для проведения уголовного расследования».

Ранее компания пыталась не допустить огласки использования пиратских книг для обучения своих моделей ИИ. Однако судья отклонил просьбу Meta и заявил, что компания настаивала на редактировании материалов не для того, чтобы защитить свои бизнес-интересы, а для того, чтобы «избежать негативной огласки».

Meta раскрыла в исследовательской работе, что она тренировала свою обширную языковую модель Llama на фрагментах Books3, набора данных из около 196 000 книг, извлеченных из интернета. Однако ранее она публично не указывала, что загружала данные непосредственно из LibGen.

Источник

Не пропустите важное!
Подписывайтесь и получайте дайжест новостей

Ежедневно или еженедельно – выбираете вы!

Мнение эксперта

Хотите стать автором borg.expert?

Материалы по теме

Огляд ринків

Статьи • БОРГ-review
Понад 99% активів на ринку становлять саме токени. Станом на 2025 рік їхня кількість оцінюється в ~36 млн, тоді як криптовалют – близько десяти тисяч

Огляд ринків

Статьи • БОРГ-review
Блокчейн дозволяє людям діяти навіть там, де держава намагається закрити всі можливості, фактично виступаючи проти диктатури і цензури в будь-якій формі

Огляд ринків

Статьи • БОРГ-review
Не хочеться думати, що до розробки законів в Україні іноді долучаються випадкові люди

Огляд ринків

Статьи • БОРГ-review
Проблема в тому, що "спір про право" інколи перетворюється на штучний бар’єр для доступу до процедур банкрутства

Огляд ринків

Статьи • БОРГ-review
Санкційні активи можуть стати драйвером оновлення економіки, але лише тоді, коли держава гарантує інвесторам правову стабільність

Огляд ринків

Статьи • БОРГ-review
Для ефективного використання можливостей, наданих Законом №4564-ІХ, суб’єктам господарювання рекомендується ретельно переглянути статути своїх товариств