Огляд ЗМІ

Meta завантажила понад 80 ТБ піратських книжок із торентів для навчання моделей штучного інтелекту

10 лютого 2025, 10:36Новини1055

Этот материал также доступен на русском

Минулого місяця Meta визнала, що використовувала торенти для завантаження великого набору даних, відомого як LibGen, який містить десятки мільйонів піратських книг

  • Посилання скопійованоlink copied

Судова справа письменників проти Meta розкрила нові подробиці використання піратських копій книг, зокрема з російської бібліотеки LibGen, для навчання моделей штучного інтелекту компанії.

Минулого місяця Meta визнала, що використовувала торенти для завантаження великого набору даних, відомого як LibGen, який містить десятки мільйонів піратських книг. Про це пише Ars Technica.

Тепер були вперше були оприлюднені невідредаговані електронні листи Meta, які вказують, що компанія завантажила «щонайменше 81,7 терабайта даних з кількох тіньових бібліотек через сайт Anna’s Archive, в тому числі щонайменше 35,7 терабайта даних з Z-Library і LibGen», йдеться в судовому позові авторів. В ньому також вказано, що «Meta також раніше завантажила 80,6 терабайта даних з LibGen».

«Масштаби незаконної торент-схеми Meta вражають», — зазначають письменники. Вони стверджують, що «набагато менші акти піратства даних — лише 0,008 відсотка від кількості захищених авторським правом творів, скопійованих Meta, — призвели до того, що судді направили справу до прокуратури США для проведення кримінального розслідування».

Раніше компанія намагалася не допустити розголосу про використання піратських книг для навчання своїх моделей ШІ. Проте суддя відхилив прохання Meta і заявив, що компанія наполягала на редагуванні матеріалів не для того, щоб захистити свої бізнес-інтереси, а для того, щоб «уникнути негативного розголосу».

Meta розкрила в дослідницькій роботі, що вона тренувала свою велику мовну модель Llama на фрагментах Books3, набору даних з близько 196 000 книг, витягнутих з інтернету. Однак раніше вона публічно не вказувала, що завантажувала дані безпосередньо з LibGen.

Джерело

Не пропустіть важливе!
Підписуйтесь та отримуйте дайжест новин

Щоденно чи щотижня – обираєте ви!

Думка експерта

Бажаєте стати автором borg.expert?

Матеріали за темою

Огляд ринків

Статті • БОРГ-review
Понад 99% активів на ринку становлять саме токени. Станом на 2025 рік їхня кількість оцінюється в ~36 млн, тоді як криптовалют – близько десяти тисяч

Огляд ринків

Статті • БОРГ-review
Блокчейн дозволяє людям діяти навіть там, де держава намагається закрити всі можливості, фактично виступаючи проти диктатури і цензури в будь-якій формі

Огляд ринків

Статті • БОРГ-review
Не хочеться думати, що до розробки законів в Україні іноді долучаються випадкові люди

Огляд ринків

Статті • БОРГ-review
Проблема в тому, що "спір про право" інколи перетворюється на штучний бар’єр для доступу до процедур банкрутства

Огляд ринків

Статті • БОРГ-review
Санкційні активи можуть стати драйвером оновлення економіки, але лише тоді, коли держава гарантує інвесторам правову стабільність

Огляд ринків

Статті • БОРГ-review
Для ефективного використання можливостей, наданих Законом №4564-ІХ, суб’єктам господарювання рекомендується ретельно переглянути статути своїх товариств