
Последнее обновление от 27 июня, 2025 автором Антон Резчиков
Генеративный ИИ уже подвергся резкой критике за свою ненадёжность, высокое энергопотребление и несанкционированное использование материалов, защищённых авторским правом. Недавнее судебное разбирательство раскрывает, что обучение таких моделей ИИ также включало массовое уничтожение бумажных книг.
Скрытая в деталях недавнего частичного судебного решения против Anthropic информация содержит неожиданное признание. Компания, создающая генеративный ИИ, уничтожила миллионы бумажных книг, срезав переплёты и выбросив остальное — всё ради обучения своего ИИ-ассистента. Примечательно, что этот факт был указан как одна из причин, повлиявших на решение суда в пользу Anthropic.
Для создания Claude, своей языковой модели и конкурента ChatGPT, Anthropic обучала систему на максимально возможном количестве книг. Компания закупила миллионы бумажных томов и оцифровала их, разрывая на страницы и сканируя их, что навсегда уничтожило сами книги.
Более того, Anthropic не планирует делать полученные цифровые копии доступными для публики. Эта деталь убедила судью в том, что процесс оцифровки и обработки книг представляет собой достаточную трансформацию, чтобы считаться «добросовестным использованием». Хотя, предположительно, Claude использует эту цифровую библиотеку для генерации уникального контента, критики указывают, что крупные языковые модели иногда дословно воспроизводят материалы из обучающего набора.
Частичная юридическая победа Anthropic теперь позволяет ей обучать ИИ на книгах, защищённых авторским правом, без уведомления издателей или авторов, устраняя тем самым одну из главных преград, сдерживавших развитие генеративного ИИ. Бывший исполнительный директор Metal недавно признал, что ИИ «умрёт за одну ночь», если его заставят соблюдать законы об авторском праве, поскольку разработчики лишатся доступа к огромным массивам данных, необходимых для обучения языковых моделей.
Тем не менее продолжающиеся судебные споры по авторскому праву всё ещё представляют серьёзную угрозу для технологий. В начале этого месяца генеральный директор Getty Images признал, что компания не может позволить себе оспаривать каждое нарушение авторских прав, связанное с ИИ. Тем временем иск Disney против Midjourney, в рамках которого компания продемонстрировала способность генератора изображений воссоздавать защищённый контент, может иметь серьёзные последствия для всей индустрии генеративного ИИ.
Тем не менее судья по делу Anthropic вынес и отрицательное решение: компания частично использовала пиратские библиотеки книг для обучения Claude. Anthropic всё ещё предстоит пройти судебное разбирательство по авторским правам в декабре, по итогам которого ей могут назначить штраф до $150000 за каждое пиратское произведение.