虎嗅

Клод украл электронные книги, был оштрафован на 1,5 миллиарда долларов, а затем уничтожил миллионы печатных экземпляров книг.

原文:偷下电子书、被罚15亿美元后,Claude又毁掉了百万本实体书

Краткое содержание

Материнская компания Anthropic (владеющая технологией Claude) была коллективно подана в суд авторами за использование пиратских книг для обучения искусственного интеллекта. В итоге компания достигла соглашения о выплате компенсации в размере 1,5 миллиарда долларов. Однако центр внимания переключился на высокие расходы на адвокатские услуги (изначально требуемая сумма составляла 300 миллионов долларов, позже снижена до 187,5 миллионов). Суд постановил, что использование пиратских книг для обучения ИИ является нарушением авторских прав, в то время как использование оригинальных книг считается разумным использованием (аналогично процессу обучения у людей). Для соблюдения законодательства Anthropic реализовала проект под названием «Панамский проект»: они покупали печатные книги, сканировали их, а затем утилизировали, используя оригинальный текст для обучения ИИ. Этот спор выявил неопределенности в вопросах авторских прав при использовании ИИ, а также противоречия в распределении интересов.

Почему компании по обучению ИИ приходится использовать пиратские книги?

Для создания качественного контента необходимы достоверные тексты, и книги считаются более надежным источником информации, чем онлайн-посты. Однако приобретение оригинальных книг сопровождается сложными процедурами: необходимо вести переговоры с издателями, подписывать контракты и платить авторские отчисления (генеральный директор Anthropic назвал это «правовыми и коммерческими трудностями». Поэтому компании выбрали более простой путь:

  • Сначала они использовали общедоступные пиратские наборы данных, такие как Books3 (включающие почти 200 тысяч книг); автор Андреа Барц обнаружила свою книгу в этом наборе и подала в суд;
  • Еще более удивительно, что один из сооснователей Anthropic лично участвовал в пиратском скачивании книг: в 2021 году он скачал более 190 тысяч книг из набора Books3, затем еще 5 миллионов с пиратских сайтов; в 2022 году, когда появились новые пиратские ресурсы, он скачал еще 2 миллиона книг и призвал коллег воспользоваться этим возможностью.

Результаты судебного разбирательства: компенсация в размере 1,5 миллиарда долларов и юридический пробел

В 2025 году суд постановил:

1. Использование пиратских книг для обучения ИИ является нарушением авторских прав; каждое скачивание считается отдельным нарушением, и Anthropic должна выплатить компенсацию в размере 1,5 миллиарда долларов, а также уничтожить все пиратские материалы;

2. Использование оригинальных книг считается законным; суд пришел к выводу, что использование оригинальных текстов для обучения ИИ представляет собой разумное использование авторских прав, аналогично процессу обучения у людей (человек покупает книгу, читает ее и может использовать содержимое без дополнительных выплат).

Anthropic воспользовалась этим юридическим пробелом: они приобрели миллионы печатных книг, сканировали их и утилизировали, получив таким образом тексты с официальными авторскими разрешениями для обучения ИИ. Авторы были ошеломлены, но суд признал этот подход законным.

Самое раздражающее — расходы на адвокатские услуги

Компенсация в 1,5 миллиарда долларов кажется большой суммой, но авторы получили лишь незначительную часть от нее (около 3000 долларов за каждое нарушенное произведение); кроме того, эта сумма должна была быть разделена с правообладателями (издателями). Адвокатская команда изначально требовала 300 миллионов долларов (20% от общей суммы компенсации), что вызвало недовольство всех сторон:

  • Авторы: их труд создавался без их разрешения, а полученная ими сумма была незначительной по сравнению с расходами на адвокатские услуги;
  • Суд и Anthropic: адвокаты не предоставили подробных отчетов о своей работе, почему же они должны получать такую большую долю?

Впоследствии процент снизился до 12,5% (187,5 миллионов долларов), но 7 авторов все равно выступили против этого решения. Тем не менее более 90% произведений было включено в соглашение о мирном урегулировании спора, и, скорее всего, окончательный результат не изменится — спор, начавшийся из-за защиты авторских прав, превратился в разбирательство о размере расходов на адвокатские услуги.

Споры вокруг аналогии между обучением ИИ и человеческим обучением

Сравнение процесса обучения ИИ с чтением у людей стало ключевым аспектом этого дела:

  • Сторонники технологий: считают, что это победа для ИИ, поскольку теперь можно законно использовать оригинальные книги для его обучения, что способствует развитию этой технологии;
  • Авторы и этические эксперты: возражают, утверждая, что ИИ не является человеком; процесс обучения у людей включает понимание и творчество, в то время как ИИ лишь копирует и переобразует тексты. Если использование ИИ считается «обучением», авторские права авторов теряют свою значимость — будет ли это означать, что ИИ может использовать чужие произведения без разрешения при условии покупки оригинальных копий?

Этот спор не может быть решен в ближайшем времени: компании, занимающиеся разработкой ИИ, нуждаются в развитии технологий, авторы — в защите своих прав, а законодательство еще не успевает соответствовать быстрым темпам их развития.

Выводы из этого дела

Проблема авторских прав при использовании ИИ гораздо сложнее, чем простой вопрос о пиратстве. Пример Anthropic показывает:

1. Пиратское использование текстов недопустимо; однако границы законного использования оригинальных материалов все еще не определены;

2. Распределение интересов должно быть справедливым; адвокаты не должны получать большую долю от компенсации, в то время как авторы остаются без значительной части выгоды;

3. Отношения между ИИ и творческим процессом у людей требуют более четких правил.

В будущем компаниям, занимающимся разработкой ИИ, авторам и юристам предстоит серьезно обсудить вопросы использования авторских прав при обучении ИИ: может ли ИИ действительно считаться «человеком», который читает книги, и как следует распределять выгоды от этого процесса между авторами. В противном случае подобные споры будут продолжаться.