虎嗅

전자책을 훔친 뒤 15억 달러의 벌금을 받은 클로드, 이번에는 수백만 권의 종이책을 파괴하다 (“After stealing e-books and being fined $1.5 billion, Claude destroyed millions of physical books this time.”) --- 이 번역은 중국어 원문의 의미를 정확히 전달하면서도 한국 금융 뉴스 웹사이트에 적합한 자연스러운 표현을 사용했습니다. 또한, 한국 언론의 관용구와 표현 방식을 고려하여 독자가 이해하기 쉽게 구성되었습니다.

原文：偷下电子书、被罚15亿美元后，Claude又毁掉了百万本实体书

2026-06-08 阅读原文

핵심 내용 요약

AI 기업 Anthropic（Claude의 모회사)은 불법 복제된 책을 사용하여 AI를 훈련시킨 혐의로 작가들에게 집단 소송을 당했으며, 최종적으로 15억 달러의 합의금을 지불하고 분쟁을 해결했습니다. 하지만 이 사건의 초점은 고액의 변호사 비용으로 옮겨갔습니다(변호사들은 처음에 3억 달러를 요구했으나 결국 1억 8,750만 달러로 합의). 판사는 불법 복제된 책을 사용한 AI 훈련은 저작권 침해에 해당하지만, 정식으로 구매한 책을 사용한 AI 훈련은 ‘합리적인 사용’에 해당한다고 판결했습니다(이는 인간이 책을 읽고 배우는 것과 유사하다는 논리입니다). Anthropic은 규정 준수를 위해 ‘파나마 프로젝트’를 진행하여 실제 책을 구매한 후 제본을 제거하고 스캔한 정식 텍스트를 사용하여 AI를 훈련시켰습니다. 이 사건은 AI 훈련과 관련된 저작권의 모호성과 이해관계의 갈등을 드러냈습니다.

1. 왜 AI 기업들은 불법 복제된 책을 사용하는가? – 정식 구매가 너무 번거롭기 때문

AI가 고품질의 콘텐츠를 생성하려면 양질의 텍스트가 필요한데, 온라인 게시물보다는 실제 책이 더 신뢰할 수 있습니다. 하지만 정식으로 책을 구매하고 사용하는 것은 번거로운 과정입니다(출판사와 협상, 계약 체결, 저작권료 지불 등). 이에 Anthropic은 다음과 같은 ‘지름길’을 택했습니다:

먼저 공개된 불법 복제 데이터셋인 ‘Books3’(약 20만 권의 불법 복제 책 포함)를 사용했으며, 작가 Andrea Bartz는 자신의 책이 그 데이터셋에 포함되어 있다는 것을 발견하고 소송을 제기했습니다.
더욱 놀라운 것은 Anthropic의 공동 창립자가 직접 나서서 2021년에 Books3에서 19만 권 이상의 책을 다운로드했으며, 이후 불법 복제 웹사이트에서 500만 권을 추가로 다운로드했습니다. 2022년에 새로운 불법 복제 웹사이트가 등장하자 또다시 200만 권을 다운로드하며 동료들에게도 이를 활용할 것을 촉구했습니다. 결국 시간과 비용을 절약하기 위해 의도적으로 불법 복제된 책을 사용한 것입니다.

2. 소송 결과: 15억 달러의 합의금 및 법적 모호성

2025년 판사는 다음과 같이 판결했습니다:

불법 복제를 통한 AI 훈련은 저작권 침해에 해당합니다: Anthropic이 불법 복제된 책을 다운로드하고 보유한 행위는 ‘합리적인 사용’의 예외가 아니므로, 모든 다운로드가 저작권 침해에 해당하며 15억 달러를 배상하고 모든 불법 복제 자료를 삭제해야 합니다.
정식으로 구매한 책을 사용한 AI 훈련은 합법입니다: 판사는 합법적으로 구매한 책을 사용한 AI 훈련이 ‘혁신적인 창작 활동’에 해당한다고 보았으며, 이는 인간이 책을 읽고 그 내용을 바탕으로 창작하는 것과 유사합니다(인간은 책을 구매하여 사용하지만 모든 경우에 저작권료를 지불하지 않음).

Anthropic은 이 법적 모호성을 활용하여 ‘파나마 프로젝트’를 통해 수백만 달러를 들여 실제 책을 구매한 후 제본을 제거하고 전자 문서로 변환한 뒤 재활용했습니다. 이 방식으로 그들은 ‘정식 저작권이 있는’ 텍스트를 사용하여 AI를 학습시킬 수 있었습니다. 작가들은 이 조치가 과연 합법적인지 의문을 제기했지만, 판사는 이를 인정했습니다.

3. 가장 문제가 된 것은 변호사 비용

작가들: 자신이 고생하여 쓴 책이 무단으로 사용되었지만 받은 돈은 변호사 비용에도 미치지 못합니다.
판사와 Anthropic: 변호사들이 세부적인 업무 시간을 제공하지 않았기 때문에 그렇게 많은 금액을 요구하는 것이 타당한가?

변호사들은 이후 비용 비율을 12.5%로 낮추었지만, 여전히 일부 작가들은 반대했습니다. 그럼에도 불구하고 90% 이상의 저작물이 합의에 동의했으며, 최종 결과는 변하지 않을 가능성이 높습니다. 이 사건은 ‘창작의 존엄성’을 위한 소송이었지만, 결국 ‘변호사 비용 문제’로 번졌습니다.

4. AI 훈련과 인간 학습의 유사성에 대한 논란

판사가 AI 훈련을 인간의 독서 과정에 비유한 것은 이 사건의 가장 중심적인 논쟁점입니다:

기술 기업 지지자들: 이는 AI의 승리라고 보며, 앞으로 정식으로 구매한 책을 사용하여 AI를 훈련시킬 수 있게 되어 AI의 발전에 도움이 될 것입니다.

이 논란은 당장 해결되기 어렵습니다. AI 기업들은 발전해야 하고, 작가들은 자신의 권리를 보호해야 하며, 법률은 아직 기술의 발전 속도를 따라잡지 못하고 있습니다.

결론

1. 불법 복제는 분명히 허용되지 않지만, 정식 구매를 기반으로 한 AI 훈련의 경계선은 여전히 모호합니다.

2. 이해관계의 분배가 공정해야 하며, 변호사들이 대부분의 이익을 독차지해서는 안 됩니다.

3. AI와 인간의 창작 활동 간의 관계에 대한 더 명확한 규칙이 필요합니다.

앞으로 AI 기업, 작가들, 법률 전문가들은 AI가 과연 ‘책을 읽을 수 있는지’, 그리고 책을 읽은 후 작가들에게 어떻게 보상을 해야 하는지에 대해 더 깊이 논의해야 합니다. 그렇지 않으면 유사한 소송이 계속될 것입니다.