虎嗅

بعد سرقة كتب إلكترونية وغرامته بمبلغ 1.5 مليار دولار، دمر كلاود ملايين الكتب المطبوعة

原文:偷下电子书、被罚15亿美元后,Claude又毁掉了百万本实体书

ملخص المحتوى الرئيسي

رفع عدد من الكتاب دعوى قضائية ضد شركة Anthropic (الشركة الأم لتقنية الذكاء الاصطناعي Claude) بتهمة استخدام كتب مسروقة في تدريب نظام الذكاء الاصطناعي الخاص بها، وانتهى الأمر بتسوية قضائية مقابل تعويض قدره 1.5 مليار دولار. لكن التركيز في هذه القضية تحول لاحقًا نحو تكاليف المحاماة الباهظة (حيث طالبت شركة Anthropic بمبلغ 300 مليون دولار في البداية، ثم انخفضت المطالبة إلى 187.5 مليون دولار). كما قرر القاضي أن استخدام الكتب المسروقة في تدريب الذكاء الاصطناعي يعتبر انتهاكًا لحقوق الملكية، بينما يعتبر استخدام الكتب الأصلية "استخدامًا مشروعًا" (على غرار كيفية قراءة وتعلم البشر). وللالتزام بالقوانين، أطلقت شركة Anthropic مشروع "بنما" حيث اشترت كتبًا ورقية، قامت بقطع ظهورها ومسحها ضوئيًا، ثم تم تدمير الكتب واستخدام النصوص الأصلية في تدريب الذكاء الاصطناعي. كشفت هذه القضية عن المناطق الغامضة في قوانين حقوق نشر تدريب الذكاء الاصطناعي، بالإضافة إلى التناقضات في توزيع المصالح.

أولًا: لماذا تلجأ شركات الذكاء الاصطناعي إلى استخدام كتب مسروقة في التدريب؟

لإنتاج محتوى عالي الجودة، يحتاج الذكاء الاصطناعي إلى نصوص موثوقة، والكتب أكثر موثوقية من المنشورات على الإنترنت. لكن شراء حقوق استخدام الكتب الأصلية يتطلب جهودًا كبيرة: التفاوض مع الناشرين، توقيع العقود، ودفع رسوم حقوق الملكية، وهي عملية معقدة (وصفها الرئيس التنفيذي لشركة Anthropic بأنها "مشكلة قانونية/تجارية"). لذلك، اختارت الشركات استخدام مجموعات بيانات مسروقة عامة مثل "Books3" (التي تحتوي على ما يقرب من 200 ألف كتاب مسروق)، واكتشفت الكاتبة Andrea Bartz أن كتابها من ضمن هذه المجموعة فرفعت دعوى قضائية ضد الشركة. والأكثر إثارة للجدل هو مشاركة أحد المؤسسين المشاركين في شركة Anthropic، حيث قام بتحميل أكثر من 190 ألف كتاب من مجموعة Books3 في عام 2021، ثم 5 ملايين كتاب من مواقع إلكترونية مسروقة أخرى، وفي عام 2022 عندما ظهرت مواقع إلكترونية جديدة لبيع الكتب المسروقة، قام بتحميل 2 مليون كتاب أخرى، ودعا زملاءه للاستفادة من هذه الكتب، معلقًا: "كان ذلك في الوقت المناسب تمامًا!" باختصار، الهدف كان توفير الوقت والتكاليف، حتى مع علمهم بأن الكتب مسروقة.

ثانيًا: نتائج القضية: تعويض قدره 1.5 مليار دولار + ثغرة قانونية

في عام 2025، أصدر القاضي حكمًا ينص على ما يلي:

1. استخدام الكتب المسروقة في التدريب يعتبر انتهاكًا لحقوق الملكية؛ شركة Anthropic ملزمة بدفع تعويض قدره 1.5 مليار دولار وتدمير جميع النسخ المسروقة من الكتب.

2. استخدام الكتب الأصلية في التدريب يعتبر قانونيًا؛ اعتبر القاضي أن استخدام الكتب المشتراة بشكل قانوني في تدريب الذكاء الاصطناعي يمثل "نشاطًا إبداعيًا ذا أهمية كبيرة"، مشابهًا لكيفية قراءة البشر وتعلمهم ثم إنتاج المحتوى.

استغلت شركة Anthropic هذه الثغرة القانونية من خلال مشروع "بنما"، حيث اشترت ملايين الكتب الورقية، قامت بتحويلها إلى نصوص إلكترونية، ثم تم تدمير الكتب الورقية. فوجئ الكتاب بهذا التصرف، لكن القاضي وافق عليه.

ثالثًا: المشكلة الأكبر ليست التعويض، بل تكاليف المحاماة

يبدو مبلغ التعويض البالغ 1.5 مليار دولار كبيرًا، لكن المبلغ الذي حصل عليه الكتاب كان ضئيلًا جدًا (حوالي 3000 دولار لكل كتاب مسروق)، وكان عليهم تقاسم هذا المبلغ مع أصحاب حقوق النشر (مثل الناشرين). بدأ فريق المحاماة بطلب 300 مليون دولار (20% من إجمالي التعويض)، ووصفوا ذلك بأنه "تنازل كبير". أثار هذا استياء جميع الأطراف المعنية:

  • الكتاب: كتبهم تم استخدامها دون إذن، والمبلغ الذي حصلوا عليه لا يُقارن بما دفعه المحامون.
  • القاضي وشركة Anthropic: لم يقدم فريق المحاماة سجلات تفصيلية لأوقات عملهم، فلماذا يستحقون مبلغًا كبيرًا؟

تم في النهاية خفض نسبة المبلغ إلى 12.5% (187.5 مليون دولار)، لكن سبعة كتاب ما زالوا يعارضون هذا القرار. ومع ذلك، قبل أكثر من 90% من الكتاب التسوية، ومن المحتمل ألا تتغير النتيجة النهائية؛ فالقضية التي كانت تدور حول "كرامة الإبداع" تحولت في النهاية إلى نزاع حول مقدار تكاليف المحاماة.

رابعًا: هل يمكن اعتبار تدريب الذكاء الاصطناعي عملية تعلم بشرية؟

اعتبر القاضي أن تدريب الذكاء الاصطناعي مشابهًا لعملية قراءة البشر، وهو نقطة الخلاف الرئيسية في هذه القضية:

  • من يدعمون شركات التكنولوجيا يرون أن هذا انتصارًا للذكاء الاصطناعي، حيث سيصبح من الممكن استخدام الكتب الأصلية بشكل قانوني في تدريبه، مما يساعد على تطور التكنولوجيا.
  • الكتاب وعلماء الأخلاق يعترضون قائلين إن الذكاء الاصطناعي ليس بشرًا؛ فالبشر يقرأون ويستوعبون المحتوى ثم ينتجون ما هو جديد، بينما الذكاء الاصطناعي يقوم فقط بنسخ وإعادة ترتيب النصوص. إذا اعتبر تدريب الذكاء الاصطناعي عملية تعلم، فإن حقوق الملكية الفكرية للكتاب ستصبح غير مضمونة… هل يعني ذلك أنه يمكن للذكاء الاصطناعي استخدام كتب الناس بشكل حر؟

في ختام المقال، تظل قضية استخدام التكنولوجيا في تدريب الذكاء الاصطناعي محل جدل كبير، حيث يتأثر القرارات بعوامل قانونية وأخلاقية وتجارية متعددة.