Resumen del contenido central
Anthropic, la empresa matriz de Claude (una compañía de IA), fue demandada colectivamente por escritores por usar libros pirateados para entrenar a sus algoritmos de inteligencia artificial. Finalmente, llegaron a un acuerdo y Anthropic pagó una indemnización de 1500 millones de dólares. Sin embargo, el foco del caso se desplazó hacia los elevados costos legales: los abogados inicialmente demandaban 300 millones de dólares, pero luego redujeron la cantidad a 187,5 millones. El juez dictaminó que usar libros pirateados para entrenar a la IA constituye una violación de derechos de autor, mientras que utilizar libros legales se considera un “uso razonable” (análogo al proceso de lectura y aprendizaje humano). Para cumplir con las regulaciones, Anthropic lanzó el “Proyecto Panamá”: compraron libros físicos, los escanearon para eliminar sus páginas centrales y luego utilizaron los textos legales para entrenar a la IA. Este caso ha revelado las zonas oscuras en torno a los derechos de autor relacionados con el entrenamiento de la IA, así como las contradicciones en la distribución de beneficios.
I. ¿Por qué las empresas de IA necesitan usar libros pirateados para entrenar? Los libros legales son demasiado complicados y los pirateados son más económicos y rápidos
Para que la IA genere contenido de alta calidad, necesita texto de buena calidad, y los libros son mucho más fiables que los posts en internet. Pero adquirir derechos de autor para libros legales es un proceso complejo: se debe negociar con las editoriales, firmar contratos y pagar regalías, lo cual representa una carga legal y comercial significativa (el CEO de Anthropic calificó esto como un “problema legal/comercial”). Por lo tanto, optaron por un camino más sencillo:
- Inicialmente, utilizaron el conjunto de datos público pirateado “Books3”, que contenía casi 200.000 libros piratales; la escritora Andrea Bartz descubrió que uno de sus libros estaba incluido en ese conjunto y los demandó.
- Lo que es aún más sorprendente es que uno de los cofundadores de Anthropic, Mann, participó personalmente en este proceso: en 2021 descargó más de 190.000 libros de Books3, y posteriormente compró otros 5 millones de libros desde sitios web piratales. Cuando apareció un nuevo sitio web pirateado en 2022, descargó otros 2 millones de libros, instando a sus colegas a aprovechar esta oportunidad, comentando que era “muy oportuno”. En resumen, lo hicieron para ahorrar tiempo y costos, aun sabiendo que se trataba de material pirateado.
II. Resultado del caso: una indemnización de 1500 millones de dólares y una “laguna legal”
En 2025, el juez dictaminó lo siguiente:
- Usar libros pirateados para entrenar a la IA es una violación de derechos de autor: las acciones de Anthropic de descargar y almacenar libros piratales no están protegidas por el concepto de “uso razonable”; cada descarga constituye una infracción, por lo que deben pagar 1500 millones de dólares y destruir todo el contenido pirateado.
- Usar libros legales para entrenar a la IA es legal: el juez consideró que utilizar libros adquiridos legalmente representa un “acto creativo revolucionario”, similar al proceso humano de leer y luego crear. Al igual que las personas no tienen que pagar cada vez que citan un libro que han comprado, la IA tampoco debería hacerlo.
Anthropic aprovechó esta laguna legal y lanzó el “Proyecto Panamá”: invirtió millones de dólares en comprar millones de libros físicos, los escaneó para convertirlos en texto electrónico y luego desechó las páginas. De esta manera, obtuvieron textos con derechos de autor legales para entrenar a la IA de manera legal. Los escritores quedaron perplejos ante esta estrategia, pero el juez la aceptó.
III. Lo más problemático no es la indemnización, sino los costos legales
Aunque la indemnización de 1500 millones de dólares parece elevada, la cantidad que recibieron los escritores fue insignificante: cada obra violada les reportó aproximadamente 3000 dólares, de los cuales también tuvieron que compartir una parte con los propietarios de los derechos de autor (como las editoriales). El equipo legal inicialmente demandaba el 20% del monto total de la indemnización (300 millones de dólares), lo cual generó descontento por parte de todas las partes:
- Los escritores: sus libros fueron utilizados sin su permiso y recibieron una cantidad insignificante a cambio.
- El juez y Anthropic: los abogados no proporcionaron un registro detallado de su trabajo; ¿por qué deberían recibir una parte tan grande?
Posteriormente, el porcentaje se redujo al 12,5% (187,5 millones de dólares), pero siete escritores siguieron oponiéndose. No obstante, más del 90% de las obras aceptaron el acuerdo, lo que indica que el resultado final probablemente no cambiará. Este caso, que comenzó como una lucha por la “dignidad creativa”, se convirtió en un debate sobre cuánto deberían recibir los abogados.
IV. ¿El entrenamiento de la IA es similar al aprendizaje humano? Una gran controversia
El hecho de que el juez comparara el entrenamiento de la IA con el proceso de lectura humana es el punto central de este caso:
- Los partidarios de las empresas de IA: consideran que esto representa una victoria para la IA, ya que en el futuro se podrá utilizar legalmente libros legales para su entrenamiento, lo cual impulsará su desarrollo.
- Los escritores y los expertos en ética: argumentan que la IA no es humana; mientras que las personas leen para comprender y crear, la IA simplemente “copia y reorganiza” grandes cantidades de texto. Si el entrenamiento de la IA se considera un proceso de aprendizaje, entonces los derechos de autor de los escritores quedarían sin protección. ¿Significaría esto que las empresas de IA podrán usar libremente sus libros siempre y cuando compren una versión legala?
Esta controversia no se resolverá fácilmente: las empresas de IA necesitan desarrollarse, mientras que los escritores deben proteger sus derechos. La ley aún no ha avanzado al ritmo de la tecnología.
Conclusión
El problema de los derechos de autor relacionados con el entrenamiento de la IA es más complejo de lo que parece a primera vista. El caso de Anthropic nos demuestra lo siguiente:
1. El uso de materiales pirateados no es aceptable.
2. La distribución de beneficios debe ser justa; no se puede permitir que los abogados se queden con la mayor parte del dinero, dejando a los escritores sin una compensación adecuada.
3. La relación entre la IA y la creación humana requiere reglas más claras.
En el futuro, será necesario que las empresas de IA, los escritores y el mundo jurídico discutan seriamente si la IA realmente puede “leer” libros y cómo deberían repartirse los beneficios derivados de ello. De lo contrario, casos similares seguirán ocurriendo.