虎嗅

Titulo traducido: El último blog de Anthropic: El cuello de botella para los agentes biológicos no está en el modelo, sino en la infraestructura de datos

原文：Anthropic最新博客：生物学Agent的瓶颈不在模型，而在数据基础设施

2026-06-09 阅读原文

Resumen del contenido central

El desarrollo del AI en el campo de la biología avanza mucho más lentamente que en el área de la programación. El verdadero obstáculo no radica en la falta de capacidad de razonamiento de los grandes modelos, sino en la obsoleta infraestructura de datos biomédicos, diseñada para ser manejada por humanos (similar a las ciudades antiguas de la era de los carruajes), lo que no es adecuado para los agentes AI (equivalentes a los automóviles modernos). Los estudios de Anthropic sugieren que la solución reside en crear herramientas de datos estables y fáciles de utilizar para estos agentes. Por ejemplo, el tool gget virus, desarrollado en colaboración con el NCBI, ha mejorado significativamente la precisión y la fiabilidad de los agentes al buscar datos biológicos.

El mayor obstáculo para los agentes AI en biología: una infraestructura de datos obsoleta

Puedes imaginar la infraestructura de datos biomédicos como una ciudad antigua sin planificación adecuada para automóviles: calles estrechas y muchas curvas, lo que impide que los agentes AI puedan operar de manera eficiente. Los problemas principales son tres:

1. Formatos desordenados y bases de datos dispersas: Los datos biomédicos utilizan formatos de archivo variados y están distribuidos en múltiples bases de datos, sin un punto de acceso centralizado.

2. Herramientas personalizadas: Las herramientas para trabajar con estos datos están diseñadas específicamente para escenarios particulares, lo que las hace inutilizables de manera generalizada por los agentes AI.

3. Falta de retroalimentación clara: A diferencia del campo de la informática, donde un cambio en el código puede ser rápidamente verificado, en biología no existe una señal clara de éxito cuando un agente realiza una búsqueda correcta (por ejemplo, es difícil verificar inmediatamente si los datos encontrados son correctos).

En contraste, la infraestructura del software está diseñada para automóviles: cuenta con API estandarizadas y sistemas de control de versiones que facilitan el funcionamiento eficiente de los agentes AI.

Las quejas de Karpathy sobre los problemas comunes en biología y desarrollo web

Hace unos meses, el experto en AI Karpathy señaló que escribir aplicaciones web es sencillo, pero que procesos como la autenticación y los pagos requieren múltiples clics en el navegador, lo que lleva mucho tiempo. Este problema es similar al de la biología: las herramientas biomédicas están diseñadas para ser utilizadas por humanos mediante operaciones manuales. Por ejemplo, un virologo que busca secuencias genéticas en una base de datos debe seleccionar manualmente numerosos criterios de filtro, lo que es completamente automatizable para los agentes AI.

El “impuesto de clics” en el campo de la virología

El ejemplo de la epidemia de Ébola ilustra este problema: cuando estalló en el Congo, los científicos necesitaban comparar rápidamente nuevos virus con datos históricos para determinar la efectividad de los diagnósticos y tratamientos existentes. Este proceso implicaba seleccionar manualmente numerosos criterios en la base de datos NCBI Virus, lo que era tedioso y propenso a errores.

¿Qué tan fiables son las búsquedas automatizadas por agentes AI?

El equipo de Anthropic realizó una prueba (VirBench) con varios modelos AI (como GPT-5.5 y Claude Opus) para buscar secuencias virales. Los resultados mostraron que:

1. Precisión baja: El mejor modelo tuvo una precisión del 91.3%, mientras que el peor solo alcanzó el 16.9%.

2. Resultados inestables: Incluso con el mismo modelo, los resultados variaban significativamente al realizar la búsqueda tres veces. Por ejemplo, al buscar secuencias de Ébola, el resultado correcto era de 266 secuencias, pero Claude Sonnet devolvió 106, 15 y 5 secuencias en tres intentos diferentes.

3. Conclusiones erróneas: El uso de datos incorrectos podía llevar a conclusiones absurdas (por ejemplo, determinar que el ancestro común de los virus era de 1922 en lugar de 2014, o juzgar erróneamente la efectividad de un fármaco anticuánico).

La raíz de estos problemas es que los agentes AI no tienen un camino confiable para acceder a los datos y deben hacer conjeturas al realizar sus búsquedas, lo que a menudo resulta en resultados erróneos.

La solución: proporcionar una interfaz estable para los datos

Anthropic y el NCBI desarrollaron el tool gget virus, que convierte la búsqueda de datos virales en una interfaz estable que los agentes AI pueden utilizar directamente. Este tool:

Coordina las API de múltiples bases de datos y gestiona automáticamente los criterios de filtro.
Produce resultados estandarizados con registros detallados para facilitar la verificación.
Resuelve problemas como la búsqueda en lotes y el manejo de datos en páginas divididas.

Los resultados fueron inmediatos: la precisión de todos los agentes AI aumentó al 90% o más (con GPT-5.5 alcanzando el 99.7%), y los resultados se volvieron más consistentes con repeticiones del proceso.

El autor subraya que los agentes científicos necesitan una infraestructura “aburrida pero fiable”. Los modelos pueden ser creativos, pero la lógica de acceso y búsqueda de datos debe ser estable. Incluso si los modelos AI se vuelven más potentes en el futuro, esta infraestructura seguirá siendo crucial, ya que de lo contrario, los agentes tendrían que enfrentar un proceso lento y costoso para acceder a la información.

Conclusión

Para que el AI ayude a resolver problemas científicos en biología, no basta con modelos avanzados; primero es necesario modernizar la infraestructura de datos para que sea adecuada para los agentes AI. gget virus es solo el primer paso. En el futuro, se necesitarán más herramientas como esta para que el AI se convierta realmente en un asistente confiable para los científicos.