虎嗅

**Titre français :** Le dernier blog d’Anthropic : Le goulot d’étranglement des agents biologiques ne réside pas dans les modèles, mais dans l’infrastructure de données

原文:Anthropic最新博客:生物学Agent的瓶颈不在模型,而在数据基础设施

Résumé des points clés

Le développement de l'IA dans le domaine de la biologie est bien plus lent que dans celui de la programmation. Le véritable obstacle n'est pas tant l'insuffisance des capacités de raisonnement des grands modèles, mais plutôt l'infrastructure de données biomédicales obsolète et mal conçue – ces infrastructures ont été créées pour être manipulées manuellement par les humains (comme les villes anciennes de l'époque des voitures à cheval), ce qui ne convient pas aux agents IA (équivalents aux voitures modernes). Des recherches menées par Anthropic suggèrent que la solution réside dans la mise au point d'outils de données stables et faciles à utiliser pour ces agents. Par exemple, l'outil gget virus, développé en collaboration avec NCBI, a considérablement amélioré la précision et la fiabilité des recherches de données biologiques par les agents.

Le principal obstacle des agents IA en biologie : une infrastructure de données dépassée

On peut comparer l'infrastructure de données biomédicales à une ville ancienne où les voitures n'ont jamais été conçues : les rues sont étroites et sinueuses, rendant impossible la circulation des véhicules modernes. Trois problèmes principaux existent :

1. Formatations désordonnées et bases de données dispersées : Les données biomédicales sont stockées dans divers formats et dans des bases de données disparates, sans point d'accès centralisé.

2. Outils personnalisés : Les outils utilisés pour manipuler ces données sont conçus pour des scénarios spécifiques et ne peuvent pas être généralisés.

3 Manque de feedback clair : Dans le domaine du logiciel, un simple changement de code peut être rapidement testé pour vérifier son correctitude, tandis qu'en biologie, il n'y a pas de signal de récompense clair lorsque l'agent effectue une tâche correctement (par exemple, il est difficile de vérifier immédiatement si une recherche de données est exacte).

En contraste, les infrastructures du domaine logiciel sont conçues pour des applications standardisées : elles disposent d'APIs bien définies et de systèmes de gestion des versions (comme les règles de la circulation), permettant aux agents de fonctionner sans problème.

Les mêmes problèmes dans le développement web

Il y a quelques mois, l'expert en IA Karpathy a souligné que la rédaction d'applications web est relativement simple, mais que des opérations complexes comme l'authentification ou les paiements nécessitent de nombreux clics dans le navigateur, ce qui prend beaucoup de temps. Ce problème est identique à celui de la biologie : les outils biomédicaux sont conçus pour être utilisés manuellement par les humains. Par exemple, un virologue doit sélectionner des critères dans une base de données pour trouver des séquences virales ; les agents IA ne peuvent pas automatiser ces tâches.

Le “taxe des clics” en virologie

Prenons l'exemple de l'épidémie d'Ebola : lors de son apparition au Congo, les scientifiques devaient comparer rapidement les nouveaux variants du virus avec des données historiques pour déterminer si les diagnostics et les médicaments existants étaient efficaces. Ce processus impliquait de sélectionner manuellement de nombreux critères dans la base de données NCBI Virus, ce qui était fastidieux et sujet à erreurs.

Ces étapes manuelles ressemblent à un “taxe des clics” imposé à la recherche scientifique : les humains trouvent cela ennuyeux, et les agents IA encore plus défaillants, car ils ne comprennent pas bien les menus déroulants ou les cases à cocher sur les pages web, ni ne peuvent mémoriser tous les critères de sélection.

Quelle est la fiabilité des recherches menées par les agents eux-mêmes ?

L'équipe d'Anthropic a réalisé un test (VirBench) avec plusieurs modèles IA (tels que GPT-5.5 et Claude Opus) pour effectuer 120 tâches de recherche de séquences virales. Les résultats ont montré :

1. Faible précision : Le meilleur modèle atteignait seulement 91,3 % de précision, tandis que le pire n'en atteignait que 16,9 %.

2 Instabilité des résultats : Même avec le même modèle, les résultats variaient considérablement lors de plusieurs exécutions. Par exemple, pour la recherche d'une séquence d'Ebola, la réponse correcte était de 266 séquences, mais Claude Sonnet a retourné respectivement 106, 15 et 5 séquences dans trois tentatives.

3 Conclusions erronées : L'utilisation de données incorrectes pouvait conduire à des résultats absurdes (par exemple, faire remonter l'ancêtre commun des virus de 2014 à 1922, ou juger faux l'efficacité d'un médicament antiviral).

La raison de ces problèmes est que les agents IA n'ont pas de moyen fiable d'accéder aux données et doivent donc agir par supposition, ce qui peut conduire à des résultats erronés mais apparemment logiques.

Une solution : fournir une interface stable

Anthropic et NCBI ont développé l'outil gget virus, qui transforme la recherche de données virales complexes en une interface standardisable que les agents IA peuvent utiliser directement. Cet outil :

  • Coordonne les API de plusieurs bases de données pour gérer automatiquement les critères de sélection.
  • Produit des résultats normalisés accompagnés de journaux détaillés, facilitant la vérification des résultats.
  • Résout les problèmes liés aux recherches en masse ou à l'affichage paginé.

Les résultats ont été immédiatement positifs : la précision de tous les agents a augmenté à plus de 90 % (jusqu'à 99,7 % pour GPT-5.5), et la répétition des tests a confirmé la stabilité des résultats.

L'auteur souligne que les agents scientifiques ont besoin d'une base solide et fiable, même si les modèles IA peuvent être créatifs (par exemple, générer des hypothèses). L'accès aux données et les logiciques de recherche doivent être stables. Même si les modèles s'améliorent à l'avenir, une telle infrastructure restera essentielle pour que les agents IA puissent aider efficacement les scientifiques.

En conclusion

Pour que l'IA puisse aider les humains à résoudre les problèmes biologiques, il ne suffit pas de disposer de grands modèles ; il est nécessaire de moderniser d'abord les infrastructures de données biomédicales pour qu'elles soient adaptées aux agents IA. L'outil gget virus n'est que le premier pas vers une collaboration plus efficace entre IA et scientifiques. D'autres outils similaires seront nécessaires pour que l'IA devienne un véritable assistant fiable pour la recherche scientifique.