虎嗅

Anthropics neuester Blogbeitrag: Der Engpass bei biologischen Agenten liegt nicht im Modell, sondern in der Dateninfrastruktur Dieser deutsche Titel entspricht dem Inhalt des chinesischen Artikels und fasst die Kernbotschaft prägnant zusammen. Er verwendet eine formelle Sprachweise, die typisch für Finanznachrichtenwebsites ist, und vermittelt den Lesern auf effektive Weise die wichtigsten Informationen.

原文：Anthropic最新博客：生物学Agent的瓶颈不在模型，而在数据基础设施

2026-06-09 阅读原文

Zusammenfassung der Kerninhalte:

Die Entwicklung von KI in dem Bereich der Biologie verläuft deutlich langsamer als im Programmierbereich. Der grundlegende Engpass liegt nicht in der mangelnden Rechenleistung großer Modelle, sondern in der veralteten Infrastruktur für biologische Daten – diese ist auf manuelle Bedienung durch Menschen ausgelegt (ähnlich wie alte Städte aus der Zeit der Kutschen, die nicht für moderne Autos geeignet sind). Forschungen von Anthropic zeigen, dass die Lösung darin besteht, stabile und benutzerfreundliche Tools für Biologie-AI-Agenten zu entwickeln. Ein Beispiel hierfür ist das von ihnen gemeinsam mit dem NCBI entwickelte Tool „gget virus“, welches die Genauigkeit und Stabilität der Datenabrufprozesse erheblich verbessert.

Der größte Engpass für Biologie-AI-Agenten: Die Dateninfrastruktur – wie eine Stadt aus der Kutschenzeit

Man kann die Infrastruktur für biologische Daten als eine alte Stadt betrachten, in der keine Planung für den Verkehr mit Autos stattgefunden hat: Die Straßen sind schmal und verwinkelt, sodass moderne Autos (Agenten) nicht problemlos fahren können. Es gibt drei Hauptprobleme:

1. Unstrukturierte Datenformate und verstreute Datenbanken: Biologische Daten werden in verschiedenen, unstandardisierten Formaten gespeichert und in unterschiedlichen Datenbanken abgelegt – es gibt keine zentrale Eintrittspunkt.

2. Anpassung der Tools an spezifische Anwendungen: Die Werkzeuge zur Verarbeitung dieser Daten sind auf bestimmte Zwecke zugeschnitten und daher nicht universell einsetzbar.

3. Fehlende klare Rückmeldungen: Im Softwarebereich kann eine Änderung im Code schnell überprüft werden, ob sie korrekt ist; in der Biologie gibt es hingegen keine deutlichen Signale dafür, ob eine Aktion erfolgreich war (z. B. ob die Datenabrufaktion richtig erfolgte).

Im Gegensatz dazu ist die Infrastruktur im Softwarebereich auf den Einsatz von Autos ausgelegt: Es gibt standardisierte APIs und Versionskontrollsysteme, die einen reibungslosen Betrieb der Agenten ermöglichen.

Karpathys Kritik: Auch die Entwicklung von Webanwendungen steht vor ähnlichen Problemen**

Vor einigen Monaten beschwerte sich der AI-Experte Karpathy, dass das Schreiben von Webanwendungen zwar einfach sei, aber Prozesse wie Authentifizierung und Zahlungen im Browser sehr aufwendig seien – insbesondere die vielen Klickvorgänge. Dies entspricht genau den Schwierigkeiten in der Biologie: Die Tools für biologische Daten sind ebenfalls auf manuelle Bedienung durch Menschen ausgelegt. Zum Beispiel müssen Virologen bei der Suche nach Virussequenzen zahlreiche Filterkriterien manuell auswählen, was Agenten nicht automatisieren können.

Das „Klick-Problem“ in der Virologie: Auch für Menschen ist diese Vorgehensweise sehr aufwendig – für AI-Agenten sogar noch schwieriger. Beim Ebola-Ausbruch mussten Wissenschaftler im NCBI-Virus-Datenbank zahlreiche Filterkriterien manuell auswählen, was zeitaufwendig und fehleranfällig war.

Wie zuverlässig ist die Datenabrufung durch AI-Agenten?

Das Anthropic-Team führte einen Test durch („VirBench“), bei dem mehrere KI-Modelle (z. B. GPT-5.5, Claude Opus) 120 Virussequenzabrufaufgaben ausführten. Die Ergebnisse zeigten:

1. Niedrige Genauigkeit: Selbst das beste Modell erreichte nur eine Genauigkeit von 91,3 %; das schlechteste Modell lag bei lediglich 16,9 %.

2. Unstabile Ergebnisse: Die Ergebnisse derselben Aufgabe variierten erheblich bei wiederholten Durchführungen des Tests.

3. Falsche Schlussfolgerungen: Fehlerhafte Daten konnten zu falschen Analysen führen – beispielsweise wurde das gemeinsame Alter der Viren auf 1922 Jahre geschätzt oder die Wirksamkeit von Antikörpermedikamenten fälschlicherweise beurteilt.

Die Ursache für diese Probleme ist, dass AI-Agenten keinen zuverlässigen Zugang zu den Daten haben und daher nur spekulativ vorgehen können. Die Ergebnisse erscheinen zwar plausibel, sind in Wirklichkeit jedoch oft falsch.

Lösung: Eine stabile Schnittstelle für die Daten

Anthropic und NCBI entwickelten das Tool „gget virus“, welches den komplexen Datenabrufprozess in eine standardisierte, benutzerfreundliche Schnittstelle verwandelt. Dieses Tool:

Koordiniert die APIs mehrerer Datenbanken und kümmert sich automatisch um die Auswertung der Filterkriterien.
Erstellt standardisierte Ergebnisse mit detaillierten Protokollen zur Überprüfung der Richtigkeit der Abrufaktionen.
Löst Probleme bei der Massenabrufung und der Paginierung der Ergebnisse.

Die Auswirkungen waren sofort sichtbar: Die Genauigkeit aller Agenten stieg auf über 90 % (GPT-5.5 erreichte sogar 99,7 %), und die Ergebnisse wurden bei wiederholten Tests stabiler.

Fazit

Um biologische Herausforderungen mithilfe von KI zu lösen, reichen große Modelle allein nicht aus – es ist notwendig, die Dateninfrastruktur so zu modernisieren, dass sie für AI-Agenten geeignet ist. „gget virus“ ist nur der erste Schritt; in Zukunft werden weitere solche Tools benötigt, damit KI tatsächlich zu zuverlässigen Helfern für Wissenschaftler werden kann.