虎嗅

العنوان المترجم إلى اللغة العربية: آخر مدونة من Anthropic: عقبة وكلاء البيولوجيا ليست في النماذج، بل في البنية التحتية للبيانات

原文:Anthropic最新博客:生物学Agent的瓶颈不在模型,而在数据基础设施

ملخص المحتوى الأساسي

تطور الذكاء الاصطناعي في مجال البيولوجيا أبطأ بكثير من تطوره في مجال البرمجة، والعقبة الرئيسية ليست في قدرات الموديلات الكبيرة على التفكير، بل في تخلف البنية التحتية للبيانات البيولوجية – حيث أن هذه البنية مصممة للاستخدام اليدوي من قبل البشر (مثل المدن القديمة في عصر العربات) ولا تتناسب مع استخدام وكلاء الذكاء الاصطناعي (السيارات الحديثة). أشارت أبحاث شركة Anthropic إلى أن الحل يكمن في بناء أدوات بيانات مستقرة وسهلة الاستخدام للوكلاء، مثل أداة gget virus التي طورتها بالتعاون مع NCBI، والتي ساعدت في تحسين دقة واستقرار عمليات البحث عن البيانات البيولوجية بشكل كبير.

العقبة الأكبر أمام وكلاء الذكاء الاصطناعي في مجال البيولوجيا: البنية التحتية للبيانات مثل “مدينة قديمة”

يمكن تخيل البنية التحتية للبيانات البيولوجية على أنها مدينة قديمة لم يتم تخطيطها لاستقبال السيارات؛ حيث الشوارع ضيقة ومليئة بالزوايا، مما يجعل من المستحيل على السيارات الحديثة (وكلاء الذكاء الاصطناعي) التنقل بسلاسة. هناك ثلاث مشاكل رئيسية:

1. تنوع صيغ البيانات وتفرق قواعد البيانات: توجد صيغ مختلفة للبيانات البيولوجية، والمعلومات موزعة على قواعد بيانات متعددة دون وجود نقطة دخول موحدة.

2. أدوات مخصصة: الأدوات المستخدمة لمعالجة هذه البيانات مصممة خصيصًا لسيناريوهات محددة، مما يجعل من الصعب استخدامها بشكل عام من قبل الوكلاء.

3. نقص إشارات التغذية الراجعة الواضحة: في مجال البرمجيات، يمكن تحديد صحة التغييرات بسرعة من خلال الاختبارات، لكن في علم الأحياء، لا توجد إشارات واضحة تدل على نجاح عمليات البحث.

في المقابل، تم تصميم بنية البرمجيات لتلبية احتياجات “السيارات”؛ حيث توجد واجهات برمجة تطبيقية موحدة (APIs) وأنظمة للتحكم في الإصدارات (مثل قواعد المرور)، مما يسمح للوكلاء بالعمل بسلاسة.

تذمر Karpathy: مشكلة مشتركة بين علم الأحياء وتطوير الويب

قبل بضعة أشهر، اشتكى خبير الذكاء الاصطناعي Karpathy من صعوبات كتابة التطبيقات الويب، حيث استغرقت عمليات المصادقة والدفع وقتًا طويلًا بسبب الحاجة إلى النقر المتكرر في المتصفح. هذه المشكلة مشابهة تمامًا لمشاكل علم الأحياء، حيث أن أدوات البيانات مصممة للاستخدام اليدوي من قبل البشر. على سبيل المثال، يحتاج علماء الفيروسات إلى تحديد شروط بحث دقيقة يدويًا للعثور على البيانات في قواعد البيانات، وهو أمر غير قابل للأتمتة بالنسبة لوكلاء الذكاء الاصطناعي.

مشكلة “ضريبة النقر” في علم الفيروسات: صعبة حتى على البشر، وأكثر إزعاجًا لوكلاء الذكاء الاصطناعي

خذوا جائحة الإيبولا كمثال: عندما انتشر الفيروس في الكونغو، كان على العلماء مقارنة السلالات الجديدة بالبيانات التاريخية لتحديد فعالية الأدوية المتاحة. هذه العملية تتطلب تحديد شروط متعددة يدويًا في قاعدة بيانات NCBI، وهو أمر ممل وخطير من ناحية الأخطاء.

مدى عدم موثوقية عمليات البحث التي يقوم بها الوكلاء بأنفسهم؟

قام فريق Anthropic بإجراء اختبار (VirBench) حيث طلب من عدة نماذج للذكاء الاصطناعي (مثل GPT-5.5 وClaude Opus) إكمال مهام بحث عن 120 تسلسلًا فيروسيًا، ووجدوا أن:

1. الدقة منخفضة: أفضل نموذج حقق دقة قدرها 91.3% فقط، بينما كان أسوأ نموذج يحقق دقة 16.9%.

2. عدم استقرار النتائج: نفس النموذج قدم نتائج مختلفة عند تكرار التنفيذ ثلاث مرات؛ على سبيل المثال، أعاد نموذج Claude Sonnet إظهار 106، 15، و5 نتائج لنفس التسلسل.

3. إمكانية الوصول إلى استنتاجات خاطئة: استخدام بيانات غير دقيقة قد يؤدي إلى نتائج خاطئة، مثل تحديد تاريخ سلف الفيروس في عام 1922 بدلاً من 2014 أو تقييم فعالية دواء بشكل خاطئ.

السبب في هذه المشاكل هو عدم وجود طريقة موثوقة لوصول الوكلاء إلى البيانات، مما يجعلهم يعتمدون على التخمين في عملياتهم، مما قد يؤدي إلى نتائج غير دقيقة.

الحل: توفير واجهة بيانات مستقرة لتحسين أداء الوكلاء

طور فريق Anthropic أداة gget virus بالتعاون مع NCBI، والتي تحول عمليات البحث المعقدة إلى واجهات بيانات يمكن للوكلاء استدعاؤها بشكل مباشر. تساعد هذه الأداة في:

  • تنسيق واجهات برمجة التطبيقات المختلفة لقواعد البيانات ومعالجة شروط البحث تلقائيًا.
  • إظهار نتائج موحدة مع سجلات مفصلة للتحقق من صحة النتائج.
  • حل مشكلات مثل البحث الجماعي وتقسيم النتائج إلى صفحات.

النتائج كانت فورية: ارتفعت دقة جميع الوكلاء إلى أكثر من 90% (وصل GPT-5.5 إلى 99.7%)، وأصبحت النتائج مستقرة عند تكرار التنفيذ.

أكد المؤلفون أن وكلاء الذكاء الاصطناعي في مجال العلوم بحاجة إلى بنية تحتية “مملة لكنها موثوقة”؛ يمكن للنماذج أن تكون مبدعة، لكن من المهم جدًا أن تكون عمليات الوصول إلى البيانات والبحث مستقرة. حتى مع تطور النماذج في المستقبل، ستظل هذه البنية التحتية ضرورية لضمان فعالية عمل الوكلاء.

خلاصة

لكي يساعد الذكاء الاصطناعي البشر في حل المشكلات البيولوجية، لا يكفي وجود نماذج قوية فقط؛ بل من الضروري تحديث البنية التحتية للبيانات لتتناسب مع احتياجات وكلاء الذكاء الاصطناعي. أداة gget هي مثال على ذلك، حيث تساعد في تحسين كفاءة الأبحاث بشكل كبير.