ملخص المحتوى الرئيسي
مؤخرًا، حققت وحدة البحث العلمي الذكية MIRA التابعة لفريق Deep Principles اختراقًا كبيرًا: فقد قامت بتطوير نفسها باستخدام تقنية التدريب الذاتي التكراري، حيث أكملت بشكل مستقل كامل عملية إعادة هيكلة الكود وتنظيف البيانات وتصميم استراتيجيات التدريب، لتنتج نموذجًا أساسيًا يُدعى MPA. هذا النموذج حطم الأرقام القياسية العالمية في 40 مهمة تنبؤية تجريبية، حيث انخفض متوسط الخطأ بنسبة 10٪، وبلغ أقصى انخفاض 51٪. الأهم من ذلك، أن هذا يشير إلى بدء “عجلة التطور الذاتي للذكاء الاصطناعي” في مجال علوم المواد بشكل فعلي، مما قد يعني أن وصول الذكاء الاصطناعي العام (AGI) قد يحدث أسرع مما نتوقع.
التفسير المفصل
#### 1. النماذج التقليدية للمواد تعتمد على “الكمية”, بينما MPA تعتمد على “الذكاء” لكسر الحواجز
كان نموذج Suiren في شنغهاي مثالًا على استخدام كميات هائلة من البيانات والموارد (320 وحدة معالجة رسومية عالية الأداء و70 مليون بيانة) لإنتاج نموذج يحتوي على 1.8 مليار معامل، وقد فاز بالمراكز الأولى في ذلك الوقت. لكن له عيبًا كبيرًا: فهو يمكنه فقط التنبؤ بالخصائص “الحسابية” (مثل تلك التي يمكن حسابها باستخدام برامج الكيمياء الكمومية)، ولا يمكنه التعامل مع الخصائص “التجريبية” الحاسمة في عمليات البحث والتطوير (مثل نقاط الغليان والسمية والذوبان).
لماذا؟ لأن مشكلات الخصائص التجريبية صعبة للغاية: فالبيانات نادرة (تحتاج عدة أيام لإجراء تجربة واحدة)، والضوضاء في البيانات كبيرة (نتائج التجارب مختلفة حسب المختبرات)، والمبادئ الفيزيائية وراء كل خاصية مختلفة تمامًا (مثل نقاط الغليان مرتبطة بقوى التفاعل بين الجزيئات، بينما السمية مرتبطة بالآليات البيولوجية). لا يمكن حل هذه المشكلات من خلال تراكم البيانات والمعدات فقط. ركز MPA على هذه النقطة الحرجة، واستخدم الذكاء الاصطناعي لإيجاد طرق أكثر ذكاءً بدلاً من استخدام القوة البسيطة.
#### 2. الذكاء الاصطناعي كـ “باحث شامل”: يفكر بنفسه ويعدل الكود
MIRA ليست مجرد أداة بحثية عادية، بل هي مساعد بحثي شامل:
- التفكير الذاتي: يطرح عليه الفريق سؤالًا مثل “مع وجود بنية جزيئية ثلاثية الأبعاد وتسميات التجارب، كيف نصمم نموذجًا للتنبؤ بالخصائص المتعددة؟” فيقوم أولاً بتحليل جميع الطرق الممكنة بشكل منهجي، ثم يختار هيكل UniMol ثلاثي الأبعاد كأساس.
- تعديل الكود بشكل ذاتي: يقوم بإعادة هيكلة الكود المصدري للنموذج الحالي مباشرة (وليس فقط تعديل المعاملات)، مثل التعرف على الوحدات الزائدة وإعادة تصميم تدفق البيانات وتوحيد واجهات التدريب المسبق/الوسيط/اللاحق. خلال هذه العملية، يقتصر دور الإنسان على طرح الأسئلة وتأكيد الاتجاهات، دون الحاجة إلى كتابة أي سطر من الكود.
هذا هو الفرق الرئيسي بين MIRA والأدوات العادية: فهي قادرة على التعامل مع الكود الأساسي لبنية النموذج وخطوط التدريب، بدلاً من تعديل المعاملات السطحية فقط.
#### 3. الذكاء الاصطناعي لديه أيضًا “حدس بحثي”: ينظف البيانات تلقائيًا ويفهم الفيزياء
تأتي البيانات التجريبية من قواعد بيانات متعددة، وهي مشوشة للغاية: وحدات القياس غير موحدة (بعضها يستخدم درجة مئوية والبعض الآخر فهرنهايت)، وهناك عينات مكررة وأخطاء في التسميات. لا تقتصر MIRA على معالجة هذه المشكلات الأساسية فحسب، بل يمكنها أيضًا استخدام “المعرفة الفيزيائية” الأساسية لتقييم مصداقية البيانات:
مثلاً، إذا كانت بيانات نقطة غليان جزيء ما لا تتوافق مع وزنه الجزيئي أو تركيب مجموعاته الوظيفية، فإن MIRA ستحذف هذه البيانات تلقائيًا. كان يتطلب ذلك من الخبراء في المجال أسابيع من المراجعة اليدوية، لكن الآن يمكن للذكاء الاصطناعي إنجاز ذلك تلقائيًا.
#### 4. ثلاث مراحل من التدريب: دمج خبرات نماذج اللغة الكبيرة (LLMs) مع القوانين الفيزيائية لجعل النموذج أكثر ذكاءً
الجزء الأساسي من MPA هو إطار التدريب المصمم ذاتيًا والذي يجمع بين أساليب تدريب نماذج اللغة الكبيرة (LLMs) والقوانين الفيزيائية للمواد:
- التدريب المسبق: يتعلم هياكل جزيئية ثلاثية الأبعاد عامة لـ 64 مليون جزيء لوضع الأساس.
- التدريب الوسيط المتوافق مع الفيزياء: خطوة حاسمة! يتعلم فقط المحتوى الذي يشارك نفس المبادئ الفيزيائية مع الخصائص المرغوبة (مثل الخصائص الديناميكية الحرارية التي تكون “قابلة للجمع”).
- التدريب اللاحق: يستخدم خسارة Huber لتقليل تأثير القيم الشاذة (أكثر استقرارًا من خسارة MSE التقليدية)، ويصمم طرقًا مختلطة لمعالجة الخصائص التي تتغير مع حجم الجزيئات (مثل الطاقة الحرارية اللاهبة) وتلك التي لا تتغير (مثل نقاط الانفجار).
هذه التصاميم تسمح للنموذج بالتكيف تلقائيًا مع القوانين الفيزيائية المختلفة، مما يقلل من الأخطاء بشكل كبير (مثل انخفاض خطأ الطاقة الحرارية اللاهبة بنسبة 51٪).
#### 5. الذكاء الاصطناعي يحسن نفسه، هل بدأت عجلة التطور الخاصة بالذكاء الاصطناعي العام (AGI) تدور؟
إنجازات MIRA مبهرة: حققت نتائج جيدة في جميع المراحل، مما يشير إلى أن عجلة التطور الخاصة بالذكاء الاصطناعي العام قد بدأت تدور بالفعل.
هذا الملخص يوضح كيف يستخدم الذكاء الاصطناعي لحل مشكلات معقدة في علم البيانات والهندسة، وكيف يمكن أن يؤدي تطوره إلى تغييرات كبيرة في هذه المجالات.