فتحت شركتا Anthropic وOpenAI جبهة جديدة في منافستهما يوم الثلاثاء، وكلاهما يهدف إلى البحث العلمي. أطلقت Anthropic منصة Claude Science، وهي منصة عمل للباحثين بالذكاء الاصطناعي، بينما أصدرت OpenAI GeneBench-Pro، وهو معيار لعلم الأحياء الحاسوبي.
تدفع الإصدارات في نفس اليوم سباق الذكاء الاصطناعي إلى ما هو أبعد من روبوتات الدردشة والبرمجة إلى العمل المخبري. قامت إحدى الشركات بشحن أداة ليستخدمها العلماء اليوم. والآخر بنى معيارا لمدى ما لا تزال التكنولوجيا بحاجة إليه.
ما الذي يفعله كلود ساينس من أنثروبيك
يجمع كلود ساينس قواعد البيانات والشيفرة وقوة الحوسبة التي يستخدمها العلماء في تطبيق واحد. يربط أكثر من 60 قاعدة بيانات علمية في مجالات الجينوميات والبروتيوميات والكيميائية.
كلود ساينس تطبيق، وليس نموذجا جديدا. هبط بينما أقوى نماذج Fable 5 وMythos 5 من Anthropic لا تزال مقيدة بموجب قواعد التصدير الأمريكية. كل نتيجة قابلة للتدقيق وتتبعها إلى الكود الذي أنتجها.
تمتد منصة العمل إلى جهد علوم الحياة الذي بدأت أنثروبيك في أكتوبر 2025. في النسخة التجريبية، استخدمها جيروم لوكوك من معهد ألين لضغط المراجعات التي كانت تستغرق في السابق ما يصل إلى عامين.
كما ستمول أنثروبيك ما يصل إلى 50 مشروعا بحثيا، مع ما يصل إلى 30,000 دولار من الاعتمادات لكل مشروع.
برنامج GeneBench-Pro من OpenAI يرفع المستوى
بعد إصدار Anthropic على Claude Science، أصدرت OpenAI لعبة GeneBench-Pro. يختبر ما إذا كان بإمكان وكلاء الذكاء الاصطناعي اتخاذ قرارات الأحكام التي تتطلبها أبحاث الأحياء الحقيقية.
يحتوي المعيار على 129 مشكلة في مجالات الجينوم، والبيولوجيا الكمية، والطب الترجمي.
أقوى نموذج ل OpenAI، GPT-5.6 Sol، حل 28.7٪ من المشاكل بأعلى مستوى منطقي له. ارتفع هذا الرقم إلى 31.5٪ في وضع المحترفين. جاء إصدار GPT-5.6 المتدرج السابق من الشركة بناء على طلب واشنطن.
حصل GPT-5 على أقل من 5٪ في GeneBench الأصلي، بينما حصل Opus 4.8 من Anthropic على 16٪ في الاختبار الأثقل.
تابعنا على X للحصول على آخر الأخبار فور حدوثها
استراتيجيتان، سباق واحد
يكشف الانقسام عن مسارين لنفس الهدف. شركة Anthropic تشحن منتجا للاستخدام اليومي في المختبر. تقوم OpenAI بقياس مدى موثوقية نمذجة المنطق من خلال البيانات الفوضوية.
كما جاء كلا الإطلاقين مع تقدم النماذج الصينية في أبحاث الذكاء الاصطناعي. أرقام OpenAI نفسها تخفف من الضجة لأن أفضل نموذج لها لا يزال يفشل في معظم مهام GeneBench-Pro.
الضغط جيوسياسي وعلمي في آن واحد. لقد دفعت حدود التصدير الأمريكية بالفعل شركة أنثروبيك لتقييم دول مضيفة جديدة لطرازاتها.
قدر المراجعون أن كل مشكلة في GeneBench-Pro ستستغرق من خبير بشري من 20 إلى 40 ساعة، مما يكلف آلاف الدولارات. قالت OpenAI إن نموذجها ينهي نفس التحليل مقابل بضعة دولارات.
يرى أوبري دي غراي، عالم الشيخوخة الطبية الحيوية، أن الذكاء الاصطناعي يزيل عنق الزجاجة الرئيسية في البحث حتى لو استغرقت المكاسب الأوسع وقتا أطول.
"ما سنراه قريبا جدا هو أن الذكاء الاصطناعي سيجعل أجزاء معينة من العملية، خاصة تطوير الأدوية، لا تقيد المعدل،" تحدث أوبري دي غراي، رئيس ومدير العلوم في مؤسسة Longevity Escape Velocity، في بودكاست BeInCrypto.
حذر دي غراي من أن تحويل البحث الأسرع إلى علاجات معتمدة لا يزال يعتمد على التنظيم وتحمل الجمهور للمخاطر.
يتوقع الباحثون تبنيا أسرع
يجادل بعض المتخصصين بأن التحول قد بدأ بالفعل. قال الدكتور ديريا أونتماز، أستاذ علم المناعة، لنفس لجنة BeInCrypto إن الذكاء الاصطناعي الآن يتفوق على حكمه الخاص.
"أنا شخصيا أثق بالذكاء الاصطناعي أكثر من أفكاري في مجالي الذي دام 35 عاما."
يتوقع أن ينتشر هذا الاعتماد بسرعة عبر الممارسة السريرية.
"إنه أمر غير أخلاقي وأعتقد أنه قريبا جدا سيكون عدم استخدام الذكاء الاصطناعي في الطب خطأ طبيا."
هذا التفاؤل لا يزال يتجاوز المعايير. ستظهر الأشهر القادمة ما إذا كان العلماء سيتبنوا هذه الأدوات وما إذا كانت درجات GeneBench-Pro تبدأ في الارتفاع.









