تقول Anthropic إن الاختبارات الداخلية وجدت أن Claude Fable 5 لا يشكل خطرا أمنيا فريدا في الأمن السيبراني، حيث يعود Claude Mythos 5 عالميا في 2 يوليو.
يأتي هذا الاعتراف مع إعادة إطلاق فابل 5 عالميا، ليختتم تعليق لمدة 18 يوما بسبب ضوابط التصدير الأمريكية في 12 يونيو. اختبرت Anthropic نماذج منافسة لتقييم التهديد الحقيقي وراء هذا التقييد.
لماذا تعليق Anthropic Fable 5
تم إطلاق Fable 5 وMythos 5 في 9 يونيو، حيث يشتركان في نفس النموذج الأساسي مع الأول مفتوح للجمهور. ظل ميثوس 5 محدودا بعدد قليل من شركاء مشروع جلاسوينغ الموثوقين للعمل الدفاعي في الأمن السيبراني.
وصلت ضوابط التصدير بعد أن وجد باحثو أمازون طريقة لتجاوز ضمانات Fable 5. دفعت التقنية النموذج إلى تحديد ثغرات البرمجيات، وفي حالة واحدة، إظهار استغلال.
وجدت اختبارات Anthropic أن Claude Opus 4.8 وGPT-5.5 وKimi K2.7 يمكنهم تحديد نفس الثغرات التي أشار إليها Fable 5 في تقرير أمازون. كل نموذج تم اختباره يمكنه إعادة إنتاج عرض استغلال واحد أيضا.
تشير النتائج إلى أن التوجيه استهدف فجوة مشتركة عبر الصناعة، وليس تهديدا خاصا ب Fable. ومع ذلك، قامت Anthropic ببناء مصنف أقوى لحجب التقنية، والتي أصبحت الآن تشير أيضا إلى طلبات الترميز والتصحيح الروتينية الروتينية.
كيف تعمل الحواجز فعليا
أطلقت Fable 5 بأقوى هامش أمان قامت Anthropic بتركيبه في أي طراز. المصنفات الخاصة به تمنع الطلبات التي تبدو حتى قليلا الخطرة، وليس فقط تلك الضارة بوضوح. المصنف الجديد الذي تم تدريبه بعد تقرير أمازون يمنع التجاوز المبلغ عنه في أكثر من 99٪ من الحالات، وفقا لموقع Anthropic. الطلبات المحجوبة تعيد توجيهها تلقائيا الآن إلى Opus 4.8.
هذا الهامش الأمان يأتي بتكلفة. تعترف Anthropic بأن المصنف يعلم طلبات البرمجة والتصحيح الأكثر اعتيادية، وتقول إنها ستستمر في تعديله لحذف الإيجابيات الكاذبة. عاد ميثوس 5، الذي يحمل عددا أقل من هذه الحواجز، فقط للمؤسسات التي تم تصريحها من قبل الحكومة في 26 يونيو.
بيانات أنثروبيك نفسها تثير سؤالا أصعب. إذا كانت النماذج الأضعف قادرة بالفعل على تحقيق ما تم حظر Fable 5 من أجله، فما هو المعيار الذي سيطبقه المنظمون في المرة القادمة التي يطلق فيها نموذج Frontier؟









