العربية

عودة Mythos: تظهر اختبارات Anthropic أن Fable 5 لم تكن محفوفة بالمخاطر بشكل فريد

  • تُظهر الاختبارات أن Opus 4.8 وGPT-5.5 وKimi K2.7 يمكنها تحديد نفس نقاط الضعف.
  • يعود Claude Fable 5 عالميًا، مع المزيد من الحماية، في 2 يوليو.
  • مصنِّفات Fable 5 الجديدة تميز المزيد من مهام البرمجة وتصحيح الأخطاء غير الضارة.
Promo

تقول Anthropic إن الاختبارات الداخلية وجدت أن Claude Fable 5 لا يشكل خطرا أمنيا فريدا في الأمن السيبراني، حيث يعود Claude Mythos 5 عالميا في 2 يوليو.

يأتي هذا الاعتراف مع إعادة إطلاق فابل 5 عالميا، ليختتم تعليق لمدة 18 يوما بسبب ضوابط التصدير الأمريكية في 12 يونيو. اختبرت Anthropic نماذج منافسة لتقييم التهديد الحقيقي وراء هذا التقييد.

ممول
ممول

لماذا تعليق Anthropic Fable 5

تم إطلاق Fable 5 وMythos 5 في 9 يونيو، حيث يشتركان في نفس النموذج الأساسي مع الأول مفتوح للجمهور. ظل ميثوس 5 محدودا بعدد قليل من شركاء مشروع جلاسوينغ الموثوقين للعمل الدفاعي في الأمن السيبراني.

وصلت ضوابط التصدير بعد أن وجد باحثو أمازون طريقة لتجاوز ضمانات Fable 5. دفعت التقنية النموذج إلى تحديد ثغرات البرمجيات، وفي حالة واحدة، إظهار استغلال.

وجدت اختبارات Anthropic أن Claude Opus 4.8 وGPT-5.5 وKimi K2.7 يمكنهم تحديد نفس الثغرات التي أشار إليها Fable 5 في تقرير أمازون. كل نموذج تم اختباره يمكنه إعادة إنتاج عرض استغلال واحد أيضا.

تشير النتائج إلى أن التوجيه استهدف فجوة مشتركة عبر الصناعة، وليس تهديدا خاصا ب Fable. ومع ذلك، قامت Anthropic ببناء مصنف أقوى لحجب التقنية، والتي أصبحت الآن تشير أيضا إلى طلبات الترميز والتصحيح الروتينية الروتينية.

كيف تعمل الحواجز فعليا

أطلقت Fable 5 بأقوى هامش أمان قامت Anthropic بتركيبه في أي طراز. المصنفات الخاصة به تمنع الطلبات التي تبدو حتى قليلا الخطرة، وليس فقط تلك الضارة بوضوح. المصنف الجديد الذي تم تدريبه بعد تقرير أمازون يمنع التجاوز المبلغ عنه في أكثر من 99٪ من الحالات، وفقا لموقع Anthropic. الطلبات المحجوبة تعيد توجيهها تلقائيا الآن إلى Opus 4.8.

هذا الهامش الأمان يأتي بتكلفة. تعترف Anthropic بأن المصنف يعلم طلبات البرمجة والتصحيح الأكثر اعتيادية، وتقول إنها ستستمر في تعديله لحذف الإيجابيات الكاذبة. عاد ميثوس 5، الذي يحمل عددا أقل من هذه الحواجز، فقط للمؤسسات التي تم تصريحها من قبل الحكومة في 26 يونيو.

بيانات أنثروبيك نفسها تثير سؤالا أصعب. إذا كانت النماذج الأضعف قادرة بالفعل على تحقيق ما تم حظر Fable 5 من أجله، فما هو المعيار الذي سيطبقه المنظمون في المرة القادمة التي يطلق فيها نموذج Frontier؟


لقراءة أحدث تحليلات سوق العملات المشفرة من BeInCrypto، انقر هنا.

تنبيه

جميع المعلومات المنشورة على موقعنا الإلكتروني تم عرضها على أساس حسن النية ولأغراض المعلومات العامة فقط. لذا، فأي إجراء أو تصرف أو قرار يقوم به القارئ وفقاً لهذه المعلومات يتحمل مسؤوليته وتوابعه بشكل فردي حصراً ولا يتحمل الموقع أية مسؤولية قانونية عن هذه القرارات.

ممول
ممول