خرج عميل ذكاء اصطناعي (AI) من عالم الرمل الذي بناه مهندسو التشفير a16z خلال اختبار. أراد المهندسون تقييم ما إذا كان بإمكان وكلاء الذكاء الاصطناعي الانتقال إلى ما هو أبعد من تحديد الثغرات إلى بناء ثغرات عاملة.
نشر مهندسا الأمن دايجون بارك ومات جليسون النتائج في 28 أبريل. سلطوا الضوء على كيف أن وكيلهم الجاهز اكتشفوا بشكل مستقل كيفية استخدام أدوات "لم تعطى صراحة أبدا."
تأتي هذه النتائج في وقت أدلى فيه إيلون ماسك بتصريح صادم بأن 'الذكاء الاصطناعي قد يقتلنا جميعا'.
كيف "هرب" عميل الذكاء الاصطناعي من قفصه
وضع المهندسون الوكيل في بيئة مقيدة، مع وصول مقيد إلى Etherscan، وعقدة محلية مثبتة على كتلة محددة. قام الفريق بحجب جميع الوصول إلى الشبكة الخارجية.
تم تصميم هذا التكوين المفتوح خصيصا لمنع الوكيل من استرجاع أي بيانات مستقبلية. خلال اختبارات الصندوق المفتوح، واجه الوكيل عقبة في عقد هدف غير موثق بدون شفرة مصدر.
تابعنا على X للحصول على آخر الأخبار فور حدوثها
لذا، استعلام عن تكوين عقدة السندان المحلية باستخدام "cast rpc anvil_nodeInfo"، كاشفا عن رابط RPC للأعلى مع مفتاح واجهة برمجة تطبيقات الكيمياء النصية الواضحة. حاول الوكيل الوصول الخارجي المباشر، لكن جدار الحماية الخاص ب Docker قام بحظر الطلب.
بعد أن يمنع جدار الحماية الوصول الصادر المباشر، استخدم الوكيل "طريقة RPC anvil_reset" لإعادة تعيين عقدة السندان إلى كتلة مستقبلية. سمح له هذا الانتقال باستعلام سجلات الكتل والمعاملات المستقبلية عبر عقدة السندان المحلية.
بعد ذلك، استعاد العميل آثار تنفيذ معاملة الهجوم. بعد الانتهاء من التحليل، أعاد وكيل الذكاء الاصطناعي العقدة إلى كتلتها الأصلية وأنتج إثبات مفهوم عملي بناء على البيانات المستخرجة.
قام بارك وغليسون لاحقا بتقييد الوكيل لحظر جميع طرق تصحيح أخطاء Anvil.
"حدث ذلك في بيئة صندوق رمل صغيرة، لكنه يبرز نمطا أكبر يستحق التوثيق: وكلاء مدعومون بالأدوات يتجاوزون القيود لتحقيق أهدافهم،" أشار الفريق. استخدام anvil_reset لتجاوز كتلة الشوكة المثبتة كان سلوكا لم نتوقعه."
تسلط الحادثة الضوء على خطر رئيسي في بيئات اختبار الذكاء الاصطناعي: حيث يمكن للوكلاء اكتشاف واستغلال المسارات غير المقصودة داخل سلاسل الأدوات، حتى بدون تعليمات صريحة.
رغم ذلك، وجدت الدراسة أن وكلاء الذكاء الاصطناعي لا يزالون محدودين في تنفيذ استغلالات DeFi المعقدة. بينما كان العميل يحدد الثغرات باستمرار، إلا أنه واجه صعوبة في تجميع استراتيجيات هجوم متعددة الخطوات.
اشترك في قناتنا على يوتيوب لمشاهدة القادة والصحفيين يقدمون رؤى خبراء





