ابنِ الصين نموذج ذكاء اصطناعي رئيسي بدون رقائق إنفيديا، والآن اكتشفت أوبن إيه آي طرقاً للعمل بعدد أقل بكثير منها، ما خفض تكاليف الاستدلال بأكثر من النصف. رغم ذلك، ارتفع سهم إنفيديا.
شكّل هذا اللغز. تُعد أوبن إيه آي واحدة من أكبر عملاء إنفيديا (NVDA)، ومع ذلك ارتفعت الأسهم حتى مع اتجاهها لاستخدام عدد أقل من الرقائق.
تخفض أوبن إيه آي تكاليف الاستدلال على جبهتين
تتمثل الجبهة الأولى في البرمجيات. أفادت ذا إنفرميشن أن مهندسي أوبن إيه آي خفضوا تكاليف الاستدلال بأكثر من النصف عبر طرق تحسين جديدة. لم تنشر أوبن إيه آي التفاصيل التقنية.
تُقلل هذه الوفورات عدد رقائق إنفيديا اللازمة لمعالجة جزء من حركة مرور شات جي بي تي. يمكن أن تتيح أيضاً لأوبن إيه آي خفض الأسعار أو رفع حدود الاستخدام.
تتمثل الجبهة الثانية في العتاد. في 24 يونيو، كشفت أوبن إيه آي و برودكوم (AVGO) النقاب عن هالابينو، أول شريحة مخصصة لهما. قالت أوبن إيه آي إن الاختبارات الأولى تشير إلى أداء أفضل بكثير لكل واط مقارنة بالرقائق الرائدة اليوم، مع تصميم استغرق تسعة أشهر.
سوف يبدأ نشر أولى الرقائق على نطاق الجيجاواط بحلول نهاية 2026، مع مايكروسوفت كشريك رئيسي. ما تزال إنفيديا تدير معظم عمليات الاستدلال الخاصة بأوبن إيه آي، مع قيام أوبن إيه آي بتمويل شراكتها في رقائق برودكوم .
تسابق شركات التكنولوجيا الكبرى لبناء رقائقها الخاصة
لا تعمل أوبن إيه آي وحدها. تبني جوجل وحدات معالجة التنسور منذ 2016، واتبعتها أمازون بوحداتها الخاصة. ذكرت شركة تريندفورس للأبحاث أن الأنظمة المعتمدة على ASIC ستصل إلى 27,8% من شحنات خوادم الذكاء الاصطناعي في 2026، وهي النسبة الأعلى منذ 2023.
أحصِ بـTrendForce أن الشرائح المخصصة ستنمو أسرع من وحدات معالجة الرسوميات لـNvidia لأول مرة. أصبح الموردون مثل Broadcom وMarvell صانعي شرائح مخصصة رئيسيين في عملية البناء.
تدفع العقوبات نفس الاتجاه في الصين. دربت Meituan مؤخراً نموذج LongCat-2,0 الخاص بها الذي يحتوي على 1,6 تريليون معلمة باستخدام الشرائح المحلية الصينية، دون أي معدات من Nvidia.
لماذا تواصل أسهم Nvidia الارتفاع
كن أن التهديد حقيقياً، لكن الأرقام تفسر الهدوء. ارتفعت أسهم Nvidia بنحو 2% في 30 يونيو، لتقترب قيمتها من 4,8 تريليون دولار. كشفت النتائج الأخيرة لـNvidia أن إيرادات مركز البيانات ارتفعت بنسبة 75% لتصل إلى مستوى قياسي بلغ 62,3 مليار دولار في ربع واحد.
يجلس معظم الضغط في الاستنتاج، وليس التدريب. لا تزال Nvidia تهيمن على تدريب النماذج، حيث أن برنامج CUDA الخاص بها قد احتجز المطورين منذ عام 2006. نادراً ما تضاهي الشرائح المخصصة تلك المرونة.
تدافع Nvidia أيضاً عن طبقة الاستنتاج التي يُتهم بأنها تخسرها. في GTC، ذكرت Nvidia أن منصتها القادمة Rubin تخفض تكاليف الاستنتاج لكل رمز بما يصل إلى 10 مرات مقارنة بـBlackwell. أيضاً، يؤدي الاستنتاج الأرخص عادة إلى زيادة الاستخدام وإجمالي الحوسبة معه.
لا يقتنع الجميع بذلك. انتقل بعض المستثمرين إلى أسهم شرائح منافسة، مراهنين على أن التحول في الاستنتاج سيتضاعف. ومع ذلك، وجهت Nvidia توقعاتها لهذا الربع دون احتساب أي مبيعات في الصين، ولا تزال ترى طلباً قياسياً.
تستمر Nvidia في بيع كل شريحة يمكن أن تصنعها. يكمن الاختبار الحقيقي في ما إذا كان بإمكان أكبر عملائها إقصاؤها بسرعة تفوق نمو السوق.









