هواوی در رویداد Connect 2025، نقشه راه سختافزاری بلندپروازانهای را معرفی کرد که شامل نخستین حافظه HBM توسعهیافته در داخل شرکت و نسل جدیدی از شتابدهندههای هوش مصنوعی سری Ascend است. پیام اصلی این رونمایی روشن بود: هواوی بهجای رقابت در سطح عملکرد تکتراشهای، بر مقیاسپذیری سیستمها تمرکز خواهد کرد. اگرچه عملکرد تراشههای هواوی هنوز از نظر قدرت پردازشی نسبت به انویدیا عقبتر است، اما راهکارهای مبتنی بر مقیاس سیستم میتوانند رقابتی ظاهر شوند.
خانواده Ascend 950 قرار است در اوایل سال 2026 عرضه شود و شامل دو مدل باشد:
- مدل 950PR با 128 گیگابایت حافظه HBM داخلی و پهنای باند حدود 1.6 ترابایت بر ثانیه
- مدل 950DT با 144 گیگابایت حافظه و پهنای باند نزدیک به 4 ترابایت بر ثانیه
هواوی همچنین برنامههایی برای عرضه نسلهای بعدی شامل Ascend 960 و Ascend 970 در سالهای 2027 و 2028 ترسیم کرده که ظرفیت حافظه تجمیعی بیشتر، پهنای باند بالاتر و پشتیبانی گستردهتر از قالبهای دقت FP8 را وعده میدهند. استراتژی رقابتی هواوی بر پایه بستهبندی متراکم و شبکهسازی تهاجمی بنا شده است، نه صرفاً عملکرد تراشهای. این شرکت از ساختارهای SuperPod و ابرخوشههایی پرده برداشت که با استفاده از پروتکل ارتباطی جدید Lingqu و لینکهای نوری، صدها هزار شتابدهنده را به هم متصل میکنند.
ابرگره Atlas 950 که قرار است در سهماهه چهارم 2025 عرضه شود، مبتنی بر واحدهای Ascend 950 طراحی شده و برای بارهای کاری FP8 در مقیاس اگزا هدفگذاری شده است. نسل بعدی خوشههای Atlas 960 نیز با افزایش تعداد تراشهها، توان عملیاتی بیشتری را ارائه خواهند داد. بزرگترین ابرخوشه هواوی قادر خواهد بود تا 524 اگزا فلاپس توان پردازشی FP8 و یک زتافلاپ توان FP4 را فراهم کند. این توان از طریق 64 واحد Atlas SuperPod تأمین میشود که در مجموع تا 524.288 شتابدهنده را در خود جای میدهند، ظرفیتی که میتواند همزمان چندین آزمایشگاه هوش مصنوعی را برای آموزش و استنتاج پشتیبانی کند.
در حال حاضر، بزرگترین خوشه غربی در حال توسعه، Colossus 2 متعلق به xAI است که از بیش از 550.000 واحد پردازنده NVIDIA GB200 و GB300 بهره خواهد برد. مقیاس طراحیهای هواوی اکنون قابل مقایسه با برترین راهکارهای انویدیا و شرکای آن است. فلسفه هواوی ساده است: اگر حافظه و شبکهسازی در مالکیت شرکت باشد و سیستمها فراتر از یک رک مقیاسپذیر شوند، توان پردازشی تجمیعی میتواند شکاف عملکردی در سطح تراشه را جبران کند.
در صورت تحقق این ابرخوشهها، اپراتورهای مراکز داده ممکن است در انتخاب میان بهرهوری تراشهای و عملکرد خوشهای گسترده تجدیدنظر کنند. در زمینه زیرساخت داخلی، شبکه برق چین توانایی تحمل بارهای سنگینتر را دارد و میتواند با مصرف انرژی بیشتر، عملکرد بالاتری در حوزه هوش مصنوعی ارائه دهد. در مقابل، مراکز داده مستقر در ایالات متحده اغلب با محدودیتهای مصرف برق مواجهاند که مانع از ساخت سیستمهای عظیم میشود، مگر در موارد خاص.