مایکروسافت Azure بهتازگی از سری جدید ماشینهای مجازی NDv6 GB300 رونمایی کرده که نخستین خوشه تولیدی در مقیاس ابررایانهای با استفاده از سیستمهای NVIDIA GB300 NVL72 محسوب میشود. این زیرساخت پیشرفته بهطور اختصاصی برای پاسخگویی به نیازهای سنگین استنتاج مدلهای هوش مصنوعی OpenAI طراحی شده است. این خوشه شامل بیش از 4600 واحد پردازنده گرافیکی NVIDIA Blackwell Ultra است که از طریق پلتفرم شبکهای NVIDIA Quantum-X800 InfiniBand به یکدیگر متصل شدهاند.
طراحی منحصربهفرد مایکروسافت در زمینه حافظه و شبکه، مقیاس عظیمی از توان پردازشی را برای آموزش و استنتاج مدلهای استدلالی و سیستمهای عاملمحور هوش مصنوعی فراهم میسازد. در قلب این معماری، سیستم NVIDIA GB300 NVL72 قرار دارد که در هر رک، 72 پردازنده گرافیکی Blackwell Ultra و 36 پردازنده مرکزی Grace را در یک واحد یکپارچه ترکیب میکند.
این سیستم با 37 ترابایت حافظه سریع و توان پردازشی FP4 به میزان 1.44 اگزافلاپس در هر ماشین مجازی، امکان فضای حافظهای یکپارچه را برای مدلهای پیچیده چندوجهی و استدلالی فراهم میکند. در بنچمارکهای MLPerf Inference v5.1، این سیستمها با فرمت NVFP4 عملکردی بینظیر از جمله افزایش 5 برابری سرعت پردازش در مدل DeepSeek-R1 با 671 میلیارد پارامتر نسبت به معماری Hopper و برتری در مدلهای جدیدی مانند Llama 3.1 با 405 میلیارد پارامتر ارائه دادند.
برای اتصال این تعداد عظیم از پردازندههای گرافیکی، معماری دولایه شبکهای NVIDIA بهکار گرفته شده است. درون هر رک، نسل پنجم سوئیچهای NVLink پهنای باند مستقیم 130 ترابایت بر ثانیه را میان GPUها فراهم میسازد. در سطح خوشه، پلتفرم Quantum-X800 با سرعت 800 گیگابیت بر ثانیه برای هر GPU، ارتباطی روان و مقیاسپذیر را تضمین میکند.
مایکروسافت برای دستیابی به این سطح از عملکرد، تمامی لایههای مرکز داده خود را بازطراحی کرده است؛ از جمله سیستم خنککننده مایع، توزیع برق، و پشته نرمافزاری جدید برای هماهنگی و ذخیرهسازی. این زیرساخت پیشرفته، گامی مهم در مسیر آینده هوش مصنوعی است و به مشتریانی مثل OpenAI امکان میدهد مدلهای نسل جدید را با سرعت و مقیاسی بیسابقه توسعه دهند.