نیاز به اتصالات مقیاسپذیر (Scale-Up) سریعتر
دستیابی به پتانسیل کامل محاسبات اگزاسکیل (exascale computing) و مدلهای هوش مصنوعی با تریلیونها پارامتر، به ارتباط سریع و بیدرنگ بین هر GPU در یک کلاستر سرور وابسته است. نسل پنجم NVIDIA NVLink™ یک اتصال مقیاسپذیر (scale-up interconnect) است که استدلال هوش مصنوعی را به شدت تقویت کرده و عملکرد مدلهای استنتاجی با تریلیونها پارامتر را تسریع میبخشد.
حداکثرسازی توان عملیاتی سیستم با NVIDIA NVLink
نسل پنجم NVLink مقیاسپذیری سیستمهای بزرگتر چند GPU را با امکان اشتراکگذاری حافظه و محاسبات برای جریانهای کاری آموزش، استنتاج و استدلال، به طور چشمگیری بهبود میبخشد. یک NVIDIA Blackwell GPU به تنهایی تا ۱۸ اتصال NVLink با سرعت ۱۰۰ گیگابایت بر ثانیه (GB/s) را پشتیبانی میکند که مجموع پهنای باند آن به ۱.۸ ترابایت بر ثانیه (TB/s) میرسد – این میزان دو برابر پهنای باند نسل قبلی و بیش از ۱۴ برابر پهنای باند PCIe Gen5 است. پلتفرمهای سرور مانند NVIDIA GB300 NVL72 از این فناوری بهره میبرند تا مقیاسپذیری بیشتری را برای پیچیدهترین مدلهای بزرگ امروزی فراهم کنند.
عملکرد NVLink در مقیاس بالا
افزایش توان عملیاتی استدلال با ارتباطات NVLink
اتصال کامل GPUها با NVIDIA NVLink و سوئیچ NVLink
NVLink یک اتصال مستقیم GPU-به-GPU دوطرفه با سرعت ۱.۸ ترابایت بر ثانیه است که ورودی و خروجی (IO) چند GPU را در یک سرور مقیاسپذیر میکند. تراشههای سوئیچ NVIDIA NVLink چندین NVLink را به هم متصل میکنند تا ارتباط همه-به-همه GPU را با سرعت کامل NVLink در یک رک و بین رکها فراهم کنند.
برای فعال کردن عملیاتهای جمعی پرسرعت، هر سوئیچ NVLink دارای موتورهایی برای پروتکل تجمع و کاهش سلسلهمراتبی مقیاسپذیر (SHARP)™ انویدیا برای کاهشهای درون شبکه و شتابدهی چندپخشی است.
درباره NVLink و سوئیچ NVLink بیشتر بیاموزیدتسریع استدلال زمان آزمون برای مدلهای تریلیون پارامتری با سیستم سوئیچ NVLink
با سوئیچ NVLink، اتصالات NVLink میتوانند در سراسر گرهها (nodes) گسترش یابند تا یک کلاستر GPU چند گرهای یکپارچه و با پهنای باند بالا ایجاد کنند – که عملاً یک GPU به اندازه یک مرکز داده را تشکیل میدهد. سوئیچ NVIDIA NVLink در یک GB300 NVL72 پهنای باند GPU تا ۱۳۰ ترابایت بر ثانیه را برای موازیسازی مدلهای بزرگ امکانپذیر میسازد. کلاسترهای چند سرور با NVLink ارتباطات GPU را متناسب با افزایش محاسبات مقیاسپذیر میکنند، بنابراین NVL72 میتواند ۹ برابر تعداد GPUهای یک سیستم تکی ۸ GPU را پشتیبانی کند.
درباره NVIDIA GB300 NVL72 بیشتر بیاموزیدسوئیچ NVIDIA NVLink
سوئیچ NVIDIA NVLink 5 دارای ۱۴۴ پورت NVLink با ظرفیت سوئیچینگ بدون انسداد ۱۴.۴ ترابایت بر ثانیه است. این سوئیچ رک برای فراهم کردن پهنای باند بالا و تأخیر کم در سیستمهای NVIDIA GB300 NVL72 که از اتصال خارجی نسل پنجم NVLink پشتیبانی میکنند، طراحی شده است.
NVIDIA NVLink Fusion
NVIDIA NVLink™ Fusion عملکرد پیشرو در صنعت را در مقیاسپذیری افقی (scale-up) و عمودی (scale-out) هوش مصنوعی با فناوری انویدیا به همراه ASICهای نیمه سفارشی یا CPUها ارائه میدهد. این امر به هایپراسکیلرها (hyperscalers) امکان میدهد تا زیرساخت هوش مصنوعی ترکیبی ASIC را با فناوری NVIDIA NVLink و معماری در مقیاس رک بسازند.
بیشتر بیاموزیداتصال کامل برای عملکرد بینظیر
سوئیچ NVLink اولین تراشه سوئیچ در سطح رک است که قادر به پشتیبانی از ۵۷۶ GPU با اتصال کامل در یک ساختار محاسباتی بدون انسداد (non-blocking) است. سوئیچ NVLink هر جفت GPU را با سرعت باورنکردنی ۱۸۰۰ گیگابایت بر ثانیه به هم متصل میکند. این سوئیچ از ارتباط کامل همه-به-همه پشتیبانی میکند. ۷۲ GPU در NVIDIA GB300 NVL72 میتوانند به عنوان یک شتابدهنده با کارایی بالا با قدرت محاسباتی هوش مصنوعی تا ۱.۴ اگزافلاپس (exaFLOPS) استفاده شوند.
قدرتمندترین پلتفرم هوش مصنوعی و HPC
NVLink و سوئیچ NVLink اجزای اصلی راهحل کامل مرکز داده NVIDIA هستند که شامل سختافزار، شبکه، نرمافزار، کتابخانهها و مدلها و برنامههای هوش مصنوعی بهینهشده از مجموعه نرمافزاری NVIDIA AI Enterprise و کاتالوگ NVIDIA NGC™ است. این قدرتمندترین پلتفرم هوش مصنوعی و HPC جامع (end-to-end) به محققان امکان میدهد تا نتایج واقعی را ارائه داده و راهحلها را به مرحله تولید برسانند و شتابی بیسابقه را در هر مقیاس به ارمغان آورند.
مشخصات
NVLink
| نسل سوم | نسل چهارم | نسل پنجم | |
|---|---|---|---|
| پهنای باند NVLink به ازای هر GPU | ۶۰۰ گیگابایت بر ثانیه | ۹۰۰ گیگابایت بر ثانیه | ۱,۸۰۰ گیگابایت بر ثانیه |
| حداکثر تعداد لینک به ازای هر GPU | ۱۲ | ۱۸ | ۱۸ |
| معماریهای NVIDIA پشتیبانیشده | معماری NVIDIA Ampere | معماری NVIDIA Hopper™ | معماری NVIDIA Blackwell |
سوئیچ NVLink
| سوئیچ NVLink 3 | سوئیچ NVLink 4 | سوئیچ NVLink 5 | |
|---|---|---|---|
| تعداد GPUهای دارای اتصال مستقیم در یک دامنه NVLink | تا ۸ | تا ۸ | تا ۵۷۶ |
| پهنای باند GPU-به-GPU در NVSwitch | ۶۰۰ گیگابایت بر ثانیه | ۹۰۰ گیگابایت بر ثانیه | ۱,۸۰۰ گیگابایت بر ثانیه |
| کل پهنای باند تجمیعی | ۴.۸ ترابایت بر ثانیه | ۷.۲ ترابایت بر ثانیه | ۱ پتابایت بر ثانیه |
| معماریهای NVIDIA پشتیبانیشده | معماری NVIDIA Ampere | معماری NVIDIA Hopper™ | معماری NVIDIA Blackwell |
مشخصات اولیه؛ ممکن است تغییر کند.
NVIDIA Blackwell بازگشت سرمایه را در استنتاج هوش مصنوعی به حداکثر میرساند
NVIDIA Blackwell بالاترین درآمد کارخانه هوش مصنوعی را امکانپذیر میسازد: سرمایهگذاری ۵ میلیون دلاری در GB200 NVL72 منجر به ۷۵ میلیون دلار درآمد از توکنها میشود – بازده سرمایهگذاری ۱۵ برابری. این شامل طراحی مشترک عمیق در NVIDIA Blackwell، NVLink™ و سوئیچ NVLink برای مقیاسپذیری افقی؛ NVFP4 برای دقت پایین؛ و NVIDIA Dynamo و TensorRT™ LLM برای سرعت و انعطافپذیری است – همچنین توسعه با چارچوبهای جامعه مانند SGLang، vLLM و موارد دیگر.
نتایج کلیدی را بررسی کنیدبرای بررسی عمیق معماری NVIDIA Blackwell، به لینک زیر مراجعه کنید.
بیشتر بیاموزید