NVIDIA NVLink و سوئیچ NVLink

نیاز به اتصالات مقیاس‌‌پذیر (Scale-Up) سریع‌تر

دستیابی به پتانسیل کامل محاسبات اگزاسکیل (exascale computing) و مدل‌های هوش مصنوعی با تریلیون‌ها پارامتر، به ارتباط سریع و بی‌درنگ بین هر GPU در یک کلاستر سرور وابسته است. نسل پنجم NVIDIA NVLink™ یک اتصال مقیاس‌پذیر (scale-up interconnect) است که استدلال هوش مصنوعی را به شدت تقویت کرده و عملکرد مدل‌های استنتاجی با تریلیون‌ها پارامتر را تسریع می‌بخشد.

NVLink نسل پنجم — NVLink در NVIDIA GB300 پهنای باند ارتباط بین GPUها را در مقایسه با نسل قبلی ۲ برابر افزایش می‌دهد، بنابراین محققان می‌توانند از برنامه‌های بزرگ‌تر و پیچیده‌تر برای حل مسائل دشوارتر استفاده کنند.

حداکثرسازی توان عملیاتی سیستم با NVIDIA NVLink

نسل پنجم NVLink مقیاس‌پذیری سیستم‌های بزرگ‌تر چند GPU را با امکان اشتراک‌گذاری حافظه و محاسبات برای جریان‌های کاری آموزش، استنتاج و استدلال، به طور چشمگیری بهبود می‌بخشد. یک NVIDIA Blackwell GPU به تنهایی تا ۱۸ اتصال NVLink با سرعت ۱۰۰ گیگابایت بر ثانیه (GB/s) را پشتیبانی می‌کند که مجموع پهنای باند آن به ۱.۸ ترابایت بر ثانیه (TB/s) می‌رسد – این میزان دو برابر پهنای باند نسل قبلی و بیش از ۱۴ برابر پهنای باند PCIe Gen5 است. پلتفرم‌های سرور مانند NVIDIA GB300 NVL72 از این فناوری بهره می‌برند تا مقیاس‌پذیری بیشتری را برای پیچیده‌ترین مدل‌های بزرگ امروزی فراهم کنند.

عملکرد NVLink در مقیاس بالا

افزایش توان عملیاتی استدلال با ارتباطات NVLink

اتصال کامل GPUها با NVIDIA NVLink و سوئیچ NVLink

NVLink یک اتصال مستقیم GPU-به-GPU دوطرفه با سرعت ۱.۸ ترابایت بر ثانیه است که ورودی و خروجی (IO) چند GPU را در یک سرور مقیاس‌پذیر می‌کند. تراشه‌های سوئیچ NVIDIA NVLink چندین NVLink را به هم متصل می‌کنند تا ارتباط همه-به-همه GPU را با سرعت کامل NVLink در یک رک و بین رک‌ها فراهم کنند.

برای فعال کردن عملیات‌های جمعی پرسرعت، هر سوئیچ NVLink دارای موتورهایی برای پروتکل تجمع و کاهش سلسله‌مراتبی مقیاس‌پذیر (SHARP)™ انویدیا برای کاهش‌های درون شبکه و شتاب‌دهی چندپخشی است.

درباره NVLink و سوئیچ NVLink بیشتر بیاموزید

تسریع استدلال زمان آزمون برای مدل‌های تریلیون پارامتری با سیستم سوئیچ NVLink

با سوئیچ NVLink، اتصالات NVLink می‌توانند در سراسر گره‌ها (nodes) گسترش یابند تا یک کلاستر GPU چند گره‌ای یکپارچه و با پهنای باند بالا ایجاد کنند – که عملاً یک GPU به اندازه یک مرکز داده را تشکیل می‌دهد. سوئیچ NVIDIA NVLink در یک GB300 NVL72 پهنای باند GPU تا ۱۳۰ ترابایت بر ثانیه را برای موازی‌سازی مدل‌های بزرگ امکان‌پذیر می‌سازد. کلاسترهای چند سرور با NVLink ارتباطات GPU را متناسب با افزایش محاسبات مقیاس‌پذیر می‌کنند، بنابراین NVL72 می‌تواند ۹ برابر تعداد GPUهای یک سیستم تکی ۸ GPU را پشتیبانی کند.

درباره NVIDIA GB300 NVL72 بیشتر بیاموزید

سوئیچ NVIDIA NVLink

سوئیچ NVIDIA NVLink 5 دارای ۱۴۴ پورت NVLink با ظرفیت سوئیچینگ بدون انسداد ۱۴.۴ ترابایت بر ثانیه است. این سوئیچ رک برای فراهم کردن پهنای باند بالا و تأخیر کم در سیستم‌های NVIDIA GB300 NVL72 که از اتصال خارجی نسل پنجم NVLink پشتیبانی می‌کنند، طراحی شده است.

NVIDIA NVLink Fusion

NVIDIA NVLink™ Fusion عملکرد پیشرو در صنعت را در مقیاس‌پذیری افقی (scale-up) و عمودی (scale-out) هوش مصنوعی با فناوری انویدیا به همراه ASICهای نیمه سفارشی یا CPUها ارائه می‌دهد. این امر به هایپراسکیلرها (hyperscalers) امکان می‌دهد تا زیرساخت هوش مصنوعی ترکیبی ASIC را با فناوری NVIDIA NVLink و معماری در مقیاس رک بسازند.

بیشتر بیاموزید

اتصال کامل برای عملکرد بی‌نظیر

سوئیچ NVLink اولین تراشه سوئیچ در سطح رک است که قادر به پشتیبانی از ۵۷۶ GPU با اتصال کامل در یک ساختار محاسباتی بدون انسداد (non-blocking) است. سوئیچ NVLink هر جفت GPU را با سرعت باورنکردنی ۱۸۰۰ گیگابایت بر ثانیه به هم متصل می‌کند. این سوئیچ از ارتباط کامل همه-به-همه پشتیبانی می‌کند. ۷۲ GPU در NVIDIA GB300 NVL72 می‌توانند به عنوان یک شتاب‌دهنده با کارایی بالا با قدرت محاسباتی هوش مصنوعی تا ۱.۴ اگزافلاپس (exaFLOPS) استفاده شوند.

قدرتمندترین پلتفرم هوش مصنوعی و HPC

NVLink و سوئیچ NVLink اجزای اصلی راه‌حل کامل مرکز داده NVIDIA هستند که شامل سخت‌افزار، شبکه، نرم‌افزار، کتابخانه‌ها و مدل‌ها و برنامه‌های هوش مصنوعی بهینه‌شده از مجموعه نرم‌افزاری NVIDIA AI Enterprise و کاتالوگ NVIDIA NGC™ است. این قدرتمندترین پلتفرم هوش مصنوعی و HPC جامع (end-to-end) به محققان امکان می‌دهد تا نتایج واقعی را ارائه داده و راه‌حل‌ها را به مرحله تولید برسانند و شتابی بی‌سابقه را در هر مقیاس به ارمغان آورند.

مشخصات

NVLink

	نسل سوم	نسل چهارم	نسل پنجم
پهنای باند NVLink به ازای هر GPU	۶۰۰ گیگابایت بر ثانیه	۹۰۰ گیگابایت بر ثانیه	۱,۸۰۰ گیگابایت بر ثانیه
حداکثر تعداد لینک به ازای هر GPU	۱۲	۱۸	۱۸
معماری‌های NVIDIA پشتیبانی‌شده	معماری NVIDIA Ampere	معماری NVIDIA Hopper™	معماری NVIDIA Blackwell

سوئیچ NVLink

	سوئیچ NVLink 3	سوئیچ NVLink 4	سوئیچ NVLink 5
تعداد GPUهای دارای اتصال مستقیم در یک دامنه NVLink	تا ۸	تا ۸	تا ۵۷۶
پهنای باند GPU-به-GPU در NVSwitch	۶۰۰ گیگابایت بر ثانیه	۹۰۰ گیگابایت بر ثانیه	۱,۸۰۰ گیگابایت بر ثانیه
کل پهنای باند تجمیعی	۴.۸ ترابایت بر ثانیه	۷.۲ ترابایت بر ثانیه	۱ پتابایت بر ثانیه
معماری‌های NVIDIA پشتیبانی‌شده	معماری NVIDIA Ampere	معماری NVIDIA Hopper™	معماری NVIDIA Blackwell

مشخصات اولیه؛ ممکن است تغییر کند.

NVIDIA Blackwell بازگشت سرمایه را در استنتاج هوش مصنوعی به حداکثر می‌رساند

NVIDIA Blackwell بالاترین درآمد کارخانه هوش مصنوعی را امکان‌پذیر می‌سازد: سرمایه‌گذاری ۵ میلیون دلاری در GB200 NVL72 منجر به ۷۵ میلیون دلار درآمد از توکن‌ها می‌شود – بازده سرمایه‌گذاری ۱۵ برابری. این شامل طراحی مشترک عمیق در NVIDIA Blackwell، NVLink™ و سوئیچ NVLink برای مقیاس‌پذیری افقی؛ NVFP4 برای دقت پایین؛ و NVIDIA Dynamo و TensorRT™ LLM برای سرعت و انعطاف‌پذیری است – همچنین توسعه با چارچوب‌های جامعه مانند SGLang، vLLM و موارد دیگر.

نتایج کلیدی را بررسی کنید

برای بررسی عمیق معماری NVIDIA Blackwell، به لینک زیر مراجعه کنید.

بیشتر بیاموزید

https://www.nvidia.com/en-us/data-center/nvlink/