تراشه سوئیچ NVLink
تراشه سوئیچ NVLink

NVIDIA NVLink و سوئیچ NVLink

نیاز به اتصالات مقیاس‌‌پذیر (Scale-Up) سریع‌تر

دستیابی به پتانسیل کامل محاسبات اگزاسکیل (exascale computing) و مدل‌های هوش مصنوعی با تریلیون‌ها پارامتر، به ارتباط سریع و بی‌درنگ بین هر GPU در یک کلاستر سرور وابسته است. نسل پنجم NVIDIA NVLink™ یک اتصال مقیاس‌پذیر (scale-up interconnect) است که استدلال هوش مصنوعی را به شدت تقویت کرده و عملکرد مدل‌های استنتاجی با تریلیون‌ها پارامتر را تسریع می‌بخشد.

NVLink نسل پنجم
NVLink در NVIDIA GB300 پهنای باند ارتباط بین GPUها را در مقایسه با نسل قبلی ۲ برابر افزایش می‌دهد، بنابراین محققان می‌توانند از برنامه‌های بزرگ‌تر و پیچیده‌تر برای حل مسائل دشوارتر استفاده کنند.

حداکثرسازی توان عملیاتی سیستم با NVIDIA NVLink

نسل پنجم NVLink مقیاس‌پذیری سیستم‌های بزرگ‌تر چند GPU را با امکان اشتراک‌گذاری حافظه و محاسبات برای جریان‌های کاری آموزش، استنتاج و استدلال، به طور چشمگیری بهبود می‌بخشد. یک NVIDIA Blackwell GPU به تنهایی تا ۱۸ اتصال NVLink با سرعت ۱۰۰ گیگابایت بر ثانیه (GB/s) را پشتیبانی می‌کند که مجموع پهنای باند آن به ۱.۸ ترابایت بر ثانیه (TB/s) می‌رسد – این میزان دو برابر پهنای باند نسل قبلی و بیش از ۱۴ برابر پهنای باند PCIe Gen5 است. پلتفرم‌های سرور مانند NVIDIA GB300 NVL72 از این فناوری بهره می‌برند تا مقیاس‌پذیری بیشتری را برای پیچیده‌ترین مدل‌های بزرگ امروزی فراهم کنند.

عملکرد NVLink در مقیاس بالا

تراشه سوئیچ NVLink
تراشه سوئیچ NVLink
رک GB300 NVL72
رک GB300 NVL72
سینی سوئیچ NVLink
سینی سوئیچ NVLink

افزایش توان عملیاتی استدلال با ارتباطات NVLink

اتصال کامل GPUها با NVIDIA NVLink و سوئیچ NVLink

NVLink یک اتصال مستقیم GPU-به-GPU دوطرفه با سرعت ۱.۸ ترابایت بر ثانیه است که ورودی و خروجی (IO) چند GPU را در یک سرور مقیاس‌پذیر می‌کند. تراشه‌های سوئیچ NVIDIA NVLink چندین NVLink را به هم متصل می‌کنند تا ارتباط همه-به-همه GPU را با سرعت کامل NVLink در یک رک و بین رک‌ها فراهم کنند.

برای فعال کردن عملیات‌های جمعی پرسرعت، هر سوئیچ NVLink دارای موتورهایی برای پروتکل تجمع و کاهش سلسله‌مراتبی مقیاس‌پذیر (SHARP)™ انویدیا برای کاهش‌های درون شبکه و شتاب‌دهی چندپخشی است.

درباره NVLink و سوئیچ NVLink بیشتر بیاموزید

تسریع استدلال زمان آزمون برای مدل‌های تریلیون پارامتری با سیستم سوئیچ NVLink

با سوئیچ NVLink، اتصالات NVLink می‌توانند در سراسر گره‌ها (nodes) گسترش یابند تا یک کلاستر GPU چند گره‌ای یکپارچه و با پهنای باند بالا ایجاد کنند – که عملاً یک GPU به اندازه یک مرکز داده را تشکیل می‌دهد. سوئیچ NVIDIA NVLink در یک GB300 NVL72 پهنای باند GPU تا ۱۳۰ ترابایت بر ثانیه را برای موازی‌سازی مدل‌های بزرگ امکان‌پذیر می‌سازد. کلاسترهای چند سرور با NVLink ارتباطات GPU را متناسب با افزایش محاسبات مقیاس‌پذیر می‌کنند، بنابراین NVL72 می‌تواند ۹ برابر تعداد GPUهای یک سیستم تکی ۸ GPU را پشتیبانی کند.

درباره NVIDIA GB300 NVL72 بیشتر بیاموزید

سوئیچ NVIDIA NVLink

سوئیچ NVIDIA NVLink 5 دارای ۱۴۴ پورت NVLink با ظرفیت سوئیچینگ بدون انسداد ۱۴.۴ ترابایت بر ثانیه است. این سوئیچ رک برای فراهم کردن پهنای باند بالا و تأخیر کم در سیستم‌های NVIDIA GB300 NVL72 که از اتصال خارجی نسل پنجم NVLink پشتیبانی می‌کنند، طراحی شده است.

NVIDIA NVLink Fusion
NVIDIA NVLink Fusion

NVIDIA NVLink Fusion

NVIDIA NVLink™ Fusion عملکرد پیشرو در صنعت را در مقیاس‌پذیری افقی (scale-up) و عمودی (scale-out) هوش مصنوعی با فناوری انویدیا به همراه ASICهای نیمه سفارشی یا CPUها ارائه می‌دهد. این امر به هایپراسکیلرها (hyperscalers) امکان می‌دهد تا زیرساخت هوش مصنوعی ترکیبی ASIC را با فناوری NVIDIA NVLink و معماری در مقیاس رک بسازند.

بیشتر بیاموزید

اتصال کامل برای عملکرد بی‌نظیر

سوئیچ NVLink اولین تراشه سوئیچ در سطح رک است که قادر به پشتیبانی از ۵۷۶ GPU با اتصال کامل در یک ساختار محاسباتی بدون انسداد (non-blocking) است. سوئیچ NVLink هر جفت GPU را با سرعت باورنکردنی ۱۸۰۰ گیگابایت بر ثانیه به هم متصل می‌کند. این سوئیچ از ارتباط کامل همه-به-همه پشتیبانی می‌کند. ۷۲ GPU در NVIDIA GB300 NVL72 می‌توانند به عنوان یک شتاب‌دهنده با کارایی بالا با قدرت محاسباتی هوش مصنوعی تا ۱.۴ اگزافلاپس (exaFLOPS) استفاده شوند.

قدرتمندترین پلتفرم هوش مصنوعی و HPC

NVLink و سوئیچ NVLink اجزای اصلی راه‌حل کامل مرکز داده NVIDIA هستند که شامل سخت‌افزار، شبکه، نرم‌افزار، کتابخانه‌ها و مدل‌ها و برنامه‌های هوش مصنوعی بهینه‌شده از مجموعه نرم‌افزاری NVIDIA AI Enterprise و کاتالوگ NVIDIA NGC™ است. این قدرتمندترین پلتفرم هوش مصنوعی و HPC جامع (end-to-end) به محققان امکان می‌دهد تا نتایج واقعی را ارائه داده و راه‌حل‌ها را به مرحله تولید برسانند و شتابی بی‌سابقه را در هر مقیاس به ارمغان آورند.

مشخصات

NVLink

نسل سومنسل چهارمنسل پنجم
پهنای باند NVLink به ازای هر GPU۶۰۰ گیگابایت بر ثانیه۹۰۰ گیگابایت بر ثانیه۱,۸۰۰ گیگابایت بر ثانیه
حداکثر تعداد لینک به ازای هر GPU۱۲۱۸۱۸
معماری‌های NVIDIA پشتیبانی‌شدهمعماری NVIDIA Ampereمعماری NVIDIA Hopper™معماری NVIDIA Blackwell

سوئیچ NVLink

سوئیچ NVLink 3سوئیچ NVLink 4سوئیچ NVLink 5
تعداد GPUهای دارای اتصال مستقیم در یک دامنه NVLinkتا ۸تا ۸تا ۵۷۶
پهنای باند GPU-به-GPU در NVSwitch۶۰۰ گیگابایت بر ثانیه۹۰۰ گیگابایت بر ثانیه۱,۸۰۰ گیگابایت بر ثانیه
کل پهنای باند تجمیعی۴.۸ ترابایت بر ثانیه۷.۲ ترابایت بر ثانیه۱ پتابایت بر ثانیه
معماری‌های NVIDIA پشتیبانی‌شدهمعماری NVIDIA Ampereمعماری NVIDIA Hopper™معماری NVIDIA Blackwell

مشخصات اولیه؛ ممکن است تغییر کند.

نتایج بنچمارک NVIDIA InferenceMax
نتایج بنچمارک NVIDIA InferenceMax

NVIDIA Blackwell بازگشت سرمایه را در استنتاج هوش مصنوعی به حداکثر می‌رساند

NVIDIA Blackwell بالاترین درآمد کارخانه هوش مصنوعی را امکان‌پذیر می‌سازد: سرمایه‌گذاری ۵ میلیون دلاری در GB200 NVL72 منجر به ۷۵ میلیون دلار درآمد از توکن‌ها می‌شود – بازده سرمایه‌گذاری ۱۵ برابری. این شامل طراحی مشترک عمیق در NVIDIA Blackwell، NVLink™ و سوئیچ NVLink برای مقیاس‌پذیری افقی؛ NVFP4 برای دقت پایین؛ و NVIDIA Dynamo و TensorRT™ LLM برای سرعت و انعطاف‌پذیری است – همچنین توسعه با چارچوب‌های جامعه مانند SGLang، vLLM و موارد دیگر.

نتایج کلیدی را بررسی کنید

برای بررسی عمیق معماری NVIDIA Blackwell، به لینک زیر مراجعه کنید.

بیشتر بیاموزید