شرکت انویدیا (NVIDIA) با رونمایی از خانواده جدید مدلهای زبانی بزرگ خود تحت عنوان Nemotron-3، گام بلند دیگری در دنیای هوش مصنوعی برداشت. این غول فناوری با تمرکز بر ارائه مدلهای «باز» (Open Models)، به توسعهدهندگان وعده میدهد که سرعت پردازش را تا ۴ برابر نسبت به رقبا افزایش دهند. انویدیا این مدلها را در سه کلاس ابعادی مختلف مهندسی کرده تا پردازشها را از دستگاههای لبه (Edge) تا دیتاسنترهای عظیم به بهترین شکل مدیریت کنند.
🔵 رونمایی رسمی انویدیا از خانواده مدلهای Nemotron-3 در سه سایز
🔵 ثبت رکورد سرعت ۳۷۷ توکن بر ثانیه توسط نسخه نانو
🔵 دستیابی به عملکرد ۴ برابر سریعتر با موتور TensorRT-LLM
🔵 کسب امتیازات بالا در شاخصهای هوشمندی و «باز بودن»
🔵 امکان اجرای مدلها روی دستگاههای شخصی و سرورهای ابری
مدیران انویدیا استراتژی جدید خود را بر پایه انعطافپذیری بنا نهادهاند. خانواده Nemotron-3 برخلاف رویکرد «یک سایز برای همه»، طیف وسیعی از نیازها را پوشش میدهد. همانطور که انویدیا در تصویر زیر ترسیم کرده، این شرکت مسیر مشخصی را برای عرضه مدلها در نظر دارد:

انویدیا سه نسخه نانو، سوپر و اولترا را برای کاربریهای مختلف عرضه میکند.
مهمترین برگ برنده انویدیا در این رویداد، سرعت خیرهکننده مدلهاست. طبق بنچمارکهایی که موسسه Artificial Analysis منتشر کرد، مدل Nemotron-3 Nano توانست رقبای سرسختی همچون GPT-4o-mini و مدلهای Llama را پشت سر بگذارد.
نمودار زیر به وضوح نشان میدهد که نسخه نانو با ثبت سرعت ۳۷۷ توکن خروجی در ثانیه، با اختلاف فاحشی در صدر جدول ایستاد. این عدد یعنی هوش مصنوعی تقریباً به صورت آنی به درخواستهای کاربر پاسخ میدهد.

مدل Nemotron-3 Nano با سرعت ۳۷۷ توکن بر ثانیه، سریعترین عملکرد را ثبت کرد.
پیش از این در مدلهای هوش مصنوعی، افزایش سرعت معمولاً کیفیت را کاهش میداد؛ اما انویدیا مدعی تغییر این معادله است. موتور بهینهسازی TensorRT-LLM به مدلهای انویدیا کمک میکند تا بدون قربانی کردن کیفیت پاسخها، نهایت سرعت را ارائه دهند.
تحلیلهای آماری، موقعیت مدلهای مختلف را در مختصات «هوش» نسبت به «سرعت» بررسی کردند. مدلهای انویدیا در ناحیه سبز رنگ (ناحیه مطلوب) جای دارند که نشان میدهد این ابزارها هوش بالا را در کنار سرعت خروجی بسیار زیاد حفظ میکنند.

مدلهای Nemotron در ناحیه سبز نمودار، تعادل عالی بین سرعت و هوشمندی را به نمایش میگذارند.
گزارشهای تحلیلی، جایگاه انویدیا را در شاخص «باز بودن» (Openness Index) برجسته میدانند. انویدیا با انتشار دیتاستهای باز (Open Datasets) و ابزارهایی مانند NeMo Gym، فراتر از یک سازنده سختافزار عمل میکند.
نمودار زیر شاخص هوشمندی را در برابر شاخص باز بودن مقایسه میکند. این دادهها ثابت میکنند که Nemotron-3 علاوه بر قدرت فنی، شفافیت و دسترسی بیشتری را نسبت به مدلهای بسته (مانند مدلهای OpenAI) در اختیار محققان و توسعهدهندگان میگذارد.

انویدیا در کنار عملکرد بالا، امتیاز خوبی در شاخص مدلهای باز به دست آورد.
انویدیا با معرفی خانواده Nemotron-3 پیام روشنی به بازار فرستاد: برای دستیابی به هوش مصنوعی سریع و دقیق، لزوماً به سختافزارهای ابری غولپیکر نیاز ندارید و سیستمهای لوکال نیز عملکردی خیرهکننده ارائه میدهند. ترکیب سرعت ۳۷۷ توکن بر ثانیه با معماری باز، نظر توسعهدهندگان بسیاری را به این مدلها جلب میکند.
نظر شما درباره جهش سرعت در مدلهای جدید انویدیا چیست؟ در کارهای روزمره یا توسعه نرمافزار، سرعت پاسخدهی را ترجیح میدهید یا دقت نهایی مدل؟ دیدگاههای خود را با ما در میان بگذارید.