حساب کاربری ندارید؟ ثبت نام کنید

گوگل مدل هوش مصنوعی DiffusionGemma را معرفی کرد؛ تولید متن تا ۴ برابر سریع‌تر از مدل‌های سنتی

نوشته

9 ساعت قبل | بدون دیدگاه | گوگل، هوش مصنوعی

گوگل به‌تازگی از DiffusionGemma، یک مدل آزمایشی متن‌باز (Open Weight) هوش مصنوعی برای تولید متن مبتنی‌بر فناوری دیفیوژن، رونمایی کرده است. این مدل که تحت مجوز Apache 2.0 منتشر شده، رویکردی متفاوت نسبت به مدل‌های زبانی رایج دارد و به‌جای تولید متن به‌صورت کلمه‌به‌کلمه، می‌تواند بلوک‌های کامل متن را به‌صورت هم‌زمان تولید و اصلاح کند. DiffusionGemma بر پایه معماری خانواده Gemma 4 و تحقیقات Gemini Diffusion توسعه یافته و به گفته گوگل، در برخی سناریوهای اجرای محلی می‌تواند تا ۴ برابر سریع‌تر از مدل‌های زبانی سنتی عمل کند.

خلاصه خبر در یک نگاه

🔷 گوگل مدل جدید DiffusionGemma را به‌صورت متن‌باز منتشر کرد.

🔷 این مدل از روش Diffusion برای تولید متن استفاده می‌کند.

🔷 DiffusionGemma می‌تواند تا ۲۵۶ توکن را هم‌زمان تولید و اصلاح کند.

🔷 سرعت تولید متن تا ۴ برابر بیشتر از مدل‌های سنتی اعلام شده است.

🔷 مدل دارای ۲۶ میلیارد پارامتر و معماری Mixture of Experts است.

🔷 اجرای نسخه کوانتیزه‌شده به حدود ۱۸ گیگابایت حافظه گرافیکی نیاز دارد.

🔷 این مدل از هم‌اکنون تحت مجوز Apache 2.0 در دسترس توسعه‌دهندگان قرار گرفته است.

مدل هوش مصنوعی DiffusionGemma گوگل چیست؟

اکثر مدل‌های زبانی امروزی مانند ChatGPT ،Gemini و Claude از معماری خودرگرسیو استفاده می‌کنند؛ به این معنا که متن را به‌صورت توکن‌به‌توکن و پشت سر هم تولید می‌کنند.

اما DiffusionGemma رویکرد متفاوتی دارد. این مدل ابتدا مجموعه‌ای از توکن‌های تصادفی ایجاد می‌کند و سپس طی چندین مرحله بازسازی (Denoising)، کل متن را به‌تدریج اصلاح می‌کند تا به خروجی نهایی برسد.

این فرآیند شباهت زیادی به مدل‌های تولید تصویر مبتنی بر دیفیوژن دارد که از نویز اولیه شروع کرده و در نهایت یک تصویر کامل تولید می‌کنند.

مدل هوش مصنوعی DiffusionGemma گوگل

مدل هوش مصنوعی DiffusionGemma گوگل

تولید هم‌زمان ۲۵۶ توکن

یکی از مهم‌ترین ویژگی‌های DiffusionGemma توانایی تولید و اصلاح هم‌زمان حداکثر ۲۵۶ توکن است.

در حالی که مدل‌های سنتی متن را به‌صورت ترتیبی تولید می‌کنند، DiffusionGemma کل بلوک متن را به شکل موازی پردازش می‌کند. این موضوع باعث افزایش چشمگیر سرعت تولید محتوا و کاهش تأخیر پاسخ‌گویی می‌شود.

مدل هوش مصنوعی DiffusionGemma گوگل

مزایای معماری دیفیوژن در تولید متن

به گفته گوگل، استفاده از توجه دوطرفه (Bi-directional Attention) در این مدل مزایای متعددی به همراه دارد:

  • ویرایش مستقیم متن (Inline Editing)
  • تکمیل کدهای برنامه‌نویسی (Code Infilling)
  • تولید ساختارهای پیچیده Markdown
  • پردازش نمودارهای ریاضی
  • تولید توالی‌های اسید آمینه در پژوهش‌های زیستی
  • تولید ساختارهای متنی غیرخطی

این مدل می‌تواند کل متن را به‌صورت یکپارچه ارزیابی کند و هنگام تولید، اشتباهات احتمالی را اصلاح نماید.

مشخصات فنی DiffusionGemma

ویژگی جزئیات
نام مدل DiffusionGemma
معماری Mixture of Experts (MoE)
تعداد پارامترها 26 میلیارد پارامتر
پارامترهای فعال هنگام اجرا 3.8 میلیارد پارامتر
حافظه موردنیاز حدود 18 گیگابایت VRAM
مجوز انتشار Apache 2.0

🔴 همچنین بخوانید: هوش مصنوعی Gemma 4 معرفی شد: نسل جدید خانواده هوش مصنوعی متن باز گوگل

عملکرد و سرعت پردازش

گوگل و انویدیا اعلام کرده‌اند که DiffusionGemma می‌تواند بهره‌وری سخت‌افزارهای مدرن را به شکل قابل توجهی افزایش دهد و محدودیت‌های رایج مدل‌های ترتیبی را کاهش دهد.

آمارهای منتشرشده شامل موارد زیر است:

  • بیش از 1000 توکن در ثانیه روی NVIDIA H100
  • بیش از 700 توکن در ثانیه روی NVIDIA GeForce RTX 5090
  • حدود 150 توکن در ثانیه روی NVIDIA DGX Spark
  • تا 2000 توکن در ثانیه روی NVIDIA DGX Station
  • تا 4 برابر سرعت بیشتر نسبت به مدل‌های خودرگرسیو مشابه در اجرای محلی

کاربردهای DiffusionGemma

گوگل معتقد است این مدل برای سناریوهایی که تأخیر پایین اهمیت زیادی دارد، بسیار مناسب خواهد بود.

  • دستیارهای هوش مصنوعی محلی
  • چت‌بات‌های تعاملی
  • ویرایش سریع محتوا
  • تولید و اصلاح کد
  • عامل‌های هوشمند (AI Agents)
  • فرآیندهای برنامه‌ریزی و تصمیم‌گیری روی دستگاه
  • نمونه‌سازی و توسعه سریع پروژه‌ها

نمونه استفاده در حل سودوکو

گوگل اعلام کرده شرکت Unsloth نسخه‌ای از DiffusionGemma را برای حل جدول‌های سودوکو آموزش داده است.

این نوع مسائل برای مدل‌های خودرگرسیو چالش‌برانگیز هستند، زیرا تصمیم‌گیری درباره برخی خانه‌ها به اطلاعاتی وابسته است که در آینده مشخص می‌شوند. اما معماری توجه دوطرفه DiffusionGemma مدیریت چنین سناریوهایی را آسان‌تر می‌کند.

مدل هوش مصنوعی DiffusionGemma گوگل

پشتیبانی گسترده از اکوسیستم انویدیا

انویدیا این مدل را برای طیف گسترده‌ای از محصولات خود بهینه‌سازی کرده است.

سخت‌افزارهای پشتیبانی‌شده

  • NVIDIA GeForce RTX 4090
  • NVIDIA GeForce RTX 5090
  • NVIDIA RTX PRO 6000
  • NVIDIA DGX Spark
  • NVIDIA DGX Station
  • سیستم‌های Hopper و Blackwell

پشتیبانی از هسته‌های NVFP4 نیز باعث افزایش سرعت پردازش بدون افت محسوس دقت شده است.

پشتیبانی نرم‌افزاری و ابزارهای توسعه

DiffusionGemma از روز نخست با طیف وسیعی از ابزارهای توسعه و چارچوب‌های هوش مصنوعی سازگار است.

فریم‌ورک‌ها و ابزارهای استقرار

  • Hugging Face Transformers
  • vLLM
  • MLX
  • NVIDIA NIM
  • Red Hat vLLM Deployments

ابزارهای آموزش و Fine-Tuning

  • Unsloth
  • NVIDIA NeMo
  • Hackable Diffusion

دسترسی و انتشار

گوگل DiffusionGemma را به‌صورت متن‌باز و تحت مجوز Apache 2.0 منتشر کرده است. توسعه‌دهندگان می‌توانند وزن‌های مدل را دانلود کرده، از طریق APIهای انویدیا آن را آزمایش کنند یا روی سخت‌افزارهای سازگار به‌صورت محلی اجرا کنند.

همچنین گوگل اعلام کرده پشتیبانی رسمی از llama.cpp در نسخه‌های آینده ارائه خواهد شد.

DiffusionGemma یکی از متفاوت‌ترین پروژه‌های اخیر گوگل در حوزه مدل‌های زبانی محسوب می‌شود. این مدل با بهره‌گیری از فناوری Diffusion و تولید موازی متن، سرعت پردازش را به شکل چشمگیری افزایش می‌دهد و می‌تواند مسیر جدیدی برای توسعه نسل آینده دستیارهای هوش مصنوعی و ابزارهای تولید محتوا ایجاد کند. با این حال گوگل تأکید کرده که از نظر کیفیت خروجی، مدل‌های استاندارد Gemma 4 همچنان گزینه مناسب‌تری برای کاربردهای تولیدی و حرفه‌ای هستند.

به نظر شما آینده مدل‌های زبانی به سمت معماری‌های مبتنی بر Diffusion حرکت خواهد کرد یا مدل‌های خودرگرسیو همچنان انتخاب اصلی صنعت هوش مصنوعی باقی خواهند ماند؟

اشتراک در
اطلاع از
0 Comments
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
رپورتاژ آگهی پربازده
رپورتاژ آگهی پربازده
امیرحسین ملکی