گوگل از هوش مصنوعی Gemini 2.0 Flash Thinking به‌عنوان اولین مدل استدلالی خود رونمایی کرد

گوگل به‌تازگی یک مدل آزمایشی از هوش مصنوعی Gemini 2.0 خود با نام Gemini 2.0 Flash Thinking را منتشر کرده است که برای نشان دادن فرآیند استدلال در زمان حل مشکلات پیچیده طراحی شده است.

هوش مصنوعی Gemini 2.0 Flash Thinking گوگل

این مدل که در Google AI Studio موجود است، بر درک چندوجهی، استدلال و کدنویسی تمرکز دارد. این مدل همچنین برای مقابله با مشکلات چالش‌برانگیز در زمینه‌هایی مانند برنامه‌نویسی، ریاضیات و فیزیک درنظر گرفته شده است.

مدل Gemini 2.0 Flash Thinking برای بهبود استدلال در برابر چالش‌های دشوار با ایجاد فرآیند تفکر مدل درحین حل مسائل پیچیده طراحی شده است.

این رویکرد به آن اجازه می‌دهد تا از مدل استاندارد Gemini 2.0 Flash بهتر عمل کند. به‌گفته لوگان کیلپاتریک، رئیس محصول استودیوی هوش مصنوعی، این مدل جدید «اولین گام در سفر استدلالی گوگل» است.

جف دین، دانشمند ارشد Google DeepMind، نیز تأکید کرد که این مدل «از افکار برای تقویت استدلال خود استفاده می‌کند» که منجر به بهبود عملکرد ازطریق افزایش محاسبات زمان استنتاج می‌شود؛ میزان محاسباتی که برای پردازش و تجزیه‌وتحلیل یک سؤال استفاده می‌شود.

افزایش سرعت و عملکرد

به‌عنوان بخشی از سری Gemini 2.0 Flash، مدل Thinking از سرعت و عملکرد Flash 2.0 استفاده می‌کند و محاسبات سریع‌تری را ارائه می‌دهد. تیم گوگل چندین نسخه نمایشی را به‌اشتراک گذاشته است، به‌ویژه در زمینه فیزیک و احتمال، تا نشان دهد که این مدل چگونه با سؤالات برخورد می‌کند.

به‌عنوان‌مثال، هنگام حل یک مسئله فیزیک، این مدل استدلال خود را با تجزیه سؤال به مراحل قابل مدیریت قبل از ارائه پاسخ نهایی، نشان می‌دهد.

نحوه استفاده از Thinking Mode

Thinking Mode ازطریق دو کانال اصلی در دسترس است: Gemini API و Google AI Studio.

با استفاده از Gemini API:

برای استفاده از این مدل ازطریق Gemini API، توسعه‌دهندگان می‌توانند هنگام درخواست، کد مدل gemini-2.0-flash-thinking-exp را مشخص کنند.

استفاده از Google AI Studio:

برای دسترسی به مدل در Google AI Studio، به سادگی مدل Gemini 2.0 Flash Thinking Experimental را از منوی کشویی در قسمت تنظیمات انتخاب کنید.

هوش مصنوعی Gemini 2.0 Flash Thinking گوگل

درک فرآیند تفکر مدل

فرآیند فکر تولیدشده توسط این مدل بسته‌به پلتفرم مورداستفاده به روش‌های مختلفی ظاهر می‌شود. هنگام استفاده از Gemini API، افکار مدل به‌عنوان اولین عنصر محتوای تولیدشده ظاهر می‌شوند.

در استودیوی هوش مصنوعی گوگل، فرآیند تفکر در یک پنل جداگانه «Thoughts» نمایش داده می‌شود که می‌تواند برای مشاهده مراحل استدلال مدل گسترش یابد.

محدودیت‌های Thinking Mode

به‌عنوان یک مدل تجربی، Gemini 2.0 Flash Thinking دارای محدودیت‌های زیر است:

محدودیت ورودی 32 هزار توکن

فقط ورودی متن و تصویر

محدودیت خروجی 8 هزار توکن

خروجی فقط به‌صورت متن

بدون ابزار داخلی، مانند جستجو یا اجرای کد

زمان در دسترس بودن

مدل Thinking Mode اکنون در Google AI Studio در دسترس است و ازطریق Gemini API و Vertex AI نیز قابل‌استفاده می‌باشد. توسعه‌دهندگان می‌توانند از امروز با آزمایش مدل با نوت‌بوک Colab گوگل یا با ادغام آن در پروژه‌های خود، از این مدل استفاده کنند.