گوگل بهتازگی یک مدل آزمایشی از هوش مصنوعی Gemini 2.0 خود با نام Gemini 2.0 Flash Thinking را منتشر کرده است که برای نشان دادن فرآیند استدلال در زمان حل مشکلات پیچیده طراحی شده است.
این مدل که در Google AI Studio موجود است، بر درک چندوجهی، استدلال و کدنویسی تمرکز دارد. این مدل همچنین برای مقابله با مشکلات چالشبرانگیز در زمینههایی مانند برنامهنویسی، ریاضیات و فیزیک درنظر گرفته شده است.
مدل Gemini 2.0 Flash Thinking برای بهبود استدلال در برابر چالشهای دشوار با ایجاد فرآیند تفکر مدل درحین حل مسائل پیچیده طراحی شده است.
این رویکرد به آن اجازه میدهد تا از مدل استاندارد Gemini 2.0 Flash بهتر عمل کند. بهگفته لوگان کیلپاتریک، رئیس محصول استودیوی هوش مصنوعی، این مدل جدید «اولین گام در سفر استدلالی گوگل» است.
جف دین، دانشمند ارشد Google DeepMind، نیز تأکید کرد که این مدل «از افکار برای تقویت استدلال خود استفاده میکند» که منجر به بهبود عملکرد ازطریق افزایش محاسبات زمان استنتاج میشود؛ میزان محاسباتی که برای پردازش و تجزیهوتحلیل یک سؤال استفاده میشود.
افزایش سرعت و عملکرد
بهعنوان بخشی از سری Gemini 2.0 Flash، مدل Thinking از سرعت و عملکرد Flash 2.0 استفاده میکند و محاسبات سریعتری را ارائه میدهد. تیم گوگل چندین نسخه نمایشی را بهاشتراک گذاشته است، بهویژه در زمینه فیزیک و احتمال، تا نشان دهد که این مدل چگونه با سؤالات برخورد میکند.
بهعنوانمثال، هنگام حل یک مسئله فیزیک، این مدل استدلال خود را با تجزیه سؤال به مراحل قابل مدیریت قبل از ارائه پاسخ نهایی، نشان میدهد.
نحوه استفاده از Thinking Mode
Thinking Mode ازطریق دو کانال اصلی در دسترس است: Gemini API و Google AI Studio.
با استفاده از Gemini API:
برای استفاده از این مدل ازطریق Gemini API، توسعهدهندگان میتوانند هنگام درخواست، کد مدل gemini-2.0-flash-thinking-exp را مشخص کنند.
استفاده از Google AI Studio:
برای دسترسی به مدل در Google AI Studio، به سادگی مدل Gemini 2.0 Flash Thinking Experimental را از منوی کشویی در قسمت تنظیمات انتخاب کنید.
درک فرآیند تفکر مدل
فرآیند فکر تولیدشده توسط این مدل بستهبه پلتفرم مورداستفاده به روشهای مختلفی ظاهر میشود. هنگام استفاده از Gemini API، افکار مدل بهعنوان اولین عنصر محتوای تولیدشده ظاهر میشوند.
در استودیوی هوش مصنوعی گوگل، فرآیند تفکر در یک پنل جداگانه «Thoughts» نمایش داده میشود که میتواند برای مشاهده مراحل استدلال مدل گسترش یابد.
محدودیتهای Thinking Mode
بهعنوان یک مدل تجربی، Gemini 2.0 Flash Thinking دارای محدودیتهای زیر است:
محدودیت ورودی 32 هزار توکن
فقط ورودی متن و تصویر
محدودیت خروجی 8 هزار توکن
خروجی فقط بهصورت متن
بدون ابزار داخلی، مانند جستجو یا اجرای کد
زمان در دسترس بودن
مدل Thinking Mode اکنون در Google AI Studio در دسترس است و ازطریق Gemini API و Vertex AI نیز قابلاستفاده میباشد. توسعهدهندگان میتوانند از امروز با آزمایش مدل با نوتبوک Colab گوگل یا با ادغام آن در پروژههای خود، از این مدل استفاده کنند.