
هفته گذشته، گوگل در یک پادکست سرانجام توضیح داد که چگونه مولد تصویر محبوبش، نانو بنانا (Nano Banana)، به این نام عجیبوغریب دست یافته است. درحالیکه این نام بازیگوش به شهرت آن کمک کرد، اما این نتایج فوقالعاده ابزار بود که باعث فراگیر شدن آن شد. اکنون بهنظر میرسد گوگل درحال کار بر روی نسل دوم این مدل هوش مصنوعی است و یک افشاگری جدید ادعا میکند که نانو بنانا ۲ میتواند بهبودهای قابلتوجهی را ارائه دهد.
بر اساس گزارشی از وبسایت آلمانی WinFuture، مدل نانو بنانا ۲ مبتنیبر Gemini 2.5 Flash Image خواهد بود و چندین بهبود برجسته نسبتبه نسخه اول خواهد داشت. یکی از این بهبودها، پشتیبانی از رزولوشنهای متنوع از 1K تا 4K است که شامل پشتیبانی بومی از رندر 2K و قابلیت افزایش مقیاس (Upscaling) به 4K میشود.
کاربرانی در شبکه اجتماعی X ادعا کردهاند که یک وبسایت شخص ثالث بهصورت «تصادفی» پیشنمایشی از آنچه که گمان میرود Nano Banana 2 با اسم رمز Gempix باشد را ارائه داده است. تصاویر به اشتراک گذاشته شده توسط این کاربران، بهبودهایی را در کیفیت رندر، با جزئیات بیشتر و موارد کمتری از آرتیفکتهای هوش مصنوعی نشان میدهد.
بااینحال، بهبود بزرگتر ممکن است فرآیند جدید تولید چندمرحلهای (multi-stage generation) باشد. گفته میشود که این مولد تصویر قبل از ارائه خروجی نهایی، نتایج را برنامهریزی، تأیید و اصلاح میکند تا از عدم دقت و سایر مشکلات جلوگیری کند. این رویکرد آن را از اکثر مولدهای تصویر هوش مصنوعی دیگر که تصویر را در یک مرحله تولید میکنند، متمایز میسازد. در این گزارش ذکر شده که این فرآیند منجر به خطوط تمیزتر، زوایای تیزتر و خطاهای کمتر میشود.
این افشاگری کمی مشکوک بهنظر میرسد، بنابراین توصیه میکنیم با دیده تردید به آن بنگرید. تا زمانی که گوگل بهصورت رسمی اطلاعاتی را منتشر نکند، تمام این جزئیات در حد یک شایعه باقی خواهند ماند.
بهنظر شما آیا فرآیند تولید چندمرحلهای میتواند نقطه برتری بزرگ نانو بنانا ۲ در رقابت با ابزارهایی مانند میدجرنی باشد؟