گوگل بهتازگی دو مدل جدید هوش مصنوعی مولد خود را معرفی کرده است؛ Nano Banana 2 Lite برای تولید سریع و کمهزینه تصاویر توسعه یافته و میتواند تنها در ۴ ثانیه یک تصویر تولید کند؛ در کنار آن، Gemini Omni Flash نیز برای نخستین بار امکان تولید و ویرایش ویدیو از طریق دستورات متنی در Gemini API را در اختیار توسعهدهندگان قرار میدهد. هر دو مدل از امروز در Google AI Studio ،Gemini API و Gemini Enterprise Agent Platform در دسترس قرار گرفتهاند.
🔷 گوگل از مدلهای Nano Banana 2 Lite و Gemini Omni Flash رونمایی کرد.
🔷 مدل Nano Banana 2 Lite تصاویر 1K را تنها در ۴ ثانیه و با هزینه ۰.۰۳۴ دلار تولید میکند.
🔷 مدل Gemini Omni Flash امکان تولید و ویرایش ویدیو از طریق Gemini API را فراهم میکند.
🔷 گوگل پیشنهاد میکند این دو مدل برای ساخت محتوای تصویری و ویدیویی بهصورت ترکیبی استفاده شوند.
🔷 هر دو مدل از فناوری SynthID برای واترمارکگذاری محتوای تولیدشده با هوش مصنوعی استفاده میکنند.
مدل Nano Banana 2 Lite که در API با نام gemini-3.1-flash-lite-image شناخته میشود، برای توسعهدهندگانی طراحی شده است که به تولید سریع حجم بالایی از تصاویر نیاز دارند.
به گفته گوگل، این مدل میتواند یک تصویر با وضوح 1K را تنها در ۴ ثانیه تولید کند و هزینه هر تصویر نیز ۰.۰۳۴ دلار است.
| مدل | هزینه هر تصویر | وضوح تصویر |
|---|---|---|
| Nano Banana 2 Lite | ۰.۰۳۴ دلار | 1K |
| Nano Banana 2 | ۰.۰۶۷ دلار | 1K |
| Nano Banana Pro | ۰.۱۳۴ دلار | 1K یا 2K |
گوگل اعلام کرده است که با وجود تمرکز Nano Banana 2 Lite بر سرعت، این مدل همچنان در اجرای دقیق دستورات متنی، حفظ یکپارچگی شخصیتها و تولید متن خوانا در تصاویر عملکرد قابلاعتمادی دارد.
علاوه بر API، این مدل بهتدریج در سرویسهای مختلف گوگل نیز عرضه میشود، از جمله:
گوگل همچنین اعلام کرده است که Nano Banana 2 Lite جایگزین نسخه اولیه Nano Banana مبتنی بر Gemini 2.5 شده است.
مدل Gemini Omni Flash که نخستین بار در رویداد Google I/O معرفی شده بود، اکنون از طریق Gemini API و Google AI Studio در اختیار توسعهدهندگان قرار گرفته است.
این مدل قابلیتهای استدلال چندوجهی (Multimodal) جمینای را با امکان تولید و ویرایش ویدیو ترکیب میکند.
هزینه استفاده از Gemini Omni Flash برابر با ۰.۱۰ دلار به ازای هر ثانیه خروجی ویدیو است؛ قیمتی که با مدل Veo 3.1 Fast برابری میکند.
در حال حاضر، این مدل تنها قادر به تولید ویدیوهای ۱۰ ثانیهای است.
گوگل همچنین اعلام کرده است که قابلیتهایی مانند استفاده از مرجع صوتی، ادامه دادن صحنهها، پردازش صحیح ویدیوهای مرجع و حفظ کامل ثبات شخصیتها بین تغییر زاویه دوربین یا صحنهها هنوز بهطور کامل پشتیبانی نمیشوند.
به اعتقاد گوگل، بیشترین کارایی زمانی حاصل میشود که Nano Banana 2 Lite و Gemini Omni Flash در کنار یکدیگر استفاده شوند.
در این سناریو، توسعهدهندگان ابتدا تصاویر موردنظر را با Nano Banana 2 Lite تولید کرده و سپس همان تصاویر را بهعنوان مرجع به Gemini Omni Flash میدهند تا به ویدیو تبدیل شوند.
گوگل برای نمایش این قابلیت سه نمونه کاربردی ارائه کرده است:
گوگل اعلام کرده است که هر دو مدل از فناوری SynthID برای نشانهگذاری محتوای تولیدشده با هوش مصنوعی استفاده میکنند.
کاربران میتوانند اصالت این محتوا را از طریق اپلیکیشن Gemini ،Gemini در مرورگر Chrome یا Google Search بررسی کنند.
🔴 همچنین بخوانید: گوگل نانو بنانا پرو را معرفی کرد: انقلابی در ویرایش تصویر با هوش مصنوعی Gemini 3 Pro
🔴 همچنین بخوانید: گوگل از Nano Banana 2 رونمایی کرد: مدل تصویرساز جمینای ۳.۱ فلش با سرعت و دقت خیرهکننده
به نظر شما کدام قابلیت کاربردیتر است؛ تولید تصویر در ۴ ثانیه یا ساخت و ویرایش ویدیو با دستورات متنی؟