حساب کاربری ندارید؟ ثبت نام کنید

گوگل از Nano Banana 2 Lite و Gemini Omni Flash رونمایی کرد؛ تولید تصویر در ۴ ثانیه و ساخت ویدیو از طریق API

نوشته

15 ساعت قبل | بدون دیدگاه | گوگل، هوش مصنوعی

گوگل به‌تازگی دو مدل جدید هوش مصنوعی مولد خود را معرفی کرده است؛ Nano Banana 2 Lite برای تولید سریع و کم‌هزینه تصاویر توسعه یافته و می‌تواند تنها در ۴ ثانیه یک تصویر تولید کند؛ در کنار آن، Gemini Omni Flash نیز برای نخستین بار امکان تولید و ویرایش ویدیو از طریق دستورات متنی در Gemini API را در اختیار توسعه‌دهندگان قرار می‌دهد. هر دو مدل از امروز در Google AI Studio ،Gemini API و Gemini Enterprise Agent Platform در دسترس قرار گرفته‌اند.

خلاصه خبر در یک نگاه

🔷 گوگل از مدل‌های Nano Banana 2 Lite و Gemini Omni Flash رونمایی کرد.

🔷 مدل Nano Banana 2 Lite تصاویر 1K را تنها در ۴ ثانیه و با هزینه ۰.۰۳۴ دلار تولید می‌کند.

🔷 مدل Gemini Omni Flash امکان تولید و ویرایش ویدیو از طریق Gemini API را فراهم می‌کند.

🔷 گوگل پیشنهاد می‌کند این دو مدل برای ساخت محتوای تصویری و ویدیویی به‌صورت ترکیبی استفاده شوند.

🔷 هر دو مدل از فناوری SynthID برای واترمارک‌گذاری محتوای تولیدشده با هوش مصنوعی استفاده می‌کنند.

مدل Nano Banana 2 Lite؛ تولید تصویر در ۴ ثانیه

مدل Nano Banana 2 Lite که در API با نام gemini-3.1-flash-lite-image شناخته می‌شود، برای توسعه‌دهندگانی طراحی شده است که به تولید سریع حجم بالایی از تصاویر نیاز دارند.

به گفته گوگل، این مدل می‌تواند یک تصویر با وضوح 1K را تنها در ۴ ثانیه تولید کند و هزینه هر تصویر نیز ۰.۰۳۴ دلار است.

مقایسه مدل‌های خانواده Nano Banana

مدل هزینه هر تصویر وضوح تصویر
Nano Banana 2 Lite ۰.۰۳۴ دلار 1K
Nano Banana 2 ۰.۰۶۷ دلار 1K
Nano Banana Pro ۰.۱۳۴ دلار 1K یا 2K

گوگل اعلام کرده است که با وجود تمرکز Nano Banana 2 Lite بر سرعت، این مدل همچنان در اجرای دقیق دستورات متنی، حفظ یکپارچگی شخصیت‌ها و تولید متن خوانا در تصاویر عملکرد قابل‌اعتمادی دارد.

مدل Nano Banana 2 Lite گوگل

مدل Nano Banana 2 Lite گوگل

ورود Nano Banana 2 Lite به محصولات گوگل

علاوه بر API، این مدل به‌تدریج در سرویس‌های مختلف گوگل نیز عرضه می‌شود، از جمله:

  • AI Mode در Google Search
  • اپلیکیشن Gemini
  • NotebookLM
  • Google Photos
  • Stitch
  • Google Flow
  • Google Ads

گوگل همچنین اعلام کرده است که Nano Banana 2 Lite جایگزین نسخه اولیه Nano Banana مبتنی بر Gemini 2.5 شده است.

مدل Gemini Omni Flash؛ تولید و ویرایش ویدیو با متن

مدل Gemini Omni Flash که نخستین بار در رویداد Google I/O معرفی شده بود، اکنون از طریق Gemini API و Google AI Studio در اختیار توسعه‌دهندگان قرار گرفته است.

این مدل قابلیت‌های استدلال چندوجهی (Multimodal) جمینای را با امکان تولید و ویرایش ویدیو ترکیب می‌کند.

هزینه استفاده از Gemini Omni Flash برابر با ۰.۱۰ دلار به ازای هر ثانیه خروجی ویدیو است؛ قیمتی که با مدل Veo 3.1 Fast برابری می‌کند.

قابلیت‌های Gemini Omni Flash

  • تولید و ویرایش ویدیو با زبان طبیعی
  • ترکیب ورودی‌های متنی، تصویری و ویدیویی
  • استفاده از دانش عمومی Gemini برای تولید محتوا
  • هماهنگ‌سازی متن و گرافیک با اتفاقات داخل ویدیو

در حال حاضر، این مدل تنها قادر به تولید ویدیوهای ۱۰ ثانیه‌ای است.

گوگل همچنین اعلام کرده است که قابلیت‌هایی مانند استفاده از مرجع صوتی، ادامه دادن صحنه‌ها، پردازش صحیح ویدیوهای مرجع و حفظ کامل ثبات شخصیت‌ها بین تغییر زاویه دوربین یا صحنه‌ها هنوز به‌طور کامل پشتیبانی نمی‌شوند.

مدل Gemini Omni Flash گوگل

مدل Gemini Omni Flash گوگل

گوگل استفاده ترکیبی از دو مدل را پیشنهاد می‌کند

به اعتقاد گوگل، بیشترین کارایی زمانی حاصل می‌شود که Nano Banana 2 Lite و Gemini Omni Flash در کنار یکدیگر استفاده شوند.

در این سناریو، توسعه‌دهندگان ابتدا تصاویر موردنظر را با Nano Banana 2 Lite تولید کرده و سپس همان تصاویر را به‌عنوان مرجع به Gemini Omni Flash می‌دهند تا به ویدیو تبدیل شوند.

گوگل برای نمایش این قابلیت سه نمونه کاربردی ارائه کرده است:

  • Anywhere؛ قرار دادن کاربران در مکان‌های مشهور جهان با استفاده از عکس سلفی و ساخت ویدیو.
  • Space Lift؛ تولید ایده‌های طراحی داخلی از تصاویر اتاق و تبدیل آن‌ها به ویدیو.
  • Omni Product Studio؛ تبدیل تصاویر ثابت محصولات به ویدیوهای مناسب فروشگاه‌های آنلاین.

واترمارک SynthID برای محتوای تولیدشده با هوش مصنوعی

گوگل اعلام کرده است که هر دو مدل از فناوری SynthID برای نشانه‌گذاری محتوای تولیدشده با هوش مصنوعی استفاده می‌کنند.

کاربران می‌توانند اصالت این محتوا را از طریق اپلیکیشن Gemini ،Gemini در مرورگر Chrome یا Google Search بررسی کنند.

🔴 همچنین بخوانید: گوگل نانو بنانا پرو را معرفی کرد: انقلابی در ویرایش تصویر با هوش مصنوعی Gemini 3 Pro

🔴 همچنین بخوانید: گوگل از Nano Banana 2 رونمایی کرد: مدل تصویرساز جمینای ۳.۱ فلش با سرعت و دقت خیره‌کننده

به نظر شما کدام قابلیت کاربردی‌تر است؛ تولید تصویر در ۴ ثانیه یا ساخت و ویرایش ویدیو با دستورات متنی؟

اشتراک در
اطلاع از
0 Comments
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها