حساب کاربری ندارید؟ ثبت نام کنید

گوگل نانو بنانا پرو را معرفی کرد: انقلابی در ویرایش تصویر با هوش مصنوعی Gemini 3 Pro

نوشته

3 ساعت قبل | بدون دیدگاه | گوگل، هوش مصنوعی

گوگل تنها یک روز پس از معرفی مدل زبانی قدرتمند Gemini 3 Pro، از مدل تصویرساز جدید خود رونمایی کرد. این مدل که رسماً «Gemini 3 Pro Image» نام دارد، در میان کاربران با نام مستعار وایرال شده‌ی نانو بنانا پرو (Nano Banana Pro) شناخته می‌شود. این ابزار جدید با بهره‌گیری از قدرت استدلال پیشرفته، قابلیت‌های ویرایش تصویر، ترکیب عکس‌ها و نوشتن متن‌های خوانا در تصویر را به سطحی کاملاً جدید ارتقا داده است.

خلاصه و نکات کلیدی

  • 🔹معرفی نانو بنانا پرو: گوگل مدل تصویرساز جدید خود را بر پایه Gemini 3 Pro عرضه کرد.
  • 🔹متن‌های دقیق و خوانا: این مدل می‌تواند متون را با دقت بالا و فونت‌های متنوع در تصاویر بگنجاند (پشتیبانی از زبان‌های مختلف).
  • 🔹ویرایش پیشرفته: قابلیت تغییر نورپردازی (روز به شب)، تغییر فوکوس، و ویرایش موضعی اجزای تصویر.
  • 🔹ترکیب تصاویر: امکان ترکیب تا ۱۴ تصویر و حفظ ثبات چهره تا ۵ نفر در یک صحنه سینمایی.
  • 🔹سیاست واترمارک: گوگل واترمارک را برای مشترکین AI Ultra (جهت استفاده حرفه‌ای) حذف می‌کند، اما ابزار تشخیص SynthID همچنان فعال است.

تصویر ساخته شده با Nano Banana Pro

نانو بنانا پرو چیست و چه تفاوتی با مدل قبلی دارد؟

گوگل پس از عرضه مدل متنی در روز سه‌شنبه، اکنون نانو بنانا پرو (Nano Banana Pro) را عرضه کرده است. مدل اصلی (Gemini 2.5 Flash Image) در اواخر آگوست (شهریور) معرفی شده بود، اما مدل جدید بر پایه Gemini 3 Pro ساخته شده است.

این مدل از «دانش دنیای واقعی و قدرت استدلال پیشرفته» مدل پایه استفاده می‌کند تا اطلاعات را بهتر از هر زمان دیگری به تصویر بکشد. یکی از بزرگترین مشکلات هوش مصنوعی، یعنی نوشتن متن در تصویر، در اینجا بهبود چشمگیری یافته است. نانو بنانا پرو می‌تواند متن‌های دقیق‌تر و خواناتری را در زبان‌های مختلف ایجاد کند و تنوع وسیع‌تری از بافت‌ها، فونت‌ها و خوشنویسی را ارائه دهد.

قابلیت‌های ویرایش: تغییر نور و فوکوس با یک دستور

این مدل به شما اجازه می‌دهد تا کنترل کاملی بر روی صحنه داشته باشید. شما می‌توانید:

  • زوایای دوربین را تنظیم کنید.
  • فوکوس (Focus) را تغییر دهید (مثلاً پس‌زمینه را تار کنید).
  • درجه‌بندی رنگی (Color Grading) پیچیده اعمال کنید.
  • نورپردازی صحنه را تغییر دهید (مثلاً تبدیل روز به شب یا ایجاد نور ملایم از سمت چپ).
  • ویرایش موضعی (Localized Editing) انجام دهید: انتخاب، اصلاح و تغییر تنها بخشی از تصویر بدون تأثیر بر بقیه آن.

خروجی‌ها در نسبت‌های تصویر مختلف و با رزولوشن‌های 2K و 4K در دسترس هستند.

ویرایش تصاویر با Nano Banana Pro

قدرت ترکیب تصاویر و اینفوگرافیک‌ها

یکی از ویژگی‌های خیره‌کننده Nano Banana Pro، توانایی ترکیب تا ۱۴ تصویر در یک قاب سینمایی است، در حالی که ثبات و شباهت چهره تا ۵ نفر را حفظ می‌کند. این ویژگی برای ساخت داستان‌های مصور یا صحنه‌های پیچیده ایده‌آل است.

علاوه بر این، قدرت استدلال مدل به آن اجازه می‌دهد تا اینفوگرافیک‌ها و نمودارهای دقیق تولید کند (مثلاً دستور تهیه چای با تمام مراحل)، که نشان‌دهنده درک عمیق مدل از فرآیندهای دنیای واقعی است.

اینفوگرافیک دستور آماده‌سازی یک نوع چایی

قابلیت ترکیب کردن و به‌کارگیری تصاویر مختلف

دسترسی، قیمت و واترمارک

نانو بنانا پرو از امروز (پنج‌شنبه، ۲۹ آبان ۱۴۰۴) به صورت جهانی در اپلیکیشن Gemini در حال انتشار است. برای استفاده، کافی است مدل Thinking (Gemini 3 Pro) را انتخاب کرده و گزینه «Create images» را بزنید.

سهمیه‌های استفاده:

  • کاربران رایگان: سهمیه محدودی دارند و پس از آن به مدل اصلی Nano Banana باز می‌گردند.
  • مشترکین Plus، Pro و Ultra: محدودیت‌های استفاده بسیار بالاتری دریافت می‌کنند.

همچنین گوگل سیاست واترمارک خود را تغییر داده است. برای مشترکین AI Ultra که اغلب از این ابزار برای کارهای حرفه‌ای استفاده می‌کنند، واترمارک حذف می‌شود. با این حال، گوگل افزونه SynthID@ را در اپلیکیشن جمینای فعال کرده است که به کاربران اجازه می‌دهد با آپلود یک تصویر، بررسی کنند که آیا توسط هوش مصنوعی گوگل ساخته شده است یا خیر.

قابلیت تشخیص تصاویر ساخته شده با هوش مصنوعی گوگل

نظر شما چیست؟

گوگل با معرفی نانو بنانا پرو، فاصله بین تخیل و تصویرسازی را به حداقل رسانده است. توانایی این مدل در فهم دقیق متن، ترکیب پیچیده تصاویر و ویرایش‌های سینمایی، آن را به ابزاری قدرتمند برای طراحان و تولیدکنندگان محتوا تبدیل می‌کند. اگرچه نام آن کمی شوخ‌طبعانه به نظر می‌رسد، اما قابلیت‌های آن کاملاً جدی و در سطح حرفه‌ای است.

هوش مصنوعی گوگل Gemini 3 رسماً رونمایی شد: «هوشمندترین» مدل AI با استدلال پیشرفته و رابط کاربری مولد

نظر شما چیست؟

اشتراک در
اطلاع از
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
رپورتاژ آگهی پربازده
رپورتاژ آگهی پربازده
سهیل سلیمانی