حساب کاربری ندارید؟ ثبت نام کنید

مدل هوش مصنوعی Gemini 2.5 Flash Image با قابلیت‌های جدید برای استفاده عمومی عرضه شد

نوشته

6 ساعت قبل | بدون دیدگاه | گوگل، هوش مصنوعی

گوگل روز گذشته، اعلام کرد که مدل هوش مصنوعی Gemini 2.5 Flash Image اکنون به صورت عمومی و آماده برای استفاده تجاری (Production Use) در دسترس قرار گرفته است. این خبر بزرگی برای توسعه‌دهندگانی است که به دنبال قابلیت‌های پیشرفته برای تولید و ویرایش تصویر مبتنی بر هوش مصنوعی هستند. همچنین این به‌روزرسانی، قابلیت‌های جدیدی مانند پشتیبانی از نسبت‌های تصویر متنوع و امکان تولید خروجی «فقط-تصویر» را  فراهم می‌کند.

خلاصه و نکات کلیدی

🔹عرضه عمومی: گوگل اعلام کرد مدل هوش مصنوعی Gemini 2.5 Flash Image اکنون به صورت عمومی و آماده برای استفاده تجاری در دسترس توسعه‌دهندگان قرار گرفته است.

🔹انعطاف‌پذیری خلاقانه: این آپدیت پشتیبانی از ۱۰ نسبت تصویر (Aspect Ratio) مختلف، از سینمایی تا عمودی، و قابلیت تولید خروجی فقط-تصویر را اضافه می‌کند.

🔹قابلیت‌های پیشرفته: ویژگی‌های کلیدی شامل ترکیب یکپارچه تصاویر، حفظ ثبات کاراکترها در تصاویر مختلف و ویرایش هدفمند با دستورات زبان طبیعی است.

🔹دسترسی برای توسعه‌دهندگان: توسعه‌دهندگان می‌توانند از طریق پلتفرم‌های Google AI Studio و Vertex AI (برای کسب‌وکارها) به این مدل دسترسی پیدا کنند.

🔹قیمت‌گذاری: هزینه استفاده از این مدل ۰.۰۳۹ دلار برای هر تصویر و ۳۰ دلار برای هر یک میلیون توکن خروجی تعیین شده است.

Gemini 2.5 Flash Image

چه قابلیت‌های جدیدی در این مدل ارائه شده است؟

مدل Gemini 2.5 Flash Image به کاربران و توسعه‌دهندگان اجازه می‌دهد تا کارهای زیر را انجام دهند:

  1. ترکیب یکپارچه چندین تصویر با یکدیگر.
  2. حفظ ثبات و ظاهر یکسان کاراکترها در تصاویر مختلف.
  3. انجام ویرایش‌های دقیق و هدفمند روی بخشی از تصویر با استفاده از دستورات زبان طبیعی (مثلاً: «رنگ لباس این شخص را آبی کن»).
  4. استفاده از دانش گسترده جمنای برای تولید و اصلاح تصاویر بر اساس اطلاعات واقعی.

نسبت‌های تصویر پشتیبانی

این مدل اکنون از ۱۰ نسبت تصویر مختلف پشتیبانی می‌کند که انعطاف‌پذیری بالایی را برای تولید محتوا در فرمت‌های گوناگون فراهم می‌کند:

  1. افقی (Landscape): 21:9, 16:9, 4:3, 3:2
  2. مربعی (Square): 1:1
  3. عمودی (Portrait): 9:16, 3:4, 2:3
  4. انعطاف‌پذیر (Flexible): 5:4, 4:5

موارد استفاده برای توسعه‌دهندگان

برخی شرکت‌ها از هم‌اکنون استفاده از این مدل را در محصولات خود آغاز کرده‌اند:

  • Cartwheel: این شرکت، مدل Gemini 2.5 Flash Image را با ابزار مدل‌سازی سه‌بعدی خود ترکیب کرده تا کنترل مستقیمی بر روی ژست کاراکترها و ثبات بصری در داستان‌سرایی ایجاد کند.
  • Volley: سازندگان بازی Wit’s End، از این مدل برای تولید و ویرایش لحظه‌ای پرتره شخصیت‌ها، تصاویر صحنه‌ها و ترکیب‌بندی‌های چندشخصیتی استفاده می‌کنند.

چگونه می‌توان به این مدل دسترسی پیدا کرد؟

مطابق با گزارش منبع، توسعه‌دهندگان می‌توانند از طریق دو پلتفرم اصلی گوگل به Gemini 2.5 Flash Image دسترسی داشته باشند:

  • Google AI Studio: که دارای یک «حالت ساخت» برای ایجاد و ترکیب سریع اپلیکیشن‌های مبتنی بر هوش مصنوعی است.
  • Vertex AI: برای استفاده‌های تجاری و در سطح سازمانی.

قیمت‌گذاری و دسترسی

قیمت‌گذاری این سرویس مطابق با قیمت‌گذاری استاندارد مدل Gemini 2.5 Flash تعیین شده است:

  1. ۰.۰۳۹ دلار (حدود ۰.۰۳۶ یورو) به ازای تولید هر تصویر.
  2. ۳۰ دلار (حدود ۲۸ یورو) به ازای هر ۱ میلیون توکن خروجی.

این مدل هم‌اکنون به صورت پایدار و آماده برای استفاده در پروژه‌های واقعی، از طریق Gemini API در پلتفرم‌های Google AI Studio و Vertex AI در دسترس است.

گوگل مدل هوش مصنوعی Gemini 2.5 Flash را ارتقاء داد: راهنمای تکالیف هوشمندتر و درک بهتر تصاویر

عرضه عمومی مدل هوش مصنوعی Gemini 2.5 Flash Image یک گام مهم از سوی گوگل برای توانمندسازی توسعه‌دهندگان و شرکت‌ها در زمینه تولید محتوای بصری است. این مدل با ارائه قابلیت‌های پیشرفته‌ای مانند ویرایش با زبان طبیعی و حفظ ثبات کاراکتر، همراه با یک مدل قیمت‌گذاری شفاف، ابزاری قدرتمند و در دسترس برای ساخت نسل بعدی اپلیکیشن‌های خلاقانه و تجاری محسوب می‌شود. اکنون که این فناوری از فاز آزمایشی خارج شده، باید منتظر موج جدیدی از نوآوری‌ها در اپلیکیشن‌های مبتنی بر هوش مصنوعی تصویرساز باشیم.

اشتراک در
اطلاع از
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
رپورتاژ آگهی پربازده
رپورتاژ آگهی پربازده
سهیل سلیمانی