گوگل روز گذشته، اعلام کرد که مدل هوش مصنوعی Gemini 2.5 Flash Image اکنون به صورت عمومی و آماده برای استفاده تجاری (Production Use) در دسترس قرار گرفته است. این خبر بزرگی برای توسعهدهندگانی است که به دنبال قابلیتهای پیشرفته برای تولید و ویرایش تصویر مبتنی بر هوش مصنوعی هستند. همچنین این بهروزرسانی، قابلیتهای جدیدی مانند پشتیبانی از نسبتهای تصویر متنوع و امکان تولید خروجی «فقط-تصویر» را فراهم میکند.
🔹عرضه عمومی: گوگل اعلام کرد مدل هوش مصنوعی Gemini 2.5 Flash Image اکنون به صورت عمومی و آماده برای استفاده تجاری در دسترس توسعهدهندگان قرار گرفته است.
🔹انعطافپذیری خلاقانه: این آپدیت پشتیبانی از ۱۰ نسبت تصویر (Aspect Ratio) مختلف، از سینمایی تا عمودی، و قابلیت تولید خروجی فقط-تصویر را اضافه میکند.
🔹قابلیتهای پیشرفته: ویژگیهای کلیدی شامل ترکیب یکپارچه تصاویر، حفظ ثبات کاراکترها در تصاویر مختلف و ویرایش هدفمند با دستورات زبان طبیعی است.
🔹دسترسی برای توسعهدهندگان: توسعهدهندگان میتوانند از طریق پلتفرمهای Google AI Studio و Vertex AI (برای کسبوکارها) به این مدل دسترسی پیدا کنند.
🔹قیمتگذاری: هزینه استفاده از این مدل ۰.۰۳۹ دلار برای هر تصویر و ۳۰ دلار برای هر یک میلیون توکن خروجی تعیین شده است.
Gemini 2.5 Flash Image
مدل Gemini 2.5 Flash Image به کاربران و توسعهدهندگان اجازه میدهد تا کارهای زیر را انجام دهند:
این مدل اکنون از ۱۰ نسبت تصویر مختلف پشتیبانی میکند که انعطافپذیری بالایی را برای تولید محتوا در فرمتهای گوناگون فراهم میکند:
برخی شرکتها از هماکنون استفاده از این مدل را در محصولات خود آغاز کردهاند:
مطابق با گزارش منبع، توسعهدهندگان میتوانند از طریق دو پلتفرم اصلی گوگل به Gemini 2.5 Flash Image دسترسی داشته باشند:
قیمتگذاری این سرویس مطابق با قیمتگذاری استاندارد مدل Gemini 2.5 Flash تعیین شده است:
این مدل هماکنون به صورت پایدار و آماده برای استفاده در پروژههای واقعی، از طریق Gemini API در پلتفرمهای Google AI Studio و Vertex AI در دسترس است.
گوگل مدل هوش مصنوعی Gemini 2.5 Flash را ارتقاء داد: راهنمای تکالیف هوشمندتر و درک بهتر تصاویر
عرضه عمومی مدل هوش مصنوعی Gemini 2.5 Flash Image یک گام مهم از سوی گوگل برای توانمندسازی توسعهدهندگان و شرکتها در زمینه تولید محتوای بصری است. این مدل با ارائه قابلیتهای پیشرفتهای مانند ویرایش با زبان طبیعی و حفظ ثبات کاراکتر، همراه با یک مدل قیمتگذاری شفاف، ابزاری قدرتمند و در دسترس برای ساخت نسل بعدی اپلیکیشنهای خلاقانه و تجاری محسوب میشود. اکنون که این فناوری از فاز آزمایشی خارج شده، باید منتظر موج جدیدی از نوآوریها در اپلیکیشنهای مبتنی بر هوش مصنوعی تصویرساز باشیم.