شرکت OpenAI این هفته از نسخه جدید مدل تولید تصویر خود با نام ChatGPT Images 2.0 پرده برداشت. این نسخه بهروزشده که بهگفته OpenAI عصر جدیدی در تولید تصویر را رقم میزند، قادر است وظایف بصری پیچیده را با دقت و جزئیات بسیار بالاتری نسبتبه نسل قبل انجام دهد. مهمترین نوآوری این مدل، افزودن قابلیت تفکر به فرایند تولید تصویر است که نتیجه نهایی را طبیعیتر و کمتر شبیه به خروجیهای هوش مصنوعی میکند.
🔹هوش مصنوعی ChatGPT Images 2.0 نخستین مدل تصویرسازی OpenAI با قابلیت تفکر است که حس ترکیببندی و سلیقه بصری بهبودیافتهای دارد و تصاویر طبیعیتری تولید میکند.
🔹این مدل میتواند از یک دستور واحد تا ۸ تصویر تولید کند، در رزولوشن 2K خروجی دهد و برای اطلاعات بهروز، وب را جستجو کند.
🔹درک چندزبانه بهبودیافته و رندر متون غیرالتین مانند ژاپنی، کرهای، چینی، هندی و بنگالی با دقت بالاتری انجام میشود.
🔹این سرویس هماکنون برای تمامی کاربران ChatGPT، Codex و API در دسترس است.
هوش مصنوعی ChatGPT Images 2.0 نخستین مدل تصویرسازی OpenAI است که به قابلیت تفکر مجهز شده است. این ویژگی به مدل اجازه میدهد پیش از تولید تصویر نهایی، دستورات پیچیده را تحلیل کرده و روابط میان اشیاء را بهدرستی درک کند. نتیجه این تحلیل، تصاویری با حس ترکیببندی و سلیقه بصری بهبودیافته است که بهگفته OpenAI، کمتر حس تولیدشده توسط هوش مصنوعی را القا میکنند.
این مدل میتواند دستورالعملهای دقیق و جزئی را دنبال کند، اشیاء را بهدرستی در صحنه جایگذاری و به هم مرتبط سازد، جزئیات ظریف را حفظ کند و طرحهای متراکم و پیچیده را با دقت بالایی رندر نماید.
مدل ChatGPT Images 2.0 با مجموعهای از ویژگیهای فنی پیشرفته عرضه میشود که آن را به ابزاری قدرتمند برای طراحان، تولیدکنندگان محتوا و توسعهدهندگان تبدیل میکند. مشخصات و قابلیتهای کلیدی این مدل بهشرح زیر است:
بهبود رندر متون غیرالتین یکی از مهمترین پیشرفتهای این نسخه محسوب میشود، زیرا مدلهای پیشین معمولاً در نمایش صحیح این زبانها با مشکل مواجه بودند. ChatGPT Images 2.0 هماکنون برای تمامی کاربران ChatGPT، Codex و API در دسترس قرار دارد و میتوان از آن در پروژههای مختلف استفاده کرد.
بهنظر شما آیا قابلیت تفکر در مدلهای تصویرسازی میتواند مرز میان تصاویر تولیدشده توسط هوش مصنوعی و آثار انسانی را محو کند؟