محققان اپل بهتازگی مدل جدیدی از هوش مصنوعی منبع باز خود با نام MGIE را منتشر کردهاند که میتواند بر اساس دستورالعملهای زبان طبیعی کاربر به تولید تصویر بپردازد.
این برنامه که “MGIE” نامیده میشود، مخفف MLLM-Guided Image Editing است و از مدلهای زبان بزرگ چندوجهی (MLLMs) برای تفسیر درخواستهای کاربر و انجام ویرایش تصویر در سطح پیکسل استفاده میکند.
این مدل قابلیت ویرایش جنبههای مختلف تصاویر را دارد. بهبودهای ایجادشده در تصاویر میتواند شامل روشنایی، کنتراست یا وضوح یا استفاده از جلوههای هنری مانند طراحی باشد. ویرایش محلی میتواند شکل، اندازه، رنگ یا بافت مناطق یا اشیاء خاص را در یک تصویر تغییر دهد، درحالیکه تغییرات به سبک فتوشاپ میتواند شامل برش، تغییر اندازه، چرخش و افزودن فیلترها یا حتی تغییر پسزمینه و ترکیب تصاویر باشد.
ورودی کاربر برای عکس یک پیتزا میتواند «سالمتر جلوه دادن آن» باشد. با استفاده از استدلال عقل سلیم، این مدل میتواند رویههای سبزیجات مانند گوجهفرنگی و سبزی را به این پیتزا اضافه کند. یک درخواست ورودی اصلاح ممکن است به شکل «افزودن کنتراست برای شبیهسازی نور بیشتر» باشد، درحالیکه یک اصلاح به سبک فتوشاپ میتواند با درخواست از مدل برای حذف افراد از پسزمینه عکس یا تغییر فوکوس تصویر از حالت چهره سوژه به سمت عکس انجام شود.
اپل با محققان دانشگاه کالیفرنیا همکاری کرده است تا MGIE را ایجاد کند که در مقالهای در کنفرانس بینالمللی نمایشهای یادگیری (ICLR) 2024 ارائه شد. این مدل در GitHub در دسترس است و شامل کد، دادهها و مدلهای از پیش آموزش دیده میشود.
این دومین پیشرفت اپل در تحقیقات هوش مصنوعی در چند ماه اخیر است. در اواخر دسامبر، اپل فاش کرد که با ابداع یک تکنیک ابداعی استفاده از حافظه فلش، پیشرفتهایی در استقرار مدلهای زبان بزرگ (LLM) روی آیفونها و سایر دستگاههای اپل با حافظه محدود داشته است.
در چند ماه گذشته، اپل درحال آزمایش یک مدل هوش مصنوعی اختصاصی بوده است که میتواند با ChatGPT رقابت کند. بهگفته مارک گورمن از بلومبرگ، کار روی هوش مصنوعی برای اپل در اولویت قرار دارد و این شرکت درحال طراحی چارچوب «Ajax» برای مدلهای زبان بزرگ است.
جف پو، تحلیلگر The Information، ادعا میکنند که اپل در اواخر سال 2024، یعنی زمانی که iOS 18 ارائه میشود، نوعی ویژگی هوش مصنوعی مولد را در آیفون و آیپد در دسترس قرار خواهد داد. طبق گفته مارک گورمن، iOS 18 شامل نسخه بهبودیافته از سیری با عملکرد هوش مصنوعی مولد ChatGPT است و این پتانسیل را دارد که «بزرگترین» بهروزرسانی نرمافزاری در تاریخ آیفون باشد.
نظر شما درباره ابراز تولید تصویر بر اساس هوش مصنوعی اپل چیست؟