شرکت OpenAI امروز بهطور رسمی مدل تولید ویدیوی مبتنیبر هوش مصنوعی خود، Sora، را منتشر کرد و آن را ازطریق اشتراکهای پولی ChatGPT در دسترس عموم قرار داد. Sora که ابتدا در فوریه 2024 بهعنوان پیشنمایش تحقیقاتی معرفی شد، اکنون به یک محصول کاملاً توسعهیافته تبدیل شده است.
OpenAI از نسخه ارتقایافته این مدل به نام Sora Turbo رونمایی کرده که سریعتر و کارآمدتر از پیشنمایش فوریه است. این انتشار همزمان با کمپین «12 Days of OpenAI» است که شامل اعلامیههای روزانه محصولات، ازجمله معرفی ChatGPT Pro با حالت o1 Pro میباشد.
سورا چگونه کار میکند؟
Sora مشابه ابزار تولید تصویر DALL-E، با ایجاد ویدئو از توضیحات متنی کار میکند. این مدل همچنین از ویژگیهای پیشرفته مانند تولید ویدیو از تصاویر ثابت، گسترش کلیپهای موجود و پر کردن فریمهای ازدسترفته نیز پشتیبانی میکند.
OpenAI ابزارهای جدیدی را برای ساده کردن قابلیت استفاده Sora معرفی کرده است، ازجمله ابزار داستانی که به کاربران کمک میکند ورودیهای خاصی را برای هر فریم تعریف کنند. این پلتفرم دارای یک فید انجمن بهروزرسانی شده است که خلاقیتهای کاربر را ازطریق بخشهای ویژه و اخیر بهنمایش میگذارد.
محدودیتها و پادمان ها
علیرغم پیشرفتهای صورتگرفته، OpenAI محدودیتهای Sora مانند دشواری در انجام اقدامات پیچیده و حفظ فیزیک واقعگرایانه در مدت زمان طولانی را اعلام کرده است. بااینحال، این شرکت بهطور فعال درتلاش است تا این فناوری را مقرونبهصرفهتر کند و درعینحال قابلیتهای آن را افزایش دهد.
برای اطمینان از شفافیت و استفاده مسئولانه، همه ویدیوهای تولیدشده توسط Sora شامل ابردادههای C2PA هستند که به تأیید منشأ آنها کمک میکند. واترمارکهای پیشفرض نیز در ویدیوها اعمال میشوند و یک ابزار جستجوی داخلی، محتوای تولیدشده توسط Sora را با استفاده از ویژگیهای فنی شناسایی میکند.
OpenAI برای جلوگیری از استفادههای غیراخلاقی، مانند مسدود کردن مطالب سوء استفاده جنسی از کودکان و محدود کردن دیپفیکهای جنسی، تدابیری را درنظر گرفته است. آپلودهای حاوی افراد واقعی درحالحاضر محدود هستند و برنامههایی برای گسترش این ویژگی پس از اصلاح سیستمهای پیشگیری از دیپفیک وجود دارد.
ویژگیهای کلیدی Sora
1080p Resolution: ویدیوها را با کیفیت 1080p، حداکثر تا 20 ثانیه، با نسبتهای مختلف ایجاد کنید.
Remix: عناصر ویدئویی را با جایگزینی، حذف یا تصور مجدد آنها تغییر دهید.
Re-cut: فریمهای خاص را برای کامل کردن صحنهها جدا کرده و گسترش دهید.
Storyboard: فیلمها را با استفاده از یک جدول زمانی شخصی سازماندهی و ویرایش کنید.
Loop: برش و ایجاد ویدیوهای loop.
Blend: دو ویدیو را در یک کلیپ منسجم ادغام کنید.
Style Presets: سبکهای ویدیویی خلاقانه را اعمال و بهاشتراک بگذارید.
در دسترس بودن
Sora اکنون ازطریق Sora.com برای مشترکین ChatGPT Plus و ChatGPT Pro در دسترس است:
برای کاربران ChatGPT Plus:
حداکثر 50 ویدیو (1000 credits)
حداکثر وضوح 720p و مدت زمان 5 ثانیه
برای کاربران ChatGPT Pro:
حداکثر 500 ویدیو (10000 credits)
تولید ویدیوی نامحدود
حداکثر وضوح 1080p و مدت زمان 20 ثانیه
دانلودهای بدون واترمارک
OpenAI همچنین قصد دارد در اوایل سال آینده گزینههای قیمتگذاری سفارشی را برای دستههای مختلف کاربران معرفی کند.
با اعلام انتشار رسمی این مدل، OpenAI بیان میکند:
«ما امیدواریم که این نسخه اولیه از Sora الهامبخش مردم در سراسر جهان باشد تا فرصتهای خلاقانه جدیدی را کشف کنند، داستانهای خود را به اشتراک بگذارند و محدودیتهای داستانگویی ویدیویی را بازتعریف کنند. ما از دیدن محتوای باورنکردنی که جهان با Sora ایجاد خواهد کرد، هیجانزده هستیم.»
نظر شما درباره مدل Sora برای تولید ویدیو ازطریق هوش مصنوعی چیست؟