شرکت OpenAI ماه گذشته از ابزار پیشگامانه تبدیل متن به ویدیو خود با نام Sora رونمایی کرد که میتواند ویدیوهای 1080p با ظاهر واقعی تولید کند. درحالحاضر، این ابزار فقط برای تعداد معدودی از فیلمسازان و سازندگانی در دسترس است که درحال آزمایش آن هستند تا آسیبپذیریها را بیابند و آنها را برطرف کنند و پیش از عرضه عمومی این مدل، از ایمن بودن آن اطمینان حاصل کنند. حال در مصاحبهای با وال استریت ژورنال، میرا موراتی، مدیر ارشد فناوری OpenAI، اعلام کرد که این شرکت قصد دارد Sora را قبل از سال 2025 برای عموم عرضه کند.
Sora محتوایی را بهصورت فوق واقعگرایانه تولید میکند (بهجز برخی نمایشهای عجیب دستها و انگشتان) و مدیر ارشد فناوری OpenAI میگوید که آنها این ابزار را پیش از آنکه اطمینان حاصل کنند که استفاده از آن کاملاً ایمن است، بهطور عمومی برای مردم عرضه نخواهند کرد. قابلذکر است، ویدیوهای تولیدشده توسط Sora نیز مانند بسیاری دیگر از ابزارهای تولید متن به تصویر، واترمارک خواهند شد.
وقتی از موراتی پرسیده شد که چگونه این ابزار ممکن است بر شغل سازندگان در آینده تأثیر بگذارد، وی بیان داشت که هدف آنها این است که بهجای جایگزین کردن آنها، به این مدل بهعنوان ابزاری برای کمک به سازندگان در کارشان کمک کنند:
«میدانید، روشی که من میبینم این است که این ابزاری برای گسترش خلاقیت است و ما میخواهیم افراد در صنعت فیلم و سازندگان محتوا در همه صنایع، بخشی از اطلاعرسانی در مورد چگونگی توسعه بیشتر آن و همچنین نحوه استقرار آن باشند. همچنین، استفاده از این مدل زمانی که مردم دادهها و مواردی از این قبیل را ارائه میکنند، جنبههای اقتصادی دارد.»
در مورد دادهها، وقتی از او پرسیده شد که آنها از چه دادههایی برای آموزش Sora استفاده کردهاند، او خیلی فراتر نرفت و تنها بیان داشت که «دادههایی در دسترس عموم و دارای مجوز هستند.» این میتواند ویدیوهایی از یوتیوب، فیسبوک، اینستاگرام و پلتفرمهای مشابه باشد.
قابلذکر است که Sora صدا را در کلیپهای تولیدشده ارائه نمیکند و OpenAI طبق گزارشها برنامههایی برای یکپارچهسازی صدا در آینده دارد. اگرچه ممکن است پلتفرم مبتنیبر صدای این شرکت، Sora نبوده، بلکه نسخهای بهتر از آن با نامی متفاوت باشد. درست مانند DALL-E، برای اینکه بتوانید از این مدل استفاده کنید باید هزینه بپردازید.
نظر شما درباره زمان عرضه OpenAI Sora چیست؟