اگر اشتراک جمینای پرو گوگل را داشته باشید، به یکی از بهترین ابزارهای هوش مصنوعی یعنی Veo 3 دسترسی دارید؛ یک مولد متن به ویدیوی تحسینبرانگیز که میتواند هر توصیفی را به یک ویدیوی کوتاه هایپررئالیستی تبدیل کند. اما دنیای هوش مصنوعی با سرعتی سرسامآور حرکت میکند و هفته گذشته، OpenAI از مدل رقیب خود یعنی Sora 2 رونمایی کرد. با توجه به اینکه مدل جدید OpenAI دیگر یک پروژه آزمایشی نیست و در اختیار کاربران قرار گرفته، تصمیم گرفتیم مقایسه مدل هوش مصنوعی Sora 2 با Veo 3 گوگل را با شما به اشتراک بگذاریم تا مشخص شود کدام یک در حال حاضر برتری دارد.
🔹نبرد تناتنگ: این مقاله یک مقایسه مدل هوش مصنوعی Sora 2 با Veo 3 گوگل را بر اساس آزمونهای عملی با دستورات (پرامپتهای) یکسان انجام میدهد.
🔹نقاط قوت Sora 2: مدل جدید OpenAI در زمینه واقعگرایی فیزیک و جزئیات دقیق صحنه (مانند حیوانات و محیطهای شهری) عملکردی فوقالعاده و گاهی «نگرانکننده» از خود نشان میدهد.
🔹نقاط قوت Veo 3: مدل گوگل در مدیریت صحنههای پیچیده حرکتی (مانند موتورسواری) و به خصوص در بازآفرینی شخصیتهای دارای کپیرایت (مانند مندلورین) برتری قاطعی دارد.
🔹نتایج ترکیبی: هیچکدام از مدلها برنده مطلق نیستند و هر کدام در سناریوهای متفاوتی بر دیگری برتری دارند. Sora 2 در برخی آزمونها به طرز شگفتانگیزی شکست میخورد.
🔹هزینه و دسترسی: در حال حاضر، Veo 3 از طریق اشتراک پولی Gemini Pro (۲۰ دلار در ماه) در دسترس است، در حالی که Sora 2 رایگان اما فقط با دعوتنامه قابل استفاده است.
من چندین دستور متفاوت را برای هر دو مدل (و همچنین نسل اول Sora برای مقایسه) اجرا کردم تا نقاط قوت و ضعف هرکدام را بسنجم.
دستور: «یک شات فوتورئالیستی از اسپرسو که در حال ریختن درون یک فنجان سفید با حرکت آهسته است.»
🔵 Sora (نسل اول): نتیجه در نگاه اول قابل قبول بود اما مایع غلظتی شبیه به ژله داشت و با فیزیکی غیرطبیعی در فنجان میپاشید.
🔵 Veo 3: نتیجه بسیار حرفهای و سینمایی بود. مایع با گرانروی (Viscosity) باورپذیر جریان داشت. تنها ایراد جزئی، ریختن قهوه تنها از یک سمت پرتافیلتر بود.
🔵 Sora 2: بهترین نتیجه را تولید کرد. فیزیک کاملاً واقعگرایانه و بدون ایرادات جزئی Veo 3 بود.
(برنده: Sora 2)
دستور: «یک سگ گلدن ریتریور در یک پارک شلوغ.»
🔵 Sora (نسل اول): نتیجه قابل قبولی داشت و انرژی سگ را خوب به تصویر کشیده بود.
🔵 Veo 3: کمی بهتر بود، اما افراد حاضر در پسزمینه به وضوح مصنوعی و دارای آرتیفکتهای هوش مصنوعی بودند.
🔵 Sora 2: نتیجه به طرز نگرانکنندهای واقعی بود. سگ با دقتی بینظیر رندر شده بود و کل صحنه، از جمله افراد، کاملاً باورپذیر بودند.
(برنده: Sora 2)
دستور: «یک موتورسوار در حال حرکت در امتداد ساحل هنگام غروب آفتاب.»
🔵 Sora (نسل اول): نتیجهای نزدیک به کارتون تحویل داد که در آن موتورسیکلتها به شکلی غیرممکن حرکت میکردند.
🔵 Sora 2: در کمال تعجب، این مدل نیز دقیقاً همان اشتباهات نسل قبلی خود را تکرار کرد و در این آزمون شکست خورد.
🔵 Veo 3: نتیجهای کاملاً سینمایی ارائه داد. حرکت موتور روی شن، رد لاستیک و گرد و غبار کاملاً طبیعی بود. نورپردازی و سایههای بلند نیز شگفتانگیز بودند.
(برنده: Veo 3)
دستور: «مندلورین در بانکوک.»
🔵 Sora (نسل اول): یک شخصیت عمومی با زره براق کرومی تولید کرد که تنها شباهت دوری به مندلورین داشت. در واقع از نقض کپیرایت فرار کرد اما دستور را هم دقیق اجرا نکرد.
🔵 Veo 3: نتیجه حیرتانگیز بود. شخصیت تولید شده یک کپی بینقص از کاراکتر اصلی بود، از جلای خاص زره تا سیلوئت نمادین کلاهخود. بیشتر شبیه یک صحنه حذف شده از سریال بود تا یک ویدیوی ساخته شده با هوش مصنوعی.
🔵 Sora 2: این مدل از اجرای دستور به دلیل وجود شخصیت دارای کپیرایت خودداری کرد.
(برنده قاطع: Veo 3)
هر دو مدل Veo 3 و Sora 2 یک جهش عظیم نسبت به نسلهای قبلی هستند و میتوانند ابزارهای فوقالعادهای برای تولید محتوا باشند. اما دسترسی به آنها متفاوت است:
با توجه به اینکه Sora 2 هنوز به صورت عمومی در دسترس نیست، در حال حاضر Veo 3 یکی از بهترین و در دسترسترین گزینهها برای کاربرانی است که مایل به پرداخت هزینه برای تجربه نسل جدید تولید ویدیو با هوش مصنوعی هستند.
رقابت در عرصه تولید ویدیو با هوش مصنوعی به سطح جدیدی رسیده است. هم Sora 2 و هم Veo 3 ابزارهای فوقالعادهای هستند که یک جهش عظیم نسبت به نسلهای قبلی خود محسوب میشوند و میتوانند ویدیوهای کاملی را تنها با یک جمله تولید کنند.
در این مقایسه، برنده مطلقی وجود ندارد؛ Sora 2 در واقعگرایی و فیزیک بینظیر است، در حالی که Veo 3 درک سینمایی بهتر، ثبات در حرکات پیچیده و جسارت بیشتری در اجرای دستورات دارد. در حال حاضر، انتخاب بین این دو بیشتر به دسترسی و نیاز خاص شما بستگی دارد. Veo 3 بهترین گزینه در دسترس برای کاربران پولی است، اما پتانسیل Sora 2 انکارناپذیر است. برنده واقعی این رقابت تنگاتنگ، مصرفکنندگانی هستند که شاهد نوآوریهای سریعتر و ابزارهای قدرتمندتری در آینده نزدیک خواهند بود.
اپلیکیشن هوش مصنوعی Sora صدرنشین اپ استور شد: شبکه اجتماعی جدیدی که در آن هیچچیز واقعی نیست
نظر شما چیست؟ کدامیک از این مدلهای هوش مصنوعی عملکرد بهتری داشتند؟