گوگل امروز درجریان رویداد Google I/O 2024، مدلهای جدید ایجاد تصویر و ویدیو براساس هوش مصنوعی خود را معرفی کرد: Veo که میتواند ویدیوهای 1080p با کیفیت بالا تولید کند و Imagen 3 بهعنوان جدیدترین مدل تبدیل متن به تصویر. اگرچه هیچکدام از این مدلها انقلابی بهنظر نمیرسند، اما راهی برای گوگل بهمنظور ادامه رقابت با مدلهای OpenAI Sora و Dall-E 3 هستند.
گوگل ادعا میکند که Veo درکی پیشرفته از زبان طبیعی و معنای بصری دارد تا هر ویدیویی را که در ذهن دارید، ایجاد کند. ویدئوهای تولیدشده توسط این مدل هوش مصنوعی میتوانند بیش از یک دقیقه باشند. Veo همچنین قادر به درک تکنیکهای سینمایی و بصری مانند مفهوم تایملپس است.
برای اثبات اینکه Veo بهدنبال سرقت شغل هنرمندان نیست، گوگل همچنین با Donald Glover همکاری کرده است تا تواناییهای مدل را به رخ بکشد. در یک ویدیوی تبلیغاتی بسیار کوتاه، این هنرمند را میبینیم که از متنی برای ساختن ویدیویی از ورود یک قایق بادبانی به یک خانه اروپایی و یک قایق بادبانی در اقیانوس استفاده میکند. بهگفته گوگل، Veo میتواند فیزیک دنیای واقعی را بهتر از مدلهای قبلی خود شبیهسازی کند و همچنین نحوه ارائه تصاویر با کیفیت بالا را بهبود بخشیده است.
Glover در این ویدیو میگوید: «همه قرار است کارگردان شوند و همه باید کارگردان شوند.»
باید دید که آیا کسی واقعاً مایل به تماشای ویدیوی تولیدشده توسط هوش مصنوعی است، خارج از کنجکاوی بیمارگونهای که تلاش ماشینی برای بازسازی الگوریتمی آثار هنرمندان انسانی را انجام میدهد. اما این باعث نمیشود که گوگل یا OpenAI این ابزارها را تبلیغ نکنند و امیدوار باشند که مفید باشند. Veo امروز در داخل ابزار VideoFX گوگل برای برخی از سازندگان در دسترس خواهد بود و این شرکت میگوید که این مدل بهزودی به YouTube Shorts و سایر محصولات این شرکت نیز میآید. اگر Veo درنهایت به بخشی داخلی از YouTube Shorts تبدیل شود، این حداقل یکی از ویژگیهایی است که گوگل میتواند بر TikTok غلبه کند.
در مورد Imagen 3، گوگل میگوید که این مدل با کیفیتترین مدل تبدیل متن به تصویر این شرکت است، با سطح جزئیات باورنکردنی برای خلق تصاویر واقعی و مصنوعات کمتر. البته آزمون واقعی این خواهد بود که ببینیم این مدل چگونه درخواستها را در مقایسه با Dall-E 3 مدیریت میکند. گوگل میگوید Imagen 3 بهتر از قبل متن را مدیریت میکند و همچنین در مورد رسیدگی به جزئیات درخواستهای طولانی، هوشمندتر است.
گوگل همچنین با هنرمندانی مانند Wyclef Jean و Bjorn همکاری میکند تا Music AI Sandbox خود را آزمایش کند، مجموعهای از ابزارهایی که میتوانند در خلق آهنگ کمک کنند.
گوگل میلیاردها دلار سرمایهگذاری میکند تا رؤیای هوش مصنوعی خود را به واقعیت تبدیل کند. درنهایت نظر شما درباره مدلهای گوگل Veo و Imagen 3 چیست؟