حساب کاربری ندارید؟ ثبت نام کنید

گوگل Veo و Imagen 3 معرفی شدند: مدل‌های جدید هوش مصنوعی برای ایجاد تصویر و ویدیو

نوشته

6 ماه قبل | بدون دیدگاه | گوگل، هوش مصنوعی

گوگل امروز درجریان رویداد Google I/O 2024، مدل‌های جدید ایجاد تصویر و ویدیو براساس هوش مصنوعی خود را معرفی کرد: Veo که می‌تواند ویدیوهای 1080p با کیفیت بالا تولید کند و Imagen 3 به‌عنوان جدیدترین مدل تبدیل متن به تصویر. اگرچه هیچ‌کدام از این مدل‌ها انقلابی به‌نظر نمی‌رسند، اما راهی برای گوگل به‌منظور ادامه رقابت با مدل‌های OpenAI Sora و Dall-E 3 هستند.

گوگل Veo

گوگل ادعا می‌کند که Veo درکی پیشرفته از زبان طبیعی و معنای بصری دارد تا هر ویدیویی را که در ذهن دارید، ایجاد کند. ویدئوهای تولیدشده توسط این مدل هوش مصنوعی می‌توانند بیش از یک دقیقه باشند. Veo همچنین قادر به درک تکنیک‌های سینمایی و بصری مانند مفهوم تایم‌لپس است.

برای اثبات اینکه Veo به‌دنبال سرقت شغل هنرمندان نیست، گوگل همچنین با Donald Glover همکاری کرده است تا توانایی‌های مدل را به رخ بکشد. در یک ویدیوی تبلیغاتی بسیار کوتاه، این هنرمند را می‌بینیم که از متنی برای ساختن ویدیویی از ورود یک قایق بادبانی به یک خانه اروپایی و یک قایق بادبانی در اقیانوس استفاده می‌کند. به‌گفته گوگل، Veo می‌تواند فیزیک دنیای واقعی را بهتر از مدل‌های قبلی خود شبیه‌سازی کند و همچنین نحوه ارائه تصاویر با کیفیت بالا را بهبود بخشیده است.

گوگل Veo

گوگل Veo

Glover در این ویدیو می‌گوید: «همه قرار است کارگردان شوند و همه باید کارگردان شوند.»

باید دید که آیا کسی واقعاً مایل به تماشای ویدیوی تولیدشده توسط هوش مصنوعی است، خارج از کنجکاوی بیمارگونه‌ای که تلاش ماشینی برای بازسازی الگوریتمی آثار هنرمندان انسانی را انجام می‌دهد. اما این باعث نمی‌شود که گوگل یا OpenAI این ابزارها را تبلیغ نکنند و امیدوار باشند که مفید باشند. Veo امروز در داخل ابزار VideoFX گوگل برای برخی از سازندگان در دسترس خواهد بود و این شرکت می‌گوید که این مدل به‌زودی به YouTube Shorts و سایر محصولات این شرکت نیز می‌آید. اگر Veo درنهایت به بخشی داخلی از YouTube Shorts تبدیل شود، این حداقل یکی از ویژگی‌هایی است که گوگل می‌تواند بر TikTok غلبه کند.

Imagen 3

در مورد Imagen 3، گوگل می‌گوید که این مدل با کیفیت‌ترین مدل تبدیل متن به تصویر این شرکت است، با سطح جزئیات باورنکردنی برای خلق تصاویر واقعی و مصنوعات کمتر. البته آزمون واقعی این خواهد بود که ببینیم این مدل چگونه درخواست‌ها را در مقایسه با Dall-E 3 مدیریت می‌کند. گوگل می‌گوید Imagen 3 بهتر از قبل متن را مدیریت می‌کند و همچنین در مورد رسیدگی به جزئیات درخواست‌های طولانی، هوشمندتر است.

Imagen 3

Imagen 3

گوگل همچنین با هنرمندانی مانند Wyclef Jean و Bjorn همکاری می‌کند تا Music AI Sandbox خود را آزمایش کند، مجموعه‌ای از ابزارهایی که می‌توانند در خلق آهنگ کمک کنند.

گوگل میلیاردها دلار سرمایه‌گذاری می‌کند تا رؤیای هوش مصنوعی خود را به واقعیت تبدیل کند. درنهایت نظر شما درباره مدل‌های گوگل Veo و Imagen 3 چیست؟

اشتراک در
اطلاع از
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
رپورتاژ آگهی پربازده
رپورتاژ آگهی پربازده
امیرحسین ملکی