گوگل مدل‌های هوش مصنوعی Imagen 3 و Veo خود را عرضه کرد

پس از گذشت حدود 6 ماه از رونمایی رسمی، پلتفرم Vertex AI گوگل سرانجام میزبان دو مدل جدید هوش مصنوعی این شرکت یعنی Imagen 3 و Veo شده است. این دو مدل می‌توانند به‌تنهایی کار کنند، اما می‌توان با هم نیز استفاده شوند. اولی می‌تواند یک تصویر براساس یک دستور متنی ایجاد کند، درحالی‌که دومی یک تصویر و یک پیام متنی را می‌گیرد و آن را متحرک می‌کند.

مدل‌های هوش مصنوعی Imagen 3 و Veo گوگل

وقتی صحبت از تسلط هوش مصنوعی مولد به‌میان می‌آید، شرکت‌ها فعالانه به‌دنبال این هستند که خودشان را تثبیت کنند یا با کاوش مداوم قابلیت‌های جدید، پیشرو باشند. OpenAI به‌طور گسترده‌ای رشد کرده است و به ارائه ارتقاء و نوآوری در مدل‌های خود ازطریق فناوری پیشرفته خود ادامه می‌دهد. بااین‌حال، این شرکت به کاربران خود وعده یک مدل هوشمند برای ایجاد ویدیو، Sora، را داده است که هنوز عرضه نشده است. از سوی دیگر، گوگل با راه‌اندازی Veo در پیش‌نمایش خصوصی، انقلابی در تولید محتوا ایجاد کرده است.

مدل‌های هوش مصنوعی Imagen 3 و Veo گوگل

درحالی‌که OpenAI اولین کسی بود که در ماه فوریه از مدل ویدئویی هوش مصنوعی مولد خود یعنی همان Sora رونمایی کرد و حتی توانایی خود را برای ایجاد ویدئوهای 60 ثانیه‌ای ازطریق پیام‌های متنی به‌نمایش گذاشت، گوگل اکنون با عرضه رقیب آن، Veo، در یک پیش‌نمایش خصوصی، پیشتاز است.

گوگل مدل ویدئویی هوش مصنوعی خود را حدود سه ماه پس از آن که OpenAI مدل Sora را از متن به ویدئو نشان داد، به‌نمایش گذاشت. در طول کنفرانس توسعه‌دهندگان I/O، گوگل ادعا کرد که Veo دارای قابلیت‌های گسترده‌ای است که می‌تواند به تولید ویدیوهای با کیفیت در بیش از یک دقیقه کمک کند و کاربران می‌توانند از سبک‌های بصری و سینمایی متنوعی استفاده کنند.

درحالی‌که اطلاعات پراکنده‌ای در مورد اینکه آیا مدت‌زمان تولید ویدیو آن چیزی است که قبلاً در ویدیوها نشان داده شده است، کلیپ‌های جدید ویدیوهای واقعی هوش مصنوعی قابل‌توجهی را نشان می‌دهند. ویدیوها از کیفیت بالایی برخوردار هستند و تشخیص آن را از فیلم واقعی بسیار دشوار می‌کند مگر اینکه کاربران با دقت زیاد به آن‌ها نگاه کنند.

مدل Imagen 3 گوگل نیز، یک تولیدکننده هوش مصنوعی متن به تصویر، به‌زودی در دسترس مشتریان Google Cloud قرار خواهد گرفت و هفته آینده به‌طور گسترده عرضه خواهد شد. ویژگی‌های جدید برای کاربرانی که در لیست مجاز ذکر شده‌اند نیز در دسترس خواهند بود و به آن‌ها امکان سفارشی‌سازی، ویرایش سریع عکس یا حتی تغییر لوگوها یا عناصر برای تصاویر تولیدشده را می‌دهند.

گوگل همچنان تأکید می‌کند که مدل‌های Veo و Imagen 3 هر دو دارای محافظ‌های داخلی هستند که به جلوگیری از تخلفات کمک می‌کند و همچنین هرگونه محتوای نامناسب را مسدود می‌کند. بااین‌حال، با آزمایش، مشخص شد که دور زدن آن‌ها غیرممکن نیست. گفته می‌شود محتوای تولیدشده ازطریق مدل‌ها دارای یک واترمارک دیجیتال نامرئی است که با کمک فناوری SynthID DeepMind تولید می‌شود و تشخیص می‌دهد آیا محتوا درواقع توسط هوش مصنوعی تولیدشده است یا خیر.

با عرضه Veo، مدل هوش مصنوعی ویدیویی توسط گوگل، فشار بر OpenAI برای ارائه مدل Sora خود که کاربران مدت‌ها منتظر آن بودند و نزدیک به پایان سال 2024 وعده داده شده بود، وارد می‌شود.

نظر شما درباره مدل‌های جدید هوش مصنوعی گوگل چیست؟