پس از گذشت حدود 6 ماه از رونمایی رسمی، پلتفرم Vertex AI گوگل سرانجام میزبان دو مدل جدید هوش مصنوعی این شرکت یعنی Imagen 3 و Veo شده است. این دو مدل میتوانند بهتنهایی کار کنند، اما میتوان با هم نیز استفاده شوند. اولی میتواند یک تصویر براساس یک دستور متنی ایجاد کند، درحالیکه دومی یک تصویر و یک پیام متنی را میگیرد و آن را متحرک میکند.
وقتی صحبت از تسلط هوش مصنوعی مولد بهمیان میآید، شرکتها فعالانه بهدنبال این هستند که خودشان را تثبیت کنند یا با کاوش مداوم قابلیتهای جدید، پیشرو باشند. OpenAI بهطور گستردهای رشد کرده است و به ارائه ارتقاء و نوآوری در مدلهای خود ازطریق فناوری پیشرفته خود ادامه میدهد. بااینحال، این شرکت به کاربران خود وعده یک مدل هوشمند برای ایجاد ویدیو، Sora، را داده است که هنوز عرضه نشده است. از سوی دیگر، گوگل با راهاندازی Veo در پیشنمایش خصوصی، انقلابی در تولید محتوا ایجاد کرده است.
درحالیکه OpenAI اولین کسی بود که در ماه فوریه از مدل ویدئویی هوش مصنوعی مولد خود یعنی همان Sora رونمایی کرد و حتی توانایی خود را برای ایجاد ویدئوهای 60 ثانیهای ازطریق پیامهای متنی بهنمایش گذاشت، گوگل اکنون با عرضه رقیب آن، Veo، در یک پیشنمایش خصوصی، پیشتاز است.
گوگل مدل ویدئویی هوش مصنوعی خود را حدود سه ماه پس از آن که OpenAI مدل Sora را از متن به ویدئو نشان داد، بهنمایش گذاشت. در طول کنفرانس توسعهدهندگان I/O، گوگل ادعا کرد که Veo دارای قابلیتهای گستردهای است که میتواند به تولید ویدیوهای با کیفیت در بیش از یک دقیقه کمک کند و کاربران میتوانند از سبکهای بصری و سینمایی متنوعی استفاده کنند.
درحالیکه اطلاعات پراکندهای در مورد اینکه آیا مدتزمان تولید ویدیو آن چیزی است که قبلاً در ویدیوها نشان داده شده است، کلیپهای جدید ویدیوهای واقعی هوش مصنوعی قابلتوجهی را نشان میدهند. ویدیوها از کیفیت بالایی برخوردار هستند و تشخیص آن را از فیلم واقعی بسیار دشوار میکند مگر اینکه کاربران با دقت زیاد به آنها نگاه کنند.
مدل Imagen 3 گوگل نیز، یک تولیدکننده هوش مصنوعی متن به تصویر، بهزودی در دسترس مشتریان Google Cloud قرار خواهد گرفت و هفته آینده بهطور گسترده عرضه خواهد شد. ویژگیهای جدید برای کاربرانی که در لیست مجاز ذکر شدهاند نیز در دسترس خواهند بود و به آنها امکان سفارشیسازی، ویرایش سریع عکس یا حتی تغییر لوگوها یا عناصر برای تصاویر تولیدشده را میدهند.
گوگل همچنان تأکید میکند که مدلهای Veo و Imagen 3 هر دو دارای محافظهای داخلی هستند که به جلوگیری از تخلفات کمک میکند و همچنین هرگونه محتوای نامناسب را مسدود میکند. بااینحال، با آزمایش، مشخص شد که دور زدن آنها غیرممکن نیست. گفته میشود محتوای تولیدشده ازطریق مدلها دارای یک واترمارک دیجیتال نامرئی است که با کمک فناوری SynthID DeepMind تولید میشود و تشخیص میدهد آیا محتوا درواقع توسط هوش مصنوعی تولیدشده است یا خیر.
با عرضه Veo، مدل هوش مصنوعی ویدیویی توسط گوگل، فشار بر OpenAI برای ارائه مدل Sora خود که کاربران مدتها منتظر آن بودند و نزدیک به پایان سال 2024 وعده داده شده بود، وارد میشود.
نظر شما درباره مدلهای جدید هوش مصنوعی گوگل چیست؟
سرویس های جذابین به نظرم