هوش مصنوعی مولد گوگل Gemini Omni برای «خلق هر چیز» معرفی شد

گوگل یک خانواده بزرگ جدید از مدل‌های هوش مصنوعی مولد را معرفی کرده که آن را Gemini Omni می‌نامد. نخستین مدل اومنی، یعنی Omni Flash، می‌تواند ویدئوهای هوش مصنوعی را با استفاده از مجموعه‌ای متنوع از ورودی‌ها از جمله متن، عکس‌، ویدئو و صدا تولید کند. اما در آینده، گوگل اومنی را به‌عنوان چیزی تصور می‌کند که می‌تواند «هر چیزی را از هر ورودی خلق کند». به‌همین‌دلیل نام Omni (به‌معنای «همه») انتخاب شده است. این مدل از امروز در اپلیکیشن Gemini، گوگل Flow و یوتوب شرتس در دسترس خواهد بود.

خلاصه در یک نگاه

🔹هوش مصنوعی مولد Gemini Omni Flash می‌تواند ویدئوهای تا ۱۰ ثانیه با صدا و تصویر تولید کند و برخلاف Veo (مدل متن-به-ویدئوی گوگل)، می‌تواند از یک ویدئو به‌عنوان پایه برای ساخت ویدئوی دیگر استفاده کند.
🔹این مدل به‌لطف داده‌های آموزشی جمینای از «دانش جهانی بسیار بیش‌تری» نسبت‌به Veo برخوردار است، و می‌تواند کارکتری شبیه شما را در ویدئوها قرار دهد – قابلیتی که کاربران پیش‌تر با Nano Banana برای تصاویر انجام می‌دادند.
🔹گوگل درحال کار روی افزایش طول ویدئوهای قابل تولید است و Omni Flash را به‌عنوان «نسخه ویدئویی Nano Banana» معرفی می‌کند که تاکنون بیش از ۵۰ میلیارد تصویر با آن تولید شده است.
🔹این مدل از امروز از طریق اپلیکیشن Gemini، Google Flow (پلتفرم جدید گوگل برای دسترسی به Gen AI) و YouTube Shorts در دسترس است.

هوش مصنوعی مولد گوگل Gemini Omni

تفاوت با Veo و دانش جهانی گسترده‌تر

گوگل از قبل یک مدل تولید ویدئو به نام Veo دارد، اما آن یک مدل متن-به-ویدئو است – درحالی‌که Omni Flash می‌تواند از یک ویدئو به‌عنوان پایه برای کمک به ساخت ویدئوی دیگر استفاده کند.

دومیترو ارهان (Dumitru Erhan)، مدیر ارشد تحقیقات در Google DeepMind، می‌گوید با Gemini Omni Flash می‌توانید کلیپ‌هایی با ویدئو و صدا تا ۱۰ ثانیه تولید کنید و این شرکت درحال کار روی طولانی‌تر کردن آن است.

کورای کاووکچوغلو (Koray Kavukcuoglu)، مدیر گوگل DeepMind و معمار ارشد هوش مصنوعی گوگل، می‌گوید Omni Flash همچنین «دانش جهانی بسیار بیش‌تری» نسبت‌به Veo دارد، به‌دلیل داده‌های آموزشی جمینای.

🔴 همچنین بخوانید: مدل هوش مصنوعی Gemini 3.5 Flash گوگل معرفی شد

کاربردها و چشم‌انداز آینده

این شرکت Omni Flash را به‌عنوان نسخه ویدئویی چیزی مانند مدل تولید تصویر Nano Banana خود معرفی می‌کند که مردم از زمان معرفی آن در سال گذشته، بیش از ۵۰ میلیارد تصویر با آن تولید کرده‌اند.

برای مثال، می‌توانید از Omni Flash بخواهید کارکتر شبیه شما را در ویدئوها قرار دهد. نیکول بریچتووا (Nicole Brichtova)، که تیم محصول کارکننده روی Omni را رهبری می‌کند، می‌گوید گوگل افراد زیادی را دیده که کارکتر شبیه خود را با Nano Banana در تصاویر قرار می‌دهند.

هوش مصنوعی مولد Gemini Omni Flash از امروز در اپلیکیشن Gemini، Google Flow (پلتفرم جدید گوگل برای دسترسی به هوش مصنوعی مولد) و YouTube Shorts در دسترس خواهد بود.

به‌نظر شما آیا توانایی تولید ویدئو از ورودی‌های چندگانه می‌تواند خلاقیت دیجیتال را متحول کند یا نگرانی‌های مربوط به دیپ‌فیک و سوءاستفاده مانع از پذیرش گسترده این فناوری خواهد شد؟

منبع