در رویداد Google I/O 2025، گوگل از ابزار جدیدی بهنام Flow رونمایی کرد که ساخت ویدئوهای هوش مصنوعی را سادهتر و سریعتر از همیشه میکند. این ابزار در کنار مدلهای تصویری و ویدئویی جدیدی مانند Veo 3 ،Veo 2 و Imagen 4 معرفی شده که همگی بهطور مستقیم از قدرت پردازشی هوش مصنوعی Gemini و DeepMind بهره میبرند.
Flow به کاربران اجازه میدهد تا با وارد کردن یک پرامپت متنی (Text-to-Video) یا استفاده از چند تصویر نمونه (Ingredients)، ویدئوهای ۸ ثانیهای تولید کنند. سپس با ابزار SceneBuilder میتوان چند کلیپ را بههم متصل کرد و یک صحنه کامل ساخت؛ بدون نیاز به دانش تدوین یا نرمافزارهای سنگین.
این ابزار بیشتر شبیه به یک اپلیکیشن فیلمسازی ساده است، مخصوصاً برای ایدهپردازان و فیلمنامهنویسانی که میخواهند مفاهیم ذهنی خود را بهسرعت به تصویر بکشند.
در نسخه نمایشی که گوگل ارائه داد، یک انیمیشن کوتاه نمایش داده شد که ابتدا در قاب یک تلویزیون بود، سپس تصویر از تلویزیون بیرون آمد و فضای اتاق را نمایش داد، بعد دوربین از پنجره خارج شد و به خیابان رسید. تمام این توالی با حرکات دوربین کاملاً نرم و پیوسته توسط Flow ساخته شده بود.
بهگفته Thomas Iljic، مدیر محصول در Google Labs، هدف Flow ساخت ویدئوهای بلند نیست، بلکه کمک به تبدیل سریع ایده به تصویر است.
مدل جدید Veo 3 اکنون قادر است ویدئوهایی با کیفیت بالاتر، درک بهتر از پرامپتهای بلند و حتی تولید همزمان تصویر و صدا (شامل دیالوگ) انجام دهد. این مدل برای سازندگان محتوای حرفهای و تولیدات سینمایی پیشرفته طراحی شده است.
مدل Veo 2 نیز اکنون دارای ابزارهایی مانند کنترل دوربین و حذف اشیاء از صحنه است؛ قابلیتی شبیه به نرمافزارهای تدوین پیشرفته اما کاملاً هوشمند.
مدل تصویری جدید گوگل با عنوان Imagen 4 حالا میتواند:
تصاویر با کیفیت بالاتر تولید کند.
خروجی را در فرمتهای متنوعتری ارائه دهد.
متنهای واقعی و قابل خواندن در تصویر بنویسد (برخلاف نسخههای قبلی با نوشتههای نامفهوم).
این ویژگیها به طراحان گرافیک و تولیدکنندگان محتوای تبلیغاتی کمک بزرگی خواهد کرد.
ابزار Flow از امروز در ایالات متحده برای مشترکین دو پلن جدید Google AI Pro و Google AI Ultra فعال شده است:
Google AI Pro: شامل ویژگیهای کلیدی Flow و امکان ساخت تا ۱۰۰ ویدئو در ماه
Google AI Ultra: با بیشترین سقف استفاده، دسترسی زودهنگام به Veo 3 و تولید ویدئو همراه با صدا و دیالوگ واقعی
سخن پایانی
با معرفی ابزارهایی مانند Flow و مدلهای پیشرفته Veo 3 و Imagen 4، گوگل گام بلندی در مسیر دموکراتیزهسازی تولید محتوای ویدئویی هوش مصنوعی برداشته است. حالا هر فردی میتواند بدون دانش تدوین یا انیمیشنسازی، ایدههای ذهنی خود را تنها با چند جمله و تصویر به ویدئوهای حرفهای تبدیل کند.