گوگل در ادامه روند توسعه پرشتاب ابزارهای خود، قابلیت شگفتانگیز دیگری را به هوش مصنوعی جمینای اضافه کرد. طبق آخرین اخبار، این دستیار هوشمند اکنون میتواند تنها با دریافت یک متن یا تصویر، آهنگهایی کامل شامل موسیقی، ترانه (Lyrics) و حتی کاور آلبوم تولید کند. گوگل این ویژگی را برای طیف وسیعی از کاربران رایگان و پولی در دسترس قرار داده است.
🔹 ساخت آهنگ کامل (موزیک + شعر) با دستور متنی یا تصویری
🔹 استفاده از مدل پیشرفته صوتی Lyria 3
🔹 تولید خودکار کاور آلبوم با ابزار Nano Banana
🔹 دسترسپذیری عمومی برای کاربران رایگان و اشتراکی
جمینای در سالهای اخیر پیشرفتهای چشمگیری داشته است؛ از ارتقای کیفیت عکس و ویدیو در آپدیت «جمینای ۳» گرفته تا بهبود قابلیتهای تفکر عمیق و کدنویسی. اما اکنون گوگل گامی بزرگ بهسوی حوزهای برداشته که پیشازاین کمتر به آن پرداخته بود: تولید موسیقی.
این قابلیت جدید قدرت خود را از مدل تبدیل متن-به-صدا (Text-to-Audio) جدید دیپمایند با نام Lyria 3 میگیرد. درحالیکه نسخههای قبلی لیریا تنها در ابزارهای آزمایشی مانند MusicFX یا PromptDJ محدود بودند، گوگل اکنون تصمیم گرفته تا این فناوری را از طریق اپلیکیشن موبایل و نسخه وب جمینای در اختیار عموم کاربران قرار دهد.

اضافه شدن گزینه ساخت آهنگ به جمینای
کاربران میتوانند یک مفهوم را توصیف کنند یا یک تصویر را بارگذاری نمایند؛ سپس جمینای آن را به یک «تِرَک باکیفیت و شنیدنی» تبدیل میکند. برخلاف مدلهای قدیمی که فقط موسیقی پسزمینه تولید میکردند، سیستم جدید همزمان ترانه (شعر) را نیز میسراید و آن را با لایههای پیچیده و ملودیک سازهای مختلف ترکیب میکند. این ویژگی مستقیماً اپلیکیشنهای محبوبی مانند Suno را به چالش میکشد.
گوگل همچنین امکانی را فراهم کرده تا کاربران بتوانند فایلهای موسیقی موجود را آپلود کنند تا جمینای از آنها الهام بگیرد. علاوه بر این، برای هر آهنگ تولیدشده، یک تصویر کاور هنری (Album Art) نیز با استفاده از ابزار Nano Banana ساخته میشود تا پکیج خروجی کامل باشد.

قابلیت جدید جمینای: تبدیل متن و تصویر به موسیقی با کلام و کاور آلبوم
نتیجه تست ترنجی با پرامپت فارسی: ما این قابلیت جدید جمینای را با پرامپت فارسی آزمایش کردیم. همانطور که در ویدیوی زیر مشاهده میکنید، هوش مصنوعی گوگل توانست یک قطعه موسیقی کامل به زبان فارسی تولید کند.
البته باتوجهبه اینکه مدلهای هوش مصنوعی هنوز در تلفظ کلمات فارسی و رعایت لحن دقیق (Accent) کمی ضعف دارند، شنیدن برخی ایرادات در ادای کلمات کاملاً طبیعی است. بااینحال، خروجی نهایی از نظر ملودی، ریتم و ترکیببندی سازها بسیار باکیفیت و فراتر از انتظار بود.
از اینجا 👇🏻 میتوانید نمونه خروجی را گوشی کنید:
یکی از نگرانیهای اصلی در حوزه موسیقی هوش مصنوعی، نقض حقوق ناشران و هنرمندان است. گوگل موضع سفتوسختی در این زمینه اتخاذ کرده و اعلام میکند که مدل جدید را با رعایت توافقنامههای کپیرایت آموزش داده است. این مدل صدای خوانندگان واقعی را تقلید نمیکند و خروجیها را با آثار موجود مقایسه میکند تا شباهت غیرقانونی وجود نداشته باشد.
علاوهبراین، تمام آهنگهای تولیدشده دارای یک واترمارک نامرئی به نام SynthID هستند. این شناسه به پلتفرمها کمک میکند تا موسیقی ساخت هوش مصنوعی را از آثار هنرمندان واقعی تشخیص دهند.
بهنظر شما آیا هوش مصنوعی جمینای میتواند روزی جایگزین آهنگسازان و خوانندگان واقعی شود یا صرفاً یک ابزار سرگرمی باقی میماند؟