به لطف ویژگی جدیدی برای تقویت گفتار که گوگل ارائه داده است، ممکن است شاهد بهبود چشمگیر کیفیت صدا در برخی استوری هی یوتیوب باشید. قابلیت حذف نویز استوری یوتیوب برای iOS با هوش مصنوعی می تواند کیفیت را بالا ببرد و واقعا از همین حالا منتظر ارایه شدن آن روی دیگر پلتفرم ها هستم.
چند سال پیش، این شرکت عنوان کرد در حال توسعه فناوری “به دنبال گوش دادن” است که می تواند صدای افراد را از بین جمع انتخاب کند. اکنون، این فناوری در دسترس سازندگان است که استوری های یوتیوب را در دستگاه های iOS ضبط می کنند.
گوگل با آموزش دادن آن به وسیله مجموعه بزرگی از ویدیوهای آنلاین، به آموزش گوش دادن به همبستگی بین گفتار و سیگنالهای دیداری ، مانند حرکات دهان و حالت های چهره بلندگو پرداخت.
گوگل برای اطمینان از اینکه برای همه مفید خواهد بود و تبعیضی نشان نخواهد داد، یک سری آزمایشات را برای بررسی عملکرد آن بر اساس ویژگی های مختلف شنیداری و دیداری انجام داد. این ویژگی ها شامل سن سوژه، رنگ پوست ، زبان گفتاری ، میزان صدا ، دید صورت ، حالت سر ، موهای صورت ، وجود عینک و سطح صدای پس زمینه است.
به عنوان مثال، آنها قادر به تعیین اینکه توانایی این فن آوری برای افزایش گفتار در بین زبانهای سخنران کاملاً ثابت است، بودند. به نظر نمی رسد که موهای صورت نیز تأثیر زیادی بر روی آنها بگذارد، اگرچه در صورت هایی که موی صورت ندارند و افرادی که تراشیده شده اند بهترین نتیجه را می دهند.
این غول فناوری همچنین در پست اعلامیه خود توضیح داد که چگونه این فناوری را در طی دو سال گذشته بهبود داده است. برای شروع ، توسعه دهندگان اطمینان حاصل کردند که این برنامه می تواند تمام پردازش ها را روی دستگاه انجام دهد ، بنابراین نیازی به ارسال چیزی به یک سرور از راه دور نیست.
آنها همچنین از تکنیکی استفاده کردند که به آن امکان می دهد برای تجزیه و تحلیل خیلی سریع تصاویر کوچک را از روی ویدئوها استخراج کند. این به فناوری اجازه می دهد تا هنگام ضبط ویدیو ، بهبود گفتار را شروع کند. این پیشرفت ها اندازه ویژگی را از 120 مگابایت به 6 مگابایت کاهش داده و استقرار را آسان تر می کند. گوگل می گوید که آنها همچنین “با استفاده از فرمول اصلی … زمان اجرای فناوری را از 10 برابر در زمان واقعی روی دسکتاپ به عملکرد در زمان واقعی 0.5 برابر فقط با استفاده از CPU آیفون کاهش دادند.” در حقیقت ، پردازش یک استوری 15 ثانیه ای فقط به چند ثانیه زمان نیاز دارد.
برای فعال کردن این ویژگی ، سازندگان فقط باید “افزایش گفتار” را در کنترل میزان صدا در iOS تغییر دهند.
نمونه خروجی را ببینید:
نظر شما درباره این فناوری فوق العاده گوگل چیست؟
چی بودیم چی شدیم ، چیه این تکنولوژی اصلا 🤨
چقدر خفن 🤨