گوگل با معرفی هوش مصنوعی Gemini، تجربه گفتگو با دستیارهای صوتی را بسیار طبیعیتر از دوران Google Assistant کرد. اما این فناوری هنوز جای پیشرفت دارد. در همین راستا، گوگل امروز آپدیت مهمی را برای مدل Gemini 2.5 Flash Native Audio منتشر کرد که تمرکز اصلی آن بر بهبود گفتگوی زنده جمینای و رفع برخی از آزاردهندهترین مشکلات تعامل صوتی است.

گوگل در این بهروزرسانی که برای مدل صوتی جمینای ۲.۵ فلش عرضه شده، روی سه حوزه کلیدی تمرکز کرده است تا تعامل کاربر با هوش مصنوعی روانتر شود:
قابلیت اطمینان جمینای در استفاده از ابزارهای خارجی افزایش یافته است. اکنون این هوش مصنوعی بهتر تشخیص میدهد که چه زمانی باید در حین گفتگو به دنبال اطلاعات آنلاین و لحظهای (Real-time) بگردد. نکته مهم اینجاست که جمینای این دادهها را بهصورت یکپارچه در پاسخ صوتی خود میگنجاند، بدون اینکه وقفه آزاردهندهای در جریان مکالمه ایجاد شود.
دقت مدل در اجرای دستورات توسعهدهندگان و کاربران بهبود چشمگیری داشته است. طبق آمار گوگل، نرخ پیروی از دستورات از ۸۴٪ در نسخه قبلی به ۹۰٪ در نسخه جدید رسیده است. این یعنی جمینای اکنون در مدیریت دستورالعملهای پیچیده و ارائه خروجیهای قابلاعتماد، توانمندتر شده است.
مدل جدید اکنون قدرت بیشتری در به یاد آوردن و بازیابی محتوای بخشهای قبلی مکالمه دارد. این ویژگی باعث میشود گفتگوها منسجمتر باشند و هوش مصنوعی درک بهتری از روند کلی بحث پیدا کند.
علاوه بر بهبودهای فنی، «جاش وودوارد»، معاون بخش Google labs، از دو ویژگی کاربردی دیگر برای تجربه کاربری (UX) خبر داد که مستقیماً روی بهبود گفتگوی زنده جمینای تأثیر میگذارند:
| نام ویژگی | مشکل قبلی | راهکار جدید |
|---|---|---|
| صبر هوشمند | قطع صحبت کاربر هنگام مکث برای تفکر | جمینای دیگر وسط جمله شما نمیپرد و هنگام مکثهای طولانی صبر میکند. |
| کنترل میکروفون | تداخل صدای محیط یا کاربر با صحبتهای جمینای | امکان قطع میکروفون (Mute) هنگام صحبت کردن هوش مصنوعی فراهم شده است. |
گوگل اعلام کرده است که هدف نهایی این بهروزرسانی، توانمندسازی مدل برای مدیریت گردش کارهای پیچیده و ارائه مکالماتی با حس انسانی است. این آپدیت هماکنون برای پلتفرمهای زیر در حال انتشار است:
با این آپدیت، گوگل نشان داد که تنها به دنبال افزایش قدرت پردازشی نیست، بلکه به ظرافتهای تعامل انسانی نیز اهمیت میدهد. حل مشکل قطع کردن صحبت کاربر و افزایش درک متقابل، گام بزرگی برای تبدیل کردن جمینای از یک «ماشین پاسخگو» به یک «همصحبت هوشمند» است.
نظر شما چیست؟ شما چقدر از قابلیت Live هوش مصنوعی جمینای استفاده میکنید؟