حساب کاربری ندارید؟ ثبت نام کنید

قابلیت گفتگوی زنده هوش مصنوعی جمینای گوگل بهبود یافت

نوشته

4 ساعت قبل | بدون دیدگاه | گوگل، هوش مصنوعی

گوگل با معرفی هوش مصنوعی Gemini، تجربه گفتگو با دستیارهای صوتی را بسیار طبیعی‌تر از دوران Google Assistant کرد. اما این فناوری هنوز جای پیشرفت دارد. در همین راستا، گوگل امروز آپدیت مهمی را برای مدل Gemini 2.5 Flash Native Audio منتشر کرد که تمرکز اصلی آن بر بهبود گفتگوی زنده جمینای و رفع برخی از آزاردهنده‌ترین مشکلات تعامل صوتی است.

خلاصه و نکات کلیدی

  • 🔹بهبود قابلیت فراخوانی توابع (Function Calling) برای دریافت دقیق‌تر اطلاعات لحظه‌ای بدون قطع جریان مکالمه.
  • 🔹افزایش دقت مدل در پیروی از دستورات پیچیده به نرخ ۹۰ درصد.
  • 🔹حل مشکل قطع کردن صحبت کاربر؛ جمینای اکنون هنگام مکث‌های طولانی وسط جمله، صبر می‌کند.
  • 🔹اضافه شدن قابلیت قطع میکروفون (Mute) هنگام صحبت کردن جمینای برای جلوگیری از تداخل ناخواسته.
  • 🔹انتشار آپدیت برای سرویس‌های Gemini Live، Search Live و Google AI Studio.

سه محور اصلی آپدیت جدید چیست؟

گوگل در این به‌روزرسانی که برای مدل صوتی جمینای ۲.۵ فلش عرضه شده، روی سه حوزه کلیدی تمرکز کرده است تا تعامل کاربر با هوش مصنوعی روان‌تر شود:

۱. فراخوانی دقیق‌تر توابع (Sharper Function Calling)

قابلیت اطمینان جمینای در استفاده از ابزارهای خارجی افزایش یافته است. اکنون این هوش مصنوعی بهتر تشخیص می‌دهد که چه زمانی باید در حین گفتگو به دنبال اطلاعات آنلاین و لحظه‌ای (Real-time) بگردد. نکته مهم اینجاست که جمینای این داده‌ها را به‌صورت یکپارچه در پاسخ صوتی خود می‌گنجاند، بدون اینکه وقفه آزاردهنده‌ای در جریان مکالمه ایجاد شود.

۲. پیروی بهتر از دستورات

دقت مدل در اجرای دستورات توسعه‌دهندگان و کاربران بهبود چشمگیری داشته است. طبق آمار گوگل، نرخ پیروی از دستورات از ۸۴٪ در نسخه قبلی به ۹۰٪ در نسخه جدید رسیده است. این یعنی جمینای اکنون در مدیریت دستورالعمل‌های پیچیده و ارائه خروجی‌های قابل‌اعتماد، توانمندتر شده است.

۳. گفتگوهای روان‌تر

مدل جدید اکنون قدرت بیشتری در به یاد آوردن و بازیابی محتوای بخش‌های قبلی مکالمه دارد. این ویژگی باعث می‌شود گفتگوها منسجم‌تر باشند و هوش مصنوعی درک بهتری از روند کلی بحث پیدا کند.

حل مشکل «پریدن وسط حرف» کاربر

علاوه بر بهبودهای فنی، «جاش وودوارد»، معاون بخش Google labs، از دو ویژگی کاربردی دیگر برای تجربه کاربری (UX) خبر داد که مستقیماً روی بهبود گفتگوی زنده جمینای تأثیر می‌گذارند:

نام ویژگی مشکل قبلی راهکار جدید
صبر هوشمند قطع صحبت کاربر هنگام مکث برای تفکر جمینای دیگر وسط جمله شما نمی‌پرد و هنگام مکث‌های طولانی صبر می‌کند.
کنترل میکروفون تداخل صدای محیط یا کاربر با صحبت‌های جمینای امکان قطع میکروفون (Mute) هنگام صحبت کردن هوش مصنوعی فراهم شده است.

دسترسی و پلتفرم‌ها

گوگل اعلام کرده است که هدف نهایی این به‌روزرسانی، توانمندسازی مدل برای مدیریت گردش کارهای پیچیده و ارائه مکالماتی با حس انسانی است. این آپدیت هم‌اکنون برای پلتفرم‌های زیر در حال انتشار است:

  • سرویس Gemini Live
  • جستجوی زنده (Search Live)
  • استودیوی هوش مصنوعی گوگل (Google AI Studio)
  • پلتفرم Vertex AI

نظر شما چیست؟

با این آپدیت، گوگل نشان داد که تنها به دنبال افزایش قدرت پردازشی نیست، بلکه به ظرافت‌های تعامل انسانی نیز اهمیت می‌دهد. حل مشکل قطع کردن صحبت کاربر و افزایش درک متقابل، گام بزرگی برای تبدیل کردن جمینای از یک «ماشین پاسخگو» به یک «هم‌صحبت هوشمند» است.

گوگل چگونه وب‌گردی هوشمند با جمینای را امن می‌کند؟

نظر شما چیست؟ شما چقدر از قابلیت Live هوش مصنوعی جمینای استفاده می‌کنید؟

اشتراک در
اطلاع از
0 Comments
قدیمی‌ترین
تازه‌ترین بیشترین رأی
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
رپورتاژ آگهی پربازده
رپورتاژ آگهی پربازده
سهیل سلیمانی