شرکت OpenAI بهتازگی حالت صوتی هوش مصنوعی ChatGPT خود را برای کاربران اشتراکی بهروزرسانی کرده است. هدف از این آپدیت جدید، طبیعیتر کردن مکالمات صوتی و امکان ترجمه همزمان توسط این مدل عنوان شده است.
طبق اعلام OpenAI، نسخه بهروزرسانیشده Advanced Voice Mode اکنون میتواند گفتار نرمتر و با تنوع احساسی بیشتر تولید کند. بهبودهای جدید شامل موارد زیر است:
بهبود زیر و بمی صدا (Intonation)
مکثهای طبیعیتر
توانایی بیان همدلانه یا حتی طعنهآمیز بهشکل واقعیتر
یکی دیگر از ویژگیهای مهم این بهروزرسانی، امکان ترجمه همزمان (Real-time Translation) است. کاربران اکنون میتوانند از ChatGPT بخواهند بین دو زبان خاص مکالمه دوطرفه را بهطور پیوسته ترجمه کند. این ویژگی میتواند برای موقعیتهای مختلف بسیار مفید باشد.
برای دسترسی به این قابلیتهای جدید، کاربران اشتراکی میتوانند از طریق آیکون زبان در رابط کاربری این چتبات، آنها را فعال کنند.
البته برخی مشکلات همچنان وجود دارد. بهگفته OpenAI:
کاربران ممکن است گاهی با افت کیفیت صدا مواجه شوند؛ مانند تغییرات غیرمنتظره در زیر و بمی یا حجم صدا که در برخی صداها محسوستر است.
همچنین پدیده موسوم به هذیانگویی (Hallucinations) ادامه دارد. در برخی موارد، ChatGPT بدون درخواست کاربر، صداهای عجیبی مانند تبلیغات، نویزهای تصادفی یا حتی موسیقی پسزمینه تولید میکند.
در یک نمونه اخیر، کاربری گزارش داده که در میانه مکالمه، ChatGPT ناگهان تبلیغی را پخش کرده، درحالیکه OpenAI اساساً هیچ تبلیغی در ChatGPT ارائه نمیدهد.
Advanced Voice Mode نخستینبار در مه ۲۰۲۴ با انتشار تدریجی عرضه شد و در اکتبر ۲۰۲۴ برای کاربران اتحادیه اروپا نیز در دسترس قرار گرفت.
هدف از توسعه این قابلیت، فراهمکردن تعامل طبیعی، زنده و آنی با هوش مصنوعی است؛ بهگونهای که کاربر بتواند:
درمیانه مکالمه صحبت ChatGPT را قطع کند.
احساسات را در روند گفتوگو منتقل کند.
همچنین، اگر کاربران دوربین خود را نیز فعال کنند، ChatGPT میتواند بهصورت زنده در مورد اشیاء یا محیط اطراف اظهار نظر کند. این قابلیت مشابه امکاناتی است که گوگل در اپلیکیشن Gemini ارائه میدهد.
سخن پایانی
بهروزرسانی جدید قابلیتهای صوتی ChatGPT گامی مهم در جهت ایجاد تجربهای طبیعیتر و انسانیتر در مکالمات با هوش مصنوعی محسوب میشود. امکان بیان بهتر احساسات و ترجمه همزمان دوطرفه، این ابزار را در موقعیتهای روزمره کاربردیتر میکند. البته همچنان رفع کامل برخی مشکلات فنی مانند افت کیفیت صدا و تولید صداهای تصادفی میتواند تجربه کاربران را بهبود بیشتری ببخشد. با توجه به رقابت شدید در حوزه دستیارهای هوش مصنوعی، باید دید OpenAI در نسخههای بعدی چه نوآوریهای بیشتری به ChatGPT اضافه خواهد کرد.
آیا تاکنون با حالت صوتی ChatGPT کار کردهاید؟ اگر پاسخ شما مثبت است، تجربه کاربری خود را پیش و پس از آپدیت اخیر این مدل با ما بهاشتراک بگذارید.