گزارشهای جدید نشان میدهند OpenAI درحال آزمایش مدل صوتی معرفینشدهای با نام GPT Bidi 1 است؛ مدلی که میتواند بهصورت همزمان صحبت کند، بشنود و به مکالمه ادامه دهد. این قابلیت میتواند یکی از بزرگترین ارتقاهای تاریخ ChatGPT در حوزه تعامل صوتی باشد و تجربهای طبیعیتر از مکالمه با هوش مصنوعی را در اختیار کاربران قرار دهد.
🔷 مدل GPT Bidi 1 یک مدل صوتی جدید برای ChatGPT است که همزمان صحبت میکند و گوش میدهد.
🔷 این مدل میتواند وقفههای کاربر را بهصورت طبیعی مدیریت کند.
🔷 گزارشها از آغاز عرضه آزمایشی آن برای گروه محدودی از کاربران خبر میدهند.
🔷 مدل صوتی GPT Bidi 1 حافظه مکالمه طولانیتری دارد و زمینه گفتگو را بهتر حفظ میکند.
🔷 شرکت OpenAI هنوز بهصورت رسمی این مدل را معرفی نکرده است.
براساس گزارش منتشرشده از سوی TestingCatalog، مدل GPT Bidi 1 یک معماری صوتی دوطرفه یا Bidirectional دارد. واژه Bidi به طراحی دوطرفه اشاره میکند؛ رویکردی که به دستیار هوش مصنوعی اجازه میدهد بهطور همزمان صحبت کند، صدای کاربر را بشنود و جریان مکالمه را دنبال کند.
در کدهای داخلی مشاهدهشده، OpenAI از این مدل بهعنوان «نسل بعدی قابلیت صوتی» و یک «جهش بزرگ در هوشمندی» یاد کرده است. این موضوع نشان میدهد شرکت قصد دارد تجربه صوتی ChatGPT را به سطحی نزدیکتر به مکالمات انسانی برساند.
مهمترین ویژگی گزارششده برای GPT Bidi 1 توانایی مدیریت وقفهها و تغییر مسیر مکالمه در لحظه است. برای مثال، اگر از مدل بخواهید از یک تا ده بشمارد و در میانه کار درخواست کنید شمارش را برعکس ادامه دهد، سیستم بلافاصله خود را با دستور جدید تطبیق میدهد.
این مدل همچنین هنگام مکث کوتاه کاربر، بازخوردهای طبیعی مانند «باشه» یا تأییدهای کوتاه ارائه میدهد؛ بدون اینکه صحبت کاربر را قطع کند. چنین رفتاری میتواند مکالمات را روانتر و انسانیتر جلوه دهد.
یکی از مهمترین ضعفهای فعلی قابلیت صوتی ChatGPT از دست دادن بخشی از زمینه گفتگو در مکالمات طولانی است. گزارشها ادعا میکنند GPT Bidi 1 میتواند رشته اصلی مکالمه را برای مدت طولانیتری حفظ کند و اطلاعات قبلی را بهتر درک کند.
این موضوع میتواند کیفیت تعاملات پیچیده و چندمرحلهای را بهطور قابلتوجهی افزایش دهد؛ بهویژه برای کاربرانی که از ChatGPT بهعنوان دستیار شخصی یا ابزار کاری استفاده میکنند.
براساس گزارش جدید TestingCatalog، OpenAI عرضه محدود GPT Bidi 1 را برای بخشی از کاربران اپلیکیشن ChatGPT آغاز کرده است. گفته میشود این مدل در بخش انتخاب مدلها و در کنار گزینههای استاندارد و پیشرفته نمایش داده میشود.
همچنین برخی کاربران گزارش دادهاند پس از انتخاب GPT Bidi 1، حباب رابط صوتی به رنگ زرد تغییر میکند؛ نشانهای که احتمالاً برای تشخیص این حالت جدید درنظر گرفته شده است.
گزارشها حاکی از آن هستند که OpenAI قصد دارد ChatGPT را به یک «سوپراپلیکیشن» تبدیل کند و قابلیتهای جدیدی در حوزه ابزارهای عاملمحور (Agentic AI) و توسعه نرمافزار ارائه دهد.
در همین راستا، ارتقای لایه صوتی ChatGPT اهمیت ویژهای پیدا میکند. OpenAI معتقد است در آینده، بسیاری از کاربران بهجای تایپ کردن، از طریق صدا با هوش مصنوعی تعامل خواهند داشت. بههمیندلیل، نزدیک کردن کیفیت مکالمه صوتی به مدلهای متنی پیشرفته شرکت میتواند نقش مهمی در استراتژی آینده آن ایفا کند.

مدل جدید OpenAI میتواند همزمان صحبت کند و به کاربر گوش دهد.
🔴 همچنین بخوانید: مدل هوش مصنوعی GPT-5.6 با ارتقای عمده عملکرد هفته دیگر از راه میرسد
تا این لحظه OpenAI هیچ اطلاعات رسمی درباره GPT Bidi 1 یا برنامههای احتمالی مرتبط با GPT 5.6 منتشر نکرده است. بااینحال، مشاهده این مدل در کدهای داخلی و آغاز آزمایش محدود آن، احتمال معرفی رسمی در روزهای آینده را افزایش داده است.
اگر اطلاعات منتشرشده صحت داشته باشند، GPT Bidi 1 میتواند یکی از مهمترین بهروزرسانیهای صوتی ChatGPT باشد و فاصله میان مکالمات انسانی و تعامل با هوش مصنوعی را بیشازپیش کاهش دهد.
گزارشهای غیررسمی نشان میدهند GPT Bidi 1 با قابلیت شنیدن و صحبت کردن همزمان، مدیریت طبیعی وقفهها و حفظ بهتر زمینه گفتگو، آماده ورود به اکوسیستم ChatGPT است. هرچند OpenAI هنوز این مدل را تأیید نکرده، اما نشانهها از نزدیک بودن رونمایی رسمی آن حکایت دارند.
بهنظر شما آیا قابلیت مکالمه طبیعی و دوطرفه میتواند نحوه استفاده کاربران از ChatGPT و سایر دستیارهای هوش مصنوعی را متحول کند؟