حساب کاربری ندارید؟ ثبت نام کنید

مدل صوتی GPT Bidi 1 احتمالاً این هفته معرفی می‌شود؛ قابلیت شنیدن و صحبت همزمان برای ChatGPT

نوشته

5 ساعت قبل | بدون دیدگاه | هوش مصنوعی

گزارش‌های جدید نشان می‌دهند OpenAI درحال آزمایش مدل صوتی معرفی‌نشده‌ای با نام GPT Bidi 1 است؛ مدلی که می‌تواند به‌صورت همزمان صحبت کند، بشنود و به مکالمه ادامه دهد. این قابلیت می‌تواند یکی از بزرگ‌ترین ارتقاهای تاریخ ChatGPT در حوزه تعامل صوتی باشد و تجربه‌ای طبیعی‌تر از مکالمه با هوش مصنوعی را در اختیار کاربران قرار دهد.

خلاصه خبر در یک نگاه:

🔷 مدل GPT Bidi 1 یک مدل صوتی جدید برای ChatGPT است که همزمان صحبت می‌کند و گوش می‌دهد.
🔷 این مدل می‌تواند وقفه‌های کاربر را به‌صورت طبیعی مدیریت کند.
🔷 گزارش‌ها از آغاز عرضه آزمایشی آن برای گروه محدودی از کاربران خبر می‌دهند.
🔷 مدل صوتی GPT Bidi 1 حافظه مکالمه طولانی‌تری دارد و زمینه گفتگو را بهتر حفظ می‌کند.
🔷 شرکت OpenAI هنوز به‌صورت رسمی این مدل را معرفی نکرده است.

مدل GPT Bidi 1 چیست؟

براساس گزارش منتشرشده از سوی TestingCatalog، مدل GPT Bidi 1 یک معماری صوتی دوطرفه یا Bidirectional دارد. واژه Bidi به طراحی دوطرفه اشاره می‌کند؛ رویکردی که به دستیار هوش مصنوعی اجازه می‌دهد به‌طور همزمان صحبت کند، صدای کاربر را بشنود و جریان مکالمه را دنبال کند.

در کدهای داخلی مشاهده‌شده، OpenAI از این مدل به‌عنوان «نسل بعدی قابلیت صوتی» و یک «جهش بزرگ در هوشمندی» یاد کرده است. این موضوع نشان می‌دهد شرکت قصد دارد تجربه صوتی ChatGPT را به سطحی نزدیک‌تر به مکالمات انسانی برساند.

 

مدل صوتی GPT Bidi 1 چه قابلیت‌هایی ارائه می‌دهد؟

مهم‌ترین ویژگی گزارش‌شده برای GPT Bidi 1 توانایی مدیریت وقفه‌ها و تغییر مسیر مکالمه در لحظه است. برای مثال، اگر از مدل بخواهید از یک تا ده بشمارد و در میانه کار درخواست کنید شمارش را برعکس ادامه دهد، سیستم بلافاصله خود را با دستور جدید تطبیق می‌دهد.

این مدل همچنین هنگام مکث کوتاه کاربر، بازخوردهای طبیعی مانند «باشه» یا تأییدهای کوتاه ارائه می‌دهد؛ بدون اینکه صحبت کاربر را قطع کند. چنین رفتاری می‌تواند مکالمات را روان‌تر و انسانی‌تر جلوه دهد.

  • شنیدن و صحبت کردن به‌صورت همزمان
  • مدیریت طبیعی وقفه‌های کاربر
  • تغییر وظایف در لحظه بدون نیاز به شروع مجدد گفتگو
  • حفظ بهتر زمینه مکالمات طولانی
  • جلوگیری از پاسخ‌های ناخواسته هنگام سکوت‌های طولانی

حفظ بهتر زمینه مکالمه؛ نقطه‌عطف GPT Bidi 1

یکی از مهم‌ترین ضعف‌های فعلی قابلیت صوتی ChatGPT از دست دادن بخشی از زمینه گفتگو در مکالمات طولانی است. گزارش‌ها ادعا می‌کنند GPT Bidi 1 می‌تواند رشته اصلی مکالمه را برای مدت طولانی‌تری حفظ کند و اطلاعات قبلی را بهتر درک کند.

این موضوع می‌تواند کیفیت تعاملات پیچیده و چندمرحله‌ای را به‌طور قابل‌توجهی افزایش دهد؛ به‌ویژه برای کاربرانی که از ChatGPT به‌عنوان دستیار شخصی یا ابزار کاری استفاده می‌کنند.

عرضه آزمایشی GPT Bidi 1 آغاز شده است؟

براساس گزارش جدید TestingCatalog، OpenAI عرضه محدود GPT Bidi 1 را برای بخشی از کاربران اپلیکیشن ChatGPT آغاز کرده است. گفته می‌شود این مدل در بخش انتخاب مدل‌ها و در کنار گزینه‌های استاندارد و پیشرفته نمایش داده می‌شود.

همچنین برخی کاربران گزارش داده‌اند پس از انتخاب GPT Bidi 1، حباب رابط صوتی به رنگ زرد تغییر می‌کند؛ نشانه‌ای که احتمالاً برای تشخیص این حالت جدید درنظر گرفته شده است.

چرا GPT Bidi 1 برای OpenAI اهمیت دارد؟

گزارش‌ها حاکی از آن هستند که OpenAI قصد دارد ChatGPT را به یک «سوپراپلیکیشن» تبدیل کند و قابلیت‌های جدیدی در حوزه ابزارهای عامل‌محور (Agentic AI) و توسعه نرم‌افزار ارائه دهد.

در همین راستا، ارتقای لایه صوتی ChatGPT اهمیت ویژه‌ای پیدا می‌کند. OpenAI معتقد است در آینده، بسیاری از کاربران به‌جای تایپ کردن، از طریق صدا با هوش مصنوعی تعامل خواهند داشت. به‌همین‌دلیل، نزدیک کردن کیفیت مکالمه صوتی به مدل‌های متنی پیشرفته شرکت می‌تواند نقش مهمی در استراتژی آینده آن ایفا کند.

مدل جدید OpenAI می‌تواند همزمان صحبت کند و به کاربر گوش دهد.

مدل جدید OpenAI می‌تواند همزمان صحبت کند و به کاربر گوش دهد.

🔴 همچنین بخوانید: مدل هوش مصنوعی GPT-5.6 با ارتقای عمده عملکرد هفته دیگر از راه می‌رسد

آیا OpenAI به‌زودی GPT Bidi 1 را معرفی می‌کند؟

تا این لحظه OpenAI هیچ اطلاعات رسمی درباره GPT Bidi 1 یا برنامه‌های احتمالی مرتبط با GPT 5.6 منتشر نکرده است. بااین‌حال، مشاهده این مدل در کدهای داخلی و آغاز آزمایش محدود آن، احتمال معرفی رسمی در روزهای آینده را افزایش داده است.

اگر اطلاعات منتشرشده صحت داشته باشند، GPT Bidi 1 می‌تواند یکی از مهم‌ترین به‌روزرسانی‌های صوتی ChatGPT باشد و فاصله میان مکالمات انسانی و تعامل با هوش مصنوعی را بیش‌ازپیش کاهش دهد.

جمع‌بندی

گزارش‌های غیررسمی نشان می‌دهند GPT Bidi 1 با قابلیت شنیدن و صحبت کردن همزمان، مدیریت طبیعی وقفه‌ها و حفظ بهتر زمینه گفتگو، آماده ورود به اکوسیستم ChatGPT است. هرچند OpenAI هنوز این مدل را تأیید نکرده، اما نشانه‌ها از نزدیک بودن رونمایی رسمی آن حکایت دارند.

به‌نظر شما آیا قابلیت مکالمه طبیعی و دوطرفه می‌تواند نحوه استفاده کاربران از ChatGPT و سایر دستیارهای هوش مصنوعی را متحول کند؟

اشتراک در
اطلاع از
0 Comments
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
رپورتاژ آگهی پربازده
رپورتاژ آگهی پربازده
ساحل عطایی