همانطور که OpenAI پیش از این وعده داده بود، این شرکت امروز رویداد بهاری بهروزرسانی محصولات خود را بهصورت زنده در یوتیوب برگزار کرد. مدیرعامل این شرکت، سم آلتمن، پیش از این بیان کرده بود محصول جدید آنها چیزی است که وی رؤیای آن را داشته، اما به جزئیات پیرامون آن نپرداخت. امروز اما، OpenAI درنهایت از مدل جدید هوش مصنوعی خود با نام GPT-4o پرده برداشت که بسیار سریعتر از GPT-4 بوده و خبر خوب آنکه برای تمامی کاربران رایگان است.
OpenAI بیان میکند که GPT-4o مشابه GPT-4 کار میکند، اما بسیار سریعتر از برادر بزرگتر خود است. GPT-4o همچنین فناوری جدیدی را در پشت حالت صوتی خود اضافه میکند، جایی که افراد از میکروفون خود برای صحبت با ChatGPT استفاده میکنند. OpenAI میخواست مکالمه با ChatGPT را با استفاده از حالت صوتی مانند صحبت با یک شخص واقعی انجام دهد، اما تأخیر بین اتمام بلندگو و پاسخ ChatGPT، این رؤیا را خراب کرد. اکنون، این شرکت فناوریهای جدیدی را به GPT-4o اضافه میکند تا صحبت کردن با یک چتبات تا حد امکان طبیعی باشد.
بهطور کلی OpenAI لیست قابلیتهای جدید و رایگان GPT-4o را به شرح زیر بیان کرده است:
عملکرد و هوشمندی همسطح با GPT-4
دریافت پاسخ هم از مدل و هم ازطریق وب بهصورت همزمان
تجزیهوتحلیل دادهها و ایجاد نمودار
امکان چت درباره تصاویری که بهاشتراک میگذارید
کمک به جمع بندی، نوشتن یا تجزیهوتحلیل فایلهای آپلودشده
استفاده رایگان از GPT Store
ایجاد تجربه مفیدتر با Memory
برای نشان دادن این بهروزرسانی، OpenAI یک دموی آزمایشی مکالمه با GPT-4o با استفاده از صدا برگزار کرد. GPT-4o نهتنها بلافاصله پس از اتمام صحبت ارائهدهنده پاسخ داد، بلکه با تبدیل متن به گفتار نیز واکنش نشان داد، بنابراین احساس میکنید که در حال صحبت با شخصی در زمان واقعی هستید. در طول نمایش، GPT-4o به مجری آموزش داد که چگونه بهتر نفس بکشد، ازجمله ثبت نمونههای صوتی از نفس او و بیان توصیههایی به وی.
نسخه دموی دیگری از GPT-4o یک داستان پیش از خواب با دستور «robots and love» ارائه میدهد. در اواسط داستان، مجری وارد عمل شد و از GPT-4o خواست تا احساسی را که برای صحبت کردن استفاده میکند، تنظیم کند. مطمئناً GPT-4o میتواند صدای خود را بسته به خواستهها، از یک اجرای بیش از حد دراماتیک به لحن سرد و رباتیک تغییر دهد. درنهایت، آنها برخی از قابلیتهای آواز GPT-4o را بهنمایش گذاشتند تا داستان را کامل کنند.
در دمو بعدی، مجریان یک معادله نوشتند و آن را ازطریق دوربین گوشی به GPT-4o نشان دادند. مجری از GPT-4o خواست تا به آنها در حل این معادله کمک کند. مطمئناً، GPT-4o کاربر را ازطریق روش حل یک معادله ساده راهنمایی میکند، دقیقاً مانند آنچه که یک معلم ریاضی خوب انجام میدهد. بهعلاوه، این مدل حتی پاسخی برای «چه زمانی از این در زندگی واقعی استفاده خواهم کرد؟» داشت. بنابراین توضیح میدهد که چگونه معادلات درجه دوم میتوانند به ما در انجام کارهای روزمره کمک کنند.
مجریان همچنین از نسخه دسکتاپ GPT-4o برای بررسی کدهایی که در اختیار داشتند، استفاده کردند. GPT-4o نهتنها میتواند توضیح دهد که کد چه کار میکند، بلکه میتواند بگوید اگر بخشهای خاصی از آن را تغییر دهید، چه اتفاقی میافتد. مجریان نشان دادند که GPT-4o میتواند بهعنوان یک مترجم زنده عمل کند و به دو نفر که به زبانهای مختلف صحبت میکنند، گوش دهد و به یک نفر بگوید که دیگری به زبان مادری خود چه گفته است.
در بیانیه مطبوعاتی OpenAI آمده است: «با یک میانبر صفحه کلید ساده (Option + Space)، میتوانید فوراً یک سؤال از ChatGPT بپرسید. علاوهبر این، حالت صوتی به شما این امکان را میدهد که با ChatGPT مستقیماً از مک خود مکالمات صوتی داشته باشید.»
OpenAI درحالحاضر برنامههای ChatGPT را برای آیفون و آیپد ارائه میکند و قصد دارد نسخه ویندوزی را نیز در اواخر سال جاری منتشر کند.
OpenAI همچنین درحال ایجاد برخی بهروزرسانیها در رابط وب ChatGPT ازجمله معرفی صفحه اصلی جدید، طرحبندی مجدد پیام و موارد دیگر است. این شرکت بیان میکند که ظاهر جدید «برای دوستانهتر کردن و گفتگوی بیشتر طراحی شده است.»
اگرچه همانطور که گفته شد، مدل جدید GPT-4o برای همه کاربران رایگان خواهد بود، اما کاربران پریمیوم همچنان «حداکثر پنج برابر ظرفیت» کاربران رایگان امکان تعامل با آن را خواهند داشت. همچنین قابلیتهای GPT-4o رفتهرفته ارائه میشوند، اما ویژگیهای متن و تصویر این مدل از امروز در ChatGPT در دسترس قرار میگیرد.
نظر شما درباره مدل هوش مصنوعی GPT-4o چیست؟