هوش مصنوعی OpenAI o1 خانواده جدیدی از LLMها (مدلهای زبانی بزرگ) و باهوشتر از GPT 4o (LLM قدرتدهنده ChatGPT) است. OpenAI ادعا میکند که o1 میتواند فکر کرده، استدلال کند و بهطرز شگفتانگیزی احساس انسان بودن میکند. این شرکت چندین بنچمارک برای حمایت از ادعای خود منتشر کرده است. در ادامه بیایید علاوهبر بررسی بنچمارکها، ببینیم که OpenAI o1 چگونه کار میکند، چگونه از آن استفاده کنیم، چقدر هزینه دارد و چه کارهایی میتواند انجام دهد و چه کاری نمیتواند انجام دهد.
پیش از آنکه شروع کنیم، در ابتدا دلیل و چرایی اهمیت o1 را بازگو میکنیم. با تولید متن توسط هوش مصنوعی، GPT 4o و همتایان آن، مانند سیستمهای پیشبینیکننده پیشرفته با قابلیت تکمیل خودکار عمل میکنند. خب، گفته میشود که با خانواده مدلهای LLM تازه معرفیشده o1، همه چیز قرار است تغییر کند.
OpenAI دو مدل o1-preview و o1-mini را معرفی کرده است. وقتی در هر جایی از این مقاله به o1 اشاره میکنیم، منظور مدل بزرگتر o1-preview است، مگر اینکه خلاف آن مشخص شده باشد.
o1 در داخل شرکت OpenAI با اسم رمز «Strawberry» شناخته میشود و بهدلیل تواناییهای استدلال مشابه انسان، بهشدت موردانتظار بوده است.
“o” در O1 مخفف Omni به معنای «همه» و 1 به «بازنشانی شمارنده به 1» اشاره دارد. این نشان میدهد که این شرکت احساس میکند که o1 نقطهعطفی در تحقیقات هوش مصنوعی و نقشهراه محصول خود است.
مدل o1 برای یادگیری، درک اشتباهات، یادگیری مجدد و دنبال کردن استراتژیهای مختلف برای حل یک مشکل آموزش دیده است.
o1 با استفاده از یک مجموعه داده جدید متناسب و یک الگوریتم/فرآیند بهینهسازی به نام «یادگیری تقویتی» آموزش داده میشود. o1 برای تجزیهوتحلیل و حل مسائل پیچیده (با ریاضیات و استدلال منطقی) ساخته شده است. به این فکر کنید که چگونه ذهن انسان زنجیرهای از افکار خرد را دنبال میکند که هر کدام به فکر دیگری منتهی میشود. به موازات آن، میتواند به چیزهای گسسته نیز فکر کند. بهطور مشابه، o1 نیز الگوها را یاد میگیرد و بهعنوان یک ماشین با حافظه گسترده، روی تعداد زیادی از مشکلات آموزش میبیند.
o1 ساخته شده است تا پاسخهای مناسب را تشخیص دهد یا مجموعهای از مراحل مناسب را ازطریق رویکرد هویج و چوب انتخاب کند.
جایی که o1 واقعاً حتی محققان OpenAI را شگفتزده میکند زمانی است که این مدل درحین حل یک مشکل به یک مانع برخورد میکند، منابع بیشتری را جمعآوری میکند و از آنها برای رسیدن به یک هدف استفاده میکند.
o1 میتواند مانند یک انسان استدلال کند.
میتواند خود را بررسی کند.
میتواند با استفاده از عباراتی شبیه به انسان «اوه، وقتم درحال تمام شدن است، اجازه دهید سریع به جواب برسم» یا «من میتوانم این کار را انجام دهم، چه کنم؟»
o1 در المپیاد بینالمللی ریاضی (IMO) برای دانش آموزان دبیرستانی در ایالاتمتحده 83 درصد امتیاز کسب کرده است؛ درحالیکه GPT 4o فقط میتواند 13 درصد را مدیریت کند.
Apollo Research در آزمایش خود دریافته است که o1 نسبتبه GPT-4o از خودشناسی، خود استدلالی/آگاهی و نظریه کاربردی ذهن بهتری برخوردار است.
o1 همچنین دارای مهارتهای چندزبانه است، بهویژه در زبانهایی مانند کرهای و عربی.
میتواند بازیهای معمایی مانند بازیهای منطقی آکروستیک و LSAT را حل کند، به سؤالات شیمی درجه دکتری پاسخ دهد، به فیزیکدانان کمک کند تا فرمولهای پیچیده را حل کنند، به محققان مراقبتهای بهداشتی کمک کند تا دادههای توالی سلولی را حاشیهنویسی کنند، بیماری فرد را براساس گزارش آنها ازجمله علائم و تاریخچه تشخیص دهد، کدها، و تجزیهوتحلیل مختصر حقوقی بنویسد.
Jakub Pachocki، دانشمند ارشد OpenAI، میگوید: «این مدل زمان میخواهد؛ میتواند به مشکل فکر کند و سعی کند آن را تجزیه کرده و برای ارائه بهترین پاسخ بهدنبال جوابهایی باشد.»
o1 مانند GPT 4o و دیگر مدلهای محبوب LLM امروزی چندوجهی نیست. بهعبارتدیگر، نمیتواند فایلها، تصاویر، ویدئوها و غیره را تجزیهوتحلیل کند. فقط میتواند متن را بخواند، پردازش کند و بنویسد.
نمیتواند صحفات وب را برای نتایج بلادرنگ مرور کند.
دانش آن تا اکتبر 2023 محدود است، درست مانند GPT-4o.
OpenAI بهوضوح بیان میکند که توهمات و سایر مشکلات ذاتی مدلهای هوش مصنوعی مانند سوگیریها را حل نکرده است.
پاسخهای آن هنوز میتواند از نظر واقعی اشتباه باشد.
فقط به این دلیل که در حل مسائل ریاضی خوب است، به این معنی نیست که میتواند معلم ریاضی خوبی باشد.
کند است و درحالیکه بهنظر میرسد در حال فکر کردن است (که حتی ممکن است حدود 10 ثانیه طول بکشد)، پیغامی دریافت میکنید که به شما میگوید «به چه چیزی فکر میکند/چه میکند.»
OpenAI برای اولین بار به یکی از مدلهای خود رتبه «medium» را برای خطر سلاحهای شیمیایی، بیولوژیکی، رادیولوژیکی و هستهای داده است. این مدل دارای برچسبهایی است که به شما در مورد خطرات احتمالی استفاده بیاحتیاطی از آن هشدار میدهد.
o1-preview و o1-mini اکنون برای کاربران ChatGPT Plus یا ChatGPT Team Plan در دسترس هستند و از 19 سپتامبر/29 شهریور برای کاربران ChatGPT Enterprise و ChatGPT Edu نیز در دسترس خواهند بود.
کاربران پولی میتوانند تنها به 30 پیام در هفته (در مورد o1-preview) و 50 پیام در هفته (در مورد o1-mini) دسترسی داشته باشند.
o1-preview API تا 15 دلار برای هر 1 میلیون توکن ورودی و 60 دلار بهازای هر 1 میلیون توکن خروجی هزینه دارد. این درحالی است که GPT-4o بهازای هر 1 میلیون توکن ورودی، 5 دلار و برای هر 1 میلیون توکن خروجی، 15 دلار هزینه دارد.
o1-mini با هزینهای 80 درصد ارزانتر از o1-preview در دسترس خواهد بود.
OpenAI همچنین اعلام کرده است که قصد دارد بعدها o1-mini را برای کاربران رایگان ChatGPT در دسترس قرار دهد. اما، این شرکت تاریخ انتشار یا جدول زمانی را اعلام نکرده است.
مرحله 1: وبسایت ChatGPT.com یا اپلیکیشن ChatGPT را باز کنید.
مرحله 2: وارد حساب کاربری خود شوید. اگر کاربر ChatGPT Plus نیستید، پلن خود را ارتقا دهید.
مرحله 3: هنگامی که در صفحه اصلی قرار گرفتید، روی دکمه «ChatGPT» ضربه بزنید.
مرحله 4: بین مدل o1-preview یا o1-mini یکی را انتخاب کنید.
مرحله 5: با انتخاب کادر پیام شروع به چت کردن کنید. برای تست مدلهای o1، دستور خود را وارد کنید.
کاش دسترسی راحت تری برای ایرانی ها می داشت
قابلیت استدلال داره این اما مسئولین …