حساب کاربری ندارید؟ ثبت نام کنید

مدل هوش مصنوعی Gemini 3.1 Pro معرفی شد؛ هوشمندتر برای پیچیده‌ترین وظایف

نوشته

11 ساعت قبل | بدون دیدگاه | برترین‌های ترنجی، هوش مصنوعی

شرکت گوگل با معرفی مدل هوش مصنوعی جمینای 3.1 پرو (Gemini 3.1 Pro)، قصد دارد هوشمندی هسته خانواده مدل‌های خود را ارتقا دهد. در یک بنچمارک استدلال دشوار، عملکرد این مدل نسبت‌به نسل قبلی بیش از دو برابر شده است. اگرچه بنچمارک‌ها تنها نیمی از ماجرا هستند و عملکرد واقعی ملاک است، اما این ارقام نویدبخش پیشرفت‌های بزرگی در دنیای هوش مصنوعی می‌باشند.

خلاصه در یک نگاه

🔹گوگل مدل جمینای 3.1 پرو را با تمرکز بر ارتقای حل مسئله و استدلال پیشرفته معرفی کرد.

🔹امتیاز این مدل در بنچمارک ARC-AGI-2 به 77.1 درصد رسید که بیش از دو برابر نسل قبل است.

🔹جمینای 3.1 پرو در کدنویسی و دانش علمی از رقبایی مثل GPT-5.2 و Opus 4.6 پیشی گرفته است.

🔹این مدل هم‌اکنون به‌صورت پیش‌نمایش برای توسعه‌دهندگان و شرکت‌ها در دسترس است.

🔹قیمت‌گذاری این مدل بسیار رقابتی و ارزان‌تر از مدل‌های رده‌بالای آنتروپیک تعیین شده است.

ارتقای هوشمندی و حل مسائل پیچیده

گوگل از Gemini 3.1 Pro به‌عنوان یک ارتقای بزرگ برای سری جمینای 3 یاد می‌کند که نشان‌دهنده جهشی عظیم در قابلیت حل مسئله است. این مدل هم‌اکنون به‌عنوان یک نسخه پیش‌نمایش برای توسعه‌دهندگان، کسب‌وکارها و کاربران نهایی درحال عرضه است.

گوگل این مدل را به‌عنوان هوش پایه بهبودیافته‌ای توصیف می‌کند که قدرت پیشرفت‌های پشت‌صحنه مدل Gemini 3 Deep Think (که هفته گذشته به‌روزرسانی شد) را نیز تأمین می‌کند. درحالی‌که Deep Think روی وظایف پیچیده علمی و مهندسی تمرکز دارد، هدف نسخه 3.1 پرو آوردن همان دستاوردها به استفاده‌های روزمره است. به‌عنوان‌مثال، گوگل به یک داشبورد هوافضا اشاره می‌کند که در آن مدل به‌طور مستقل یک جریان تلمتری عمومی را برای تجسم مدار ایستگاه فضایی بین‌المللی پیکربندی کرده است.

رکوردشکنی در استدلال و رقابت با رقبا

بزرگ‌ترین جهش در بنچمارک ARC-AGI-2 برای وظایف منطق انتزاعی دیده می‌شود. طبق اعلام گوگل، جمینای 3.1 پرو امتیاز ۷۷.۱ درصد را کسب کرده است که بیش از دو برابر امتیاز ۳۱.۱ درصدی جمینای 3 پرو است. گوگل می‌گوید که مدل Opus 4.6 شرکت آنتروپیک (با ۶۸.۸ درصد) و مدل GPT-5.2 شرکت OpenAI (با ۵۲.۹ درصد) نیز با اختلاف زیادی عقب‌تر هستند.

این مدل همچنین در اکثر بنچمارک‌های دیگر پیشتاز است:

  • GPQA Diamond (دانش علمی): ۹۴.۳ درصد
  • MCP Atlas (بنچمارک ایجنتی): ۶۹.۲ درصد
  • LiveCodeBench Pro (کدنویسی رقابتی): امتیاز Elo برابر با ۲۸۸۷ (بالاتر از GPT-5.2)

بااین‌حال، جمینای 3.1 پرو در همه‌جا برنده نیست. در بنچمارک چندوجهی MMMU Pro، نسخه قبلی یعنی جمینای 3 پرو با امتیاز ۸۱.۰ درصد کمی بهتر از مدل جدید (۸۰.۵ درصد) عمل کرده است. همچنین در تست Humanity’s Last Exam، مدل Opus 4.6 رتبه اول را کسب کرد.

بنچمارک مدل هوش مصنوعی Gemini 3.1 Pro

بنچمارک مدل هوش مصنوعی Gemini 3.1 Pro

دسترسی گسترده و قیمت‌گذاری

گوگل این مدل را به‌صورت هم‌زمان در پلتفرم‌های مختلف عرضه می‌کند. توسعه‌دهندگان می‌توانند از طریق Gemini API، گوگل AI Studio و Android Studio به آن دسترسی داشته باشند. کاربران سازمانی نیز از طریق Vertex AI به آن دسترسی خواهند داشت.

قیمت‌گذاری API براساس طول پرامپت متغیر است و مشابه نرخ‌های جمینای 3 پرو است که به‌مراتب ارزان‌تر از مدل‌های Opus آنتروپیک تمام می‌شود:

دسته‌بندی تا 200 هزار توکن بیش از 200 هزار توکن
ورودی (Input) 2.00 دلار / 1 میلیون توکن 4.00 دلار / 1 میلیون توکن
خروجی (Output) 12.00 دلار / 1 میلیون توکن 18.00 دلار / 1 میلیون توکن
کشینگ (Caching) 0.20 دلار / 1 میلیون توکن 0.40 دلار / 1 میلیون توکن

به‌نظر شما آیا جهش امتیازات بنچمارک در جمینای 3.1 پرو در استفاده روزمره و واقعی نیز محسوس خواهد بود یا صرفاً اعدادی روی کاغذ هستند؟

اشتراک در
اطلاع از
0 Comments
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
رپورتاژ آگهی پربازده
رپورتاژ آگهی پربازده
امیرحسین ملکی