شرکت گوگل با معرفی مدل هوش مصنوعی جمینای 3.1 پرو (Gemini 3.1 Pro)، قصد دارد هوشمندی هسته خانواده مدلهای خود را ارتقا دهد. در یک بنچمارک استدلال دشوار، عملکرد این مدل نسبتبه نسل قبلی بیش از دو برابر شده است. اگرچه بنچمارکها تنها نیمی از ماجرا هستند و عملکرد واقعی ملاک است، اما این ارقام نویدبخش پیشرفتهای بزرگی در دنیای هوش مصنوعی میباشند.
🔹گوگل مدل جمینای 3.1 پرو را با تمرکز بر ارتقای حل مسئله و استدلال پیشرفته معرفی کرد.
🔹امتیاز این مدل در بنچمارک ARC-AGI-2 به 77.1 درصد رسید که بیش از دو برابر نسل قبل است.
🔹جمینای 3.1 پرو در کدنویسی و دانش علمی از رقبایی مثل GPT-5.2 و Opus 4.6 پیشی گرفته است.
🔹این مدل هماکنون بهصورت پیشنمایش برای توسعهدهندگان و شرکتها در دسترس است.
🔹قیمتگذاری این مدل بسیار رقابتی و ارزانتر از مدلهای ردهبالای آنتروپیک تعیین شده است.
گوگل از Gemini 3.1 Pro بهعنوان یک ارتقای بزرگ برای سری جمینای 3 یاد میکند که نشاندهنده جهشی عظیم در قابلیت حل مسئله است. این مدل هماکنون بهعنوان یک نسخه پیشنمایش برای توسعهدهندگان، کسبوکارها و کاربران نهایی درحال عرضه است.
گوگل این مدل را بهعنوان هوش پایه بهبودیافتهای توصیف میکند که قدرت پیشرفتهای پشتصحنه مدل Gemini 3 Deep Think (که هفته گذشته بهروزرسانی شد) را نیز تأمین میکند. درحالیکه Deep Think روی وظایف پیچیده علمی و مهندسی تمرکز دارد، هدف نسخه 3.1 پرو آوردن همان دستاوردها به استفادههای روزمره است. بهعنوانمثال، گوگل به یک داشبورد هوافضا اشاره میکند که در آن مدل بهطور مستقل یک جریان تلمتری عمومی را برای تجسم مدار ایستگاه فضایی بینالمللی پیکربندی کرده است.
بزرگترین جهش در بنچمارک ARC-AGI-2 برای وظایف منطق انتزاعی دیده میشود. طبق اعلام گوگل، جمینای 3.1 پرو امتیاز ۷۷.۱ درصد را کسب کرده است که بیش از دو برابر امتیاز ۳۱.۱ درصدی جمینای 3 پرو است. گوگل میگوید که مدل Opus 4.6 شرکت آنتروپیک (با ۶۸.۸ درصد) و مدل GPT-5.2 شرکت OpenAI (با ۵۲.۹ درصد) نیز با اختلاف زیادی عقبتر هستند.
این مدل همچنین در اکثر بنچمارکهای دیگر پیشتاز است:
بااینحال، جمینای 3.1 پرو در همهجا برنده نیست. در بنچمارک چندوجهی MMMU Pro، نسخه قبلی یعنی جمینای 3 پرو با امتیاز ۸۱.۰ درصد کمی بهتر از مدل جدید (۸۰.۵ درصد) عمل کرده است. همچنین در تست Humanity’s Last Exam، مدل Opus 4.6 رتبه اول را کسب کرد.
گوگل این مدل را بهصورت همزمان در پلتفرمهای مختلف عرضه میکند. توسعهدهندگان میتوانند از طریق Gemini API، گوگل AI Studio و Android Studio به آن دسترسی داشته باشند. کاربران سازمانی نیز از طریق Vertex AI به آن دسترسی خواهند داشت.
قیمتگذاری API براساس طول پرامپت متغیر است و مشابه نرخهای جمینای 3 پرو است که بهمراتب ارزانتر از مدلهای Opus آنتروپیک تمام میشود:
| دستهبندی | تا 200 هزار توکن | بیش از 200 هزار توکن |
| ورودی (Input) | 2.00 دلار / 1 میلیون توکن | 4.00 دلار / 1 میلیون توکن |
| خروجی (Output) | 12.00 دلار / 1 میلیون توکن | 18.00 دلار / 1 میلیون توکن |
| کشینگ (Caching) | 0.20 دلار / 1 میلیون توکن | 0.40 دلار / 1 میلیون توکن |
بهنظر شما آیا جهش امتیازات بنچمارک در جمینای 3.1 پرو در استفاده روزمره و واقعی نیز محسوس خواهد بود یا صرفاً اعدادی روی کاغذ هستند؟