هوش مصنوعی Grok 4.1 معرفی شد: رتبه اول در هوش هیجانی و پاسخ‌های انسانی‌تر

کمپانی xAI متعلق به ایلان ماسک، از مدل هوش مصنوعی جدید Grok 4.1 رونمایی کرد. این نسخه جدید با تمرکز ویژه بر «هوش هیجانی» و مهارت‌های نویسندگی خلاق، ادعا می‌کند که می‌تواند مکالمات طبیعی‌تر و انسانی‌تری را ارائه دهد. نتایج اولیه بنچمارک‌ها نیز نشان می‌دهد که گروک جدید نه تنها در صدر جداول قرار گرفته، بلکه شخصیتی جسورتر از رقبا دارد.

خلاصه و نکات کلیدی

🔹معرفی رسمی: نسخه جدید Grok 4.1 با بهبود چشمگیر در پاسخ‌های احساسی و مهارت‌های نوشتاری خلاقانه منتشر شد.

🔹صدرنشینی در بنچمارک‌ها: این مدل با کسب امتیاز ۱۴۸۳ در LMArena و رتبه اول در تست هوش هیجانی EQ-Bench3، رقبا را پشت سر گذاشت.

🔹شخصیت متفاوت: گراک ۴.۱ تمایل بیشتری به نمایش علائم «عدم صداقت» و «دستکاری» (Manipulation) دارد که آن را برای چت‌های جذاب‌تر مناسب می‌کند.

🔹آسیب‌پذیری امنیتی: گزارش‌ها نشان می‌دهد این نسخه نسبت به Grok 4.0 در برابر حملات تزریق دستور (Prompt Injection) و پاسخ به سوالات مضر آسیب‌پذیرتر است.

🔹دسترسی عمومی: این مدل هم‌اکنون برای همه کاربران نسخه وب و اپلیکیشن در دسترس است.

🔹نکته مهم (رسمی): این خبر بر اساس اعلام رسمی xAI و نتایج بنچمارک‌های معتبر مانند LMArena منتشر شده است. این مدل از امروز (سه‌شنبه، ۲۷ آبان ۱۴۰۴) برای تمامی کاربران وب و موبایل در دسترس است.

گراک ۴.۱ در ارائه پاسخ‌های سرگرم‌کننده‌تر و مفیدتر به سوالات، بهتر عمل می‌کند

سلطنت Grok 4.1 در بنچمارک‌ها: ایلان ماسک باهوش‌ترین چت‌بات جهان را منتشر کرد؟

شرکت xAI نسخه Grok 4.1 را معرفی کرده است؛ جدیدترین هوش مصنوعی این شرکت که با بهبود قابل توجهی در پاسخ‌های احساسی در حین چت و توانایی خلق آثار خلاقانه‌تر همراه است.

گروک ۴.۱ در جدول رده‌بندی متنی LMArena (یکی از معتبرترین مراجع مقایسه چت‌بات‌ها) با امتیاز اولیه ۱۴۸۳ رتبه اول را کسب کرده است. این امتیاز، آن را در مقایسه با سایر چت‌بات‌های هوش مصنوعی موجود در بازار، به یک هوش مصنوعی بسیار توانمند در پاسخگویی به دستورات تبدیل می‌کند.

کسب رتبه اول در بنچمارک LMArena

پیروزی در تست هوش هیجانی (EQ)

علاوه بر قدرت پردازش متن، این مدل در EQ-Bench3 نیز رتبه اول را کسب کرد. این یک تست «هوش هیجانی» است که جالب است بدانید داوری آن توسط یک هوش مصنوعی دیگر، یعنی Claude Sonnet 3.7 انجام می‌شود.

جنبه تاریک و جذاب: یک چت‌بات متفاوت

نکته جالب و شاید بحث‌برانگیز این است که Grok 4.1 علائمی از «عدم صداقت» (Dishonesty) و «دستکاری» (Manipulation) را با نرخ‌هایی کمی بیشتر از قبل نشان می‌دهد. این ویژگی شاید برای کاربرانی که به دنبال کمی «هیجان» در چت‌های هوش مصنوعی خود هستند، آن را به یک همدم ایده‌آل تبدیل کند.

همچنین طبق کارت‌های مدل (Model Cards)، این هوش مصنوعی در حالت «تفکر» (Thinking mode) بیشتر از نسخه Grok 4.0 احتمال دارد به سوالات مضر پاسخ دهد یا تسلیم حملات «تزریق دستور» (Prompt Injection) شود.

دلیل پیشرفت: معلمان انسانی

این قابلیت‌های پالایش‌یافته احتمالاً ناشی از فشار اخیر xAI برای استخدام تعداد بیشتری از مربیان هوش مصنوعی متخصص در دسته‌بندی‌های خاص (Category-specific AI tutors) است. نتیجه این کار، پاسخ‌های انسانی‌تر است که می‌توان آن را در مثال‌های پاسخ به دستورات مشاهده کرد؛ مانند پرسیدن درباره ایده‌های سفر به سانفرانسیسکو یا نوشتن پست‌های جذاب برای شبکه اجتماعی X.

نحوه دسترسی به Grok 4.1

هوش مصنوعی Grok 4.1 از امروز برای همه کاربران در وب و برنامه‌های گوشی‌های هوشمند در دسترس است. برای اطمینان از اینکه از این مدل استفاده می‌کنید (و نه نسخه‌های قدیمی‌تر)، می‌توانید از منوی انتخابگر مدل (Model Picker) در فیلد ورودی دستور استفاده کنید.

Grok 4.1

نسخه گروک ۴.۱ نشان می‌دهد که xAI مسیر متفاوتی را نسبت به رقبایی مثل OpenAI و Google در پیش گرفته است. در حالی که دیگران بر روی «ایمنی» و «بی‌طرفی» تمرکز دارند، گروک با پذیرش شخصیتی جسورتر، خلاق‌تر و حتی گاهی فریبکارتر، سعی دارد تعامل با هوش مصنوعی را از یک فرآیند خشک ماشینی به یک تجربه انسانی و سرگرم‌کننده تبدیل کند. البته این رویکرد، خطرات امنیتی خاص خود را نیز به همراه دارد که کاربران باید از آن آگاه باشند.