بر اساس اعلامیه اخیر در حساب کاربری Weibo شیائومی، مدل زبانی بزرگ (LLM) شیائومی با نام رسمی MiLM، مراحل ثبتنام در بخش مدلهای زبانی را پشت سر گذاشته است. بدینترتیب، مدل زبانی شیائومی MiLM که احتمالاً با هوش مصنوعی اختصاصی این شرکت ادغام میشود، در انواع محصولات از گوشیهای هوشمند گرفته تا خودروها و لوازم خانگی استفاده خواهد شد.
شیائومی میگوید که MiLM آماده ادغام با محصولات خود ازجمله گوشیهای هوشمند، دستگاههای هوشمند خانگی و حتی خودروهای شیائومی است. این اعلامیه همچنین به امکان باز کردن قابلیتهای MiLM برای کاربران گستردهتر در آینده اشاره کرد.
MiLM برای اولین بار در آگوست 2023 در پلتفرمهای بنچمارک C-Eval و CMMLU بهصورت عمومی ظاهر شد، جایی که به نتایج چشمگیری دست یافت.
این مدل جایگاه اول را در رده پارامترهای خود در تابلوی امتیازات C-Eval درحالیکه رتبه 10 را درمجموع کسب کرده است، بهدست آورد. اطلاعات از صفحه GitHub پروژه نشان میدهد که MiLM-6B، مدل خاص موردبحث، دارای 6.4 میلیارد پارامتر است.
تفکیک موضوعی C-Eval قدرت MiLM-6B را در زمینههای STEM (علم، فناوری، مهندسی و ریاضیات) برجسته میکند. این مدل در تمامی 20 موضوع STEM، ازجمله اندازهشناسی، فیزیک، شیمی و زیستشناسی، به نمرات دقت بالایی دست یافت.
درحالیکه MiLM-6B در اکثر موضوعات هنرهای لیبرال نیز عملکرد امیدوارکنندهای دارد، بهنظر میرسد حوزههایی که به «تفکر انتزاعی» مانند قانون، ریاضیات، برنامهنویسی و نظریه احتمال نیاز دارند، زمینههایی هستند که نیاز به بهبود بیشتر داند.
علوم اجتماعی حوزه دیگری است که نتایج متفاوتی دارد. MiLM-6B در هشت موضوع از ده موضوع علوم اجتماعی، بهاستثنای آموزش و جغرافیا، دقت خوبی بهدست آورد. درنهایت، وقتی صحبت از علوم انسانی بهمیان میآید، این مدل در تاریخ و حقوق عملکرد خوبی دارد، درحالیکه دقت سایر موضوعات باید مشخص شود.
MiLM-6B اکنون آماده است تا در محصولات مختلف شیائومی ادغام شود. درحالیکه عملکرد آن در موضوعات مختلف متفاوت است، نویدبخش بهبود تجربیات کاربر در حوزههای مختلف میباشد.
دیدگاه شما پیرامون مدل زبانی بزرگ شیائومی با نام MiLM چیست؟