اپل امروز چندین مدل زبانی بزرگ (LLM) منبع باز را منتشر کرده است که بهجای پردازش ازطریق سرورهای ابری، کاملاً بر روی دستگاه (on-device) اجرا شوند. مدل زبانی جدید اپل که OpenELM (مدلهای زبانی کارآمد منبع باز) نامیده میشود، در Hugging Face Hub، انجمنی برای اشتراکگذاری کدهای هوش مصنوعی، در دسترس هستند.
همانطور که در یک صفحه PDF ذکر شده است، درمجموع هشت مدل OpenELM وجود دارد که چهار مدل از آنها با استفاده از کتابخانه CoreNet از قبل آموزش داده شدهاند و چهار مدل نیز تنظیمشده با دستورالعمل هستند. اپل از یک استراتژی مقیاسبندی لایهای استفاده میکند که هدف آن بهبود دقت و کارایی است.
اپل کد، گزارشهای آموزشی و نسخههای متعدد را بهجای مدل آموزشدیده نهایی ارائه کرده است و محققان امیدوارند که این پروژه منجر به پیشرفت سریعتر و نتایج قابلاعتمادتر در زمینه هوش مصنوعی با زبان طبیعی شود.
«OpenELM یک مدل زبانی باز پیشرفته است. این مدل از یک استراتژی مقیاسبندی لایهای برای تخصیص مؤثر پارامترها در هر لایه از مدل ترانسفورماتور استفاده میکند که منجر به افزایش دقت میشود. بهعنوانمثال، با بودجه پارامتری تقریباً یک میلیارد، OpenELM در مقایسه با OLMo تا 2.36 درصد بهبود در دقت نشان میدهد درحالیکه به 2 برابر توکنهای کمتر قبل از آموزش نیاز دارد.
با انحراف از رویههای قبلی که فقط وزن مدل و کد استنتاج ارائه میکنند، نسخه جدید شامل چارچوب کاملی برای آموزش و ارزیابی مدل زبانی درمجموعه دادههای در دسترس عموم است.»
اپل میگوید که مدلهای OpenELM را برای «توانمندسازی و غنیسازی جامعه تحقیقات باز» با مدلهای زبانی پیشرفته منتشر میکند. به اشتراکگذاری مدلهای منبع باز به محققان راهی برای بررسی ریسکها و دادهها و سوگیریهای مدل میدهد. توسعهدهندگان و شرکتها میتوانند از مدلها همانطور که ارائه شدهاند، استفاده کرده یا تغییراتی را در آنها ایجاد کنند.
بهاشتراکگذاری آزاد اطلاعات به ابزار مهمی برای اپل برای جذب مهندسان، دانشمندان و کارشناسان برتر تبدیل شده است، زیرا فرصتهایی را برای مقالات تحقیقاتی فراهم میکند که بهطور معمول تحت سیاستهای محرمانه اپل نمیتوانستند منتشر شوند.
اپل هنوز این نوع قابلیتهای هوش مصنوعی را به دستگاههای خود نیاورده است، اما انتظار میرود iOS 18 دارای تعدادی ویژگی جدید هوش مصنوعی باشد و شایعات حاکی از آن است که اپل درحال برنامهریزی برای اجرای مدلهای زبانی بزرگ خود بر روی دستگاه برای حفظ حریم خصوصی است.
نظر شما درباره هوش مصنوعی متن باز OpenELM اپل چیست؟