
گوگل دیپمایند از SIMA 2، آخرین نسخه از تحقیقات خود در زمینه هوش مصنوعی عمومی، رونمایی کرد. این عامل (Agent) هوشمند که برپایه مدل سال گذشته، SIMA (Scalable Instructable Multiworld Agent)، ساخته شده، اکنون میتواند علاوه بر پیروی از دستورالعملها، استدلال کند، اقدامات هدفمند انجام دهد و حتی خود را بهبود بخشد.
نسخه اول SIMA میتوانست در چندین محیط مجازی، بیش از ۶۰۰ وظیفه مبتنیبر زبان مانند «به چپ بپیچ» یا «از نردبان بالا برو» را دنبال کند. اما SIMA 2 این رویکرد را با ترکیب دنبال کردن دستورالعملها با قابلیتهای پیشرفتهتری تکامل میدهد.
SIMA 2 با مدل قدرتمند Gemini یکپارچه شده است که به آن امکان میدهد اهداف سطح بالای کاربر را تفسیر کند، درمورد وظایف استدلال نماید و اقدامات خود را توضیح دهد. این عامل میتواند مراحلی را که برای رسیدن به اهداف طی میکند توصیف کند، به سؤالات کاربر پاسخ دهد و رفتار و محیط خود را ارزیابی کند.
این عامل همچنین تعمیمپذیری بهبودیافتهای را نشان میدهد و قادر به اجرای دستورالعملهای پیچیده در بازیهایی است که بهطور صریح در آنها آموزش ندیده است؛ از جمله بازی بقای وایکینگی ASKA و MineDojo (یک محیط تحقیقاتی مبتنیبر ماینکرفت). SIMA 2 میتواند وظایف طولانی و چندمرحلهای، ورودیهای چندوجهی مانند طرحها (sketches)، چندین زبان و حتی ایموجیها را درک کند. همچنین میتواند مفاهیم آموختهشده را منتقل کند، بهعنوانمثال، دانش «معدنکاری» از یک بازی را به «برداشت محصول» در بازی دیگر اعمال کند.
هنگامی که SIMA 2 با Genie 3 (مدلی که دنیاهای سهبعدی را از روی تصاویر یا متن تولید میکند) ترکیب میشود، میتواند در دنیاهایی که قبلاً هرگز ندیده، حرکت کرده و اقدامات هدفمند انجام دهد. این امر سازگاری بالای ایجنت با محیطهای جدید را نشان میدهد.
یکی از شگفتانگیزترین قابلیتهای SIMA 2، توانایی بهبود مستقل از طریق بازی کردن خودگردان است. آموزش اولیه به نمایشهای انسانی متکی است، اما پس از آن، ایجنت میتواند دادههای تجربی را برای آموزش نسخههای آینده خود تولید کند. این فرآیند تکراری به ایجنت اجازه میدهد تا وظایف بهطور فزاینده پیچیدهای را امتحان کرده و در محیطهای تازه ایجادشده، بدون نیاز به دادههای انسانی اضافی، یاد بگیرد.
مهارتهای توسعهیافته توسط SIMA 2، از جمله ناوبری، استفاده از ابزار و اجرای وظایف مشارکتی، پایهای برای تحقیقات در زمینه هوش تجسمیافته عمومی (general embodied intelligence) فراهم میکند. بااینحال، هنوز محدودیتهایی در وظایفی که نیاز به برنامهریزی بلندمدت، اقدامات دقیق سطح پایین و درک بصری قوی دارند، باقی مانده است.
دیپمایند بر نظارت بر قابلیتهای خودبهبودی تأکید کرده و بهدنبال بازخورد بینرشتهای برای تضمین توسعه مسئولانه و کاهش خطرات احتمالی است.
بهنظر شما چنین عاملهای هوشمندی که میتوانند در محیطهای مجازی یاد بگیرند، چه تأثیری بر آینده بازیهای ویدیویی و رباتیک خواهند داشت؟