امروز، بخش گوگل DeepMind در خبر رسمی اعلام کرد که Gemini Robotics را راهاندازی کرده است تا هوش مصنوعی جمنای را به دنیای فیزیکی و رباتهای هدفدار بیاورد. این مدلهای جدید قادر به انجام «دامنهای گستردهتر از وظایف دنیای واقعی» هستند، بیشتر از هر زمان دیگری.
برای اینکه هوش مصنوعی در دنیای فیزیکی مفید و کمککننده باشد، باید توانایی «استدلال جسمانی» را نشان دهد، توانایی انسانمانند برای درک و واکنش به دنیای اطراف ما و همچنین اقدامات ایمنی برای انجام وظایف مختلف.
هدف این است که رباتهای عمومی ساخته شوند. ساندار پیچای، مدیرعامل گوگل، افزود که این شرکت همیشه رباتیک را «زمینهای مفید برای آزمایش ترجمه پیشرفتهای هوش مصنوعی به دنیای فیزیکی» درنظر گرفته است.
Gemini Robotics یک مدل Vision-Language-Action (VLA) است که بر پایه Gemini 2.0 ساخته شده و قابلیت جدید اعمال فیزیکی بهعنوان یک حالت خروجی برای کنترل مستقیم رباتها به آن اضافه شده است.
پیش از این، گوگل سه ویژگی اصلی برای مدلهای هوش مصنوعی رباتیک تعیین کرده بود:
گوگل همچنین مدل Gemini Robotics-ER (استدلال جسمانی) را معرفی کرده است که درک مکانی پیشرفتهتری از دنیا دارد و بهویژه بر استدلال مکانی تمرکز میکند. این مدل به متخصصان رباتیک اجازه میدهد آن را به کنترلکنندههای سطح پایین موجود خود متصل کنند.
بهعنوانمثال:
«هنگامی که یک فنجان قهوه به مدل نشان داده میشود، میتواند نوعی گرفتن مناسب با دو انگشت برای بلند کردن آن از دسته و یک مسیر ایمن برای نزدیک شدن به آن را تشخیص دهد.»
اجرا روی رباتهای مختلف
این مدلها روی انواع مختلف رباتها اجرا میشوند، ازجمله رباتهای دوبازو و رباتهای انساننما. شرکتهای معتبری مانند Agile Robots ،Agility Robotics ،Boston Dynamics و Enchanted Tools بهعنوان تستکنندگان اعتمادشده درحال استفاده از این فناوری هستند.
سخن پایانی
Gemini Robotics نشاندهنده گامی بزرگ در ترکیب هوش مصنوعی و رباتیک است. این مدلها با ترکیب درک دنیای فیزیکی، تعاملپذیری و مهارت دستی، قادر به انجام وظایف پیچیده در دنیای واقعی هستند. این پیشرفت میتواند به توسعه رباتهای عمومی کمک کند که در زندگی روزمره مفید و کاربردی باشند.
دیدگاه شما درباره ورود هوش مصنوعی در دنیای واقعی و ساخت رباتهایی با قابلیت درک از محیط اطراف چیست؟