مدل RT2

آموزش ربات‌های گوگل توسط مدل RT2 هوش مصنوعی

سرفصل‌های مقاله

گوگل می‌خواهد ربات‌های خود را با عرضه مدل یادگیری هوش مصنوعی Robotic Transformer (RT2) هوشمندتر کند.

RT2 نسخه جدیدی از چیزی است که این شرکت آن را «مدل بینایی زبان-عمل (VLA)» می‌نامد. این مدل به ربات‌ها می‌آموزد که الگوهای بصری و زبانی را بهتر تشخیص داده تا دستورالعمل‌ها را تفسیر، و استنباط کنند که برای اجرای بهتر یک درخواست، از چه اشیایی باید استفاده کرد.

محققان RT2 را با یک بازوی رباتیک در یک محیط اداری آشپزخانه آزمایش کردند و از بازوی رباتیک آن خواستند تا تصمیم بگیرد که از چه وسیله‌ای به عنوان چکش استفاده کند (وسیله مورد نظر آن‌ها یک سنگ بود) و بعد برای یک فرد خسته، یک نوشیدنی مناسب انتخاب کند (نوشیدنی انرژی‌زای ردبول).

ربات در هر دو آزمایش بهترین تصمیم ممکن را گرفت.

آموزش ربات‌های گوگل توسط مدل RT2

 ربات‌های گوگل
آموزش ربات‌های گوگل توسط مدل RT2

گوگل در مقاله‌ای اعلام کرده که مدل جدید، بر روی داده‌های وب و رباتیک آموزش دیده است و از پیشرفت‌های تحقیقاتی مدل‌های زبان بزرگ، مانند هوش مصنوعی Google Bard و ترکیب آن با داده‌های رباتیک استفاده می‌کند. این ربات همچنین قادر است مسیرهای حرکتی خود را به زبان‌های غیرانگلیسی نیز درک کند.

در طول سال‌ها، محققان تلاش کرده‌اند تا ربات‌هایی بسازند که دارای قدرت استنباط بهتری باشد و بتواند در یک محیط واقعی، مسائل مختلف را حل کند. ربات‌ها برای انجام کارهای ساده برای انسان‌ها به آموزش بیشتری نیاز دارند.

به عنوان مثال وقتی یک لیوان نوشابه روی میز چپه می‌شود، انسان‌ها به طور غریزی می‌دانند چه باید بکنند: لیوان را بردارند، با یک پارچه محل را تمیز کنند، پارچه را بشورند و دفعه بعدی بیشتر مراقب حرکات‌شان باشند.

پیش از این، آموزش یک ربات زمان زیادی می برد. پژوهش‌گران مجبور بودند به طور جداگانه جهت‌های مختلف را برای یک ربات برنامه‌ریزی کنند. اما با قدرت مدل‌های VLA مثل RT2، حالا ربات‌ها می‌توانند به مجموعه بزرگ‌تری از اطلاعات برای آموزش دیدن و پی بردن به حرکات بعدی‌شان دسترسی پیدا کنند.

اولین تلاش گوگل برای ساخت ربات‌های هوشمندتر سال گذشته آغاز شد، زمانی که این شرکت اعلام کرد از فناوری LLM PalM خود در رباتیک استفاده و سیستمی به نام PaLM-SayCan را ایجاد می‌کند تا LLM (مدل زبانی بزرگ) را با رباتیک فیزیکی ادغام کند.

ربات جدید گوگل هنوز کامل نیست. نیویورک تایمز یک نسخه نمایشی زنده از این ربات را دید و گزارش داد که طعم‌های نوشابه را به اشتباه شناسایی کرده و رنگ تمام میوه‌ها را سفید تشخیص داده است.

به نظر می‌رسد پیشرفت قابل ملاحظه هوش مصنوعی در یک سال گذشته، روی آینده علم رباتیک هم تاثیرات شگفت‌انگیزی بگذارد و بشر به‌زودی شاهد ظهور ربات‌های هوشمندی باشد که پیش از این فقط در فیلم‌های علمی-تخیلی دیده بود!

دوست دارید یک ربات ترسیم کنید که در یک قهوه‌خانه سنتی مشغول سرو کردن چای برای مشتریان است؟ می‌توانید از دستیار هوش مصنوعی فارسی ZIGAP برای چت با هوش مصنوعی و تصویرسازی استفاده کنید.

نوید رضایی
نوید رضایی