مهندسان رباتهایی ساختهاند که میتوانند با تماشای ویدیوهایی از انسانها در حال انجام مهارتهای جدید، آن مهارتها را بیاموزند.
تیمی از دانشگاه کارنگی ملون (CMU) مدلی را ابداع کردند که به رباتها امکان میداد کارهای خانه از جمله باز کردن کشوها و برداشتن چاقوها را پس از تماشای ویدیویی از انجام این کارها، انجام دهند.
روش پل بصریــروباتیک (VRB) مستلزم وجود نظارت انسانی نیست و میتواند تنها ظرف ۲۵ دقیقه، به یادگیری مهارتهای جدید منجر شود. دیپاک پاتاک، استادیار موسسه رباتیک سیامیو، میگوید: «این ربات میتواند از طریق تماشای ویدیوها، مکان و چگونگی تعامل انسان با اشیای مختلف را یاد بگیرد.»
Read More
This section contains relevant reference points, placed in (Inner related node field)
«ما به کمک این اطلاعات میتوانیم مدلی را بسازیم که به دو ربات امکان میدهد در محیطهای مختلف، وظایف مشابهی را انجام دهند.»
مدل ویآربی به روبات امکان میدهد یاد بگیرد اعمال نشاندادهشده در ویدیو را چگونه انجام دهد؛ حتی اگر روی تنظیمات متفاوتی باشد.
این ربات این کار را با شناسایی نقاط تماســ از جمله دستگیره کشو یا دسته چاقوــ و با درک اینکه باید کدام حرکت را بکند تا کارش تکمیل شود، انجام میدهد.
شیکار باهل، دانشجوی دکترای رباتیک در سیامیو، گفت: «ما توانستیم رباتها را به محوطه دانشگاه ببریم و انواع کارها را انجام دهیم.»
رباتها میتوانند از این مدل برای اکتشاف کنجکاوانه در دنیای پیرامون خود استفاده کنند. یک ربات به جای اینکه فقط بازوهای خود را تکان دهد، میتواند با نحوه تعاملش کاربردیتر عمل کند.»
«این کار میتواند روباتها را قادر کند تا از حجم گسترده ویدیوهای اینترنت و یوتیوب بیاموزند.»
رباتیک اغلب با مشکل [منطقی فلسفی] اول مرغ بوده یا تخم مرغ مواجه است: هیچ داده ربات در سطح وب برای آموزش (برخلاف سیوی یا انالپی) رباتهای بی/سی هنوز به کار گرفته نشدهاند و بالعکس.
معرفی ویآربی: از ویدیوهای انسانی در سطح گسترده برای آموزش یک مدل *چندمنظوره* استفاده کنید تا هر الگوی رباتیکی را راه بیندازید!
— دیپاک پاتک (pathak2206@) ۱۳ ژوئن ۲۰۲۳
Robotics often faces a chicken and egg problem: no web-scale robot data for training (unlike CV or NLP) b/c robots aren't deployed yet & vice-versa.
— Deepak Pathak (@pathak2206) June 13, 2023
Introducing VRB: Use large-scale human videos to train a *general-purpose* affordance model to jumpstart any robotics paradigm! pic.twitter.com/csbvsfswuG
رباتهای شرکتکننده در این پژوهش طی ۲۰۰ ساعت آزمایش در دنیای واقعی، ۱۲ کار جدید را با موفقیت آموختند.
همه این کارها بهنسبت سرراست و ساده بودند؛ از جمله باز کردن قوطیها و برداشتن گوشی تلفن. پژوهشگران اینک قصد دارند سیستم ویآربی را توسعه دهند تا به رباتها امکان دهد کارهایی چندمرحلهای انجام دهند.
جزئیات این پژوهش در مقالهای با عنوان «ایجاد قابلیت از طریق ویدیوهای ساخت انسان به عنوان یک برنامه چندمنظوره برای رباتیک» شرح داده شده است که این ماه در نشست «میدان دید و تشخیص الگو» در ونکوور کانادا ارائه خواهد شد.
© The Independent