یادگیری ماشینی کار ربات ها را در قلمرو ناآشنا تضمین می کند – ScienceDaily


یک پهپاد کوچک یک پرواز آزمایشی را از طریق فضایی پر از استوانه های مقوایی به طور تصادفی قرار داده و نقش درختان ، افراد یا سازه ها را دارد. الگوریتم کنترل هواپیماهای بدون سرنشین در هزاران دوره با مانع شبیه سازی شده آموزش دیده است ، اما هرگز چنین موردی را ندیده است. و با این حال ، از هر 10 بار 9 بار ، یک هواپیما به اندازه یک پیمانه از همه موانع موجود در مسیر خود جلوگیری می کند.

این آزمایش زمین آزمایش یک چالش اساسی در رباتیک مدرن است: توانایی اطمینان از ایمنی و موفقیت ربات های خودکار که در محیط های جدید کار می کنند. در حالی که مهندسان به طور فزاینده ای به روش های یادگیری ماشین برای تولید ربات های سازگار روی می آورند ، کار جدید محققان دانشگاه پرینستون در زمینه انواع گمانه های ربات در زمینه انواع موانع و محدودیت ها پیشرفت می کند.

وی گفت: “طی دهه گذشته یا حدود این ، میزان زیادی هیجان و پیشرفت در مورد یادگیری ماشین در زمینه رباتیک وجود داشته است ، عمدتا به این دلیل که به شما امکان می دهد از ورودی های حسگر غنی مانند ورودی های یک دوربین ربات استفاده کرده و این ورودی های پیچیده عمل را ترسیم کنید.” آنیرودا مجومدار ، استادیار مهندسی مکانیک و فضا در پرینستون.

با این حال ، الگوریتم های کنترل ربات مبتنی بر ماشین خطر هدایت شدن به داده های آموزشی آنها را دارند ، که ممکن است باعث شود الگوریتم ها هنگام ورود به ورودی های غیر از مواردی که در آنها آموزش دیده اند ، کارایی کمتری داشته باشند. آزمایشگاه حرکت هوشمند Majumdar با گسترش طیف وسیعی از ابزارهای موجود برای آموزش سیاست های کنترل ربات و کمی سازی موفقیت و ایمنی احتمالی ربات هایی که در محیط های جدید کار می کنند ، با این چالش مقابله کرد.

در سه مقاله جدید ، محققان در حال تطبیق چارچوب های یادگیری ماشین از سایر عرصه ها با زمینه حرکت و دستکاری ربات ها هستند. آنها به تئوری تعمیم روی آوردند ، که معمولاً در زمینه هایی که یک ورودی را به یک خروجی تبدیل می کنند ، مانند برچسب گذاری خودکار تصویر ، استفاده می شود. روش های جدید از اولین روش هایی است که نظریه تعمیم را برای کار پیچیده تر ، اطمینان از عملکرد ربات ها در تنظیمات ناآشنا اعمال می کند. مجومدار گفت ، در حالی كه سایر رویكردها چنین مفاهیمی را با فرضیات محدودتر ارائه می دهند ، اما روشهای این تیم ضمانت های كاملاً كارآمدتری را در محیط های جدید ارائه می دهند.

در کتاب اول ، اثبات اصل استفاده از چارچوب های یادگیری ماشین ، این تیم روش خود را در شبیه سازی های مربوط به حرکت یک وسیله نقلیه چرخدار در فضای پر از مانع و بازوی رباتیک که اشیا on را روی میز می گرفت ، آزمایش کرد. آنها همچنین با ارزیابی سرعت جلوگیری از مانع شدن هواپیمای بدون سرنشین کوچک بنام Parrot Swing (ترکیبی از کوادکوپتر و هواپیمای با بال ثابت) ، این فن را در حین پرواز در دالانی به طول 60 فوت که با سیلندرهای مقوایی پر شده بود ، تأیید کردند. موفقیت تضمین شده در سیاست کنترل هواپیماهای بدون سرنشین 88.4٪ بود و از 18 تلاش (90٪) از موانع جلوگیری کرد.

این اثر ، منتشر شده در 3 اکتبر در مجله بین المللی تحقیقات رباتیک، یکی از نویسندگان مجومدار است. الک فرید ، دانشجوی تحصیلات تکمیلی مهندسی مکانیک و فضا ؛ و Anoopkumar Sonar ، قطب علوم کامپیوتر در سال 2021 کلاس پرینستون.

فرید گفت ، هنگامی که شما از سایر زمینه ها روش های یادگیری ماشین را برای رباتیک استفاده می کنید ، “پیش فرض های زیادی وجود دارد که باید آنها را برآورده کنید ، و یکی از آنها می گوید محیطی که انتظار دارید ببینید چقدر با محیط سیاست شما مشابه است. آموزش دیده در ما علاوه بر نشان دادن اینكه می توانیم این كار را در یك محیط رباتیک انجام دهیم ، بر تلاش برای گسترش انواع محیط هایی كه می توانیم برای آنها تضمین كنیم تمركز كردیم. “

“انواع تضمین هایی که می توانیم ارائه دهیم ، از 80٪ تا 95٪ موفقیت در محیط های جدید متفاوت است ، بسته به وظیفه خاص ، اما اگر شما [an unmanned aerial vehicle] در یک محیط واقعی ، 95٪ احتمالاً به اندازه کافی خوب نیستند “، مجومدار گفت.” من این را یکی از بزرگترین چالش ها و آنچه ما به طور فعال در حال کار روی آن هستیم می بینم. “

هونگ کای دای ، محقق ارشد در انستیتوی تحقیقات تویوتا در لس آلتوس ، کالیفرنیا ، گفت ، با این حال ، رویکردهای تیم نشان دهنده پیشرفت های بسیار ضروری در زمینه تضمین تعمیم ربات هایی است که در محیط های نامرئی کار می کنند.

دای که در این مطالعه مشارکت نکرده است ، گفت: “این ضمانت ها برای کاربردهای بسیار مهم ایمنی مانند وسایل نقلیه خودران و هواپیماهای بدون سرنشین خودمختار از اهمیت بالایی برخوردار است.” “این ضمانت به ما می گوید که چقدر احتمال دارد یک سیاست هنوز هم در موارد بی سابقه نسبتاً خوب کار کند و بنابراین وقتی خطرات بازی بسیار زیاد است اعتماد به سیاست را افزایش می دهد.”

در دو مقاله دیگر که در 18 نوامبر در کنفرانس آموزش ربات های مجازی ارائه می شود ، محققان پیشرفت های بیشتری را برای نزدیک کردن سیاست های کنترل ربات به تضمین هایی که برای استقرار در دنیای واقعی لازم است ، کشف کردند. یک مقاله از آموزش شبیه سازی استفاده می کند ، که در آن یک “متخصص” با هدایت دستی یک ربات شبیه سازی شده برای برداشتن اشیا different مختلف یا حرکت از طریق موانع مختلف ، داده های آموزشی را به فرد می دهد. این رویکرد می تواند موفقیت سیاستهای مدیریت مبتنی بر یادگیری ماشین را افزایش دهد.

برای تهیه داده های آموزشی ، نویسنده ارشد ، آلن رن ، دانشجوی مهندسی مکانیک و فضا ، با استفاده از یک ماوس سه بعدی کامپیوتر ، یک بازوی رباتیک شبیه سازی شده را کنترل می کند که با لیوان های نوشیدن در اندازه ها ، شکل ها و مواد مختلف بارگیری می شود. از دیگر آزمایش های آموزش تقلید می توان به فشار دادن دست جعبه به آن طرف میز و شبیه سازی یک ربات چرخدار اشاره کرد که در محیطی شبیه خانه در اطراف مبلمان حرکت می کند.

محققان سیاست هایی را آموخته اند که از کار گرفتن لیوان و فشار دادن یک جعبه به بازوی رباتیک در آزمایشگاه گرفته شده است ، که با گرفتن رینگ های خود در میان دو انگشت آن ، 25 لیوان مختلف را می تواند از بین ببرد – بدون اینکه دسته را به عنوان یکی از دستان خود نگه دارد. در مثال فشار دادن این سیاست ، 93٪ موفقیت در کارهای ساده تر و 80٪ در کارهای دشوارتر به دست آورد.

رن گفت: “ما در بالای میز دوربینی داریم که محیط را می بیند و در هر ثانیه پنج بار عکس می گیرد.” “شبیه سازی آموزش سیاست ما این تصویر را نشان می دهد و نشان می دهد که ربات چه نوع عملی را باید انجام دهد ، و سپس ما یک کنترل کننده داریم که بازو را بر اساس خروجی مدل به مکان های مورد نظر منتقل می کند.”

مقاله سوم توسعه برنامه ریزان مبتنی بر دید را نشان می دهد که تضمین هایی را برای پرواز یا راه رفتن روبات برای انجام توالی های برنامه ریزی شده حرکات در محیط های مختلف ارائه می دهد. تولید سیاست های کنترل حرکات برنامه ریزی شده منجر به مسئله ای در مقیاس جدید شده است – نیاز به بهینه سازی سیاست های مبتنی بر دید در هزاران و نه صدها بعد.

نویسنده ارشد سوشانت ویر ، دانشجوی فوق دکترا در مهندسی مکانیک و فضا گفت: “این مستلزم ابداع برخی ابزارهای الگوریتمی جدید برای مقابله با این بعد و هنوز تضمین های محکم برای تعمیم است.”

یک جنبه اصلی استراتژی Veer استفاده از بدوی های حرکتی بود ، که در آن سیاست ربات را به سمت راست رفتن یا چرخش هدایت می کند ، به عنوان مثال ، به جای تعیین گشتاور یا سرعت برای هر حرکت. مجومدار گفت ، محدود کردن فضا از اقدامات احتمالی ، فرایند برنامه ریزی را از نظر محاسباتی عملی تر می کند.

Veer و Majumdar شبیه سازهای شبیه ساز مبتنی بر دید یک وسیله نقلیه هوایی بدون سرنشین و یک ربات چهار پا را که از زمین های ناهموار با شیب تا 35 درجه عبور می کند ارزیابی کردند – “یک مشکل بسیار چالش برانگیز که بسیاری از افراد در رباتیک هنوز در تلاشند حل کردن ، “Veer گفت.

در این مطالعه ، ربات دارای پا 80٪ موفقیت در محیط های آزمایش نامرئی کسب کرد. محققان در تلاشند تا بیشتر تضمین های سیاست های خود را بهبود بخشند ، و همچنین ارزیابی اثربخشی سیاست ها برای ربات های واقعی در آزمایشگاه را انجام می دهند.

این کار تا حدی توسط سرویس تحقیقات دریایی ایالات متحده ، بنیاد ملی علوم ، جایزه تحقیقات گوگل و جایزه تحقیقات آمازون پشتیبانی شد.


منبع: khabar-erfan.ir

دیدگاهتان را بنویسید

Comment
Name*
Mail*
Website*