در عصر دانایی با دانا خبر      دانایی؛ توانایی است      دانا خبر گزارشگر هر تحول علمی در ایران و جهان      دانایی کلید موفقیت در هزاره سوم      
کد خبر: ۱۲۹۹۸۷۴
تاریخ انتشار: ۰۵ شهريور ۱۴۰۱ - ۱۸:۲۵
پژوهشگران آمریکایی در بررسی جدیدی نشان داده‌اند که یک سگ رباتیک با کمک نوعی الگوریتم یادگیری ماشینی می‌تواند راه رفتن را طی ۲۰ دقیقه یاد بگیرد.

به گزارش پایگاه خبری دانا و به نقل از نیو ساینتیست، به لطف الگوریتم یادگیری ماشینی، یک سگ رباتیک می‌تواند راه رفتن در زمین‌های ناآشنایی مانند چمن و مسیرهای پیاده‌روی را یاد بگیرد.

بیشتر ربات‌های خودکار باید به ‌دقت توسط انسان‌ها برنامه‌ریزی شوند یا در شرایط شبیه‌سازی‌شده، به طور گسترده آزمایش شوند تا بتوانند کارهای دنیای واقعی از جمله راه رفتن روی یک تپه سنگی یا یک شیب لغزنده را انجام دهند و زمانی که با محیط‌های ناآشنا روبه‌رو می‌شوند، به کشمکش با آنها می‌پردازند.

"سرگی لوین"(Sergey Levine)، پژوهشگر "دانشگاه کالیفرنیا، برکلی"(UC Berkeley) و همکارانش نشان داده‌اند که ربات با استفاده از نوعی یادگیری ماشینی به نام یادگیری تقویتی عمیق می‌تواند نحوه راه رفتن را طی حدود ۲۰ دقیقه در چندین محیط مختلف مانند چمن‌زار و مسیر پیاده‌روی یاد بگیرد.

لوین گفت: این ربات از الگوریتمی به نام "یادگیری Q" (Q-learning) استفاده می‌کند که به ارائه یک مدل از زمین مورد نظر نیازی ندارد. این الگوریتم‌های یادگیری ماشینی معمولا در شبیه‌سازی استفاده می‌شوند. ما نیازی به درک چگونگی عملکرد فیزیک یک محیط نداریم زیرا فقط ربات را در یک محیط قرار می‌دهیم و آن را روشن می‌کنیم.

ربات به ازای هر عملی که انجام می‌دهد، بسته به میزان موفقیت آن براساس اهداف از پیش تعریف‌ شده، پاداش مشخصی را دریافت می‌کند. ربات، این روند را به طور مداوم تکرار می‌کند تا زمانی که راه رفتن را یاد بگیرد.

"ایلیا کوستریکوف"(Ilya Kostrikov)، از پژوهشگران این پروژه گفت: این کار از یک جهت، بسیار شبیه به نحوه یادگیری انسان‌ها است. انسان‌ها با برخی از محیط‌ها تعامل دارند، برخی از مزایا را دریافت می‌کنند و اساسا فقط به تجربه گذشته خود فکر می‌کنند و سعی دارند بفهمند که شرایط را چگونه می‌توان بهبود بخشید.

اگرچه ربات می‌تواند راه رفتن روی هر سطح جدیدی را که با آن روبه‌رو می‌شود، یاد بگیرد اما لوین گفت که اگر ربات قرار باشد که مهارت‌های دیگری را بیاموزد، گروه باید سیستم پاداش را تنظیم کنند.

"کریس واتکینز"(Chris Watkins)، پژوهشگر "دانشگاه لندن"(UoL) گفت: روش یادگیری تقویتی عمیق در دنیای واقعی، کار سختی است زیرا متغیرها و داده‌های مختلفی باید به طور همزمان در تعامل باشند.

وی افزود: من فکر می‌کنم که این کار بسیار تأثیرگذاری است؛ اگرچه کمی متعجبم که می‌توان از روشی به سادگی یادگیری Q برای یادگیری مهارت‌هایی مانند راه رفتن روی سطوح مختلف با تجربه کم و به سرعت استفاده کرد.

انتهای پیام

ارسال نظر