سیستم کنترل ربات مبتنی بر ترانسفورماتور UC Berkeley به محیط های نادیده تعمیم می یابد

آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.


محققان در دانشگاه کالیفرنیا، برکلیa ایجاد کرده اند سیستم کنترل همه کاره برای ربات‌های انسان‌نما که بتوانند به طرز ماهرانه‌ای در انواع زمین‌ها و موانع حرکت کنند. الهام گرفتن از چارچوب های یادگیری عمیق که مدل های زبان بزرگ (LLM) را متحول کرد هوش مصنوعی سیستم مبتنی بر یک اصل ساده است: مطالعه مشاهدات اخیر می تواند به پیش بینی وضعیت ها و اقدامات آینده کمک کند.

این سیستم به طور کامل در شبیه سازی آموزش دیده بود اما عملکرد قوی را در تنظیمات غیرقابل پیش بینی در دنیای واقعی نشان می دهد. هوش مصنوعی با تجزیه و تحلیل تعاملات گذشته خود به صورت پویا رفتار خود را برای مقابله موثر با سناریوهای جدیدی که هرگز در مرحله آموزش با آن مواجه نشده بود، اصلاح می کند.

یک ربات برای تمام زمین ها

روبات‌های انسان‌نما که به شکل ما طراحی شده‌اند، این نوید را دارند که روزی به دستیاران ارزشمندی تبدیل می‌شوند که قادر به حرکت در جهان و کمک به کارهای مختلف فیزیکی و شناختی هستند. با این حال، ایجاد ربات های انسان نما همه کاره چالش های زیادی از جمله ایجاد یک سیستم کنترل انعطاف پذیر دارد.

سیستم‌های کنترل سنتی در رباتیک بسیار غیرقابل انعطاف بوده و اغلب برای کارهای خاص طراحی شده‌اند و قادر به مقابله با غیرقابل پیش‌بینی بودن زمین‌های دنیای واقعی و شرایط بصری نیستند. این سفتی کاربرد آنها را محدود می کند و آنها را به محیط های کنترل شده محدود می کند.

رویداد VB

تور AI Impact Tour

در تور AI Impact VentureBeat که به شهر نزدیک شما می آید، با جامعه هوش مصنوعی سازمانی ارتباط برقرار کنید!

بیشتر بدانید

در نتیجه، علاقه فزاینده ای به روش های مبتنی بر یادگیری برای کنترل رباتیک وجود دارد. این سیستم های کنترلی می توانند به صورت پویا رفتار خود را بر اساس داده های به دست آمده از شبیه سازی ها یا تعامل مستقیم با محیط تطبیق دهند.

سیستم کنترل جدید ایجاد شده توسط دانشمندان دانشگاه کالیفرنیا برکلی نوید این را می دهد که ربات های انسان نما را در موقعیت های مختلف به راحتی هدایت کند. این سیستم که روی Digit، یک ربات انسان‌نما با اندازه کامل و همه منظوره مستقر شده است، قابلیت‌های قابل‌توجهی در راه رفتن در فضای باز را نشان می‌دهد و به طور قابل اعتماد در محیط‌های روزمره انسان مانند پیاده‌روها، پیاده‌روها، مسیرهای دویدن و زمین‌های باز حرکت می‌کند. قابلیت انطباق این ربات به جابجایی زمین های مختلف از جمله بتن، لاستیک و چمن بدون سقوط گسترش می یابد.

محققان نوشتند: «ما دریافتیم که کنترل‌کننده ما می‌تواند به‌طور قابل‌اعتماد روی تمام مناطق آزمایش‌شده راه برود و به راحتی آن را بدون زیرانداز ایمنی به کار می‌برد.» در واقع، در طول یک هفته آزمایش تمام روز در محیط‌های باز، هیچ سقوطی مشاهده نکردیم.»

علاوه بر این، انعطاف پذیری ربات در برابر اختلالات به طور کامل آزمایش شده است. این می تواند با موفقیت مراحل غیرمنتظره، اشیاء تصادفی در مسیر خود و حتی اشیایی که در جهت آن پرتاب می شوند را مدیریت کند. ربات همچنین در برابر فشار و کشیده شدن مقاومت می کند و وضعیت و ثبات خود را در برابر چنین اختلالاتی حفظ می کند.

کنترل ربات با ترانسفورماتور

در حالی که چندین ربات انسان نما وجود دارند که قادر به انجام کارهای خیره کننده هستند، جنبه جالب این سیستم جدید، فرآیند آموزش و به کارگیری مدل هوش مصنوعی است.

مدل کنترلی صرفاً در شبیه‌سازی هزاران دامنه و ده‌ها میلیارد سناریو در Isaac Gym، یک محیط شبیه‌سازی فیزیک مبتنی بر GPU با کارایی بالا، آموزش دید. این تجربه شبیه سازی شده گسترده سپس بدون نیاز به تنظیم دقیق بیشتر به دنیای واقعی منتقل شد، فرآیندی که به عنوان انتقال سیم به واقعی شناخته می شود. به طور قابل توجهی، این سیستم توانایی های اضطراری را در طول عملیات در دنیای واقعی نشان داد، سناریوهای پیچیده ای مانند مراحل ناوبری را که به صراحت در طول آموزش پوشش داده نشده بود، مدیریت می کرد.

در قلب این سیستم یک “ترانسفورماتور علّی” قرار دارد، یک مدل یادگیری عمیق که تاریخچه مشاهدات و اعمال حس عمقی را پردازش می کند. این ترانسفورماتور در تشخیص ارتباط اطلاعات خاص، مانند الگوهای راه رفتن و حالت های تماس، با مشاهدات ربات برتری دارد.

ترانسفورماتورها که به دلیل کارایی خود در مدل های زبانی بزرگ شناخته شده اند، دارای توانایی ذاتی برای پیش بینی عناصر بعدی در توالی داده های گسترده هستند. ترانسفورماتور علّی به کار رفته در اینجا در یادگیری از توالی مشاهدات و اقدامات ماهر است، و آن را قادر می سازد پیامدهای اعمال را با دقت بالا پیش بینی کند و رفتار خود را برای دستیابی به حالت های آینده مطلوب تر تغییر دهد. به این ترتیب می تواند به صورت پویا اقدامات خود را بر اساس چشم انداز تنظیم کند، حتی اگر قبلاً با آن مواجه نشده باشد.

محققان می نویسند: “ما فرض می کنیم که تاریخچه مشاهدات و اقدامات به طور ضمنی اطلاعات مربوط به جهان را رمزگذاری می کند که یک مدل ترانسفورماتور قدرتمند می تواند از آن برای تطبیق رفتار خود به صورت پویا در زمان آزمایش استفاده کند.”

این مفهوم، که آن‌ها از آن به عنوان «انطباق درون متنی» یاد می‌کنند، نشان می‌دهد که چگونه مدل‌های زبانی از زمینه تعاملات خود برای یادگیری کارهای جدید در پرواز استفاده می‌کنند و به صورت پویا خروجی‌های خود را در طول استنتاج اصلاح می‌کنند.

ثابت شده است که ترانسفورماتورها در مقایسه با سایر مدل‌های متوالی مانند شبکه‌های کانولوشنال زمانی (TCN) و شبکه‌های حافظه کوتاه‌مدت بلندمدت (LSTM) فراگیران برتری هستند. معماری آن‌ها امکان مقیاس‌گذاری با داده‌های اضافی و قدرت محاسباتی را فراهم می‌کند و می‌توان آن‌ها را از طریق ادغام روش‌های ورودی اضافی افزایش داد.

در سال گذشته، ترانسفورماتورها به یک دارایی مهم برای جامعه رباتیک تبدیل شده‌اند، زیرا چندین مدل از تطبیق پذیری آنها برای تقویت ربات‌ها در ظرفیت‌های مختلف استفاده می‌کنند. مزایای ترانسفورماتورها شامل بهبود کدگذاری و اختلاط روش‌های مختلف و همچنین ترجمه دستورالعمل‌های زبان طبیعی سطح بالا به مراحل برنامه‌ریزی خاص برای روبات‌ها است.

محققان نتیجه می‌گیرند: «مقایسه با زمینه‌هایی مانند بینایی و زبان، ما معتقدیم که ترانسفورماتورها ممکن است پیشرفت آینده ما را در مقیاس‌بندی رویکردهای یادگیری برای حرکت انسان‌نما در دنیای واقعی تسهیل کنند».

ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.


منبع: https://venturebeat.com/ai/uc-berkeleys-transformer-based-robot-control-system-generalizes-to-unseen-environments/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *