آیا آماده اید تا آگاهی بیشتری را به برند خود بیاورید؟ در نظر بگیرید که برای تور AI Impact Tour اسپانسر شوید. درباره فرصت ها بیشتر بدانید اینجا.
محققان در دانشگاه کالیفرنیا، برکلیa ایجاد کرده اند سیستم کنترل همه کاره برای رباتهای انساننما که بتوانند به طرز ماهرانهای در انواع زمینها و موانع حرکت کنند. الهام گرفتن از چارچوب های یادگیری عمیق که مدل های زبان بزرگ (LLM) را متحول کرد هوش مصنوعی سیستم مبتنی بر یک اصل ساده است: مطالعه مشاهدات اخیر می تواند به پیش بینی وضعیت ها و اقدامات آینده کمک کند.
این سیستم به طور کامل در شبیه سازی آموزش دیده بود اما عملکرد قوی را در تنظیمات غیرقابل پیش بینی در دنیای واقعی نشان می دهد. هوش مصنوعی با تجزیه و تحلیل تعاملات گذشته خود به صورت پویا رفتار خود را برای مقابله موثر با سناریوهای جدیدی که هرگز در مرحله آموزش با آن مواجه نشده بود، اصلاح می کند.
یک ربات برای تمام زمین ها
روباتهای انساننما که به شکل ما طراحی شدهاند، این نوید را دارند که روزی به دستیاران ارزشمندی تبدیل میشوند که قادر به حرکت در جهان و کمک به کارهای مختلف فیزیکی و شناختی هستند. با این حال، ایجاد ربات های انسان نما همه کاره چالش های زیادی از جمله ایجاد یک سیستم کنترل انعطاف پذیر دارد.
سیستمهای کنترل سنتی در رباتیک بسیار غیرقابل انعطاف بوده و اغلب برای کارهای خاص طراحی شدهاند و قادر به مقابله با غیرقابل پیشبینی بودن زمینهای دنیای واقعی و شرایط بصری نیستند. این سفتی کاربرد آنها را محدود می کند و آنها را به محیط های کنترل شده محدود می کند.
در نتیجه، علاقه فزاینده ای به روش های مبتنی بر یادگیری برای کنترل رباتیک وجود دارد. این سیستم های کنترلی می توانند به صورت پویا رفتار خود را بر اساس داده های به دست آمده از شبیه سازی ها یا تعامل مستقیم با محیط تطبیق دهند.
سیستم کنترل جدید ایجاد شده توسط دانشمندان دانشگاه کالیفرنیا برکلی نوید این را می دهد که ربات های انسان نما را در موقعیت های مختلف به راحتی هدایت کند. این سیستم که روی Digit، یک ربات انساننما با اندازه کامل و همه منظوره مستقر شده است، قابلیتهای قابلتوجهی در راه رفتن در فضای باز را نشان میدهد و به طور قابل اعتماد در محیطهای روزمره انسان مانند پیادهروها، پیادهروها، مسیرهای دویدن و زمینهای باز حرکت میکند. قابلیت انطباق این ربات به جابجایی زمین های مختلف از جمله بتن، لاستیک و چمن بدون سقوط گسترش می یابد.
محققان نوشتند: «ما دریافتیم که کنترلکننده ما میتواند بهطور قابلاعتماد روی تمام مناطق آزمایششده راه برود و به راحتی آن را بدون زیرانداز ایمنی به کار میبرد.» در واقع، در طول یک هفته آزمایش تمام روز در محیطهای باز، هیچ سقوطی مشاهده نکردیم.»
علاوه بر این، انعطاف پذیری ربات در برابر اختلالات به طور کامل آزمایش شده است. این می تواند با موفقیت مراحل غیرمنتظره، اشیاء تصادفی در مسیر خود و حتی اشیایی که در جهت آن پرتاب می شوند را مدیریت کند. ربات همچنین در برابر فشار و کشیده شدن مقاومت می کند و وضعیت و ثبات خود را در برابر چنین اختلالاتی حفظ می کند.
کنترل ربات با ترانسفورماتور
در حالی که چندین ربات انسان نما وجود دارند که قادر به انجام کارهای خیره کننده هستند، جنبه جالب این سیستم جدید، فرآیند آموزش و به کارگیری مدل هوش مصنوعی است.
مدل کنترلی صرفاً در شبیهسازی هزاران دامنه و دهها میلیارد سناریو در Isaac Gym، یک محیط شبیهسازی فیزیک مبتنی بر GPU با کارایی بالا، آموزش دید. این تجربه شبیه سازی شده گسترده سپس بدون نیاز به تنظیم دقیق بیشتر به دنیای واقعی منتقل شد، فرآیندی که به عنوان انتقال سیم به واقعی شناخته می شود. به طور قابل توجهی، این سیستم توانایی های اضطراری را در طول عملیات در دنیای واقعی نشان داد، سناریوهای پیچیده ای مانند مراحل ناوبری را که به صراحت در طول آموزش پوشش داده نشده بود، مدیریت می کرد.
در قلب این سیستم یک “ترانسفورماتور علّی” قرار دارد، یک مدل یادگیری عمیق که تاریخچه مشاهدات و اعمال حس عمقی را پردازش می کند. این ترانسفورماتور در تشخیص ارتباط اطلاعات خاص، مانند الگوهای راه رفتن و حالت های تماس، با مشاهدات ربات برتری دارد.
ترانسفورماتورها که به دلیل کارایی خود در مدل های زبانی بزرگ شناخته شده اند، دارای توانایی ذاتی برای پیش بینی عناصر بعدی در توالی داده های گسترده هستند. ترانسفورماتور علّی به کار رفته در اینجا در یادگیری از توالی مشاهدات و اقدامات ماهر است، و آن را قادر می سازد پیامدهای اعمال را با دقت بالا پیش بینی کند و رفتار خود را برای دستیابی به حالت های آینده مطلوب تر تغییر دهد. به این ترتیب می تواند به صورت پویا اقدامات خود را بر اساس چشم انداز تنظیم کند، حتی اگر قبلاً با آن مواجه نشده باشد.
محققان می نویسند: “ما فرض می کنیم که تاریخچه مشاهدات و اقدامات به طور ضمنی اطلاعات مربوط به جهان را رمزگذاری می کند که یک مدل ترانسفورماتور قدرتمند می تواند از آن برای تطبیق رفتار خود به صورت پویا در زمان آزمایش استفاده کند.”
این مفهوم، که آنها از آن به عنوان «انطباق درون متنی» یاد میکنند، نشان میدهد که چگونه مدلهای زبانی از زمینه تعاملات خود برای یادگیری کارهای جدید در پرواز استفاده میکنند و به صورت پویا خروجیهای خود را در طول استنتاج اصلاح میکنند.
ثابت شده است که ترانسفورماتورها در مقایسه با سایر مدلهای متوالی مانند شبکههای کانولوشنال زمانی (TCN) و شبکههای حافظه کوتاهمدت بلندمدت (LSTM) فراگیران برتری هستند. معماری آنها امکان مقیاسگذاری با دادههای اضافی و قدرت محاسباتی را فراهم میکند و میتوان آنها را از طریق ادغام روشهای ورودی اضافی افزایش داد.
در سال گذشته، ترانسفورماتورها به یک دارایی مهم برای جامعه رباتیک تبدیل شدهاند، زیرا چندین مدل از تطبیق پذیری آنها برای تقویت رباتها در ظرفیتهای مختلف استفاده میکنند. مزایای ترانسفورماتورها شامل بهبود کدگذاری و اختلاط روشهای مختلف و همچنین ترجمه دستورالعملهای زبان طبیعی سطح بالا به مراحل برنامهریزی خاص برای روباتها است.
محققان نتیجه میگیرند: «مقایسه با زمینههایی مانند بینایی و زبان، ما معتقدیم که ترانسفورماتورها ممکن است پیشرفت آینده ما را در مقیاسبندی رویکردهای یادگیری برای حرکت انساننما در دنیای واقعی تسهیل کنند».
ماموریت VentureBeat این است که یک میدان شهر دیجیتال برای تصمیم گیرندگان فنی باشد تا دانشی در مورد فناوری سازمانی متحول کننده کسب کنند و معامله کنند. جلسات توجیهی ما را کشف کنید.
منبع: https://venturebeat.com/ai/uc-berkeleys-transformer-based-robot-control-system-generalizes-to-unseen-environments/