BTC$29880

ETH$3666

Шукати

Дослідники Шанхайського університету представили набір даних, що містить 110 тис. послідовностей

Дослідники з Шанхайського університету Цзяо Тун вирішують проблеми роботизованих маніпуляцій, впроваджуючи новітній підхід до збору даних за допомогою датчиків сили і обертового моменту та тактильних пристроїв. Сфера роботизованих маніпуляцій досягла прогресу у виконанні простих завдань, таких як маніпулювання об’єктами, але стикається з перешкодами у більш складних сценаріях. Ключовими проблемами є дефіцит різноманітних наборів даних і залежність від візуальних вказівок. Щоб вирішити ці проблеми, дослідники створили набір даних, що містить понад 110 000 послідовностей маніпуляцій роботів, які охоплюють різні навички, сценарії, роботів і кути зйомки, а також візуальні, силові, аудіо- і відеодані та дані про дії.

Огляд набору даних RH20T. Використано декілька роботів і налаштовано різноманітні середовища для збору даних. Епізоди маніпуляцій роботів включають мультимодальні візуальні, силові, звукові дані та дані про дії. Для кожного епізоду було зібрано процес маніпуляції за допомогою добре відкаліброваних камер з декількома режимами огляду. Набір даних містить різноманітні навички роботизованих маніпуляцій, і кожен епізод має відповідну демонстрацію людиною та мовний опис. Загалом було надано понад 110 тис. епізодів з роботами та 110 тис. відповідних демонстрацій людиною. Набір даних містить понад 50 мільйонів кадрів і понад 140 завдань. Джерело

Дослідження зосереджене на використанні одноразового імітаційного навчання та базових робототехнічних моделей для оснащення роботів різноманітними та адаптивними навичками для виконання завдань у відкритих областях. Незважаючи на те, що поточні зусилля в основному зосереджені на виконанні простих завдань, керованих візуальними підказками, потенціал для більш складних навичок, що включають як візуальне, так і тактильне сприйняття, залишається невивченим.

Дослідники підкреслюють важливість інтуїтивної телеоперації для уникнення зіткнень і безпечного створення значних потужностей. Вони демонструють, як їхній набір даних покращує переносимість базової моделі в рамках навчання за допомогою декількох пострілів. Попереднє навчання моделі з використанням даних набору даних значно підвищує рівень успішності, а включення даних з різних завдань під час попереднього навчання ще більше підвищує загальну продуктивність і прискорює збіжність моделі. Набір даних виявляється цінним у навчанні з кількох спроб, оскільки попередньо навчені моделі постійно перевершують своїх непідготовлених аналогів, навіть за меншої кількості демонстрацій.

Таким чином, отриманий дослідниками набір даних є цінним ресурсом для навчання різноманітним навичкам робототехніки, зокрема, роботизованим маніпуляціям в нових умовах. Він пропонує багаті на контакти послідовності маніпуляцій роботів з різними навичками, контекстами, роботами і точками зору камер, з інформацією про мультимодальне сприйняття. Визнаючи обмеження, вони надали відкритий доступ до набору даних, щоб сприяти співпраці і прогресу в цій галузі, і планують розширити його, щоб охопити ширший спектр завдань роботизованої маніпуляції.