03.10.2023 16:25
Дослідники Шанхайського університету представили набір даних, що містить 110 тис. послідовностей
Дослідники з Шанхайського університету Цзяо Тун вирішують проблеми роботизованих маніпуляцій, впроваджуючи новітній підхід до збору даних за допомогою датчиків сили і обертового моменту та тактильних пристроїв. Сфера роботизованих маніпуляцій досягла прогресу у виконанні простих завдань, таких як маніпулювання об’єктами, але стикається з перешкодами у більш складних сценаріях. Ключовими проблемами є дефіцит різноманітних наборів даних і залежність від візуальних вказівок. Щоб вирішити ці проблеми, дослідники створили набір даних, що містить понад 110 000 послідовностей маніпуляцій роботів, які охоплюють різні навички, сценарії, роботів і кути зйомки, а також візуальні, силові, аудіо- і відеодані та дані про дії.
Дослідження зосереджене на використанні одноразового імітаційного навчання та базових робототехнічних моделей для оснащення роботів різноманітними та адаптивними навичками для виконання завдань у відкритих областях. Незважаючи на те, що поточні зусилля в основному зосереджені на виконанні простих завдань, керованих візуальними підказками, потенціал для більш складних навичок, що включають як візуальне, так і тактильне сприйняття, залишається невивченим.
Дослідники підкреслюють важливість інтуїтивної телеоперації для уникнення зіткнень і безпечного створення значних потужностей. Вони демонструють, як їхній набір даних покращує переносимість базової моделі в рамках навчання за допомогою декількох пострілів. Попереднє навчання моделі з використанням даних набору даних значно підвищує рівень успішності, а включення даних з різних завдань під час попереднього навчання ще більше підвищує загальну продуктивність і прискорює збіжність моделі. Набір даних виявляється цінним у навчанні з кількох спроб, оскільки попередньо навчені моделі постійно перевершують своїх непідготовлених аналогів, навіть за меншої кількості демонстрацій.
Таким чином, отриманий дослідниками набір даних є цінним ресурсом для навчання різноманітним навичкам робототехніки, зокрема, роботизованим маніпуляціям в нових умовах. Він пропонує багаті на контакти послідовності маніпуляцій роботів з різними навичками, контекстами, роботами і точками зору камер, з інформацією про мультимодальне сприйняття. Визнаючи обмеження, вони надали відкритий доступ до набору даних, щоб сприяти співпраці і прогресу в цій галузі, і планують розширити його, щоб охопити ширший спектр завдань роботизованої маніпуляції.