Учёные из Калифорнийского университета в Беркли разработали новую вычислительную структуру под названием RoVi-Aug, которая позволяет дополнять роботизированные данные и облегчает передачу навыков между различными роботами. Эта структура использует генеративные модели для дополнения данных изображений и создания синтезированных визуальных демонстраций задач с различными видами камер для разных роботов.
По словам группы разработчиков, которыми руководили исследователи Лоуренс Чен (Lawrence Chen) и Чэньфэн Сю (Chenfeng Xu), целью их работы было преодолеть ограничения существующих алгоритмов, которые не могут надёжно передавать навыки между роботами с разными корпусами и характеристиками. Они отметили, что многие существующие наборы данных для обучения роботов не сбалансированы и содержат неточности, которые могут привести к переобучению определённых типов роботов.
«Успех современных систем машинного обучения, в частности генеративных моделей, демонстрирует впечатляющую обобщаемость и мотивирует исследователей робототехники искать, как достичь аналогичной обобщаемости в робототехнике», — рассказали Чен и Сюй.
RoVi-Aug состоит из двух отдельных компонентов: модуля роботизированного дополнения (Ro-Aug) и модуля дополнения точки обзора (Vi-Aug). Первый компонент синтезирует демонстрационные данные с участием различных роботизированных систем, а второй производит демонстрации с разных углов.