Модель искусственного интеллекта Green-VLA (Vision–Language–Action), разработанная на базе технологий Сбера и использующая языковую модель «ГигаЧат», победила в онлайн-этапе международного соревнования AgiBot World Challenge в треке Reasoning2Action. Всего в конкурсе участвовало 79 команд из России, Китая и Южной Кореи.
В ходе онлайн-соревнования модели выполняли задачи по сортировке и выкладке товаров, уборке, переносу предметов — то есть действия, ожидаемые от человекоподобных роботов, причем в сложных сценариях. Использование симулятора позволило оценить возможности самих моделей независимо от различий в аппаратном обеспечении или настройке экспериментальных стендов.
Организатором соревнований выступает компания AgiBot, один из мировых лидеров в производстве человекоподобных роботов.
Очный этап конкурса пройдет 1 июня на конференции ICRA в Вене. На нем исследователи центра робототехники Сбера представят роботов, управляемых системой Green-VLA. В ноябре прошлого года эта система уже демонстрировалась на конференции AI Journey в составе робота по имени Грин.
Ранее Сбер опубликовал технический отчет, посвященный Green-VLA и развитию технологий физического искусственного интеллекта (Physical AI). В документе описана архитектура моделей класса Vision–Language–Action, предназначенных для управления роботами. Отчет предлагается как открытая методология для исследователей и инженеров.