Гуманоид Figure01, оснащенный генеративной моделью ИИ от OpenAI, способен отвечать на вопросы во время выполнения действия, описывать окружающую среду, объяснять.
Об этом передает УНН со ссылкой на AI Robotics.
Детали
Робототехническая компания Figure AI выпустила видео о своем последнем прототипе, который благодаря технологии OpenAI может поддерживать разговор во время выполнения простых бытовых задач.
В 2,5-минутном видео человекоподобный робот стоит за столом. Он спокойно выполняет различные задания, которые ему диктует сидящий перед ним инженер. Их диалог относительно плавный, как и жесты, которые он выполняет.
Я голоден, дай мне что-нибудь поесть
"Конечно", - отвечает гуманоид (голосом Стива Джобса). Он берет с тарелки яблоко и подает ему.
Впоследствии происходит еще одно впечатляющее действо - человек высыпает скомканный мусор из урны перед Figure01 и просит робота объяснить, зачем он это сделал, одновременно подбирая мусор в урну. И тот объясняет свою "идею", собирая бумагу обратно в урну.
Поэтому я дал тебе яблоко, потому что это единственный съедобный предмет, который я могу дать тебе со стола
Также гуманоид способен оценивать свои действия, - когда его спрашивают его, как он думает, что он сделал, он не колеблясь дает себе хорошую оценку.
Справочно
Представители компании объяснили, что Figure01 использует предварительно обученную мультимодальную модель OpenAI, VLM, для понимания изображений и текста и полагается на голосовые подсказки для генерирования ответов. Кроме того гуманоид использует то, что компания называет "изученными низкоуровневыми бимануальными манипуляциями". Система координирует точную калибровку изображения (вплоть до уровня пикселей) с нейронной сетью для контроля движения.
Указывается, что каждое поведение на видео основано на обучении системы, поэтому никто за кулисами не направляет действия Figure01.
TikTok загрожує потенційна заборона в США: Палата представників ухвалила законопроект13.03.24, 17:28
Напомним,
OpenAI опровергла заявления Маска о том, что он инвестировал в разработку искусственного интеллекта 1 миллиард долларов, и заявила, что он добивался полного контроля над стартапом.
Сторонники Трампа используют искусственный интеллект для создания фальшивых изображений, на которых экс-президент окружен улыбающимися и улыбающимися группами чернокожих избирателей, в явной попытке привлечь афроамериканскую поддержку в свою потенциальную президентскую кампанию 2024 года.