Google Deepmind представили 2 новые модели AI для управления роботами
Усовершенствованные модели на базе Gemini 2.0, разработаны для нового поколения полезных роботов.
Инструменты, инсайты ИИ для бизнеса в моем тг-канале 😎, приглашаю
Gemini Robotics переносит способность Gemini к мультимодальному мышлению и пониманию мира в физический мир, позволяя роботам любой формы и размера выполнять широкий спектр реальных задач.
Ключевые возможности
Модели Gemini способны реагировать на текст, изображения, аудио и видео. Gemini Robotics добавляет способность рассуждать о физических пространствах, позволяя роботам действовать в реальном мире.
Две модели
Первая — Gemini Robotics, усовершенствованная модель «зрение-язык-действие» (VLA), которая была построена на Gemini 2.0 с добавлением физических действий в качестве новой выходной модальности для прямого управления роботами.
Вторая — Gemini Robotics-ER, модель Gemini с усовершенствованным пространственным пониманием, позволяющая робототехникам запускать собственные программы, используя способности Gemini к воплощенному рассуждению (ER).
Обе эти модели позволяют различным роботам выполнять более широкий спектр задач в реальном мире, чем когда-либо прежде.
Подробнее в блоге DeepMind