Google Deepmind представили 2 новые модели AI для управления роботами

Усовершенствованные модели на базе Gemini 2.0, разработаны для нового поколения полезных роботов.

Инструменты, инсайты ИИ для бизнеса в моем тг-канале 😎, приглашаю

Gemini Robotics переносит способность Gemini к мультимодальному мышлению и пониманию мира в физический мир, позволяя роботам любой формы и размера выполнять широкий спектр реальных задач.

Модели Gemini способны реагировать на текст, изображения, аудио и видео. Gemini Robotics добавляет способность рассуждать о физических пространствах, позволяя роботам действовать в реальном мире.

Две модели

Первая — Gemini Robotics, усовершенствованная модель «зрение-язык-действие» (VLA), которая была построена на Gemini 2.0 с добавлением физических действий в качестве новой выходной модальности для прямого управления роботами.

Вторая — Gemini Robotics-ER, модель Gemini с усовершенствованным пространственным пониманием, позволяющая робототехникам запускать собственные программы, используя способности Gemini к воплощенному рассуждению (ER).

Обе эти модели позволяют различным роботам выполнять более широкий спектр задач в реальном мире, чем когда-либо прежде.
Подробнее в блоге DeepMind

t.me

Экономика данных

#ai #deepmind #gemini #ии

Google Deepmind представили 2 новые модели AI для управления роботами

Ключевые возможности