Gemini Robotics от Google сделает роботов полезнее и "человечнее"
Google DeepMind представила свою новую ИИ модель под названием Gemini Robotics, чтобы роботы могли взаимодействовать с объектами и перемещаться в окружающей среде. Расскажу, что это дает роботам (и нам с вами)
🔥 Еще больше интересного в моем канале Продуктовые штучки
Gemini Robotics - это новая модель искусственного интеллекта от Google DeepMind для управления роботами. На базе нейросети от Google Gemini, как видно из названия. Модель обучена обобщать поведение на различных аппаратных платформах роботов и связывать "видимые" роботам объекты с действиями, которые они могут предпринять.
Google определяет ее как "наша самая передовая модель «зрение-язык-действие».
В демонстрационных видео роботы, оснащенные Gemini Robotics, складывают бумагу, кладут очки в футляр и выполняют другие задачи по голосовым командам.
В тестах Gemini Robotics показала хорошие результаты.
Возможности:
1. Роботы могут выполнять разные задачи, даже те, которым их не обучали специально.
2. Роботы понимают обычную человеческую речь и могут выполнять голосовые команды.
3. Роботы могут делать сложные вещи, требующие точности, например, складывать оригами.
4. Модель работает с разными типами роботов, не только с одним видом. Главное преимущество Gemini Robotics - это сочетание понимания языка, зрения и способности действовать в реальном мире, что делает роботов более полезными и гибкими.
Отличия Gemini Robotics
От предыдущих моделей:
- Gemini Robotics намного лучше справляется с новыми ситуациями.
- Лучше понимает пространство вокруг себя.
Отличия от конкурентов: Google утверждает, что их модель более чем в два раза лучше справляется с разными задачами, чем другие современные модели.