OpenAI запускает ИИ агента, который самостоятельно выполняет задачи

Operator появился, пожалуй, раньше, чем все ожидали. Расскажу, что может и чего не стоит ждать от ИИ агента.

🔥 Еще больше интересного в моем канале продуктовые штучки

Что может?

Operator может «видеть» (через снимки экрана) и «взаимодействовать» (используя все действия, которые позволяют мышь и клавиатура) с браузером, что позволяет ему выполнять действия в Интернете без необходимости в интеграции пользовательских API. Используя браузер, может просматривать веб-страницу и взаимодействовать с ней, печатая, нажимая и прокручивая.

Operator может автоматизировать такие задачи, как бронирование мест в отелях, бронирование столиков в ресторанах и онлайн-покупки.

В интерфейсе Operator пользователи могут выбирать категорию задачи. OpenAI сотрудничает с лидерами в этих индустриях: DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber.

В целом Operator может работать на любом сайте, но для некоторого набора самых популярных есть отдельные сценарии, в рамках которых, скорее всего, он работает лучше (потому что на них тренировали). Но компания предупреждает, что пока не все может работать так, как вы ожидаете: в настоящее время у инструмента есть проблемы со «сложными интерфейсами».

Стартовая страница агента. <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.theverge.com%2F2025%2F1%2F23%2F24350395%2Fopenai-chatgpt-operator-agent-control-computer&postId=1771548" rel="nofollow noreferrer noopener" target="_blank">Источник</a>
Стартовая страница агента. Источник

Вы можете также:

- дать инструкцию, в который сообщите свои предпочтения или нужную информацию: какие магазины лучше выбирать, где вы живете и тд.

- сохранить успешные сценарии действий и поделиться ими с другими людьми.

У Operator есть свой сайт (недоступен из России). Презентация на YouTube — тут.

А что насчет контроля, безопасности и конфиденциальности?

Operator может использовать рассуждения для «самокоррекции», и если он застрянет, он попросит помощи пользователя, с запросом на конкретные действия. И в любой момент можно перехватить управление самому.

Он также попросит пользователя взять на себя управление в тех случаях, когда веб-сайт запрашивает конфиденциальную информацию, например, логин для входа, и должен попросить пользователя одобрить действия, например, отправку электронной почты.

Но пароли каждый раз вводить тоже не придется: Operator запоминает пароли для сайтов (кроме Gmail), поэтому не нужно каждый раз заново входить в систему.

Из соображений предосторожности OpenAI также требует надзора за некоторыми задачами, такими как банковские транзакции. Это ограничивает полезность Operator, но также гарантирует, что он не нанесет вам ущерб. Google применил аналогичный подход со своим агентом Project Mariner AI, который также не заполняет информацию, такую как номера кредитных карт.

Пользователи могут удалить все данные о просмотренных сайтах и выйти из всех аккаунтов одним щелчком мыши в разделе «Конфиденциальность» в настройках. Прошлые запросы к Operator также можно быстро удалить.

OpenAI также утверждает, что Operator был разработан для «отклонения вредоносных запросов и блокировки запрещенного контента».

Кому доступен?

Сначала он запускается в США для подписчиков уровня OpenAI ChatGPT Pro за $200 в месяц.

В дальнейшем OpenAI планирует предоставить Operator пользователям Plus, Team и Enterprise и интегрировать эти возможности в ChatGPT. Operator также скоро появится и в других странах.

OpenAI запускает ИИ агента, который самостоятельно выполняет задачи

По данным TechCrunch, The Verge.

Пожалуйста, поддержите меня, поставьте лайк! 🙏

2
1 комментарий

Джарвис всё реальнее