OpenAI Operator: OpenAI выпустил агентскую модель для подписчиков плана Pro

Новый продукт является первым взглядом на AI-агентов со стороны OpenAI и позволяет управлять виртуальным браузером в облаке, выполняя произвольные указания пользователей.

Operator использует новую модель CUA (Computer-Using Agent), разработанную на основе GPT 4o специально для управления визуальными интерфейсами. Модель имеет скрытую Chain-of-Though подобно o1, умеет определять моменты, где ей не хватает информации и уточнять отсутствующие сведения у пользователя или временно передавать ему управление (например, для ввода пароля или данных карты).

В периоды управления пользователем данные экрана приватны и недоступны для модели до момента передачи управления назад от пользователя, когда модель видит скриншот состояния, в котором последний оставил интерфейс.

Для защиты от использования для вредоносных целей команда переиспользовала опыт ChatGPT, дополнительно внедрив защиту от потенциальных prompt injections со стороны вредоносных сайтов.

Модель изначально доступна для подписчиков плана «Pro» из США, другие страны будут запущены позже, запуск в ЕС потребует отдельного более длительного времени.

Детали разработки модели можно прочитать в анонсе OpenAI:

1
1 комментарий