OpenAI представили Operator: автономных ИИ-агентов

OpenAI анонсировала Operator — инновационного ИИ-агента, способного автономно управлять компьютером. Это именно тот агент, о котором так много говорили в СМИ и который долгожданен для всех энтузиастов искусственного интеллекта.

Основанная на архитектуре GPT-4o, система способна самостоятельно выполнять сложные задачи, взаимодействовать с браузером и управлять различными аспектами работы на компьютере.

С помощью Operator можно, например, заказать доставку, спланировать путешествие или забронировать столик в ресторане без непосредственного участия пользователя. Хотя система пока не достигает уровня человеческих возможностей, это значительный шаг вперед в развитии ИИ. Агент уже доступен пользователям по подписке Pro за 200 долларов в месяц, а в ближайшем будущем планируется расширить доступ для пользователей с подпиской Plus.

В разработке агентов Operator становится новым словом. Ранее такие системы уже представляли Anthropic и Google, однако, по всей видимости, Operator значительно опережает их по функциональности и возможностям.

Кроме того, вчера вышла первая опенсорсная версия подобного агента, представленная учеными из ByteDance (известной по TikTok). Это открывает новые горизонты для разработчиков и исследователей, стремящихся внедрить ИИ-агентов в различные сферы.

До официального релиза некоторые пользователи подписки Pro уже начали делиться впечатлениями. В их интерфейсе появился раздел Operator, после чего в системе произошел масштабный сбой - явление, которое зачастую предвещает скорое появление новых релизов.

Operator - это не просто очередной мощный продукт от OpenAI. Это переход на новую ступень развития искусственного интеллекта. В сентябре Сэм Альтман в интервью рассказал, что стартап выделяет всего пять ступеней развития ИИ:

Чат-боты
Ризонеры (рассуждающие чат-боты) - например, системы o1 от OpenAI или R1 от DeepSeek
Агенты - на данном этапе находится Operator
Инноваторы - ИИ, способный делать научные открытия
Целые организации из ИИ-агентов

Помимо Альтмана, концепция агентов получила поддержку и от других CEO крупных компаний. Недавно Марк Цукерберг заявил, что к 2025 году в Meta уже появятся AI-агенты, способные полноценно выполнять работу миддл-инженеров, занимающихся кодированием.

Не будем углубляться в технические детали работы таких систем, но если вам интересно, рекомендуем ознакомиться с нашим разбором агента UI-TARS от ByteDance.

Стоит отметить, что The Information ранее сообщали, что OpenAI задержала релиз Operator из-за длительной работы над обеспечением безопасности агента. Основной проблемой были prompt injection атаки, когда вредоносные сайты могут красть данные через агента без ведома пользователя. OpenAI успешно решили эту проблему, разработав агент, который не получает прямого доступа к вашему компьютеру. Вместо этого он разворачивает виртуальную машину внутри чата, где все действия происходят изолировано.

Релиз Operator стал кульминацией многочисленных слухов, которые уже несколько месяцев ходили в сообществе. Первые утечки информации об Operator появились еще несколько месяцев назад, когда Tibor Blaho, известный своей способностью обнаруживать и публиковать намеки на новые модели и продукты, заметил в коде OpenAI эндпоинты, указывающие на Operator. Несколько дней назад издание Axios опубликовало статью о скором выпуске Operator.

OpenAI представили Operator: автономных ИИ-агентов

Превосходство Operator над конкурентами

Предварительные реакции и ожидания

Технические аспекты и безопасность

Прогнозы