Google представит превью ИИ-агента, который сможет выполнять задачи в браузере — СМИ

Например, «агрегировать данные, совершать покупки, бронировать рейсы».

  • Агент под кодовым названием Project Jarvis делает и анализирует скриншот страницы. Затем «нажимает на кнопки и вводит текст», пишет The Verge со ссылкой на The Information.
  • Источники последнего говорят, что сервис работает на основе новой версии языковой модели Gemini и будет заточен прежде всего под использование в Google Chrome.
  • Показать оба решения могут в декабре 2024 года, однако доступ к ИИ-агенту думают дать ограниченному количеству пользователей — чтобы сначала найти и устранить недочёты.
  • Подробностей про новую Gemini пока нет. Собеседники The Verge в ИИ-отрасли говорят, что «прирост производительности» у неё не такой значительный, как хотелось бы разработчикам. Google эти новости не комментировала.
Источник скриншота: Tweak
Источник скриншота: Tweak
  • В октябре 2024 года Anthropic выходцев из OpenAI выпустила обновление для модели Claude 3.5 Sonnet, которое позволяет нейросети взаимодействовать с интерфейсами в компьютере: видеть экран, двигать курсором, нажимать на кнопки. Пока обновление находится на стадии открытого бета-тестирования.
  • OpenAI планирует выпустить ИИ-агентов в 2025 году, а в декабре 2024 года может показать другие технологии. Источники СМИ говорили, что речь идёт о релизе новой модели Orion, однако компания опровергла этот слух.
7
1
97 комментариев