Google представит превью ИИ-агента, который сможет выполнять задачи в браузере — СМИ
Например, «агрегировать данные, совершать покупки, бронировать рейсы».
- Агент под кодовым названием Project Jarvis делает и анализирует скриншот страницы. Затем «нажимает на кнопки и вводит текст», пишет The Verge со ссылкой на The Information.
- Источники последнего говорят, что сервис работает на основе новой версии языковой модели Gemini и будет заточен прежде всего под использование в Google Chrome.
- Показать оба решения могут в декабре 2024 года, однако доступ к ИИ-агенту думают дать ограниченному количеству пользователей — чтобы сначала найти и устранить недочёты.
- Подробностей про новую Gemini пока нет. Собеседники The Verge в ИИ-отрасли говорят, что «прирост производительности» у неё не такой значительный, как хотелось бы разработчикам. Google эти новости не комментировала.
Источник скриншота: Tweak
- В октябре 2024 года Anthropic выходцев из OpenAI выпустила обновление для модели Claude 3.5 Sonnet, которое позволяет нейросети взаимодействовать с интерфейсами в компьютере: видеть экран, двигать курсором, нажимать на кнопки. Пока обновление находится на стадии открытого бета-тестирования.
- OpenAI планирует выпустить ИИ-агентов в 2025 году, а в декабре 2024 года может показать другие технологии. Источники СМИ говорили, что речь идёт о релизе новой модели Orion, однако компания опровергла этот слух.
97 комментариев