Google представит превью ИИ-агента, который сможет выполнять задачи в браузере — СМИ

Например, «агрегировать данные, совершать покупки, бронировать рейсы».

Агент под кодовым названием Project Jarvis делает и анализирует скриншот страницы. Затем «нажимает на кнопки и вводит текст», пишет The Verge со ссылкой на The Information.
Источники последнего говорят, что сервис работает на основе новой версии языковой модели Gemini и будет заточен прежде всего под использование в Google Chrome.
Показать оба решения могут в декабре 2024 года, однако доступ к ИИ-агенту думают дать ограниченному количеству пользователей — чтобы сначала найти и устранить недочёты.
Подробностей про новую Gemini пока нет. Собеседники The Verge в ИИ-отрасли говорят, что «прирост производительности» у неё не такой значительный, как хотелось бы разработчикам. Google эти новости не комментировала.

В октябре 2024 года Anthropic выходцев из OpenAI выпустила обновление для модели Claude 3.5 Sonnet, которое позволяет нейросети взаимодействовать с интерфейсами в компьютере: видеть экран, двигать курсором, нажимать на кнопки. Пока обновление находится на стадии открытого бета-тестирования.
OpenAI планирует выпустить ИИ-агентов в 2025 году, а в декабре 2024 года может показать другие технологии. Источники СМИ говорили, что речь идёт о релизе новой модели Orion, однако компания опровергла этот слух.

Павел Комаровский

Будущее

06.04.2023

Человечество против искусственного интеллекта: может ли развитие нейросетей привести к катастрофе

История про «восстание машин» давно знакома всем любителям научной фантастики, но после взрывного роста возможностей нейросетевых языковых моделей (вроде ChatGPT) об этом риске заговорили и вполне серьезные исследователи. В этой статье мы попробуем разобраться – есть ли основания у таких опасений, или это всего лишь бред воспаленной кукухи?

Илон Маск считает риск «глобальной катастрофы из-за ИИ» реальной проблемой – так что, может быть, и вам стоит разобраться, что там и как

#новости #google