Нейросеть для создания реалистичных видео, генератор изображений Imagen 3: что показала Google на конференции I/O 2024
Собрали некоторые анонсы, о которых компания рассказала на презентации.
Источник: The Verge
- Gemini в Google Workspace теперь использует Gemini 1.5 Pro: помощник сможет давать более содержательные ответы и отвечать на большее количество вопросов. Летом 2024 года функции станут доступны всем платным подписчикам Gemini.
- Компания начинает внедрять AI Overviews — краткие сводки по теме в поиске со ссылками на источники — для всех пользователей в США, а позже и в других странах.
- Для запросов на английском языке в США «скоро» появится экспериментальная функция запросов из нескольких частей с одним ответом. Например, пользователь может попросить найти лучшие студии йоги в городе, показать детали об их предложениях и время ходьбы от определённого места. ИИ предложит несколько вариантов и покажет их на карте.
Источник: Google
- Пользователи смогут искать что-то через Google Lens, записывая видео. Например, вместо описания, что именно не работает в проигрывателе, пользователь может загрузить видео и задать вопрос. Поиск по видео «скоро» будет доступен пользователям Search Labs на английском языке в США.
Источник: Google
- Компания представила версию Gemini 1.5 Flash — «самую быструю» модель Gemini, которая работает по API. Версия Gemini Nano появится в десктопном Chrome.
- Google анонсировала Imagen 3 — генеративную ИИ-модель для создания изображений: она лучше понимает текстовые запросы, меньше ошибается и позволяет создавать более чёткий текст на изображениях.
Источник: Google
Источник: Google
Источник: Google
- Google показала прототип Project Astra — мультимодального ИИ-помощника. Компания рассчитывает, что он станет универсальным виртуальным помощником, взаимодействовать с которым можно через камеру. В ролике, например, помощник описывает код на экране, помогает найти очки и решить задачу в реальном времени.
- Google также анонсировала Gemini Live, которая будет доступна подписчикам Gemini Advanced в «ближайшие месяцы». Пользователи смогут при разговоре с Gemini выбрать голос для ответа, прерывать ответ уточняющими вопросами, а сам помощник адаптируется к манере речи говорящего. The Verge сравнивает анонс с работой GPT-4o от OpenAI, которую компания показала накануне.
64 комментария