OpenAI представила модель GPT-4o

С улучшенными возможностями работы с текстом, аудио и изображениями в реальном времени.

Компания рассказала об обновлениях на презентации. В частности, она анонсировала генеративную модель GPT-4o («o» от omni). Она будет доступна всем пользователям ChatGPT.
По словам технического директора OpenAI Миры Мурати, GPT-4o улучшает возможности работы с «аудио, текстом и изображениями».
В ChatGPT уже была поддержка голосовых чатов, но с GPT-4o пользователи могут взаимодействовать с чат-ботом «больше как с помощником». Например, во время демонстрации спикеры могли прервать чат-бота на середине ответа, чтобы что-то уточнить.
Сам бот «улавливает» эмоции говорящего и может ответить с разной интонацией, если его попросить: на презентации его просили рассказать историю «драматично», голосом робота или пропеть её.

Источник: Telegram-канал Denis Sexy IT

Также бот может переводить с одного языка на другой в реальном времени. В демонстрации бот переводил с английского на итальянский и обратно.

Источник: Сэм Альтман

OpenAI выпускает десктопное приложение ChatGPT для macOS, пишет TechCrunch. Во время демонстарции бота попросили описать код, поделившись экраном. Версия для Windows появится позже в 2024 году, уточняет издание.

Возможности бота, связанные с текстом и изображениями, начнут внедряться в ChatGPT с 13 мая 2024 года. Новая альфа-версия голосового режима с GPT-4o появится в ChatGPT Plus в «ближайшие недели».