OpenAI представила модель GPT-4o

С улучшенными возможностями работы с текстом, аудио и изображениями в реальном времени.

Скриншот vc.ru
Скриншот vc.ru
  • Компания рассказала об обновлениях на презентации. В частности, она анонсировала генеративную модель GPT-4o («o» от omni). Она будет доступна всем пользователям ChatGPT.
  • По словам технического директора OpenAI Миры Мурати, GPT-4o улучшает возможности работы с «аудио, текстом и изображениями».
  • В ChatGPT уже была поддержка голосовых чатов, но с GPT-4o пользователи могут взаимодействовать с чат-ботом «больше как с помощником». Например, во время демонстрации спикеры могли прервать чат-бота на середине ответа, чтобы что-то уточнить.
  • Сам бот «улавливает» эмоции говорящего и может ответить с разной интонацией, если его попросить: на презентации его просили рассказать историю «драматично», голосом робота или пропеть её.
Источник: Telegram-канал Denis Sexy IT
  • Также бот может переводить с одного языка на другой в реальном времени. В демонстрации бот переводил с английского на итальянский и обратно.
Источник: Сэм Альтман
  • OpenAI выпускает десктопное приложение ChatGPT для macOS, пишет TechCrunch. Во время демонстарции бота попросили описать код, поделившись экраном. Версия для Windows появится позже в 2024 году, уточняет издание.
Источник: TechCrunch
Источник: TechCrunch
  • Возможности бота, связанные с текстом и изображениями, начнут внедряться в ChatGPT с 13 мая 2024 года. Новая альфа-версия голосового режима с GPT-4o появится в ChatGPT Plus в «ближайшие недели».
137
226 комментариев