OpenAI выпустила «рассуждающую» модель o3-mini

В том числе для пользователей ChatGPT без подписки.

  • OpenAI анонсировала следующее семейство «рассуждающих» моделей — o3 и o3-mini — в декабре 2024 года. Теперь компания выпустила o3-mini для пользователей: модель будет доступна в чат-боте ChatGPT и через API.
  • Подписчики ChatGPT Plus и Team получат по 150 сообщений в день. Пользователи Pro — неограниченный доступ. Подписчики Enterprise смогут протестировать модель в начале февраля 2025 года. Лимиты для бесплатных пользователей OpenAI в релизе не назвала.
  • Платные подписчики могут выбрать o3-mini в меню выбора моделей — она заменит o1-mini. Бесплатным пользователям нужно нажать на Reason.
  • В чат-боте o3-mini настроена на «средний уровень рассуждений»: по словам компании, это «компромисс между скоростью и точностью». Все платные пользователи смогут также выбрать o3-mini-high — версию с «более высоким интеллектом», но с большей задержкой ответа.
  • o3-mini также работает с поиском, чтобы находить актуальную информацию со ссылками на источники. Но OpenAI отмечает, что это «ранний прототип».
Сравнение работы превью o1, o1, o1-mini, o3-mini (low), o3-mini (medium) и o3-mini (high) в соревнованиях по математике. Вертикальная шкала — точность ответов. Источник: OpenAI
Сравнение работы превью o1, o1, o1-mini, o3-mini (low), o3-mini (medium) и o3-mini (high) в соревнованиях по математике. Вертикальная шкала — точность ответов. Источник: OpenAI
Сравнение работы превью o1, o1, o1-mini, o3-mini (low), o3-mini (medium) и o3-mini (high) в ответах на научные вопросы уровня аспирантуры. Вертикальная шкала — точность. Источник: OpenAI
Сравнение работы превью o1, o1, o1-mini, o3-mini (low), o3-mini (medium) и o3-mini (high) в ответах на научные вопросы уровня аспирантуры. Вертикальная шкала — точность. Источник: OpenAI
22
5
3
78 комментариев

Ого, вот это OpenAl разогнались. Новые модели клепают как горячие пирожки))) Интересно, эта o3-mini будет шустрее и умнее предыдущих?

Интересно, эта o3-mini будет шустрее и умнее предыдущих?

Сэм Альтман только что звонил, говорит, что эта модель вышла медленнее и глупее предыдущей, мол, извините, старались как могли, но не получилось на этот раз. ¯\_(ツ)_/¯

56

А куда деваться, если ДикПик R1, Qwen, Ллама 4, Мистраль и тд каждую неделю чёто новое выпускают шустрее и умнее предыдущих.

3

Комментарий удалён модератором

Список китайских релизов за ЯНВАРЬ будет наверное на страницу

1

Она теперь умеет в интернете искать, в отличие от o1-mini. До этого только 4o и o1 умели гуглить

Я тут в Яндекс.Нейро спросил, кто такой Product Owner.. он мне выдал ответ из какого-то конспекта студента двоешника. При том, что PO, это сертифицированая профессия и в Scrum есть четкое описание.

8
1