OpenAI представила превью языковой модели o1 — она заточена под задачи, требующие рассуждений
В частности в точных и естественных науках.
- Компания рассказала, что ИИ-модели из её новой серии тратят больше времени на обдумывание ответа, прежде чем выдавать его пользователю. Их учат «оттачивать мыслительный процесс, пробовать разные стратегии и распознавать свои ошибки».
- В тестах по физике, химии и биологии модели отвечали на уровне аспирантов. В отборочном туре Международной математической олимпиады (IMO) GPT-4o правильно решила 13% заданий, а новая «рассуждающая» модель — 83%.
Блоки слева направо: соревнование по математике, соревновние по кодингу и опросник с научными вопросами уровня аспирантуры. Вертикальная шкала — точность ответов. Источник: OpenAI
- OpenAI предупредила, что с базовыми запросами эффективнее справляется GPT-4o — у той более «обширные знания о мире».
- К новым же моделям лучше обращаться при наличии сложных задач. Например, исследователи в медицине могут аннотировать с помощью o1 данные секвенирования, а физики — выводить формулы в квантовой оптике. Разработчикам модель поможет написать и отладить сложный код.
- В частности для последних компания выпустила облегчённую и менее дорогую версию o1 — o1-mini. Контекстное окно у обеих — 128 тысяч токенов. Файлы и изображения они не принимают, как и не ищут данные в интернете, но это пока.
Диалоговое окно с моделью. Источник: OpenAI
- Пользователи платных тарифов ChatGPT Plus и ChatGPT Team должны получить доступ к превью o1 и o1-mini уже 12 сентября 2024 года. Еженедельный лимит — 30 сообщений для o1-preview и 50 сообщений для o1-mini.
- Пользователи планов Enterprise и Edu получат доступ на неделе с 16 сентября. А через API их могут протестировать разработчики пятого «тира» (потратили на использование больше $1000), для них ограничение — до 20 запросов в минуту.
- В будущем лимиты во всех случаях рассчитывают увеличить. В планах также открыть доступ к o1-mini всем пользователям бесплатного плана ChatGPT, но когда — неизвестно.
При работе с o1-preview 1 млн «входных» токенов будет стоить $15, а «выходных» — $60. Для o1-mini это $3 и $12 соответственно.
«Пример решения довольно нетривиальной задачки, с которой текущие модели не справляются», — пишет автор канала Epsilon Correct
205 комментариев