o3 от OpenAI «думает картинками» и использует все инструменты ChatGPT одновременно — первые отзывы о модели

Она может найти ресторан по фотографии блюда, стать «личным коучем» и решить кроссворд, пишут пользователи.

Результаты моделей OpenAI на внутренних тестах

  • Компания выпустила две новые модели – o3 и o4-mini. Последняя оптимизирована для программирования и решения математических задач. o3 получила больше баллов в тестах на общие научные знания. Рядовые пользователи активнее тестируют её в соцсетях.
  • Модели научили «рассуждать» и одновременно использовать все инструменты в ChatGPT — поиск по интернету, анализ загруженных файлов через Python, создание и редактирование изображений. Например, o3 можно попросить найти объект на картинке — она приблизит и улучшит качество, чтобы «рассмотреть».
«o3 может "думать картинками"», – написал автор Telegram-канала Denis Sexy IT Денис Ширяев. Он попросил модель посчитать количество кораблей на снимке

Опыт использования o3

  • Дэн Шиппер, сооснователь и главный редактор издания про технологии Every, получил ранний доступ к модели и поделился своими наблюдениями после недельного тестирования.
  • Он заметил, что o3 «быстрее» «рассуждающих» Claude 3.7 Sonnet и Gemini 2.5 Pro и лучше справляется с задачами, в которых нужен визуальный анализ. Например, смогла решить судоку, в отличие от моделей Google и Anthropic.
Автор Telegram-канала How2AI <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Ft.me%2FHow2AI%2F964%3Fsingle&amp;postId=1931319" rel="nofollow noreferrer noopener" target="_blank">прислал</a> o3 кроссворд. Она разгадала его за 13 минут, допустив «пару» ошибок, при этом некоторые ответы пошла искать на «сайтах-решебниках» 
Автор Telegram-канала How2AI прислал o3 кроссворд. Она разгадала его за 13 минут, допустив «пару» ошибок, при этом некоторые ответы пошла искать на «сайтах-решебниках» 
  • o3 кажется «более живой», с ней интереснее общаться, чем с другими «рассуждающими» моделями OpenAI. Шиппер стал использовать o3 как основную для большинства задач, а Claude 3.7 Sonnet — для программирования.
  • o3 – это «лайт-версия» режима для изучения информации Deep Research, который доступен в ChatGPT по подписке Pro. Например, модель может искать актуальные советы на сайтах, когда пишет код.
  • Ещё o3 не просто объяснила Шипперу тему, а составила «краткий курс». Каждый день она присылала небольшой «урок», используя функцию напоминаний.
Источник: Every
Источник: Every
  • Благодаря контекстному окну в 1 млн токенов (около 750 тысяч слов) o3 может проанализировать длинный документ за один запрос – например, обсудить книгу.
  • o3 может стать «коучем для руководителей». Для этого Шиппер загрузил в чат-бот расшифровки своих совещаний за пять дней, попросил проанализировать его стиль общения с командой и дать советы по повышению личной эффективности. Он остался доволен ответами модели.
Источник: Every
Источник: Every
  • o3 может увеличивать, вращать и обрезать изображение, чтобы разобрать рукописный текст или решить задачку с лабиринтом.
Автор Telegram-канала «AI для всех» отправила o3 картинку из игры на внимательность. Модель увеличивала изображение несколько раз, чтобы найти нужного персонажа

Другие примеры пользователей

  • В соцсетях также заметили, что благодаря инструменту поиска o3 может узнать название кафе по фотографии внутри заведения или по меню.
o3 нашла нужный мост по фотографии и указала геопозицию на карте. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Femollick%2Fstatus%2F1912726124913623143&amp;postId=1931319" rel="nofollow noreferrer noopener" target="_blank">Ethan Mollick</a>
o3 нашла нужный мост по фотографии и указала геопозицию на карте. Источник: Ethan Mollick
  • Один из пользователей сравнил визуальный анализ у 4o и o3. Первая просто описала, что изображено на стикере, а вторая — разобрала и перевела иероглифы и прислала ссылку на такую же наклейку на eBay.
Ответы 4o и o3. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fvladgeorgescu%2Fstatus%2F1912576280316531188&amp;postId=1931319" rel="nofollow noreferrer noopener" target="_blank">Vlad Georgescu</a>
Ответы 4o и o3. Источник: Vlad Georgescu
  • Как и GPT-4o, o3 умеет рисовать и создавать картинки по фотографиям.

Результаты в независимых тестах

  • o3 последней версии High обошла Gemini 2.5 Pro в рейтинге LiveBench. Это независимое исследование, в котором модели тестируют в шести категориях, включая программирование, математические задачи и анализ данных. Тесты постоянно обновляют и адаптируют с развитием моделей.
Таблица показателей рассуждающих моделей. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Flivebench.ai%2F%23%2F%3FReasoning%3Da%26amp%3BCoding%3Da%26amp%3BMathematics%3Da%26amp%3BData%2BAnalysis%3Da&amp;postId=1931319" rel="nofollow noreferrer noopener" target="_blank">LiveBench</a>
Таблица показателей рассуждающих моделей. Источник: LiveBench

Цена модели

  • o3 доступна подписчикам ChatGPT Plus с ограничением в 50 запросов в неделю, а также в планах Pro и Team. Для подписчиков Pro компания планирует в «ближайшие недели» выпустить модель o3-pro. Пользователи Enterprise и Edu получат доступ на неделе до 27 апреля 2025 года.
  • Модель также добавили в API, работа с ней стоит $10 за 1 млн входящих токенов и $40 за 1 млн исходящих.
9
6
6
42 комментария