OpenAI представила GPT-4.1: +21,4% в кодировании и 1 млн токенов контекста

OpenAI 14 апреля 2025 года представила новые модели AI: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Исследования указывают, что они лучше справляются с кодированием, выполнением инструкций и обработкой длинных контекстов, по сравнению с GPT-4o и GPT-4o mini. Например, GPT-4.1 показывает 54,6% на бенчмарке SWE-bench Verified, что на 21,4% выше, чем у GPT-4o.

Доступность и ценообразование Новые модели доступны через API OpenAI (официальное объявление), но не через ChatGPT, что может потребовать от разработчиков дополнительных усилий для интеграции. Цены варьируются: например, GPT-4.1 mini снижает стоимость на 83% по сравнению с GPT-4o, что делает её доступной для малого бизнеса.

Реальные применения Компании, такие как Windsurf и Qodo, уже используют эти модели, сообщая о значительных улучшениях, например, на 60% в кодировании для Windsurf. Однако точные результаты могут различаться в зависимости от конкретных задач.

Подробный отчет 14 апреля 2025 года OpenAI объявила о выпуске трех новых моделей искусственного интеллекта: GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Эти модели, судя по предоставленной информации, представляют собой значительный шаг вперед в области кодирования, выполнения инструкций и обработки длинных контекстов, превосходя предыдущие версии, такие как GPT-4o и GPT-4o mini. Данный отчет подробно анализирует ключевые аспекты этой новости, включая характеристики моделей, их производительность, реальные применения и доступность, а также добавляет контекст на основе дополнительных источников.

Контекст выпуска Новости, опубликованные 14 апреля 2025 года, подчеркивают фокус OpenAI на улучшении технических возможностей своих моделей. Согласно официальному объявлению OpenAI, новые модели доступны через API, но не интегрированы в ChatGPT, что может повлиять на их использование конечными пользователями. Это решение, вероятно, направлено на профессиональных разработчиков, которым требуется гибкость API для интеграции в свои проекты.

Дополнительные источники, такие как статья на TechCrunch, подтверждают, что модели фокусируются на кодировании и имеют контекстное окно до 1 миллиона токенов, что позволяет обрабатывать тексты длиной, например, больше, чем роман "Война и мир". Это делает их подходящими для сложных задач, таких как анализ больших документов или генерация кода для сложных программ.

Характеристики и производительность Новые модели демонстрируют значительные улучшения в нескольких ключевых областях, что подтверждается конкретными бенчмарками:

Кодирование: GPT-4.1 достигает 54,6% на бенчмарке SWE-bench Verified, что на 21,4% выше, чем у GPT-4o, и на 26,6% лучше, чем у GPT-4.5. Это указывает на улучшенную способность модели понимать и генерировать код, что особенно важно для разработчиков программного обеспечения. Выполнение инструкций: На Scale’s MultiChallenge модель показывает 38,3%, что на 10,5% лучше, чем у GPT-4o, демонстрируя улучшенную способность следовать сложным инструкциям. Длинный контекст: На бенчмарке Video-MME (длинный, без субтитров) GPT-4.1 достигает 72,0%, что на 6,7% выше, чем у GPT-4o, что делает её подходящей для задач, связанных с анализом длинных видео или текстов. Спецификации моделей включают:

GPT-4.1 mini: Снижает задержку почти вдвое и стоимость на 83% по сравнению с GPT-4o, что делает её привлекательной для разработчиков, ищущих баланс между производительностью и затратами. GPT-4.1 nano: Самая быстрая и дешевая модель, с результатами, такими как 80,1% на MMLU и 50,3% на GPQA, идеальна для задач, таких как классификация, с минимальными затратами. Эти улучшения подчеркивают стремление OpenAI сделать AI более доступным и эффективным, особенно для задач, требующих высокой точности и скорости.

Реальные применения Реальные примеры использования новых моделей демонстрируют их потенциал в различных отраслях. Компании, такие как Windsurf, Qodo, Blue J, Hex, Thomson Reuters и Carlyle, сообщили о значительных улучшениях:

Windsurf: Улучшение на 60% на внутреннем бенчмарке кодирования и на 30% в использовании инструментов. Qodo: В 55% случаев новая модель дала лучшие результаты в обзорах кода. Blue J: На 53% более точная в налоговых сценариях. Hex: Почти вдвое улучшила оценку SQL. Thomson Reuters: На 17% лучше в обзоре нескольких документов. Carlyle: На 50% лучше в извлечении финансовых данных. Эти примеры показывают, как новые модели могут быть интегрированы в реальные бизнес-процессы, от разработки программного обеспечения до финансового анализа, что подчеркивает их универсальность и практическую ценность.

Ценообразование и доступность OpenAI предоставила прозрачное ценообразование, что делает модели доступными для широкого круга пользователей. Ниже приведена таблица с ценами за 1 миллион токенов:

Модель gpt-4.1 Ввод $2.00 Кэшированный ввод $0.50 Вывод $8.00 Смешанное ценообразование* $1.84 Модель gpt-4.1-mini Ввод $0.40 Кэшированный ввод $0.10 Вывод $1.60 Смешанное ценообразование* $0.42

Модель gpt-4.1-nano Ввод $0.10 Кэшированный ввод $0.025 Вывод $0.40 Смешанное ценообразование* $0.12

*Смешанное ценообразование основано на типичном использовании.

Модели доступны через API, но не через ChatGPT, что может потребовать от разработчиков дополнительных усилий для интеграции. Это решение, вероятно, направлено на профессиональных пользователей, которым требуется гибкость API для кастомизации.

Депрекация старых моделей Важно отметить, что предварительная версия GPT-4.5 будет выведена из эксплуатации 14 июля 2025 года, что побуждает разработчиков перейти на новые модели для продолжения использования передовых технологий.

Анализ и значение Выпуск GPT-4.1, GPT-4.1 mini и GPT-4.1 nano — это значимое событие в мире искусственного интеллекта. Эти модели не только улучшают существующие возможности, но и делают их более доступными и эффективными. С учетом быстрого развития технологий AI, такие обновления играют ключевую роль в поддержании конкурентоспособности и инноваций. Разработчики теперь могут использовать эти модели для создания более сложных и эффективных приложений, что может привести к прорывам в различных отраслях, от программной разработки до финансов и юриспруденции.

Дополнительные источники, такие как BleepingComputer, подтверждают, что выпуск был ожидаемым и обсуждается в сообществе, что подчеркивает его важность.

Выпуск новых моделей OpenAI — это не просто техническое обновление, а значимое событие, демонстрирующее, как AI продолжает развиваться, предлагая все более мощные и доступные инструменты для решения реальных задач. Для разработчиков это означает новые возможности для инноваций, а для бизнеса — шанс использовать передовые технологии для улучшения своих процессов. С доступностью через API разработчики могут начать использовать эти модели немедленно, открывая новые горизонты для будущего.

Лучший канал про нейросети и Ai Автоматизацию:

t.me

Никита Титов 🪄 Ai АВТОМАТИЗАЦИЯ