GPT-4.1 от OpenAI: чем отличаются модели, как составлять запросы и что хвалят разработчики
Модель доступна в API OpenAI, а также в сторонних редакторах кода Cursor AI и Windsurf.
Содержание
Чем отличаются модели семейства GPT-4.1
- 14 апреля 2025 года OpenAI представила «нерассуждающие» модели GPT-4.1, ориентированные на разработчиков.
- Флагманская GPT-4.1, по словам самой компании, лучшая в программировании среди других «нерассуждающих» моделей, доля «лишнего» кода снизилась с 9% до 2%. GPT‑4.1 mini – облегчённая модель, которая отвечает вдвое быстрее флагманской и стоит на 83% дешевле GPT‑4o. GPT‑4.1 nano – пока «самая быстрая и дешёвая модель компании».
- Все три модели поддерживают контекстное окно до 1 млн токенов, как Gemini 2.0 Flash и Gemini 2.5 Pro, по сравнению с 128 тысячами токенов у GPT‑4.o. Знания ограничены периодом до 1 июня 2024 года.
Где протестировать GPT-4.1 и сколько это стоит
- В API от OpenAI GPT-4.1 стоит $2 за 1 млн входящих токенов и $8 за 1 млн исходящих; GPT-4.1 mini — $0,40 и $1,6 соответственно; GPT-4.1 nano — $0,10 и $0,40 соответственно.
- Разработчики редактора кода Cursor AI добавили модель в сервис и открыли бесплатный доступ — «на время». Стоимость подписки на Cursor AI — от $20 в месяц.
- Windsurf также разрешила протестировать модель бесплатно — до 20 апреля 2025 года. Минимальная стоимость подписки — $15.
Как соотносятся цена и способности GPT-4.1 и конкурентов
- Как пишут независимые исследователи из Artificial Analysis, GPT-4.1 «умнее и дешевле», чем GPT-4o. По результатам их теста, GPT-4.1 обошла Llama 4 Maverick, Claude 3.7 Sonnet и GPT-4o, а также сравнялась с новой версией V3 от DeepSeek.
- GPT-4.1 mini, по их данным, «незначительно» превосходит GPT-4.1 в программировании. GPT-4.1 nano примерно соответствует Llama 3.3 70B и Llama 4 Scout.
- Artificial Analysis не проверяли «рассуждающие» модели. В общем тесте на программирование от платформы для редактирования кода Aider среди всех типов моделей первое место заняла новая «рассуждающая» Gemini 2.5 Pro, а GPT-4.1 оказалась на 13 строке, отметил один из разработчиков в X.
- Протестировавшие новую модель OpenAI в ответ добавили, что не удивлены результатом: считают, что Gemini 2.5 Pro лучше пишет код — прежде всего благодаря длинным цепочкам рассуждений.
Какими впечатлениями делятся разработчики
- Один из разработчиков протестировал, как модель создаёт код для фронтенда. Claude 3.7 Sonnet написала «в два раза больше кода», но, вместо того чтобы подобрать картинки, установила серые заглушки. Результат GPT-4.1 пользователю понравился больше.
- Другой разработчик попросил две модели создать приложение для заметок. Он, наоборот, выше оценил результат Claude, а GPT-4.1 и другие модели линейки назвал более «ленивыми».
- Разработчик обучающих приложений для детей заметила, что «GPT-4.1 читает меньше ненужных файлов, вносит меньше бесполезных изменений и не так много болтает».
- В марте 2025 года ИИ-энтузиасты разработали шуточный тест на креативность нейросетей Minecraft Benchmark. Пользователи выбирают лучшую «постройку» из двух, не зная, какая модель её сделала. На основе этих «симпатий» составляют рейтинг моделей.
- Сейчас лидер — Gemini 2.0 Pro. Позицию GPT-4.1 разработчики пока не добавили, но уже поделились первыми генерациями модели.
Стеклянные дворцы от GPT-4.1 (справа) и Gemini 2.5 Pro Experimental:
Земля «глазами» GPT-4.1 (справа) и GPT-4.5:
Что учитывать в промптах для новых GPT-4.1
- OpenAI адаптировала GPT‑4.1 для создания ИИ-агентов и работы с длинным контекстом. Разработчики опубликовали инструкцию по составлению промптов.
- GPT-4.1 умеет точнее следовать инструкциям, избегая вольных интерпретаций, что могли допускать предыдущие модели, так что главное — чётко формулировать запрос.
- Разработчики утверждают, что GPT-4.1 справляется даже с максимальной длиной запроса в 1 млн токенов. Но советуют писать структурированные инструкции — и в начале, и в конце длинного запроса.
Пример англоязычной инструкции, в которой разработчик указывает, когда ИИ-агент может использовать для ответа только данные из промпта, а когда — свои знания:
# Instructions
// For internal knowledge - Only use the documents in the provided External Context to answer the User Query.
// For internal and external knowledge - By default, use the provided external context to answer the User Query, but if other basic knowledge is needed to answer, and you're confident in the answer, you can use some of your own knowledge.
- GPT-4.1 — это не «рассуждающая» модель. Но в конце запроса можно попросить её составить план выполнения задачи, чтобы она «размышляла вслух».
Пример, в котором разработчик просит «пошагово поразмышлять», какие из предоставленных документов нужны:
First, think carefully step by step about what documents are needed to answer the query. Then, print out the TITLE and ID of each document. Then, format the IDs into a list.
- При создании ИИ-агента лучше попросить планировать работу перед каждым новым вызовом инструмента.
Пример такого запроса:
You MUST plan extensively before each function call, and reflect extensively on the outcomes of the previous function calls. DO NOT do this entire process by making function calls only, as this can impair your ability to solve the problem and think insightfully.
- Команды для создания ботов или ИИ-агентов: не приходить к пользователю, а продолжать работу до выполнения задачи; «читать» файлы, а не «догадываться» об их содержании.
Пример запроса с уточнением про автономность:
You are an agent - please keep going until the user’s query is completely resolved, before ending your turn and yielding back to the user. Only terminate your turn when you are sure that the problem is solved.
Пример запроса с уточнением про погружение в файлы:
If you are not sure about file content or codebase structure pertaining to the user’s request, use your tools to read files and gather the relevant information: do NOT guess or make up an answer.
- В тестах модель лучше понимала запросы, структурированные с помощью заголовков Markdown и формата XML. А вот JSON мог увеличивать нагрузку.
Пример запроса в формате XML:
<doc id=1 title=”The Fox”>The quick brown fox jumps over the lazy dog</doc>
Другой формат запроса, который «хорошо показал себя» во время тестов:
ID: 1 | TITLE: The Fox | CONTENT: The quick brown fox jumps over the lazy dog