GPT-4.1 уже здесь. Что это значит для разработчиков на самом деле?
14 апреля OpenAI действительно выпустила новую серию моделей: GPT-4.1, GPT-4.1 Mini и GPT-4.1 Nano. Как это часто бывает, интернет мгновенно наполнился анонсами, пресс-релизами и таблицами с бенчмарками. Цифр и сравнений — море. Легко утонуть в этом потоке данных и сравнений производительности на абстрактных тестах. Многие просто копируют метрики, не объясняя, что за ними стоит.
Эта статья — не очередной пересказ цифр. Мы разберем по делу: что действительно изменилось с выходом GPT-4.1, кому и для чего нужны новые модели, и как это повлияет на вашу работу. Сосредоточимся на главном, без лишнего шума.
Сразу важное уточнение: все три новые модели — GPT-4.1, Mini и Nano — доступны только через API. Их нельзя выбрать в обычном веб-интерфейсе или приложении ChatGPT. OpenAI четко разделяет инструменты: самые свежие и мощные API-модели для разработчиков, а для массового пользователя — модель GPT-4o, в которую постепенно будут переносить улучшения из GPT-4.1. Так что если вы не используете API OpenAI (напрямую, через Azure или GitHub), или различные агрегаторы нейросетей, то эти новинки пока пройдут мимо вас. Возможная альтернатива использовать Playground OpenAI и платить за токены или воспользоваться одним из множества агрегаторов доступа к нейросетям, в подписку в которых включен ChatGPT.
OpenAI выпустила сразу три модели не случайно. Они предлагают разный баланс между мощностью, скоростью и ценой. GPT-4.1 — это флагман, самая мощная и точная модель серии, предназначенная для наиболее сложных задач, где требуется глубокое понимание контекста, продвинутые навыки кодирования и строгое следование инструкциям. GPT-4.1 Mini — это золотая середина. Она часто не уступает по качеству GPT-4o, а иногда и превосходит ее, но при этом работает почти вдвое быстрее и стоит на 83% дешевле. Это вариант для тех, кто ищет оптимальное соотношение производительности, скорости и затрат. Наконец, GPT-4.1 Nano — самая компактная, быстрая и дешевая модель в линейке. Ее задача — обеспечивать минимальную задержку в таких сценариях, как классификация текста, автодополнение кода или работа простых ИИ-агентов.
Главный акцент в новой серии сделан на улучшении возможностей, критически важных для разработчиков. Во-первых, это работа с кодом. OpenAI заявляет о значительном превосходстве над GPT-4o. Модели GPT-4.1 лучше справляются с задачами в роли ИИ-агента: могут сами изучить структуру репозитория, понять задачу и написать код, который не просто компилируется, но и проходит тесты. Например, на тесте SWE-bench Verified, имитирующем реальные задачи разработки, GPT-4.1 показала результат 54.6% против 33.2% у GPT-4o. Улучшилась и работа с diff-форматами, что позволяет получать от модели только измененные строки кода, экономя токены и время. Также модель стала генерировать меньше ненужных правок в коде. Для задач, где нужно переписать файл целиком, максимальный объем ответа увеличен вдвое, до 32 тысяч токенов.
Второе ключевое улучшение — точность следования инструкциям, особенно сложным и многошаговым. Это важно для создания надежных ИИ-агентов и автоматизации рабочих процессов. Модели стали стабильнее выполнять команды, лучше извлекать нужную информацию из истории диалога. Бенчмарки вроде IFEval и Scale's MultiChallenge показывают заметный прирост точности.
Третье, и самое заметное нововведение — контекстное окно в 1 миллион токенов. Это доступно для всех трех моделей: GPT-4.1, Mini и Nano. Предыдущий лимит у GPT-4o был 128 тысяч токенов. Один миллион токенов — это примерно 750 тысяч слов, что позволяет "скормить" модели целые репозитории кода, объемные юридические документы или исследовательские статьи за один раз. OpenAI утверждает, что модели не просто поддерживают такой объем, но и умеют эффективно им пользоваться: находить нужную информацию в любой части контекста и игнорировать "шум". Однако есть нюанс: сама OpenAI признает, что по мере приближения к максимальному объему в 1 миллион токенов надежность модели может снижаться. В одном из тестов точность упала с ~84% при обработке 8 тысяч токенов до ~50% при миллионе. Это значит, что возможность гигантского контекста открывает новые горизонты, но разработчикам нужно будет тщательно тестировать свои решения и, возможно, адаптировать промпты для задач, требующих максимальной точности при работе с большими данными.
Новые модели сохранили и мультимодальные возможности, унаследованные от GPT-4o, то есть умеют работать не только с текстом, но и с изображениями. Интересно, что в задачах анализа изображений (диаграммы, графики, визуальные задачи) хорошо себя показывает GPT-4.1-mini, часто не уступая, а иногда и превосходя флагманскую GPT-4.1. Учитывая ее низкую стоимость и задержку, Mini становится очень привлекательным вариантом для приложений, активно работающих с визуальной информацией. Стоимость обработки изображений рассчитывается через специальные множители к цене текстовых токенов.
Что касается актуальности знаний, то все модели серии GPT-4.1 обучены на данных, включающих информацию по июнь 2024 года.
Теперь о доступе и ценах. Как уже говорилось, модели доступны только через API OpenAI, Microsoft Azure OpenAI Service и, вероятно, через инструменты GitHub. Цены действительно стали ниже. GPT-4.1 Mini на 83% дешевле GPT-4o, Nano — еще доступнее. Скидка за кэширование промптов (когда вы повторно отправляете тот же контекст) увеличена с 50% до 75%, что выгодно для приложений с повторяющимися запросами. Важно, что использование контекста до 1 миллиона токенов не требует дополнительной платы сверх стандартной цены за токены. Для тех, кому нужна еще большая кастомизация, Microsoft анонсировала возможность тонкой настройки (fine-tuning) моделей GPT-4.1 и Mini на собственных данных через платформу Azure AI Foundry. Это позволит адаптировать модели под специфические задачи или корпоративный стиль.
На фоне этих улучшений OpenAI приняла решение прекратить поддержку API модели GPT-4.5 Preview с 14 июля 2025 года. Причина проста: GPT-4.1 предлагает сравнимую или лучшую производительность по ключевым показателям, но стоит значительно дешевле. Также из интерфейса ChatGPT к 30 апреля 2025 года уберут оригинальную модель GPT-4, ее место окончательно займет GPT-4o.
Как отреагировал рынок? Гики в целом позитивно оценили фокус на разработчиках, улучшения в кодинге и огромный контекст. Однако сообщество разработчиков отреагировало смешанно. С одной стороны, порадовали улучшения производительности и особенно снижение цен. С другой — многих рас��троила эксклюзивность API и отсутствие моделей в ChatGPT. Главным поводом для критики стала запутанная схема именования моделей (4.1, 4o, 4.5, Mini, Nano), в которой сложно разобраться даже опытным пользователям. Также высказывался скептицизм по поводу реального превосходства над конкурентами вроде Claude 3.7 Sonnet от Anthropic или Gemini 2.5 Pro от Google, особенно в задачах кодирования. Некоторые тесты и отзывы пользователей показывают, что модели конкурентов могут быть сильнее в отдельных аспектах или предлагать лучшее соотношение цены и качества для специфических задач.
Итак, что мы имеем в сухом остатке? Серия GPT-4.1 — это обновление от OpenAI, нацеленное на разработчиков. Модели стали лучше понимать код, точнее следовать инструкциям, работать с огромным контекстом до 1 миллиона токенов и при этом стали доступнее по цене, особенно Mini и Nano. Однако это не абсолютный лидер по всем фронтам — конкуренция на рынке LLM очень высока, и модели от Google, Anthropic и других игроков часто дышат в спину или даже вырываются вперед в отдельных дисциплинах. Выбор лучшего инструмента по-прежнему требует тестирования под конкретные задачи и бюджет.