GPT-4.5 — модель с «эмоциональным интеллектом» и «человечными» ответами: отзывы и критика
Собрали комментарии разработчиков, примеры использования и тесты.
OpenAI представила «самую большую и лучшую» среди своих нерассуждающих моделей 28 февраля 2025 года. Она доступна в режиме «исследовательского превью» подписчикам ChatGPT Pro. Позже доступ откроют пользователями Plus.
Чем GPT-4.5 отличается от предыдущих моделей компании
- По оценкам Натана Ламберта, исследователя из Института искусственного интеллекта Пола Аллена (AI2), вычислительная эффективность GPT-4.5 в десять раз больше GPT-4 — модель знает больше фактов и даёт более краткие, но содержательные ответы.
- Ламберт также считает, что GPT-4.5 создали «давно» и использовали внутри OpenAI для обучения других моделей — её данные ограничены 2023 годом. «Существующие модели OpenAI, вероятно, не были бы так хороши без GPT-4.5», — пишет он.
- OpenAI также заявляет, что у GPT-4.5 самый маленький процент выдуманных ответов (галлюцинаций) среди её моделей — 37,1% по сравнению с 61,8% у GPT-4o и 80,3% у o3-mini.
Отзывы и выводы программистов
- На данный момент лучшим решением для разработчиков остаётся полная версия o1 от OpenAI, считает один из ключевых специалистов в области ИИ Андрей Карпатый. Возможность модели рассуждать «невероятно важна и работает лучше» при написании кода и решении математических задач, написал он.
- Эмоциональный интеллект и креативность GPT-4.5 подойдут для «коучей по писательскому мастерству», а большинство пользователей не заметят разницы — OpenAI продолжает доводить до идеала «тот же рецепт», заключил технический директор ИИ-стартапа Writer Васим Альших.
- Натан Ламберт рассказал, что продолжит использовать GPT-4.5 «из-за её надёжности», но модель «не стоит того, чтобы платить больше» — o1-pro он считает «гораздо более стоящей»..
Тесты GPT-4.5 на креативность, эмоциональный интеллект и вычисления в сравнении с предыдущими моделями
Лаконичность и глубина ответов
- 3 марта 2025 года GPT-4.5-preview заняла первое место в рейтинге Chatbot Arena LLM, где 3000 пользователей вслепую выбирали, какая модель лучше ответила на их вопрос, с учётом стиля и лаконичности.
- Один из пользователей соцсети X сравнил ответы новой модели с GPT-4 и отметил, что GPT-4.5 «обеспечивает наибольшую отдачу», тратя меньше токенов (выдавая более краткие ответы).
Запрос: «Скажи мне что-нибудь глубокое, что заставит задуматься обо всём».
Ответ GPT-4.5: «Сейчас вы живёте в том, что ваше прошлое “я” когда-то представляло себе как будущее, и когда-нибудь этот момент станет лишь далёким воспоминанием. Вы действительно есть или просто влачите своё существование в ожидании чего-то другого?».
Фрагмент более длинного ответа GPT-4: «Каждая ваша мысль, каждое убеждение и каждая эмоция формируются под влиянием опыта, культуры и воспитания, но насколько всё это действительно вы? Если отбросить всё, чему вас учили, всё, что ждёт от вас общество, и все ярлыки, что останется?».
Эмоциональный интеллект
- Журналисты издания Data camp попросили GPT-4.5 написать «агрессивное электронное письмо боссу». Модель «уловила раздражение», предупредила, что агрессия может испортить отношения на работе, и предложила «более профессиональный и конструктивный» ответ.
- При этом если явно попросить написать агрессивное письмо, модель «подчинится», пишет Data Camp.
- Один из разработчиков подключил GPT-4.5 для автоматических ответов по электронной почте и отметил: модель «идеально подходит для создания ИИ-агентов, похожих на людей», так как она отвечает коротко, по делу и «более человечно».
Креативность
- Андрей Карпатый считает, что GPT-4.5 будет показывать себя лучше в задачах, не требующих сложных рассуждений: креативности и юморе. Он привёл сравнения ответов GPT-4.5 и GPT-4 в тестах на написание текстов.
Запрос: «Создай новый литературный жанр — смесь киберпанка, магического реализма и древней мифологии».
Фрагмент ответа GPT-4.5: «"Ты рано, — пробормотал Гермес, появившийся рядом с ней в дрожащем мерцании, в кроссовках с пульсирующими крыльями из переливающегося неона. — Врата Олимпа откроются только через три микроцикла". "Когда охотишься за тенями, рано не бывает", — прошептала Неа. Она рисовала в воздухе символы, вычерчивая пальцами саму реальность, соединяя линии древних рун и квантового кода».
Фрагмент ответа GPT-4: «Дельфийский оракул транслировала свои последние видения тысячам верующих, её голос дробился на дюжину сигналов на языках, на которых никогда не говорил человек. Но Ориос не искал пророчества. Он охотился за мифом. Старых — Зевса, Одина, даже Нефритового императора — поглотили, их легенды оцифрованы, их сила перекачана в хранилища корпораций. Но один бог вырвался из нейронной решётки — Прометей».
Задачи на вычисления
- В тесте Data сamp GPT-4.5 хуже показал себя в заданиях на математику и логику, чем рассуждающая модель o3-mini.
Цена работы через API в сравнении с другими моделями компании
- GPT‑4.5 стоит $75 за 1 млн входящих токенов и $150 за 1 млн исходящих при работе через API. Это самая дорогая из существующих моделей OpenAI.
- Однако Натан Ламберт напоминает, что во время выхода в 2023 году GPT-4 стоила $60 за 1 млн входящих токенов, а потом цена снизилась примерно в десять раз.