GPT-4.5 — модель с «эмоциональным интеллектом» и «человечными» ответами: отзывы и критика

Собрали комментарии разработчиков, примеры использования и тесты.

OpenAI представила «самую большую и лучшую» среди своих нерассуждающих моделей 28 февраля 2025 года. Она доступна в режиме «исследовательского превью» подписчикам ChatGPT Pro. Позже доступ откроют пользователями Plus.

Чем GPT-4.5 отличается от предыдущих моделей компании

  • По оценкам Натана Ламберта, исследователя из Института искусственного интеллекта Пола Аллена (AI2), вычислительная эффективность GPT-4.5 в десять раз больше GPT-4 — модель знает больше фактов и даёт более краткие, но содержательные ответы.
  • Ламберт также считает, что GPT-4.5 создали «давно» и использовали внутри OpenAI для обучения других моделей — её данные ограничены 2023 годом. «Существующие модели OpenAI, вероятно, не были бы так хороши без GPT-4.5», — пишет он.
Пользователь попросил разные ИИ определить, где сделана фотография. Только GPT-4.5 смогла точно сказать, что это Археологический парк «Неаполис» в Сиракузе, Италия. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fkoltregaskes%2Fstatus%2F1896572487389028432&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Kol Tregaskes </a>
Пользователь попросил разные ИИ определить, где сделана фотография. Только GPT-4.5 смогла точно сказать, что это Археологический парк «Неаполис» в Сиракузе, Италия. Источник: Kol Tregaskes 
  • OpenAI также заявляет, что у GPT-4.5 самый маленький процент выдуманных ответов (галлюцинаций) среди её моделей — 37,1% по сравнению с 61,8% у GPT-4o и 80,3% у o3-mini.

Отзывы и выводы программистов

  • На данный момент лучшим решением для разработчиков остаётся полная версия o1 от OpenAI, считает один из ключевых специалистов в области ИИ Андрей Карпатый. Возможность модели рассуждать «невероятно важна и работает лучше» при написании кода и решении математических задач, написал он.
  • Эмоциональный интеллект и креативность GPT-4.5 подойдут для «коучей по писательскому мастерству», а большинство пользователей не заметят разницы — OpenAI продолжает доводить до идеала «тот же рецепт», заключил технический директор ИИ-стартапа Writer Васим Альших.
  • Натан Ламберт рассказал, что продолжит использовать GPT-4.5 «из-за её надёжности», но модель «не стоит того, чтобы платить больше» — o1-pro он считает «гораздо более стоящей»..

Тесты GPT-4.5 на креативность, эмоциональный интеллект и вычисления в сравнении с предыдущими моделями

Лаконичность и глубина ответов

  • 3 марта 2025 года GPT-4.5-preview заняла первое место в рейтинге Chatbot Arena LLM, где 3000 пользователей вслепую выбирали, какая модель лучше ответила на их вопрос, с учётом стиля и лаконичности.
Скриншот рейтинга Chatbot Arena от 3 марта 2025 года. 4 марта вперёд вырвалась новая версия Grok-3-preview, пока она обошла модель от OpenAI на один балл. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.analyticsvidhya.com%2Fblog%2F2025%2F03%2Fgpt-4-5-becomes-1-on-chatbot-arena%2F&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Nitika Sharma</a>
Скриншот рейтинга Chatbot Arena от 3 марта 2025 года. 4 марта вперёд вырвалась новая версия Grok-3-preview, пока она обошла модель от OpenAI на один балл. Источник: Nitika Sharma
  • Один из пользователей соцсети X сравнил ответы новой модели с GPT-4 и отметил, что GPT-4.5 «обеспечивает наибольшую отдачу», тратя меньше токенов (выдавая более краткие ответы).

Запрос: «Скажи мне что-нибудь глубокое, что заставит задуматься обо всём».

Ответ GPT-4.5: «Сейчас вы живёте в том, что ваше прошлое “я” когда-то представляло себе как будущее, и когда-нибудь этот момент станет лишь далёким воспоминанием. Вы действительно есть или просто влачите своё существование в ожидании чего-то другого?».

Фрагмент более длинного ответа GPT-4: «Каждая ваша мысль, каждое убеждение и каждая эмоция формируются под влиянием опыта, культуры и воспитания, но насколько всё это действительно вы? Если отбросить всё, чему вас учили, всё, что ждёт от вас общество, и все ярлыки, что останется?».

Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fpallavmac%2Fstatus%2F1895593266365759534&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Pallav Agarwal </a>
Источник: Pallav Agarwal 

Эмоциональный интеллект

  • Журналисты издания Data camp попросили GPT-4.5 написать «агрессивное электронное письмо боссу». Модель «уловила раздражение», предупредила, что агрессия может испортить отношения на работе, и предложила «более профессиональный и конструктивный» ответ.
  • При этом если явно попросить написать агрессивное письмо, модель «подчинится», пишет Data Camp.
Модель предупреждает, что агрессивное письмо может повредить профессиональным отношениям, и пишет вежливый вариант. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fchatgpt.com%2Fshare%2F67c0d852-4b38-8001-a3ed-7ea7bb0e6c8b&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">запрос Data camp</a>
Модель предупреждает, что агрессивное письмо может повредить профессиональным отношениям, и пишет вежливый вариант. Источник: запрос Data camp
  • Один из разработчиков подключил GPT-4.5 для автоматических ответов по электронной почте и отметил: модель «идеально подходит для создания ИИ-агентов, похожих на людей», так как она отвечает коротко, по делу и «более человечно».
Пример ответа ИИ-агента для писем на базе GPT-4.5. «Он говорит как я», — написал разработчик. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2FJulianGoldieSEO%2Fstatus%2F1896334711309598996&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Julian Goldie</a>
Пример ответа ИИ-агента для писем на базе GPT-4.5. «Он говорит как я», — написал разработчик. Источник: Julian Goldie

Креативность

  • Андрей Карпатый считает, что GPT-4.5 будет показывать себя лучше в задачах, не требующих сложных рассуждений: креативности и юморе. Он привёл сравнения ответов GPT-4.5 и GPT-4 в тестах на написание текстов.

Запрос: «Создай новый литературный жанр — смесь киберпанка, магического реализма и древней мифологии».

Фрагмент ответа GPT-4.5: «"Ты рано, — пробормотал Гермес, появившийся рядом с ней в дрожащем мерцании, в кроссовках с пульсирующими крыльями из переливающегося неона. — Врата Олимпа откроются только через три микроцикла". "Когда охотишься за тенями, рано не бывает", — прошептала Неа. Она рисовала в воздухе символы, вычерчивая пальцами саму реальность, соединяя линии древних рун и квантового кода».

Фрагмент ответа GPT-4: «Дельфийский оракул транслировала свои последние видения тысячам верующих, её голос дробился на дюжину сигналов на языках, на которых никогда не говорил человек. Но Ориос не искал пророчества. Он охотился за мифом. Старых — Зевса, Одина, даже Нефритового императора — поглотили, их легенды оцифрованы, их сила перекачана в хранилища корпораций. Но один бог вырвался из нейронной решётки — Прометей».

Слева ответ GPT-4.5, справа — GPT-4. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Fkarpathy%2Fstatus%2F1895337579589079434&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Andrej Karpathy</a>
Слева ответ GPT-4.5, справа — GPT-4. Источник: Andrej Karpathy
Пользователь X отметил, что качество SVG-файлов, которые GPT-4.5 рисует по текстовому запросу, «отлично подходит для логотипов». Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2FYoshidaTaiki%2Fstatus%2F1895343988703666257&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">ArtI </a>
Пользователь X отметил, что качество SVG-файлов, которые GPT-4.5 рисует по текстовому запросу, «отлично подходит для логотипов». Источник: ArtI 
Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.reddit.com%2Fr%2FChatGPT%2Fcomments%2F1iuoy7x%2Ftrue%2F%3Futm_source%3Dshare%26amp%3Butm_medium%3Dweb3x%26amp%3Butm_name%3Dweb3xcss%26amp%3Butm_term%3D1%26amp%3Butm_content%3Dshare_button&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Sweet-Category-6823</a>
Источник: Sweet-Category-6823

Задачи на вычисления

  • В тесте Data сamp GPT-4.5 хуже показал себя в заданиях на математику и логику, чем рассуждающая модель o3-mini.
Задача: «Используй все цифры от 0 до 9 только один раз, чтобы найти x, y, z, где x + y = z». GPT-4.5 ответила неверно. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.datacamp.com%2Fblog%2Fgpt-4-5%3Fdc_referrer%3Dhttps%253A%252F%252Fwww.datacamp.com%252Fblog%252Fgpt-4-5&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Data сamp</a>
Задача: «Используй все цифры от 0 до 9 только один раз, чтобы найти x, y, z, где x + y = z». GPT-4.5 ответила неверно. Источник: Data сamp
o3-mini ответила верно. Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fwww.datacamp.com%2Fblog%2Fgpt-4-5%3Fdc_referrer%3Dhttps%253A%252F%252Fwww.datacamp.com%252Fblog%252Fgpt-4-5&postId=1844263" rel="nofollow noreferrer noopener" target="_blank">Data сamp</a>
o3-mini ответила верно. Источник: Data сamp
Модель смогла написать код для прыгающих шариков внутри шестиугольника и сделать результат «креативным». Источник: OpenAIDevs

Цена работы через API в сравнении с другими моделями компании

  • GPT‑4.5 стоит $75 за 1 млн входящих токенов и $150 за 1 млн исходящих при работе через API. Это самая дорогая из существующих моделей OpenAI.
Цены на работу с рассуждающими o1 и o3-mini через API. Источник: OpenAI
Цены на работу с рассуждающими o1 и o3-mini через API. Источник: OpenAI
Цены на работу с не рассуждающими моделями. Источник: OpenAI
Цены на работу с не рассуждающими моделями. Источник: OpenAI
  • Однако Натан Ламберт напоминает, что во время выхода в 2023 году GPT-4 стоила $60 за 1 млн входящих токенов, а потом цена снизилась примерно в десять раз.
17
2
1
29 комментариев