>Не понимаю, откуда такие показатели Это показатели модели r1. Чтобы ее включить надо прожать кн…

Полина Лааксо

28 янв

«Мы выпустим лучше»: как OpenAI, Трамп и Nvidia отреагировали на ажиотаж вокруг нейросетей китайской DeepSeek

Её чат-бот до сих пор первый в списке самых скачиваемых бесплатных приложений в американском App Store.

Sasha

28 янв

Буквально сегодня тестировал в написании кода: ChatGPT, Claude, Gemini и DeepSeek. Подготовил подробный промт.

Итог:
DeepSeek — написал какую-то чушь, выдав самый худший результат.
Claude — не рабочий код.
Gemini — не рабочий код.
ChatGPT — рабочий код, то, что было нужно!

Не понимаю, откуда такие показатели. Ощущение, что они делали алгоритмы под эти же бенчмарки, чтобы хайп собрать.

Ответить

Vladimir Dorogov

29 янв

Аналогично, тоже проверял их всех, ChatGPT топ, особенно o1-mini

Ответить

Valentin Budaev

вчера

Не понимаю, откуда такие показатели

Это показатели модели r1. Чтобы ее включить надо прожать кнопочку deepthink, что многие не делают, в итоге испольдуется другая модель - v3. Обычная 4о и даже о1-мини по сравнению с r1 крайне тупые.

Ответить

Татьяна

28 янв

Может ты с ИИ работать не можешь ???😄😄😄

Ответить