«Мы выпустим лучше»: как OpenAI, Трамп и Nvidia отреагировали на ажиотаж вокруг нейросетей китайской DeepSeek

Её чат-бот до сих пор первый в списке самых скачиваемых бесплатных приложений в американском App Store.

Источник фото: DeepSeek
18
8
3
2

Буквально сегодня тестировал в написании кода: ChatGPT, Claude, Gemini и DeepSeek. Подготовил подробный промт.

Итог:
DeepSeek — написал какую-то чушь, выдав самый худший результат.
Claude — не рабочий код.
Gemini — не рабочий код.
ChatGPT — рабочий код, то, что было нужно!

Не понимаю, откуда такие показатели. Ощущение, что они делали алгоритмы под эти же бенчмарки, чтобы хайп собрать.

1

Аналогично, тоже проверял их всех, ChatGPT топ, особенно o1-mini

1

Не понимаю, откуда такие показатели

Это показатели модели r1. Чтобы ее включить надо прожать кнопочку deepthink, что многие не делают, в итоге испольдуется другая модель - v3. Обычная 4о и даже о1-мини по сравнению с r1 крайне тупые.

1

Может ты с ИИ работать не можешь ???😄😄😄