Буквально сегодня тестировал в написании кода: ChatGPT, Claude, Gemini и DeepSeek. Подготовил подробный промт.
Итог: DeepSeek — написал какую-то чушь, выдав самый худший результат. Claude — не рабочий код. Gemini — не рабочий код. ChatGPT — рабочий код, то, что было нужно!
Не понимаю, откуда такие показатели. Ощущение, что они делали алгоритмы под эти же бенчмарки, чтобы хайп собрать.
Это показатели модели r1. Чтобы ее включить надо прожать кнопочку deepthink, что многие не делают, в итоге испольдуется другая модель - v3. Обычная 4о и даже о1-мини по сравнению с r1 крайне тупые.
Буквально сегодня тестировал в написании кода: ChatGPT, Claude, Gemini и DeepSeek. Подготовил подробный промт.
Итог:
DeepSeek — написал какую-то чушь, выдав самый худший результат.
Claude — не рабочий код.
Gemini — не рабочий код.
ChatGPT — рабочий код, то, что было нужно!
Не понимаю, откуда такие показатели. Ощущение, что они делали алгоритмы под эти же бенчмарки, чтобы хайп собрать.
Аналогично, тоже проверял их всех, ChatGPT топ, особенно o1-mini
Не понимаю, откуда такие показатели
Это показатели модели r1. Чтобы ее включить надо прожать кнопочку deepthink, что многие не делают, в итоге испольдуется другая модель - v3. Обычная 4о и даже о1-мини по сравнению с r1 крайне тупые.
Может ты с ИИ работать не можешь ???😄😄😄