Тест бесплатных «рассуждающих» ИИ-моделей Gemini 2.0 от Google, DeepSeek и Qwen от Alibaba

«Скормили» им несколько заданий на вычисления, работу с таблицей и проверку кода.

Тест бесплатных «рассуждающих» ИИ-моделей Gemini 2.0 от Google, DeepSeek и Qwen от Alibaba
13
1
5
1
1

Статья просто констатирует, что модели "предварительно размышляют", но не анализирует качество этих рассуждений. Было бы полезно увидеть примеры "мыслей" моделей и оценить их логичность, последовательность и адекватность. Простое перечисление правильных/неправильных ответов не дает полной картины.