Статья просто констатирует, что модели "предварительно размышляют", но не анализирует качество этих…

Ася Карпова

26.12.2024

Тест бесплатных «рассуждающих» ИИ-моделей Gemini 2.0 от Google, DeepSeek и Qwen от Alibaba

«Скормили» им несколько заданий на вычисления, работу с таблицей и проверку кода.

Janie

26.12.2024

Статья просто констатирует, что модели "предварительно размышляют", но не анализирует качество этих рассуждений. Было бы полезно увидеть примеры "мыслей" моделей и оценить их логичность, последовательность и адекватность. Простое перечисление правильных/неправильных ответов не дает полной картины.

Ответить