Для этого готовую модель Qwen они дообучили методом «дистилляции» с помощью Gemini 2.0 Flash Thinking.
Это, конечно, впечатляет, но нужно понимать, что $50 - это только за обучение. А сколько стоит разработка, поддержка, тестирование? И главное - сколько стоит команда специалистов, которые будут с этим работать?