Alibaba выпустила рассуждающую модель QwQ-32B, «сопоставимую» с DeepSeek-R1
На этом фоне акции компании выросли на 8%.
- В некоторых тестах QwQ-32B превзошла o1-mini от Open AI и приблизилась к результатам DeepSeek-R1, хотя не смогла обойти её в тестах на программирование.
Источник: Qwen
- При этом QwQ-32B — это модель на 32 млрд параметров против 671 млрд параметров у DeepSeek-R1. По словам разработчиков, постоянное обучение «может помочь модели среднего размера достичь конкурентоспособной производительности по сравнению с гигантской моделью».
- Alibaba добавила QwQ-32B в бесплатный чат-бот Qwen Chat, веса выложила на HuggingFace.
- На фоне выхода новой модели акции компании выросли на 8,4% по итогам торгов в Гонконге 6 марта 2025 года, пишет Bloomberg.
30 комментариев