Alibaba выпустила рассуждающую модель QwQ-32B, «сопоставимую» с DeepSeek-R1

На этом фоне акции компании выросли на 8%.

  • В некоторых тестах QwQ-32B превзошла o1-mini от Open AI и приблизилась к результатам DeepSeek-R1, хотя не смогла обойти её в тестах на программирование.
Источник: Qwen
Источник: Qwen
  • При этом QwQ-32B — это модель на 32 млрд параметров против 671 млрд параметров у DeepSeek-R1. По словам разработчиков, постоянное обучение «может помочь модели среднего размера достичь конкурентоспособной производительности по сравнению с гигантской моделью».
  • Alibaba добавила QwQ-32B в бесплатный чат-бот Qwen Chat, веса выложила на HuggingFace.
  • На фоне выхода новой модели акции компании выросли на 8,4% по итогам торгов в Гонконге 6 марта 2025 года, пишет Bloomberg.
12
3
1
30 комментариев