Alibaba выпустила гибридную модель Qwen3 — она «рассуждает», генерирует картинки и видео

По заявлениям компании, она превосходит o3-mini от OpenAI в тестах.

  • Компания представила семейство гибридных моделей Qwen3. Они сами определяют, когда включать режим рассуждений, например во время написания кода. На простые вопросы модели будут отвечать быстро.
  • В тестах на программирование и математику флагманская модель Qwen3-235B-A22B превзошла DeepSeek-R1, Grok 3, а также o1 и o3-mini от OpenAI, утверждает Alibaba. При этом она уступила Gemini 2.5 Pro от Google.
Результаты моделей от разных компаний в тестах. Источник: Alibaba
Результаты моделей от разных компаний в тестах. Источник: Alibaba
  • Флагманскую модель добавили в бесплатный чат-бот Qwen Chat, который доступен в том числе из России. Там Qwen3 может анализировать документы, генерировать изображения и видео.
Пользователь сравнил, как модели в разных чат-ботах генерируют картинки. Результат Qwen3 — слева вверху. Дальше по часовой стрелке — GPT-4o, Grok, Doubao. Запрос:«Крошечная девочка в шляпе играет на гитаре в игрушечном саду». Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2FTresmort%2Fstatus%2F1917011131756904728&postId=1954642" rel="nofollow noreferrer noopener" target="_blank">Tresmort</a>
Пользователь сравнил, как модели в разных чат-ботах генерируют картинки. Результат Qwen3 — слева вверху. Дальше по часовой стрелке — GPT-4o, Grok, Doubao. Запрос:«Крошечная девочка в шляпе играет на гитаре в игрушечном саду». Источник: Tresmort
  • Картинки Qwen3 создаёт за несколько секунд, а видео — около пяти минут.
Результат Qwen3 по запросу: «Дайвер плывёт под водой». Генерация vc.ru
  • Для разработчиков компания выложила открытый исходный код версии на 32 млрд параметров и более лёгкие модели — 0,6B, 1,7B, 4B, 8B и 14B. Они доступны для скачивания на Hugging Face и GitHub.
  • Семейство Qwen3 поддерживает 119 языков и диалектов, включая русский и украинский.
11
4
1
33 комментария