Alibaba выпустила гибридную модель Qwen3 — она «рассуждает», генерирует картинки и видео
По заявлениям компании, она превосходит o3-mini от OpenAI в тестах.
- Компания представила семейство гибридных моделей Qwen3. Они сами определяют, когда включать режим рассуждений, например во время написания кода. На простые вопросы модели будут отвечать быстро.
- В тестах на программирование и математику флагманская модель Qwen3-235B-A22B превзошла DeepSeek-R1, Grok 3, а также o1 и o3-mini от OpenAI, утверждает Alibaba. При этом она уступила Gemini 2.5 Pro от Google.
Результаты моделей от разных компаний в тестах. Источник: Alibaba
- Флагманскую модель добавили в бесплатный чат-бот Qwen Chat, который доступен в том числе из России. Там Qwen3 может анализировать документы, генерировать изображения и видео.
Пользователь сравнил, как модели в разных чат-ботах генерируют картинки. Результат Qwen3 — слева вверху. Дальше по часовой стрелке — GPT-4o, Grok, Doubao. Запрос:«Крошечная девочка в шляпе играет на гитаре в игрушечном саду». Источник: Tresmort
- Картинки Qwen3 создаёт за несколько секунд, а видео — около пяти минут.
Результат Qwen3 по запросу: «Дайвер плывёт под водой». Генерация vc.ru
- Для разработчиков компания выложила открытый исходный код версии на 32 млрд параметров и более лёгкие модели — 0,6B, 1,7B, 4B, 8B и 14B. Они доступны для скачивания на Hugging Face и GitHub.
- Семейство Qwen3 поддерживает 119 языков и диалектов, включая русский и украинский.
33 комментария