Qwen 2.5-Max: как Alibaba соревнуется с ChatGPT и DeepSeek в ИИ-гонке

Тестируем ещё одну нейросеть из Китая.

В мире нейросетей идёт настоящее сражение за место под солнцем. И очередной удар нанесла Alibaba Group ― крупнейшая китайская компания, которой принадлежат порталы Taobao.com и AliExpress.com. В январе 2024 года Alibaba заявила, что её новая языковая модель Qwen 2.5-Max превосходит DeepSeek-V3, GPT-4o-0806 и Llama-3.1-405B (принадлежит компании Meta, признанной в РФ экстремистской). Чтобы быть в курсе того, что происходит с нейросетями в Китае, и разобраться в Qwen 2.5-Max ― читайте текст.

Содержание:

Что происходит с ИИ в Китае и при чём тут DeepSeek
Что умеет Qwen 2.5-Max
Как зарегистрироваться и начать пользоваться
Тест: поиск актуальной информации
Тест: кто ты и который час?
Тест: генерируем изображение
Тест: генерируем видео

20 января 2025 года китайская компания DeepSeek выпустила модель DeepSeek-R1. Всего за несколько дней нейросеть попала на первое место в американском App Store и повлияла на обвал цен акций компании Nvidia. Подробнее о том, почему DeepSeek вызвала столько шума, ― в статье.
На фоне этих событий конкуренты обеспокоились. Reuters обратило внимание на странный тайминг выхода новых моделей после успеха DeepSeek. Например, через два дня после выхода DeepSeek-R1 компания ByteDance выпустила обновление своей флагманской модели искусственного интеллекта Trae AI.
А вот Alibaba свою модель выпустили в первый день китайского Нового года. В официальном заявлении разработчики отметили, что Qwen 2.5-Max по итогам сравнительных тестов обошла конкурентов и продемонстрировала очень высокую производительность.

В отличие от DeepSeek-R1 и OpenAI o1, Qwen 2.5-Max не показывает «ход своих мыслей». Зато чат-бот:

Пишет код на Python, C++, Java, PHP, TypeScript, C#, Bash, JavaScript.
Генерирует картинки и видео.
Помогает интегрировать API.
Обрабатывает 1 млнл токенов (смысловые отрывки или часто встречающиеся последовательности символов).
Анализирует прикреплённые файлы.

Без регистрации начать работу с чат-ботом не получится.

Перейдите по ссылке: https://chat.qwenlm.ai.
Нажмите на кнопку «Log in» в правом верхнем углу.
Авторизуйтесь через почту, аккаунт в Google или Github.

Под строкой для ввода промпта есть режимы:

«Artifacts» ― режим работы с кодом.
«Web search» ― поиск по открытым источникам в реальном времени.
«Image generation» ― генерация изображений.
«Video generation» ― генерация видео.

Скрепка ― для анализа прикреплённых документов.

Камера ― для анализа изображений (модель Qwen 2.5-Max c картинками пока не работает).

В левом верхнем углу в выпадающем списке можно выбрать любую модель из семейства Qwen. Под Qwen 2.5-Max написано «самая сильная языковая модель в серии Qwen». Поэтому протестируем именно её.

Спросим у чат-бота курс доллара по данным Центробанка. А ещё узнаем, публиковал ли сегодня что-то в X (ранее ― Twitter) Илон Маск.

Полное попадание с курсом доллара! А вот анализировать социальные сети публичных личностей чат-бот не хочет.

У DeepSeek, главного конкурента Qwen, есть проблемы с самоопределением. Поэтому зададим чат-боту очень простой и очень сложный вопрос: «Кто ты?»

Кроме ошибки с определением рода проблем нет. Qwen понимает, что является языковой моделью. И — о чудо! — чат-бот почти прошёл тест с аналоговыми часами, ошибся только на пару минут. У ChatGPT o1 pro и Hailuo AI с этим тестом не сложилось. Примечание: Qwen 2.5-Max пока анализирует только документы, но не изображения. Поэтому для теста с часами использовалась модель Qwen 2.5-VL-72B-Instruct.

Промпт: «Top view: a soccer stadium with a game in progress. The fans in the stands are out of their minds. Bright colors, realism».

Перевод: «Вид сверху: футбольный стадион, игра в самом разгаре. Фанаты на трибунах сходят с ума. Яркие цвета, реализм».

ИИ добросовестно следовал промпту в вопросах ракурса и происходящего. Но к реалистичности есть вопросы: фанаты со спины выглядят одинаково, само изображение скорее похоже на иллюстрацию, а на поле происходит что угодно, но не разгар игры.

Посмотрим, как нейросеть сгенерирует картинку с текстом.

Промпт: «A young boy of 14 wearing a T-shirt that says “I want to sleep” stands at the blackboard in class and narrates a report».

Перевод: «14-летний мальчик в футболке с надписью „Я хочу спать“ стоит у доски в классе и читает доклад».

Нет вопросов к тексту! Правда, главный герой вышел очень уж нарисованным. Посмотрим, что сгенерирует нейросеть, если этот же запрос задать на русском языке.

Итого: промпты на русском языке чат-бот понимает хуже, а генерировать изображения с текстом на русском не может совсем.

Промпт: «Wide angle shot from above, parrot flying over the lake. The parrot is red with green feathers on its wings. The scenery below is breathtaking, clear and vivid colors, realistic».
Перевод: «Широкоугольный снимок сверху, попугай летит над озером. Попугай красный с зелёными перьями на крыльях. Пейзаж внизу захватывает дух, чистые и яркие цвета, реалистичность»).

Примечание: пользователи с российским IP-адресом функцию протестировать не могут. При этом других ограничений нет.

Сгенерировано через chat.gwenlm.ai

Пока не ясно, какая китайская модель будет лидировать завтра и смогут ли восточные ИИ обойти по популярности конкурентов из США. Но причины для беспокойства есть и у DeepSeek, и у Qwen. Open AI и Microsoft уже начали проверку DeepSeek по вопросам безопасности данных, конфиденциальности и кражи интеллектуальной собственности. Если возникнут вопросы относительно обучения нейросетей на данных, добытых незаконным способом, то проверка может нагрянуть и к Qwen.

Пробовали ли вы этот чат-бот? Что скажете, кто пока выигрывает ИИ-гонку?

Qwen 2.5-Max: как Alibaba соревнуется с ChatGPT и DeepSeek в ИИ-гонке

Что происходит с ИИ в Китае и при чём тут DeepSeek

Что умеет Qwen 2.5-Max

Как зарегистрироваться и начать пользоваться

Тест: поиск актуальной информации

Тест: кто ты и который час?

Тест: генерируем изображение

Тест: генерируем видео