Alibaba выпустила модель ИИ Qwen 2.5 которая, по ее словам, превосходит DeepSeek и GPT-4o🧧🎆

Необычное время выхода Qwen 2.5-Max — в первый день Лунного Нового года, когда большинство китайцев отдыхают и проводят время с семьями, — указывает на то, что стремительный рост китайского стартапа DeepSeek за последние три недели оказал давление не только на зарубежных конкурентов, но и на местных.

Попробовать <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fchat.qwenlm.ai%2F&postId=1782073" rel="nofollow noreferrer noopener" target="_blank">Qwen</a> 
Попробовать Qwen 

Следим за развитием гонки моделей ИИ 😎 и подписываемся на мой ТГ-канал:

«Qwen 2.5-Max превосходит почти по всем параметрам GPT-4o, DeepSeek-V3 и Llama-3.1-405B», — говорится в объявлении облачного подразделения Alibaba, опубликованном в официальном аккаунте WeChat.

Qwen2.5-VL привносит мультимодальные возможности в портфолио Alibaba Cloud

Визуально-языковая модель Qwen2.5-VL компании расширяет возможности своей предшественницы, предлагая размеры параметров от 3 до 72 миллиардов. Технология объединяет текстовую и визуальную обработку для анализа изображений, диаграмм и видеоконтента.

Модель обрабатывает видеоконтент, длительность которого превышает один час, и определяет конкретные временные сегменты для запросов. Эта возможность позволяет пользователям выполнять поиск в видеоконтенте и извлекать информацию из определенных моментов.

Основная функция Qwen2.5-VL — это функциональность вывода структурированных данных. Технология включает в себя функции анализа и локализации, которые позволяют ей работать как визуальному помощнику для задач компьютера и мобильного устройства.

Флагманская модель Qwen2.5-VL-72B-Instruct доступна через платформу Qwen Chat. Модель демонстрирует возможности чтения документов, интерпретации диаграмм и визуального ответа на вопросы в различных секторах, включая образование и математику.

Alibaba Cloud представляет контекст на миллион токенов с Qwen2.5-1M

Alibaba Cloud также объявила о запуске Qwen2.5-1M, версии своей языковой модели, способной обрабатывать до миллиона токенов. Токены — это основные единицы текста, которые обрабатывают языковые модели, причем каждый токен обычно представляет слово или часть слова.

  • Qwen2.5-1M обрабатывает до 1 миллиона токенов в одном контекстном окне
  • Новая структура обрабатывает входные данные в 3–7 раз быстрее, чем традиционные методы
  • Qwen2.5-VL предлагает версии от 3 до 72 миллиардов параметров.

Согласно технической документации компании, платформа обрабатывает миллионы токенов со скоростью, в три-семь раз превышающей скорость традиционных методов.

Qwen2.5-VL и Qwen2.5-1M доступны через каналы с открытым исходным кодом, включая Hugging Face и Model Scope, платформу сообщества разработчиков Alibaba.

Кто следующий представит мощную модель ИИ, как думаете?
#ai #gpt #gpt4 #deepseek #genai

1
Начать дискуссию