Alibaba представила Qwen 2.5-Omni-7B — мультимодальную модель с открытым кодом

Alibaba представила Qwen 2.5-Omni-7B — мультимодальную модель с открытым кодом

Alibaba выпустила Qwen 2.5-Omni-7B — мультимодальную ИИ-модель, которая распознаёт текст, изображения, аудио и видео, а также отвечает голосом и текстом.

Что умеет Qwen 2.5-Omni-7B?

✅ Поддерживает текст, изображения, аудио и видео.
✅ Может работать на смартфонах и ноутбуках.
✅ Разработана для голосовых приложений и ИИ-агентов.
✅ Возможные сценарии использования:

  • Аудиоописания для людей с нарушением зрения.
  • Анализ видео (например, подсказки во время готовки).
  • Клиентская поддержка и автоматизация сервисов.

Где доступна?

🔹 Hugging Face, GitHub, ModelScope – код открыт для разработчиков. 🔹 Qwen Chat – модель появится в официальном сервисе Alibaba.

Инвестиции и развитие Qwen

  • Сентябрь 2024 – представлена линейка Qwen 2.5.
  • Январь 2025 – выпущена Qwen 2.5-Max.
  • 6 марта 2025 – модель QwQ-32B, которая в тестах приблизилась к DeepSeek-R1.
  • 24 февраля 2025 – Alibaba объявила о $52 млрд инвестиций в облачные платформы и ИИ-инфраструктуру.

Qwen 2.5-Omni-7B — ещё один шаг Alibaba в развитии гибких ИИ-агентов, способных работать на широком спектре устройств.

Начать дискуссию