Alibaba представила Qwen 2.5-Omni-7B — мультимодальную модель с открытым кодом
Alibaba выпустила Qwen 2.5-Omni-7B — мультимодальную ИИ-модель, которая распознаёт текст, изображения, аудио и видео, а также отвечает голосом и текстом.
Что умеет Qwen 2.5-Omni-7B?
✅ Поддерживает текст, изображения, аудио и видео.
✅ Может работать на смартфонах и ноутбуках.
✅ Разработана для голосовых приложений и ИИ-агентов.
✅ Возможные сценарии использования:
- Аудиоописания для людей с нарушением зрения.
- Анализ видео (например, подсказки во время готовки).
- Клиентская поддержка и автоматизация сервисов.
Где доступна?
🔹 Hugging Face, GitHub, ModelScope – код открыт для разработчиков. 🔹 Qwen Chat – модель появится в официальном сервисе Alibaba.
Инвестиции и развитие Qwen
- Сентябрь 2024 – представлена линейка Qwen 2.5.
- Январь 2025 – выпущена Qwen 2.5-Max.
- 6 марта 2025 – модель QwQ-32B, которая в тестах приблизилась к DeepSeek-R1.
- 24 февраля 2025 – Alibaba объявила о $52 млрд инвестиций в облачные платформы и ИИ-инфраструктуру.
Qwen 2.5-Omni-7B — ещё один шаг Alibaba в развитии гибких ИИ-агентов, способных работать на широком спектре устройств.
Начать дискуссию