DeepSeek представила улучшенную модель VL2 для анализа изображений
Китайская компания DeepSeek выпустила серию моделей VL2, способных распознавать объекты, анализировать документы и даже предлагать рецепты по фотографиям продуктов.
Что нового в DeepSeek-VL2?
🔹 Использует метод "смеси экспертов" (MoE) – комбинацию нейросетей для сложных задач.
🔹 Три варианта:
- VL2-Tiny (1 млрд параметров)
- VL2-Small (2,8 млрд параметров)
- VL2 (4,5 млрд параметров)
- 🔹 Функции:
- Анализ документов, таблиц и диаграмм
- Распознавание рукописного текста и его преобразование в печатный
- Поиск аналогичных объектов на разных изображениях
Доступность
✅ VL2-Small – в бесплатной демоверсии на Hugging Face
❌ VL2 пока нет в чат-боте
Китайская альтернатива OpenAI?
🌍 В 2023 году ChatGPT научился распознавать изображения, но китайские компании догоняют:
- В декабре 2024 года Alibaba выпустила QvQ-72B для анализа графиков.
- В январе 2025-го – Qwen 2.5-VL для разметки объектов.
⚡ DeepSeek стремится закрепить лидерство в ИИ для визуального анализа, предлагая более доступные и эффективные решения.
Начать дискуссию