DeepSeek представила улучшенную модель VL2 для анализа изображений

Китайская компания DeepSeek выпустила серию моделей VL2, способных распознавать объекты, анализировать документы и даже предлагать рецепты по фотографиям продуктов.

Что нового в DeepSeek-VL2?

🔹 Использует метод "смеси экспертов" (MoE) – комбинацию нейросетей для сложных задач.

🔹 Три варианта:

  • VL2-Tiny (1 млрд параметров)
  • VL2-Small (2,8 млрд параметров)
  • VL2 (4,5 млрд параметров)
  • 🔹 Функции:
  • Анализ документов, таблиц и диаграмм
  • Распознавание рукописного текста и его преобразование в печатный
  • Поиск аналогичных объектов на разных изображениях

Доступность

✅ VL2-Small – в бесплатной демоверсии на Hugging Face
❌ VL2 пока нет в чат-боте

Китайская альтернатива OpenAI?

🌍 В 2023 году ChatGPT научился распознавать изображения, но китайские компании догоняют:

  • В декабре 2024 года Alibaba выпустила QvQ-72B для анализа графиков.
  • В январе 2025-го – Qwen 2.5-VL для разметки объектов.

⚡ DeepSeek стремится закрепить лидерство в ИИ для визуального анализа, предлагая более доступные и эффективные решения.

Начать дискуссию