Китайский DeepSeek представил модели Janus Pro для генерации картинок

По словам стартапа, в двух тестах Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.

  • Это мультимодальные модели, которые могут анализировать изображения и создавать новые, пишут TechCrunch и The Verge. Размер — от 1 млрд до 7 млрд параметров. У них открытый исходный код, доступен на Hugging Face. На сайте также появилась бесплатная демоверсия.
  • Janus Pro может анализировать и генерировать только изображения с разрешением до 384 x 384, указывают издания.
  • Новая модель — обновлённая версия Janus, которую китайский стартап выпустил в конце 2024 года, пишет Reuters. Компания пояснила, что она превосходит Janus за счёт «усовершенствованных» процессов обучения, качества данных и размера модели.
Сравнение результатов Janus и Janus-Pro-7B. Источник: DeepSeek
Сравнение результатов Janus и Janus-Pro-7B. Источник: DeepSeek
«Только что попробовал сгенерировать изображение птички, которая выглядит как теннисный мяч, с помощью новой Janus-Pro-7B, вот что получилось». Источник: <a href="https://api.vc.ru/v2.8/redirect?to=https%3A%2F%2Fx.com%2Favrecum%2Fstatus%2F1883948184583721127&postId=1777794" rel="nofollow noreferrer noopener" target="_blank">Alex</a>
«Только что попробовал сгенерировать изображение птички, которая выглядит как теннисный мяч, с помощью новой Janus-Pro-7B, вот что получилось». Источник: Alex
  • По данным компании, в тестах GenEval и DPG-Bench модель Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.
  • Шумиха вокруг DeepSeek не утихает 27 января 2025 года, когда приложение стартапа стало самым скачиваемым бесплатным приложением в американском App Store, сместив чат-бота ChatGPT от OpenAI на второе место.
  • После этого некоторые пользователи столкнулись со сбоем, акции ИТ-компаний стали резко падать, а DeepSeek ограничил регистрацию пользователей из-за кибератаки.
32
8
3
2
1
72 комментария