Китайский DeepSeek представил модели Janus Pro для генерации картинок
По словам стартапа, в двух тестах Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.
- Это мультимодальные модели, которые могут анализировать изображения и создавать новые, пишут TechCrunch и The Verge. Размер — от 1 млрд до 7 млрд параметров. У них открытый исходный код, доступен на Hugging Face. На сайте также появилась бесплатная демоверсия.
- Janus Pro может анализировать и генерировать только изображения с разрешением до 384 x 384, указывают издания.
- Новая модель — обновлённая версия Janus, которую китайский стартап выпустил в конце 2024 года, пишет Reuters. Компания пояснила, что она превосходит Janus за счёт «усовершенствованных» процессов обучения, качества данных и размера модели.
Сравнение результатов Janus и Janus-Pro-7B. Источник: DeepSeek
«Только что попробовал сгенерировать изображение птички, которая выглядит как теннисный мяч, с помощью новой Janus-Pro-7B, вот что получилось». Источник: Alex
- По данным компании, в тестах GenEval и DPG-Bench модель Janus-Pro-7B превосходит Stable Diffusion 3 Medium и DALL-E 3 от OpenAI.
- Шумиха вокруг DeepSeek не утихает 27 января 2025 года, когда приложение стартапа стало самым скачиваемым бесплатным приложением в американском App Store, сместив чат-бота ChatGPT от OpenAI на второе место.
- После этого некоторые пользователи столкнулись со сбоем, акции ИТ-компаний стали резко падать, а DeepSeek ограничил регистрацию пользователей из-за кибератаки.
72 комментария