Десятикратное ускорение и бьютификация генераций — что изменилось в новой версии нейросети Kandinsky 3.1

Рассказываем, как скоро модель выйдет в широкий доступ и как получить дорелизный инвайт.

Ключевыми особенностями новой версии стало улучшение качества генераций за счёт обучения на увеличенном датасете изображений и высокая скорость обработки картинок — время одной генерации сократилось почти в 10 раз, а разрешение можно повысить до 4K.

Также появилась возможность улучшения текстового запроса пользователя с помощью языковой модели. Если вы пользовались прошлыми версиями Kandinsky или другими генеративными моделями, то замечали, насколько влияет на результат детализированность запроса. Однако, большинство запросов пользователей очень короткие и содержат мало подробностей об объекте генерации — на помощь им приходит функция бьютификации: на вход языковой модели подаётся инструкция с просьбой улучшить запрос, и ответ модели подается на вход Kandinsky для генерации.

Сегодня ровно год, как вышла версия Kandinsky 2.1. За это время мы постоянно развивали нашу нейросеть, которая помогает людям создавать новые образы и даёт абсолютно каждому феноменальные возможности для творчества. По сравнению с предыдущей моделью Kandinsky 3.1 стал ещё быстрее, удобнее и реалистичнее. Kandinsky 3.1 — это гибкий, многофункциональный и абсолютно бесплатный инструмент, который превратит любого человека в художника и творца.
Александр Ведяхин, первый заместитель Председателя Правления Сбербанка

В конце апреля модель Kandinsky 3.1 вышла в широкой доступ — переходите по ссылке и тестируйте возможности новой версии. В Telegram-боте также доступна версия Kandinsky 3.1 Flash с уменьшенной в 10 раз скоростью генерации изображений (в сравнении с базовой моделью).

Также в ближайшее время появится новая модель Kandinsky Video 1.1 для генерации видео по текстовым описаниям. Нашей команде удалось существенно повысить качество генераций за счёт увеличения объёма обучающего датасета пар «текст-видео» и архитектурных улучшений модели. Внесённые изменения также позволили повысить разрешение видео в два раза по сравнению с Kandinsky Video 1.0.

Модель разработана командой Sber AI при партнёрской поддержке учёных из Института искусственного интеллекта AIRI на объединённых датасетах Sber AI и компании SberDevices.