Новая генеративная модель Сбера Kandinsky 2.1 создает высококачественные изображения по их текстовому описанию на естественном языке. Она умеет смешивать несколько рисунков, изменять их по текстовому описанию, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting).
Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.
Нейросеть разработали и обучили исследователи Sber AI на датасете компании SberDevices.
Новая модель Kandinsky 2.1 унаследовала данные предыдущей версии, обученной на 1 млрд пар «текст — изображение». Затем она дообучалась на отдельно собранном датасете из 2 млн пар качественных изображений. В данный сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей.
Попробовать новую нейронку от Сбера можно в боте, не выходя из телеграма (https://t.me/kandinsky21_bot).