Выпущена нейросеть для создания картинок Stable Diffusion 3 Medium - IT Speaker, новости информационных технологий

Выпущена нейросеть для создания картинок Stable Diffusion 3 Medium

Редакция

16:49 / 13 июня 2024

Stability AI объявила о выпуске нейросети Stable Diffusion 3 MediumНовая версия ИИ-генератора изображений работает с 2 млрд параметров. По словам разработчиков, она является «самой сложной моделью генерации изображений на сегодняшний день».  

Stable Diffusion 3.0 значительно улучшила качество изображений и способность понимать подсказку (prompt или промпт), которая быстрее аналогов понимает длинные и сложные подсказки, учитывая пространственное мышление, композиционные элементы, действия и стили. Например, генерация по запросу «Зеленый куб на котором стоит красный шар с попугаем, окруженный по обе стороны котами» покажет действительно запрашиваемый результат. 

Как отмечает основатель российского сервиса Fabula AI Али Оздиев, разработчики Stable Diffusion 3.0 изменили архитектуру модели — вместо UNET используется трансформер, за счет чего изменения коснутся качества изображения и его мелких деталях. 

«В отличии от старых моделей здесь используется три текстовых энкодера, которые позволяют более грамотно понимать промты и определять наличие текстового запроса в нем, что позволяет рисовать на изображениях текст», — говорит эксперт. 




Поделиться новостью