В докладе будет рассказано о диффузионных моделях, активно применяемых для генерации изображений в таких областях, как машинное обучение, компьютерное зрение, графический дизайн, искусство и т.д. Они основываются на диффузии (распространении) информации в изображении, где каждый пиксель изображения рассматривается как случайный процесс, который изменяется с течением времени. Будет приведены отличия диффузионных моделей от других генеративных моделей.
Будут рассмотрены различия таких диффузионных моделей, как Dall-E 2, Imagen, Stability AI’s Stable Diffusion, Midjourney, а также различные подходы к генерации изображений, такие как генеративно-состязательные сети (GAN). Также будут приведены некоторые примеры использования диффузионных моделей для генерации изображений, включая создание реалистичных фотографий лиц, архитектурных объектов, природных пейзажей и др.