Generative Model3 [Paper Review] High-Resolution Image Synthesis with Latent Diffusion Models (Aka. Stable Diffusion) https://arxiv.org/abs/2112.10752 High-Resolution Image Synthesis with Latent Diffusion ModelsBy decomposing the image formation process into a sequential application of denoising autoencoders, diffusion models (DMs) achieve state-of-the-art synthesis results on image data and beyond. Additionally, their formulation allows for a guiding mechanism tarxiv.org ์ด๋ฒ ์ฃผ์ ๋ ์์ฃผ ์ ๋ช ํ Stable Diffuion ๋ ผ๋ฌธ์ ๋ฆฌ๋ทฐํด๋ณด๋.. 2025. 2. 4. [Notable] GANs ์ ์ฃผ์ ๋ฌธ์ ์ : Mode Collapse ์ Training Instability โ 1. Mode Collapse (๋ชจ๋ ๋ถ๊ดด)๐ฉ Mode Collapse๋?Mode Collapse๋ GAN์ ์์ฑ์(Generator)๊ฐ ๋ฐ์ดํฐ์ ๋ค์ํ ํจํด์ ํ์ตํ์ง ๋ชปํ๊ณ , ์ ํ๋ ํจํด๋ง ๋ฐ๋ณต์ ์ผ๋ก ์์ฑํ๋ ํ์์ ์๋ฏธํฉ๋๋ค.์์:๊ณ ์์ด ์ฌ์ง ๋ฐ์ดํฐ์ ์ผ๋ก ํ์ต์์ผฐ๋ค๋ฉด ๋ค์ํ ๊ณ ์์ด ์ด๋ฏธ์ง๋ฅผ ์์ฑํด์ผ ํฉ๋๋ค.๊ทธ๋ฌ๋ Mode Collapse๊ฐ ๋ฐ์ํ๋ฉด ์์ฑ์๋ "ํ ๊ฐ์ง ๊ณ ์์ด ์ ํ"๋ง ๋ฐ๋ณต์ ์ผ๋ก ์์ฑํ๊ฒ ๋ฉ๋๋ค.๐ ์ ๋ฐ์ํ ๊น?GAN์ ์์ฑ์(Generator)์ ํ๋ณ์(Discriminator)๊ฐ ๊ฒฝ์ํ๋ ๊ตฌ์กฐ์ ๋๋ค. ์ด ๊ณผ์ ์์:์์ฑ์๊ฐ ์ฐ์ฐํ ํ๋ณ์๋ฅผ ์ ์์ด๋ ํน์ ํจํด์ ๋ฐ๊ฒฌํฉ๋๋ค.์ด ํจํด์ ๋ฐ๋ณตํด์ ์ฌ์ฉํ๋ฉด ํ๋ณ์๋ฅผ ์์ผ ์ ์๋ค๊ณ ํ์ตํฉ๋๋ค.๊ฒฐ๊ตญ ๋ฐ์ดํฐ์ ๋ค์์ฑ์ด ์ฌ๋ผ์ง๊ณ ํน์ ๋ชจ.. 2025. 2. 4. Generative Model 1์ธ๋ Autoencoder(AE) ์ฃผ์ด์ง ์ ๋ ฅ ๋ฐ์ดํฐ๋ก๋ถํฐ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ฅ๋ ฅ์ ๊ฐ์ถ ๋ชจ๋ธ AE๋ ์ฃผ๋ก ๋น์ง๋ ํ์ต ๋ฐฉ์์ผ๋ก ์ฌ์ฉ๋๋ฉฐ, ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ ์ฌ ํํ(latent representation)์ผ๋ก ์์ถํ ํ ์ด๋ฅผ ๋ค์ ๋ณต์ํ์ฌ ์ ๋ ฅ ๋ฐ์ดํฐ์ ์ ์ฌํ ๋ฐ์ดํฐ๋ฅผ ์์ฑ Generative model 1์ธ๋ AE๋ ๊ธฐ๋ณธ์ ์ผ๋ก ์ธ์ฝ๋(encoder)์ ๋์ฝ๋(decoder)๋ผ๋ ๋ ๋ถ๋ถ์ผ๋ก ๊ตฌ์ฑ ์ธ์ฝ๋(encoder): ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ ์ฐจ์์ ์ ์ฌ ํํ์ผ๋ก ๋ณํํฉ๋๋ค. ์ด ์ ์ฌ ํํ์ ์ผ๋ฐ์ ์ผ๋ก ์ ์ฐจ์์ ๋ฐ์ง ๋ฒกํฐ์ ๋๋ค. ์ธ์ฝ๋๋ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ ์ฐจ์ ๊ณต๊ฐ์ผ๋ก ์์ถํ๋ ๋ฐฉ์์ผ๋ก ํ์ต๋ฉ๋๋ค. ๋์ฝ๋(decoder): ์ ์ฌ ํํ์ ์๋์ ๋ฐ์ดํฐ ๊ณต๊ฐ์ผ๋ก ๋ณต์ํ์ฌ ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํฉ๋๋ค. ๋์ฝ๋.. 2023. 7. 11. ์ด์ 1 ๋ค์