본문 바로가기

Generative Model3

[Paper Review] High-Resolution Image Synthesis with Latent Diffusion Models (Aka. Stable Diffusion) https://arxiv.org/abs/2112.10752 High-Resolution Image Synthesis with Latent Diffusion ModelsBy decomposing the image formation process into a sequential application of denoising autoencoders, diffusion models (DMs) achieve state-of-the-art synthesis results on image data and beyond. Additionally, their formulation allows for a guiding mechanism tarxiv.org 이번 주제는 아주 유명한 Stable Diffuion 논문을 리뷰해보도.. 2025. 2. 4.

[Notable] GANs 의 주요 문제점: Mode Collapse 와 Training Instability ✅ 1. Mode Collapse (모드 붕괴)🚩 Mode Collapse란?Mode Collapse는 GAN의 생성자(Generator)가 데이터의 다양한 패턴을 학습하지 못하고, 제한된 패턴만 반복적으로 생성하는 현상을 의미합니다.예시:고양이 사진 데이터셋으로 학습시켰다면 다양한 고양이 이미지를 생성해야 합니다.그러나 Mode Collapse가 발생하면 생성자는 "한 가지 고양이 유형"만 반복적으로 생성하게 됩니다.🔍 왜 발생할까?GAN은 생성자(Generator)와 판별자(Discriminator)가 경쟁하는 구조입니다. 이 과정에서:생성자가 우연히 판별자를 잘 속이는 특정 패턴을 발견합니다.이 패턴을 반복해서 사용하면 판별자를 속일 수 있다고 학습합니다.결국 데이터의 다양성이 사라지고 특정 모.. 2025. 2. 4.

Generative Model 1세대 Autoencoder(AE) 주어진 입력 데이터로부터 새로운 데이터를 생성하는 능력을 갖춘 모델 AE는 주로 비지도 학습 방식으로 사용되며, 입력 데이터를 잠재 표현(latent representation)으로 압축한 후 이를 다시 복원하여 입력 데이터와 유사한 데이터를 생성 Generative model 1세대 AE는 기본적으로 인코더(encoder)와 디코더(decoder)라는 두 부분으로 구성 인코더(encoder): 입력 데이터를 저차원의 잠재 표현으로 변환합니다. 이 잠재 표현은 일반적으로 저차원의 밀집 벡터입니다. 인코더는 입력 데이터를 저차원 공간으로 압축하는 방식으로 학습됩니다. 디코더(decoder): 잠재 표현을 원래의 데이터 공간으로 복원하여 새로운 데이터를 생성합니다. 디코더.. 2023. 7. 11.

이전 1 다음

티스토리툴바