Bringing Old Photo Back to Life (CVPR 2020 oral)
์ด ๋
ผ๋ฌธ์์๋ ๋ฅ๋ฌ๋ ๊ธฐ๋ฒ์ ํ์ฉํ์ฌ ์ฌ๊ฐํ ํผ์์ ๊ฒช์ ์ค๋๋ ์ฌ์ง์ ๋ณต์ํ๋ ๋ฐฉ๋ฒ์ ๋ํด ์ ์ํ๋ค.
๊ธฐ์กด ์ง๋ ํ์ต์ ํตํด ํด๊ฒฐ๋ ์ ์๋ ๋ณต์ ์์ ๊ณผ ๋ฌ๋ฆฌ ์ค์ ์ฌ์ง์ ํผ์์ ๋ณต์กํ๋ฉฐ, ํฉ์ฑ ์ด๋ฏธ์ง์ ์ค์ ์ค๋๋ ์ฌ์ง ์ฌ์ด์ ๋๋ฉ์ธ ๊ฐ๊ฒฉ์ผ๋ก ์ธํด ๋คํธ์ํฌ ์ผ๋ฐํ์ ์คํจํ๋ค.
๋ฐ๋ผ์ ์ด ๋ ผ๋ฌธ์์๋ ์ค์ ์ฌ์ง๊ณผ ๋๊ท๋ชจ ํฉ์ฑ ์ด๋ฏธ์ง ์์ ํ์ฉํ์ฌ ์๋ก์ด ํธ๋ฆฌํ๋ฆฟ ๋๋ฉ์ธ ๋ณํ ๋คํธ์ํฌ๋ฅผ ์ ์ํ๋ค.
์ค๋๋ ์ฌ์ง๊ณผ ๊นจ๋ํ ์ฌ์ง์ ๊ฐ๊ฐ ๋ ๊ฐ์ ์ ์ฌ ๊ณต๊ฐ์ผ๋ก ๋ณํํ๊ธฐ ์ํด ๋๊ฐ์ ๋ณํ ์๋ ์ธ์ฝ๋(VAE)๋ฅผ ํ์ตํ๊ณ , ์ด๋ฅผ ํฉ์ฑ๋ ์ ๋ฐ์ดํฐ๋ก ํ์ตํ์ฌ ์ค์ ์ฌ์ง์ ์ ์ผ๋ฐํ ๋ ์ ์๋ ๋ณํ์ ์ํํ๋ค.
์ฌ๊ธฐ์ VAE๋?
- Variational Auto Encoder์ ์ค์๋ง๋ก, GAN, diffusion model๊ณผ ๊ฐ์ด generative model์ ํ ์ข ๋ฅ์ด๋ค.
- input๊ณผ output์ ๊ฐ๊ฒ ๋ง๋๋๊ฒ์ ํตํด ์๋ฏธ ์๋ latent space๋ฅผ ๋ง๋๋ autoencoder์ ๋น์ทํ๊ฒ encoder์ decoder๋ฅผ ํ์ฉํด latent space๋ฅผ ๋์ถํ๊ณ , ์ด latent space๋ก๋ถํฐ ์ฐ๋ฆฌ๊ฐ ์ํ๋ output decodingํจ์ผ๋ก์จ data generation์ ์งํํ๋ค.
- Encoder๋ input์ latent space๋ก ๋ณํํ๋ ์ญํ ์ ํ๋ค.
- Decoder๋ encoder์ ๋ฐ๋๋ก latent space๋ฅผ input์ผ๋ก ๋ณํํ๋ ์ญํ ์ ํ๋ค.
- Latent space๋ ๋ง๊ทธ๋๋ก ์ด๋ค ์จ๊ฒจ์ง vector๋ค์ ๋งํ๋ค. ์ด latent space๊ฐ ์ฃผ์ด์ ธ์ผ, decoder๋ ์ด๋ฅผ ํ์ฉํด data๋ฅผ generate ํ ์ ์๋ค.
Method :
๋ ผ๋ฌธ์์๋ ์ค๋๋ ์ฌ์ง ๋ณต์์ ์ํด ์ด๋ฏธ์ง ๋ณํ ๋ฌธ์ ๋ก ์ ์ํ๊ณ , ๊นจ๋ํ ์ด๋ฏธ์ง์ ์ค๋๋ ์ฌ์ง์ ์๋ก ๋ค๋ฅธ ๋๋ฉ์ธ์ผ๋ก ์ทจ๊ธํ์ฌ ๊ทธ ์ฌ์ด์ ๋งตํ์ ํ์ตํ๋ค.
์ด๋ฅผ ์ํด ์ค์ ์ฌ์ง ๋๋ฉ์ธ R, ์ธ๊ณต์ ์ผ๋ก ํผ์๋ ํฉ์ฑ ๋๋ฉ์ธ X, ๊ทธ๋ฆฌ๊ณ ํผ์์ด ์๋ ์ค์ ์ด๋ฏธ์ง ๋๋ฉ์ธ Y๋ฅผ ์ฌ์ฉํ๋ค. ์ด๋ฅผ ์ํด ์ธ ๊ฐ์ ์ ์ฌ ๊ณต๊ฐ์ผ๋ก ๋งคํํ๋ ER, EX, EY๋ฅผ ์ ์ํ๊ณ , ํธ๋ฆฌํ๋ฆฟ ๋๋ฉ์ธ ๋ณํ์ ์ํํ๋ค. ๊ทธ ํ ํฉ์ฑ ๋ฐ์ดํฐ๋ฅผ ํ์ฉํ์ฌ ํผ์๋ ์ด๋ฏธ์ง์ ์ ์ฌ ๊ณต๊ฐ ZX์์ ์๋ณธ ์ ์ฌ ๊ณต๊ฐ ZY๋ก์ ๋ณํ์ ํ์ตํ๊ณ ์ด๋ฅผ ํตํด ์ค์ ์ค๋๋ ์ฌ์ง์ ๋ณต์ํ๋ค.
์ด ๋ ผ๋ฌธ ๋ฐฉ๋ฒ์ ํต์ฌ์ R๊ณผ X๊ฐ ๋์ผํ ์ ์ฌ ๊ณต๊ฐ์ผ๋ก ์ธ์ฝ๋ฉ ๋๋ ๊ฐ์ ์ ์ถฉ์กฑ์ํค๋ ๊ฒ์ด๋ค. ์ด๋ฅผ ์ํด VAE๋ฅผ ํ์ฉํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์ปดํฉํธํ ํํ์ผ๋ก ์ธ์ฝ๋ฉํ๊ณ , ๋๋ฉ์ธ ๊ฐ๊ฒฉ์ ์ธก์ ํ๊ธฐ ์ํด ์ ๋์ ํ๋ณ์๋ฅผ ์ฌ์ฉํ๋ค.
์ฒซ๋ฒ์งธ ๋จ๊ณ์์๋ ์ ์ฌ ํํ์ ์ํด ๋๊ฐ์ VAE๋ฅผ ํ์ตํ๋ค.
์ค๋๋ ์ฌ์ง์ธ {r}๊ณผ ํฉ์ฑ ์ด๋ฏธ์ง์ธ {x}์ VAE1๊ณผ ์ธ์ฝ๋ ER,X ๋ฐ ์์ฑ์ GR,X๋ฅผ ๊ณต์ ํ๋ฉฐ, ๊นจ๋ํ ์ด๋ฏธ์ง์ธ {y}๋ VAE2์ ํผ๋๋๋ค.
VAE1์ ์ค๋๋ ์ฌ์ง๊ณผ ํฉ์ฑ ์ด๋ฏธ์ง์ ์ ์ฌ ๊ณต๊ฐ์ ๊ณต์ ํ์ฌ ๋ ํผ์๋ ๋๋ฉ์ธ์ ์ด๋ฏธ์ง๋ฅผ ๊ณต์ ๋ ์ ์ฌ ๊ณต๊ฐ์ผ๋ก ๋งคํํ ์ ์๋๋ก ํ๋ค. VAE๋ ์ ์ฌ ์ฝ๋์ ๋ถํฌ์ ๊ฐ์ฐ์์ ์ฌ์ ๋ถํฌ๋ฅผ ๊ฐ์ ํ๋ฉฐ, ์ ์ฌ ๊ณต๊ฐ์์ ์ํ๋ง์ ํตํด ์ด๋ฏธ์ง๋ฅผ ์ฌ๊ตฌ์ฑํ ์ ์๋๋ก ํ๋ค. ๋ ผ๋ฌธ์์๋ ์ฌ๋งค๊ฐ๋ณ์ํ ํธ๋ฆญ์ ์ฌ์ฉํ์ฌ ๋ฏธ๋ถ ๊ฐ๋ฅํ ํ๋ฅ ์ ์ํ๋ง์ ๊ฐ๋ฅํ๊ฒ ํ๊ณ , VAE1์ ๋ฐ์ดํฐ {r}๊ณผ {x}์ ๋ํด ์ต์ ํํ๋ค.
{r}์ ๋ํ ๋ชฉ์ ํจ์๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋๋ค:
LVAE1(r) = KL(ER,X(zr|r)||N(0,I)) + αEzr∼ER,X(zr|r)GR,X(rR→R|zr)−r1 + LVAE1,GAN(r).
๋จผ์ ์ค์ ์ฌ์ง r∈R๊ณผ ํฉ์ฑ ์ด๋ฏธ์ง x∈X์ ๋ํด ๋ ๊ฐ์ VAE๋ฅผ ํ์ตํ๊ณ , ๊ทธ๋ค์ ๋๋ฉ์ธ ๊ฐ๊ฒฉ์ ๋ซ๊ธฐ ์ํด ์ ๋์ ํ๋ณ์๋ฅผ ๊ณต๋์ผ๋ก ํ๋ จํ๋ค. ๊ทธ๋ฆฌ๊ณ VAE2๋ ๊นจ๋ํ ์ด๋ฏธ์ง y∈Y์ ๋ํด ํ์ต๋๋ค.
๐ VAE๋ฅผ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง๋ฅผ ์ปดํฉํธํ ์ ์ฌ ๊ณต๊ฐ์ผ๋ก ๋ณํํ ๋ค์, ์ ์ฌ ๊ณต๊ฐ์์ ํผ์๋ ์ด๋ฏธ์ง๋ฅผ ๊นจ๋ํ ์ด๋ฏธ์ง๋ก ๋ณต์ํ๋ ๋งคํ์ ํ์ตํ๋ค.
Conclusion :
๋ ผ๋ฌธ์์๋ ์๋ก์ด ํธ๋ฆฌํ๋ฆฟ ๋๋ฉ์ธ ๋ณํ ๋คํธ์ํฌ๋ฅผ ์ ์ํ์ฌ ์ค๋๋ ์ฌ์ง์ ๋ณตํฉ ํผ์์ ๋ณต์ํ๋ค.
์ค๋๋ ์ฌ์ง๊ณผ ํฉ์ฑ ์ด๋ฏธ์ง ๊ฐ์ ๋๋ฉ์ธ ๊ฐ๊ฒฉ์ด ์ค์ด๋ค๊ณ , ๊นจ๋ํ ์ด๋ฏธ์ง๋ก์ ๋ณํ์ ์ ์ฌ ๊ณต๊ฐ์์ ํ์ต๋๋ค. ์ด๋ฌํ ๋ฐฉ๋ฒ์ ์ด์ ๋ฐฉ๋ฒ์ ๋นํด ์ผ๋ฐํ ๋ฌธ์ ์ ์ํฅ์ ๋ ๋ฐ๋๋ค.
๋์๊ฐ, ๋ ผ๋ฌธ์์๋ ๋ถ๋ถ ๋น๊ตญ์ ๋ธ๋ก์ ์ ์ํ์ฌ ์ ์ญ ๋ฌธ๋งฅ์ ํ์ฉํ์ฌ ์ ์ฌ์ ์ธ ํน์ง์ ๋ณต์ํจ์ผ๋ก์จ ์คํฌ๋ ์น์ ๊ฐ์ ๊ฒฐํจ์ ๊ตฌ์กฐ์ ์ผ๊ด์ฑ์ ๊ฐ์ง๊ณ ์ฑ์ํด๋ผ ์ ์๋ค.
์ด ๋ ผ๋ฌธ์ ํ๊ณ๋ก๋ ๋ฐ์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ด ๋ณต์กํ ์์ ๊ฒฐํจ ์ฒ๋ฆฌ๋ฅผ ํ ์ ์๋ ๊ฒ์ด ์๋ค. ์ด์ ๋ก๋ ๋ฐ์ดํฐ์ ์ ์ด๋ฌํ ๊ฒฐํจ์ ๊ฐ์ง ์ค๋๋ ์ฌ์ง์ด ๊ฑฐ์ ์๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ํ๋ค.
์ค์ ์คํ์์ค :
์๋ ๋งํฌ์์ readme.txt๋ฅผ ์ฐธ๊ณ ํ์ฌ ์ค์ ์ฌ์ฉ์์ ์ปดํจํฐ์์ ์ฌ์ฉ๊ฐ๋ฅํ๋ค! ๐คฉ
https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life
GitHub - microsoft/Bringing-Old-Photos-Back-to-Life: Bringing Old Photo Back to Life (CVPR 2020 oral)
Bringing Old Photo Back to Life (CVPR 2020 oral). Contribute to microsoft/Bringing-Old-Photos-Back-to-Life development by creating an account on GitHub.
github.com
์ฐธ๊ณ ์๋ฃ :
- https://process-mining.tistory.com/161
- https://tilnote.io/pages/640c38c1eba56f08faeec472
- https://arxiv.org/abs/2004.09484
๋ค์์ imagic์ ๋ํ ๊ณต๋ถ๋ฅผ ์งํํ์ฌ ๊ธ์ ์ ์ด๋ณผ ์์ ์ด๋ค..! ๊ณง ๋์์ค๊ฒ ์ต๋๋น...!
'๐AI > Generative AI' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[์ฝ๋๊ณต๋ถ][Deepfake defection] SeqDeepFake (0) | 2023.07.20 |
---|---|
[Paper Review][Generative AI] SeqDeepFake: Detecting and Recovering Sequential DeepFake Manipulation (0) | 2023.07.17 |
Stable Diffusion (0) | 2023.07.11 |
Generative Model (0) | 2023.07.11 |
Diffusion(DDPM) (0) | 2023.07.11 |