๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ˜ŽAI/Generative AI

[Paper Review][Computer Vision] Bringing Old Photos Back to Life

by SolaKim 2023. 7. 15.
Bringing Old Photo Back to Life (CVPR 2020 oral)

 


์ด ๋…ผ๋ฌธ์—์„œ๋Š” ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•˜์—ฌ ์‹ฌ๊ฐํ•œ ํ›ผ์†์„ ๊ฒช์€ ์˜ค๋ž˜๋œ ์‚ฌ์ง„์„ ๋ณต์›ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋Œ€ํ•ด ์ œ์•ˆํ•œ๋‹ค.

๊ธฐ์กด ์ง€๋„ ํ•™์Šต์„ ํ†ตํ•ด ํ•ด๊ฒฐ๋  ์ˆ˜ ์žˆ๋Š” ๋ณต์› ์ž‘์—…๊ณผ ๋‹ฌ๋ฆฌ ์‹ค์ œ ์‚ฌ์ง„์˜ ํ›ผ์†์€ ๋ณต์žกํ•˜๋ฉฐ, ํ•ฉ์„ฑ ์ด๋ฏธ์ง€์™€ ์‹ค์ œ ์˜ค๋ž˜๋œ ์‚ฌ์ง„ ์‚ฌ์ด์˜ ๋„๋ฉ”์ธ ๊ฐ„๊ฒฉ์œผ๋กœ ์ธํ•ด ๋„คํŠธ์›Œํฌ ์ผ๋ฐ˜ํ™”์— ์‹คํŒจํ•œ๋‹ค.

๋”ฐ๋ผ์„œ ์ด ๋…ผ๋ฌธ์—์„œ๋Š” ์‹ค์ œ ์‚ฌ์ง„๊ณผ ๋Œ€๊ทœ๋ชจ ํ•ฉ์„ฑ ์ด๋ฏธ์ง€ ์Œ์„ ํ™œ์šฉํ•˜์—ฌ ์ƒˆ๋กœ์šด ํŠธ๋ฆฌํ”Œ๋ฆฟ ๋„๋ฉ”์ธ ๋ณ€ํ™˜ ๋„คํŠธ์›Œํฌ๋ฅผ ์ œ์•ˆํ•œ๋‹ค.

์˜ค๋ž˜๋œ ์‚ฌ์ง„๊ณผ ๊นจ๋—ํ•œ ์‚ฌ์ง„์„ ๊ฐ๊ฐ ๋‘ ๊ฐœ์˜ ์ž ์žฌ ๊ณต๊ฐ„์œผ๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ ์œ„ํ•ด ๋‘๊ฐœ์˜ ๋ณ€ํ˜• ์ž๋™ ์ธ์ฝ”๋”(VAE)๋ฅผ ํ•™์Šตํ•˜๊ณ , ์ด๋ฅผ ํ•ฉ์„ฑ๋œ ์Œ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•˜์—ฌ ์‹ค์ œ ์‚ฌ์ง„์— ์ž˜ ์ผ๋ฐ˜ํ™” ๋  ์ˆ˜ ์žˆ๋Š” ๋ณ€ํ™˜์„ ์ˆ˜ํ–‰ํ•œ๋‹ค.

 

 

์—ฌ๊ธฐ์„œ VAE๋ž€?
  • Variational Auto Encoder์˜ ์ค„์ž„๋ง๋กœ, GAN, diffusion model๊ณผ ๊ฐ™์ด generative model์˜ ํ•œ ์ข…๋ฅ˜์ด๋‹ค.
  • input๊ณผ output์„ ๊ฐ™๊ฒŒ ๋งŒ๋“œ๋Š”๊ฒƒ์„ ํ†ตํ•ด ์˜๋ฏธ ์žˆ๋Š” latent space๋ฅผ ๋งŒ๋“œ๋Š” autoencoder์™€ ๋น„์Šทํ•˜๊ฒŒ encoder์™€ decoder๋ฅผ ํ™œ์šฉํ•ด latent space๋ฅผ ๋„์ถœํ•˜๊ณ , ์ด latent space๋กœ๋ถ€ํ„ฐ ์šฐ๋ฆฌ๊ฐ€ ์›ํ•˜๋Š” output decodingํ•จ์œผ๋กœ์จ data generation์„ ์ง„ํ–‰ํ•œ๋‹ค.
  • Encoder๋Š” input์„ latent space๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์—ญํ• ์„ ํ•œ๋‹ค.
  • Decoder๋Š” encoder์™€ ๋ฐ˜๋Œ€๋กœ latent space๋ฅผ input์œผ๋กœ ๋ณ€ํ™˜ํ•˜๋Š” ์—ญํ• ์„ ํ•œ๋‹ค.
  • Latent space๋Š” ๋ง๊ทธ๋Œ€๋กœ ์–ด๋–ค ์ˆจ๊ฒจ์ง„ vector๋“ค์„ ๋งํ•œ๋‹ค. ์ด latent space๊ฐ€ ์ฃผ์–ด์ ธ์•ผ, decoder๋Š” ์ด๋ฅผ ํ™œ์šฉํ•ด data๋ฅผ generate ํ•  ์ˆ˜ ์žˆ๋‹ค.

vae์˜ ๊ตฌ์กฐ

 

 

 

Method :

๋…ผ๋ฌธ์—์„œ๋Š” ์˜ค๋ž˜๋œ ์‚ฌ์ง„ ๋ณต์›์„ ์œ„ํ•ด ์ด๋ฏธ์ง€ ๋ณ€ํ™˜ ๋ฌธ์ œ๋กœ ์ •์˜ํ•˜๊ณ , ๊นจ๋—ํ•œ ์ด๋ฏธ์ง€์™€ ์˜ค๋ž˜๋œ ์‚ฌ์ง„์„ ์„œ๋กœ ๋‹ค๋ฅธ ๋„๋ฉ”์ธ์œผ๋กœ ์ทจ๊ธ‰ํ•˜์—ฌ ๊ทธ ์‚ฌ์ด์˜ ๋งตํ•‘์„ ํ•™์Šตํ•œ๋‹ค.

์ด๋ฅผ ์œ„ํ•ด ์‹ค์ œ ์‚ฌ์ง„ ๋„๋ฉ”์ธ R, ์ธ๊ณต์ ์œผ๋กœ ํ›ผ์†๋œ ํ•ฉ์„ฑ ๋„๋ฉ”์ธ X, ๊ทธ๋ฆฌ๊ณ  ํ›ผ์†์ด ์—†๋Š” ์‹ค์ œ ์ด๋ฏธ์ง€ ๋„๋ฉ”์ธ Y๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ์„ธ ๊ฐœ์˜ ์ž ์žฌ ๊ณต๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•˜๋Š” ER, EX, EY๋ฅผ ์ œ์•ˆํ•˜๊ณ , ํŠธ๋ฆฌํ”Œ๋ฆฟ ๋„๋ฉ”์ธ ๋ณ€ํ™˜์„ ์ˆ˜ํ–‰ํ•œ๋‹ค. ๊ทธ ํ›„ ํ•ฉ์„ฑ ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ํ›ผ์†๋œ ์ด๋ฏธ์ง€์˜ ์ž ์žฌ ๊ณต๊ฐ„ ZX์—์„œ ์›๋ณธ ์ž ์žฌ ๊ณต๊ฐ„ ZY๋กœ์˜ ๋ณ€ํ™˜์„ ํ•™์Šตํ•˜๊ณ  ์ด๋ฅผ ํ†ตํ•ด ์‹ค์ œ ์˜ค๋ž˜๋œ ์‚ฌ์ง„์„ ๋ณต์›ํ•œ๋‹ค.

Illustration of our translation method with three domains

 

์ด ๋…ผ๋ฌธ ๋ฐฉ๋ฒ•์˜ ํ•ต์‹ฌ์€ R๊ณผ X๊ฐ€ ๋™์ผํ•œ ์ž ์žฌ ๊ณต๊ฐ„์œผ๋กœ ์ธ์ฝ”๋”ฉ ๋˜๋Š” ๊ฐ€์ •์„ ์ถฉ์กฑ์‹œํ‚ค๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋ฅผ ์œ„ํ•ด VAE๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ์ปดํŒฉํŠธํ•œ ํ‘œํ˜„์œผ๋กœ ์ธ์ฝ”๋”ฉํ•˜๊ณ , ๋„๋ฉ”์ธ ๊ฐ„๊ฒฉ์„ ์ธก์ •ํ•˜๊ธฐ ์œ„ํ•ด ์ ๋Œ€์  ํŒ๋ณ„์ž๋ฅผ ์‚ฌ์šฉํ•œ๋‹ค.

Architecture of our restoration network

์ฒซ๋ฒˆ์งธ ๋‹จ๊ณ„์—์„œ๋Š” ์ž ์žฌ ํ‘œํ˜„์„ ์œ„ํ•ด ๋‘๊ฐœ์˜ VAE๋ฅผ ํ•™์Šตํ•œ๋‹ค.

์˜ค๋ž˜๋œ ์‚ฌ์ง„์ธ {r}๊ณผ ํ•ฉ์„ฑ ์ด๋ฏธ์ง€์ธ {x}์€ VAE1๊ณผ ์ธ์ฝ”๋” ER,X ๋ฐ ์ƒ์„ฑ์ž GR,X๋ฅผ ๊ณต์œ ํ•˜๋ฉฐ, ๊นจ๋—ํ•œ ์ด๋ฏธ์ง€์ธ {y}๋Š” VAE2์— ํ”ผ๋“œ๋œ๋‹ค.

VAE1์€ ์˜ค๋ž˜๋œ ์‚ฌ์ง„๊ณผ ํ•ฉ์„ฑ ์ด๋ฏธ์ง€์˜ ์ž ์žฌ ๊ณต๊ฐ„์„ ๊ณต์œ ํ•˜์—ฌ ๋‘ ํ›ผ์†๋œ ๋„๋ฉ”์ธ์˜ ์ด๋ฏธ์ง€๋ฅผ ๊ณต์œ ๋œ ์ž ์žฌ ๊ณต๊ฐ„์œผ๋กœ ๋งคํ•‘ํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค. VAE๋Š” ์ž ์žฌ ์ฝ”๋“œ์˜ ๋ถ„ํฌ์— ๊ฐ€์šฐ์‹œ์•ˆ ์‚ฌ์ „ ๋ถ„ํฌ๋ฅผ ๊ฐ€์ •ํ•˜๋ฉฐ, ์ž ์žฌ ๊ณต๊ฐ„์—์„œ ์ƒ˜ํ”Œ๋ง์„ ํ†ตํ•ด ์ด๋ฏธ์ง€๋ฅผ ์žฌ๊ตฌ์„ฑํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•œ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์žฌ๋งค๊ฐœ๋ณ€์ˆ˜ํ™” ํŠธ๋ฆญ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฏธ๋ถ„ ๊ฐ€๋Šฅํ•œ ํ™•๋ฅ ์  ์ƒ˜ํ”Œ๋ง์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๊ณ , VAE1์„ ๋ฐ์ดํ„ฐ {r}๊ณผ {x}์— ๋Œ€ํ•ด ์ตœ์ ํ™”ํ•œ๋‹ค.

{r}์— ๋Œ€ํ•œ ๋ชฉ์ ํ•จ์ˆ˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ์ •์˜๋œ๋‹ค:

LVAE1(r) = KL(ER,X(zr|r)||N(0,I)) + αEzr∼ER,X(zr|r)GR,X(rR→R|zr)−r1 + LVAE1,GAN(r).

๋จผ์ € ์‹ค์ œ ์‚ฌ์ง„ r∈R๊ณผ ํ•ฉ์„ฑ ์ด๋ฏธ์ง€ x∈X์— ๋Œ€ํ•ด ๋‘ ๊ฐœ์˜ VAE๋ฅผ ํ•™์Šตํ•˜๊ณ , ๊ทธ๋“ค์˜ ๋„๋ฉ”์ธ ๊ฐ„๊ฒฉ์„ ๋‹ซ๊ธฐ ์œ„ํ•ด ์ ๋Œ€์  ํŒ๋ณ„์ž๋ฅผ ๊ณต๋™์œผ๋กœ ํ›ˆ๋ จํ•œ๋‹ค. ๊ทธ๋ฆฌ๊ณ  VAE2๋Š” ๊นจ๋—ํ•œ ์ด๋ฏธ์ง€ y∈Y์— ๋Œ€ํ•ด ํ•™์Šต๋œ๋‹ค.

๐Ÿ“Œ VAE๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ์ปดํŒฉํŠธํ•œ ์ž ์žฌ ๊ณต๊ฐ„์œผ๋กœ ๋ณ€ํ™˜ํ•œ ๋‹ค์Œ, ์ž ์žฌ ๊ณต๊ฐ„์—์„œ ํ›ผ์†๋œ ์ด๋ฏธ์ง€๋ฅผ ๊นจ๋—ํ•œ ์ด๋ฏธ์ง€๋กœ ๋ณต์›ํ•˜๋Š” ๋งคํ•‘์„ ํ•™์Šตํ•œ๋‹ค.

 

๊ธฐ์กด ๋ฉ”์„œ๋“œ๋“ค๊ณผ์˜ ์„ฑ๋Šฅ์ฐจ์ด ๋น„๊ต ์‚ฌ์ง„

 

 

Conclusion :

๋…ผ๋ฌธ์—์„œ๋Š” ์ƒˆ๋กœ์šด ํŠธ๋ฆฌํ”Œ๋ฆฟ ๋„๋ฉ”์ธ ๋ณ€ํ™˜ ๋„คํŠธ์›Œํฌ๋ฅผ ์ œ์•ˆํ•˜์—ฌ ์˜ค๋ž˜๋œ ์‚ฌ์ง„์˜ ๋ณตํ•ฉ ํ›ผ์†์„ ๋ณต์›ํ•œ๋‹ค.

์˜ค๋ž˜๋œ ์‚ฌ์ง„๊ณผ ํ•ฉ์„ฑ ์ด๋ฏธ์ง€ ๊ฐ„์˜ ๋„๋ฉ”์ธ ๊ฐ„๊ฒฉ์ด ์ค„์–ด๋“ค๊ณ , ๊นจ๋—ํ•œ ์ด๋ฏธ์ง€๋กœ์˜ ๋ณ€ํ™˜์€ ์ž ์žฌ ๊ณต๊ฐ„์—์„œ ํ•™์Šต๋œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์€ ์ด์ „ ๋ฐฉ๋ฒ•์— ๋น„ํ•ด ์ผ๋ฐ˜ํ™” ๋ฌธ์ œ์— ์˜ํ–ฅ์„ ๋œ ๋ฐ›๋Š”๋‹ค. 

๋‚˜์•„๊ฐ€, ๋…ผ๋ฌธ์—์„œ๋Š” ๋ถ€๋ถ„ ๋น„๊ตญ์†Œ ๋ธ”๋ก์„ ์ œ์•ˆํ•˜์—ฌ ์ „์—ญ ๋ฌธ๋งฅ์„ ํ™œ์šฉํ•˜์—ฌ ์ž ์žฌ์ ์ธ ํŠน์ง•์„ ๋ณต์›ํ•จ์œผ๋กœ์จ ์Šคํฌ๋ ˆ์น˜์™€ ๊ฐ™์€ ๊ฒฐํ•จ์„ ๊ตฌ์กฐ์  ์ผ๊ด€์„ฑ์„ ๊ฐ€์ง€๊ณ  ์ฑ„์ƒ‰ํ•ด๋‚ผ ์ˆ˜ ์žˆ๋‹ค.

์ด ๋…ผ๋ฌธ์˜ ํ•œ๊ณ„๋กœ๋Š” ๋ฐ‘์— ๊ทธ๋ฆผ๊ณผ ๊ฐ™์ด ๋ณต์žกํ•œ ์Œ์˜ ๊ฒฐํ•จ ์ฒ˜๋ฆฌ๋ฅผ ํ•  ์ˆ˜ ์—†๋Š” ๊ฒƒ์ด ์žˆ๋‹ค. ์ด์œ ๋กœ๋Š” ๋ฐ์ดํ„ฐ์…‹์— ์ด๋Ÿฌํ•œ ๊ฒฐํ•จ์„ ๊ฐ€์ง„ ์˜ค๋ž˜๋œ ์‚ฌ์ง„์ด ๊ฑฐ์˜ ์—†๊ธฐ ๋•Œ๋ฌธ์ด๋ผ๊ณ  ํ•œ๋‹ค. 

์Šคํฌ๋ ˆ์น˜๋Š” ์™„๋ฒฝ ๋ณต์›๋˜์—ˆ์ง€๋งŒ, ๋ณต์žกํ•œ ์Œ์˜ ๊ฒฐํ•จ์€ ์ฒ˜๋ฆฌ๋˜์ง€ ๋ชปํ–ˆ๋‹ค.

 

 

 

์‹ค์ œ ์˜คํ”ˆ์†Œ์Šค :

์•„๋ž˜ ๋งํฌ์—์„œ readme.txt๋ฅผ ์ฐธ๊ณ ํ•˜์—ฌ ์‹ค์ œ ์‚ฌ์šฉ์ž์˜ ์ปดํ“จํ„ฐ์—์„œ ์‚ฌ์šฉ๊ฐ€๋Šฅํ•˜๋‹ค! ๐Ÿคฉ

https://github.com/microsoft/Bringing-Old-Photos-Back-to-Life

 

GitHub - microsoft/Bringing-Old-Photos-Back-to-Life: Bringing Old Photo Back to Life (CVPR 2020 oral)

Bringing Old Photo Back to Life (CVPR 2020 oral). Contribute to microsoft/Bringing-Old-Photos-Back-to-Life development by creating an account on GitHub.

github.com

 

 

์ฐธ๊ณ  ์ž๋ฃŒ :

 

 

๋‹ค์Œ์€ imagic์— ๋Œ€ํ•œ ๊ณต๋ถ€๋ฅผ ์ง„ํ–‰ํ•˜์—ฌ ๊ธ€์„ ์ ์–ด๋ณผ ์˜ˆ์ •์ด๋‹ค..! ๊ณง ๋Œ์•„์˜ค๊ฒ ์Šต๋‹ˆ๋‹น...!

'๐Ÿ˜ŽAI > Generative AI' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[์ฝ”๋“œ๊ณต๋ถ€][Deepfake defection] SeqDeepFake  (0) 2023.07.20
[Paper Review][Generative AI] SeqDeepFake: Detecting and Recovering Sequential DeepFake Manipulation  (0) 2023.07.17
Stable Diffusion  (0) 2023.07.11
Generative Model  (0) 2023.07.11
Diffusion(DDPM)  (0) 2023.07.11