๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ˜ŽAI/Generative AI

Diffusion(DDPM)

by SolaKim 2023. 7. 11.
diffusion ์ด๋ž€?
  • diffusion process๋ฅผ ์ด์šฉํ•œ Generative ๋ชจ๋ธ์ด๋‹ค.
  • Denoising diffusion ๋ชจ๋ธ์—๋Š” ๋‘๊ฐ€์ง€ ๊ณผ์ •์ด ์žˆ๋‹ค.
  • Forward Diffusion process์—์„œ๋Š” ์ดˆ๊ธฐ ์กฐ๊ฑด๊ณผ ๋ณ€๋™์„ฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฏธ๋ž˜ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ˜๋ฉด, Reverse Diffusion process์—์„œ๋Š” ์ข…๋‹จ ๊ฐ’์ด ์ฃผ์–ด์กŒ์„ ๋•Œ ์ดˆ๊ธฐ ๊ฐ’์ด๋‚˜ ๊ฒฝ๋กœ๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๊ฒƒ์„ ๋ชฉํ‘œ๋กœ ํ•œ๋‹ค. 
    • Forward Diffusion process
      • Generative ๋ชจ๋ธ์—์„œ ์‚ฌ์šฉ๋˜๋Š” ํ™•๋ฅ ๋ก ์  ๋ชจ๋ธ๋ง ๊ธฐ๋ฒ•์ด๋‹ค.
      • ์ดˆ๊ธฐ ์กฐ๊ฑด๊ณผ ๋ณ€๋™์„ฑ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ํ™•๋ฅ  ๋ณ€์ˆ˜์˜ ๊ฐ’์„ ์—…๋ฐ์ดํŠธํ•˜์—ฌ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•œ๋‹ค.
      • Forward Diffusion process๋Š” ๋ธŒ๋ผ์šด ์šด๋™(Brownian motion)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ๋ง๋œ๋‹ค.
      • ๋ธŒ๋ผ์šด ์šด๋™์€ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ๋žœ๋คํ•˜๊ฒŒ ์›€์ง์ด๋Š” ์ž…์ž์˜ ๊ฒฝ๋กœ๋ฅผ ๋‚˜ํƒ€๋‚ด๋Š” ํ™•๋ฅ ์ ์ธ ๊ณผ์ •์ด๋‹ค. Forward Diffusion process๋Š” ๋ธŒ๋ผ์šด ์šด๋™์˜ ๊ฒฝ๋กœ๋ฅผ ๋”ฐ๋ผ ๋ณ€๋™์„ฑ ์š”์ธ์„ ์ ์šฉํ•˜์—ฌ ํ™•๋ฅ  ๋ณ€์ˆ˜์˜ ๊ฐ’์„ ๋ชจ๋ธ๋งํ•œ๋‹ค.
      • ์ผ๋ จ์˜ ํ™•๋ฅ  ๋ณ€์ˆ˜๋ฅผ ์ƒ์„ฑํ•˜์—ฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •์—์„œ ์ด์šฉ๋ฉ๋‹ˆ๋‹ค. ์ด ๋ชจ๋ธ์€ ์ดˆ๊ธฐ ์ƒํƒœ์—์„œ ์‹œ์ž‘ํ•˜์—ฌ ์‹œ๊ฐ„์ด ์ง€๋‚จ์— ๋”ฐ๋ผ ํ™•๋ฅ  ๋ณ€์ˆ˜์˜ ๊ฐ’์„ ์—…๋ฐ์ดํŠธํ•˜๊ณ , ์ƒˆ๋กœ์šด ์ƒ˜ํ”Œ์„ ์ƒ์„ฑํ•œ๋‹ค.
    • Reverse Diffusion process
      • ํ™•๋ฅ  ๋ณ€์ˆ˜์˜ ๋ณ€๋™์„ฑ๊ณผ ์ดˆ๊ธฐ ์กฐ๊ฑด์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ชจ๋ธ๋ง๋œ๋‹ค.
      • ๊ทธ๋Ÿฌ๋‚˜ Reverse Diffusion process๋Š” ์‹œ๊ฐ„์„ ๊ฑฐ๊พธ๋กœ ๋”ฐ๋ผ๊ฐ€๋Š” ๋ฐฉ์‹์œผ๋กœ ์ž‘๋™ํ•˜๋ฉฐ, ์ฃผ์–ด์ง„ ์ข…๋‹จ ๊ฐ’์—์„œ ์ดˆ๊ธฐ ๊ฐ’ ๋˜๋Š” ๊ฒฝ๋กœ๋ฅผ ์—ญ์ถ”์ ํ•œ๋‹ค.
      • Generative ๋ชจ๋ธ์—์„œ Reverse Diffusion process๋Š” ์ข…๋‹จ ๊ฐ’์ด ์ฃผ์–ด์กŒ์„ ๋•Œ, ์ด๋ฅผ ๊ธฐ๋ฐ˜์œผ๋กœ ์ด์ „ ์‹œ๊ฐ„ ๋‹จ๊ณ„์˜ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š”๋ฐ ์‚ฌ์šฉ๋œ๋‹ค.
      • ์ด ๊ณผ์ •์€ ์ฃผ์–ด์ง„ ์ข…๋‹จ ๊ฐ’๊ณผ ๋ณ€๋™์„ฑ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ™œ์šฉํ•˜์—ฌ ์—ญ์ถ”์ ํ•˜๊ณ , ์ดˆ๊ธฐ ๊ฐ’์ด๋‚˜ ๊ฒฝ๋กœ๋ฅผ ์˜ˆ์ธกํ•œ๋‹ค.
      • Reverse Diffusion process๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ƒ์„ฑ๋œ ์ดˆ๊ธฐ ๊ฐ’์ด๋‚˜ ๊ฒฝ๋กœ๋Š” ์ƒ์„ฑ๋œ ๋ฐ์ดํ„ฐ์˜ ์ผ๋ถ€๋ฅผ ๋ณต์›ํ•˜๊ฑฐ๋‚˜ ์œ ์ถ”ํ•˜๋Š” ๋ฐ ์œ ์šฉํ•˜๋‹ค.

 

 

variational lower bound ๋ž€?
  • Variational lower bound ๋˜๋Š” evidence lower bound (ELBO)์€ ๋ฒ ์ด์ฆˆ ์ถ”๋ก ์—์„œ ๊ฐ€๋ณ€ ๋ชจ๋ธ (variational model)์˜ ํ•™์Šต ๋ฐ ์ถ”๋ก ์— ์‚ฌ์šฉ๋˜๋Š” ์ค‘์š”ํ•œ ๊ฐœ๋…์ด๋‹ค.
  • ELBO๋Š” ๋กœ๊ทธ ๊ฐ€๋Šฅ๋„(log likelihood)์™€ Kullback-Leibler divergence (KL divergence)๋ฅผ ์ด์šฉํ•˜์—ฌ ๊ณ„์‚ฐ๋œ๋‹ค.
  • (์ˆ˜์‹์— ๊ด€ํ•œ ์„ค๋ช…์€ ์ƒ๋žต.)
  • Variational lower bound ๋˜๋Š” ELBO๋Š” ๊ฐ€๋ณ€ ๋ชจ๋ธ์˜ ํ•™์Šต ๋ฐ ์ถ”๋ก ์— ์‚ฌ์šฉ๋˜๋Š” ์ˆ˜ํ•™์ ์ธ ์ฒ™๋„์ด๋‹ค.
  • ELBO๋Š” ๋กœ๊ทธ ๊ฐ€๋Šฅ๋„์™€ ๊ฐ€๋ณ€ ๋ชจ๋ธ์˜ ๊ทผ์‚ฌ ์‚ฌํ›„ ๋ถ„ํฌ์™€์˜ ์ฐจ์ด๋ฅผ KL divergence๋กœ ํ‘œํ˜„ํ•˜์—ฌ ๊ณ„์‚ฐ๋œ๋‹ค.
  • ์ด๋ฅผ ์ตœ๋Œ€ํ™”ํ•˜๋Š” ๊ฒƒ์€ ๊ฐ€๋ณ€ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ•™์Šต์‹œํ‚ค๊ณ , ์‚ฌํ›„ ๋ถ„ํฌ๋ฅผ ๊ทผ์‚ฌํ™”ํ•˜์—ฌ ์ถ”๋ก ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ๋ฐ ํ™œ์šฉ๋œ๋‹ค.

 

 

parameterizing denoising model ์ด๋ž€?
  • Parameterizing denoising model์€ ๋ฐ์ดํ„ฐ์—์„œ ์žก์Œ์„ ์ œ๊ฑฐํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ๋ชจ๋ธ์„ ํŒŒ๋ผ๋ฏธํ„ฐํ™”ํ•˜๋Š” ๊ฐœ๋…์ด๋‹ค.
  • ์Œ์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ์—์„œ ์‹ ํ˜ธ๋ฅผ ๋ณต์›ํ•˜๊ณ  ์›๋ž˜์˜ ์‹ ํ˜ธ๋ฅผ ๋ณต๊ตฌํ•˜๊ธฐ ์œ„ํ•ด, ์žก์Œ ๋ชจ๋ธ์— ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์ ์šฉํ•˜์—ฌ ์‹ ํ˜ธ๋ฅผ ์ถ”์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ด๋‹ค.
  • ์žก์Œ์ด ์ถ”๊ฐ€๋œ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ ์›๋ž˜์˜ ์‹ ํ˜ธ ์‚ฌ์ด์˜ ๊ด€๊ณ„๋ฅผ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์œ„ํ•ด ํŒŒ๋ผ๋ฏธํ„ฐํ™”๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•œ๋‹ค.
  • Parameterizing denoising model์€ ์‹ ํ˜ธ ์ฒ˜๋ฆฌ, ์ด๋ฏธ์ง€ ๋ณต์›, ์Œ์„ฑ ์ฒ˜๋ฆฌ ๋“ฑ ๋‹ค์–‘ํ•œ ์˜์—ญ์—์„œ ํ™œ์šฉ๋œ๋‹ค.
    • ์˜ˆ๋ฅผ ๋“ค์–ด, ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์˜คํ† ์ธ์ฝ”๋”๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ์žก์Œ์„ ์ œ๊ฑฐํ•˜๊ณ  ์›๋ž˜์˜ ์‹ ํ˜ธ๋ฅผ ๋ณต์›ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ํŒŒ๋ผ๋ฏธํ„ฐํ™”๋œ denoising model์˜ ํ•œ ์˜ˆ์ด๋‹ค.

 

 

diffusion model์˜ ํ•œ๊ณ„
  1. ์ •ํ™•์„ฑ๊ณผ ํ˜„์‹ค์„ฑ: Diffusion ๋ชจ๋ธ์€ ๊ฐ€๊ฒฉ ๋™์  ๋ณ€๋™์„ฑ์„ ๋ชจ๋ธ๋งํ•˜๋Š” ๋ฐ์—๋Š” ์œ ์šฉํ•˜์ง€๋งŒ, ํŠน์ • ์‹œ์žฅ์—์„œ์˜ ํ˜„์‹ค์ ์ธ ๊ฐ€๊ฒฉ ์›€์ง์ž„์„ ์™„๋ฒฝํ•˜๊ฒŒ ๋ฐ˜์˜ํ•˜์ง€๋Š” ๋ชปํ•œ๋‹ค. ์‹ค์ œ ์‹œ์žฅ์€ ๋น„์„ ํ˜•์„ฑ, ์ฒด๊ฒฐ ๋ถ€์กฑ, ๊ฐ‘์ž‘์Šค๋Ÿฌ์šด ๋ณ€๋™์„ฑ ๋ณ€ํ™” ๋“ฑ ๋‹ค์–‘ํ•œ ํ˜„์ƒ์„ ํฌํ•จํ•˜๊ณ  ์žˆ์–ด ์ด๋ฅผ ๋ชจ๋‘ ์žฌํ˜„ํ•˜๋Š” ๊ฒƒ์€ ์–ด๋ ค์šธ ์ˆ˜ ์žˆ๋‹ค.
  2. ๊ฐ€์ •์˜ ๋‹จ์ˆœ์„ฑ: Diffusion ๋ชจ๋ธ์€ ์ฃผ๋กœ ๊ธฐํ•˜ ๋ธŒ๋ผ์šด ์šด๋™๊ณผ ๊ฐ™์€ ๊ฐ„๋‹จํ•œ ํ™•๋ฅ  ๊ณผ์ •์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ๋‹ค. ์ด๋Ÿฌํ•œ ๋ชจ๋ธ์€ ๊ฐ€์ •์˜ ๋‹จ์ˆœ์„ฑ์„ ํ†ตํ•ด ๋ชจ๋ธ๋ง๊ณผ ๋ถ„์„์„ ์šฉ์ดํ•˜๊ฒŒ ๋งŒ๋“ค์ง€๋งŒ, ์‹ค์ œ ์‹œ์žฅ์—์„œ ๋ฐœ์ƒํ•˜๋Š” ๋ณต์žกํ•œ ํ˜„์ƒ์„ ์™„์ „ํžˆ ๋ฐ˜์˜ํ•˜์ง€๋Š” ๋ชปํ•  ์ˆ˜ ์žˆ๋‹ค.
  3. ๊ณ„์‚ฐ์ ์ธ ์ œ์•ฝ: ์ผ๋ถ€ ๋ณต์žกํ•œ Diffusion ๋ชจ๋ธ์€ ๊ณ„์‚ฐ์ ์œผ๋กœ ํšจ์œจ์ ์ธ ํ•ด๋ฒ•์„ ์ฐพ๊ธฐ ์–ด๋ ต๊ฑฐ๋‚˜ ๊ณ„์‚ฐ๋Ÿ‰์ด ๋งŽ์•„์งˆ ์ˆ˜ ์žˆ๋‹ค. ํŠนํžˆ, ๊ณ ์ฐจ์› ๋ฌธ์ œ๋‚˜ ๋น„์„ ํ˜•์„ฑ์ด ์ฆ๊ฐ€ํ•˜๋Š” ๊ฒฝ์šฐ์—๋Š” ๊ณ„์‚ฐ์ ์ธ ์ œ์•ฝ์ด ์‹ฌํ•ด์งˆ ์ˆ˜ ์žˆ๋‹ค.
  4. ์žฅ๊ธฐ๊ฐ„ ์˜ˆ์ธก์˜ ์–ด๋ ค์›€: Diffusion ๋ชจ๋ธ์€ ์ฃผ๋กœ ๋‹จ๊ธฐ๊ฐ„ ์˜ˆ์ธก์— ์ ํ•ฉํ•˜๋ฉฐ, ์žฅ๊ธฐ๊ฐ„ ์˜ˆ์ธก์—๋Š” ์ œํ•œ์ด ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค. ํŠนํžˆ, ์žฅ๊ธฐ๊ฐ„ ์˜ˆ์ธก์€ ์™ธ๋ถ€ ์š”์ธ์˜ ์˜ํ–ฅ์ด๋‚˜ ์‹œ์žฅ ์กฐ๊ฑด์˜ ๋ณ€ํ™”๋ฅผ ๊ณ ๋ คํ•ด์•ผ ํ•˜๋ฏ€๋กœ Diffusion ๋ชจ๋ธ๋งŒ์œผ๋กœ๋Š” ์ถฉ๋ถ„ํ•˜์ง€ ์•Š์„ ์ˆ˜ ์žˆ๋‹ค.
  5. ๊ทน๋‹จ์  ์‚ฌ๊ฑด ๋ชจ๋ธ๋ง์˜ ์–ด๋ ค์›€: Diffusion ๋ชจ๋ธ์€ ์ฃผ๋กœ ์ •๊ทœ ๋ถ„ํฌ์— ๊ธฐ๋ฐ˜ํ•œ ๋ชจ๋ธ๋ง์„ ์ˆ˜ํ–‰ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ทน๋‹จ์ ์ธ ์‚ฌ๊ฑด์„ ํฌ์ฐฉํ•˜๋Š” ๋ฐ ์ œํ•œ์ด ์žˆ์„ ์ˆ˜ ์žˆ๋‹ค. ๊ธˆ์œต ์‹œ์žฅ์—์„œ๋Š” ๊ทน๋‹จ์ ์ธ ์›€์ง์ž„์ด๋‚˜ ๊ธ‰๊ฒฉํ•œ ๋ณ€๋™์„ฑ ๋ณ€ํ™”๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ, ์ด๋Ÿฌํ•œ ํ˜„์ƒ์„ ์ •ํ™•ํ•˜๊ฒŒ ๋ชจ๋ธ๋งํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ถ”๊ฐ€์ ์ธ ๊ธฐ๋ฒ•์ด ํ•„์š”ํ•  ์ˆ˜ ์žˆ๋‹ค.

'๐Ÿ˜ŽAI > Generative AI' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Paper Review][Generative AI] SeqDeepFake: Detecting and Recovering Sequential DeepFake Manipulation  (0) 2023.07.17
[Paper Review][Computer Vision] Bringing Old Photos Back to Life  (0) 2023.07.15
Stable Diffusion  (0) 2023.07.11
Generative Model  (0) 2023.07.11
OnCreative AI Membership  (0) 2023.07.04