๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ˜ŽAI/Generative AI

Generative Model

by SolaKim 2023. 7. 11.

 

1์„ธ๋Œ€ Autoencoder(AE)
  • ์ฃผ์–ด์ง„ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋กœ๋ถ€ํ„ฐ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ๋ชจ๋ธ
  • AE๋Š” ์ฃผ๋กœ ๋น„์ง€๋„ ํ•™์Šต ๋ฐฉ์‹์œผ๋กœ ์‚ฌ์šฉ๋˜๋ฉฐ, ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์ž ์žฌ ํ‘œํ˜„(latent representation)์œผ๋กœ ์••์ถ•ํ•œ ํ›„ ์ด๋ฅผ ๋‹ค์‹œ ๋ณต์›ํ•˜์—ฌ ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ ์œ ์‚ฌํ•œ ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑ
  • Generative model 1์„ธ๋Œ€ AE๋Š” ๊ธฐ๋ณธ์ ์œผ๋กœ ์ธ์ฝ”๋”(encoder)์™€ ๋””์ฝ”๋”(decoder)๋ผ๋Š” ๋‘ ๋ถ€๋ถ„์œผ๋กœ ๊ตฌ์„ฑ
    1. ์ธ์ฝ”๋”(encoder): ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์ฐจ์›์˜ ์ž ์žฌ ํ‘œํ˜„์œผ๋กœ ๋ณ€ํ™˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ์ž ์žฌ ํ‘œํ˜„์€ ์ผ๋ฐ˜์ ์œผ๋กœ ์ €์ฐจ์›์˜ ๋ฐ€์ง‘ ๋ฒกํ„ฐ์ž…๋‹ˆ๋‹ค. ์ธ์ฝ”๋”๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์ €์ฐจ์› ๊ณต๊ฐ„์œผ๋กœ ์••์ถ•ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ํ•™์Šต๋ฉ๋‹ˆ๋‹ค.
    2. ๋””์ฝ”๋”(decoder): ์ž ์žฌ ํ‘œํ˜„์„ ์›๋ž˜์˜ ๋ฐ์ดํ„ฐ ๊ณต๊ฐ„์œผ๋กœ ๋ณต์›ํ•˜์—ฌ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋””์ฝ”๋”๋Š” ์ž ์žฌ ํ‘œํ˜„์„ ์ž…๋ ฅ์œผ๋กœ ๋ฐ›์•„๋“ค์ด๊ณ , ์›๋ž˜์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ณต์›ํ•˜๋Š” ๋ฐฉ์‹์œผ๋กœ ํ•™์Šต๋ฉ๋‹ˆ๋‹ค.
    3. ํ•™์Šต: AE๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์™€ ์žฌ๊ตฌ์„ฑ๋œ ๋ฐ์ดํ„ฐ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ตœ์†Œํ™”ํ•˜๋„๋ก ์ธ์ฝ”๋”์™€ ๋””์ฝ”๋”๋ฅผ ๋™์‹œ์— ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด AE๋Š” ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ํŠน์ง•์„ ํ•™์Šตํ•˜๊ณ  ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ํš๋“ํ•ฉ๋‹ˆ๋‹ค.
  • Generative model 1์„ธ๋Œ€ AE๋Š” ์ฃผ๋กœ ๋ฐ์ดํ„ฐ์˜ ์ฐจ์› ์ถ•์†Œ, ์žก์Œ ์ œ๊ฑฐ, ๋ฐ์ดํ„ฐ ์ƒ์„ฑ ๋ฐ ๋ณต์› ๋“ฑ ๋‹ค์–‘ํ•œ ์‘์šฉ ๋ถ„์•ผ์—์„œ ์‚ฌ์šฉ
    • ์˜ˆ๋ฅผ ๋“ค์–ด, ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์— AE๋ฅผ ์ ์šฉํ•˜๋ฉด ์ด๋ฏธ์ง€ ๋ณต์›, ์ƒ์„ฑ ๋ฐ ๋ณ€ํ˜• ๋“ฑ์— ํ™œ์šฉ ๊ฐ€๋Šฅ

 

Pixel by pixel image generation
  • ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ชจ๋ธ ์ค‘ ํ•˜๋‚˜๋กœ, ํ”ฝ์…€ ๋‹จ์œ„๋กœ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ์‹
  • ์ด ๋ชจ๋ธ์€ ๊ฐ ํ”ฝ์…€์˜ ์ƒ‰์ƒ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๊ณ  ์กฐํ•ฉํ•˜์—ฌ ์ „์ฒด ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑ
  • Pixel by pixel image generation์€ ์ฃผ๋กœ ๋”ฅ๋Ÿฌ๋‹ ๊ธฐ๋ฐ˜์˜ ์ƒ์„ฑ ๋ชจ๋ธ์ธ ์‹ ๊ฒฝ๋ง์„ ์‚ฌ์šฉํ•˜์—ฌ ๊ตฌํ˜„
    • ์ผ๋ฐ˜์ ์œผ๋กœ, ์ด๋ฏธ์ง€ ์ƒ์„ฑ์„ ์œ„ํ•ด ์ƒ์„ฑ์ž(generator)๋ผ๋Š” ์‹ ๊ฒฝ๋ง์ด ์‚ฌ์šฉ๋˜๋ฉฐ, ์ด ์‹ ๊ฒฝ๋ง์€ ๊ฐ ํ”ฝ์…€์˜ ์ƒ‰์ƒ ๊ฐ’์„ ์ถœ๋ ฅ์œผ๋กœ ์˜ˆ์ธก
    • ์ž…๋ ฅ์œผ๋กœ๋Š” ์ผ๋ฐ˜์ ์œผ๋กœ ์ž ์žฌ ๋ฒกํ„ฐ๋‚˜ ์žก์Œ ๋ฒกํ„ฐ ๋“ฑ์˜ ๋‚œ์ˆ˜๋ฅผ ์‚ฌ์šฉ
  • ์ƒ์„ฑ์ž(generator): ์ž ์žฌ ๋ฒกํ„ฐ๋‚˜ ์žก์Œ ๋ฒกํ„ฐ์™€ ๊ฐ™์€ ์ž…๋ ฅ์„ ๋ฐ›์•„๋“ค์—ฌ ๊ฐ ํ”ฝ์…€์˜ ์ƒ‰์ƒ ๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ์‹ ๊ฒฝ๋ง์ด๋‹ค. ์ƒ์„ฑ์ž๋Š” ์ž…๋ ฅ์„ ๊ฐ€์ง€๊ณ  ํ”ฝ์…€ ๋‹จ์œ„๋กœ ์ด๋ฏธ์ง€์˜ ๊ฐ ์œ„์น˜์—์„œ ์ƒ‰์ƒ ๊ฐ’์„ ์ƒ์„ฑํ•œ๋‹ค.
  • ์ด๋ฏธ์ง€ ์ƒ์„ฑ: ์ƒ์„ฑ์ž๋Š” ์ž…๋ ฅ ๋ฒกํ„ฐ์— ๋Œ€ํ•ด ํ”ฝ์…€ ๋‹จ์œ„๋กœ ์ƒ‰์ƒ ๊ฐ’์„ ์˜ˆ์ธกํ•˜์—ฌ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•œ๋‹ค. ์‹œ์ž‘๋ถ€ํ„ฐ ๋๊นŒ์ง€ ํ”ฝ์…€์„ ํ•˜๋‚˜์”ฉ ์ƒ์„ฑํ•˜๋ฉด์„œ ์ด๋ฏธ์ง€๊ฐ€ ์กฐ๊ฐ์”ฉ ์™„์„ฑ๋œ๋‹ค.
  • ํ•™์Šต: ์ƒ์„ฑ์ž๋Š” ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋น„๊ตํ•˜์—ฌ ์˜ˆ์ธกํ•œ ์ƒ‰์ƒ ๊ฐ’๊ณผ ์‹ค์ œ ์ƒ‰์ƒ ๊ฐ’ ์‚ฌ์ด์˜ ์ฐจ์ด๋ฅผ ์ตœ์†Œํ™”ํ•˜๋„๋ก ํ•™์Šต๋œ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ƒ์„ฑ์ž๋Š” ์ž…๋ ฅ ๋ฒกํ„ฐ์— ๋Œ€ํ•ด ์‹ค์ œ ์ด๋ฏธ์ง€์™€ ์œ ์‚ฌํ•œ ์ด๋ฏธ์ง€๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ๋„๋ก ๊ฐœ์„ ๋œ๋‹ค.
  • ๋”ฅํŽ˜์ดํฌ(Deepfake) ๊ธฐ์ˆ ์ด๋‚˜ ์ด๋ฏธ์ง€ ๋ณ€ํ˜•, ์˜ˆ์ˆ ์ ์ธ ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋“ฑ์— ํ™œ์šฉ

'๐Ÿ˜ŽAI > Generative AI' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

[Paper Review][Generative AI] SeqDeepFake: Detecting and Recovering Sequential DeepFake Manipulation  (0) 2023.07.17
[Paper Review][Computer Vision] Bringing Old Photos Back to Life  (0) 2023.07.15
Stable Diffusion  (0) 2023.07.11
Diffusion(DDPM)  (0) 2023.07.11
OnCreative AI Membership  (0) 2023.07.04