์ด ๋ ผ๋ฌธ ๋ด์ฉ์ผ๋ก ๋ค์ด๊ฐ๊ธฐ ์ ์ Pinhole Camera Model ์ ๋ํด์ ์ด๋ ์ ๋ ์ดํด๋ฅผ ํ๊ณ ๊ฐ๋ฉด ์ข๋ค.

Abstract
1080p ํด์๋์ ๋ฌด์ ํ ๋ฐ ์์ ํ ์ฅ๋ฉด์ ๋ ๋๋ง์์๋ ์ด์ ๊น์ง๋ ์ด๋ค ๋ฐฉ๋ฒ๋ ์ค์๊ฐ ๋์คํ๋ ์ด ์๋(โฅ30 fps)๋ฅผ ๋ฌ์ฑํ์ง ๋ชปํ๊ณ ์๋ค.
์ด ๋ ผ๋ฌธ์์๋ 1080p ํด์๋์์ ๊ณ ํ์ง ์ค์๊ฐ(โฅ30 fps) ์๋ก์ด ์์ ํฉ์ฑ์ ๊ฐ๋ฅํ๊ฒ ํ๋ ์ธ ๊ฐ์ง ์ฃผ์ ์์๋ฅผ ์๊ฐํ๋ค.
1. 3D ๊ฐ์ฐ์์ ํ์ฉ: ์นด๋ฉ๋ผ ์บ๋ฆฌ๋ธ๋ ์ด์ ๊ณผ์ ์์ ์์ฑ๋ ํฌ์ ํฌ์ธํธ๋ฅผ ์์์ผ๋ก, ์ฅ๋ฉด์ 3D ๊ฐ์ฐ์์์ผ๋ก ํํํ์ฌ ์ฐ์์ ์ธ ๋ณผ๋ฅจ๊ธฐ๋ฐ Radiance Field ์ ์ฅ์ ์ ์ ์งํ๋ฉด์ ๋น ๊ณต๊ฐ์์์ ๋ถํ์ํ ๊ณ์ฐ์ ํผํ๋ค.
2. ์ต์ ํ์ ๋ฐ๋ ์ ์ด: 3D ๊ฐ์ฐ์์์ ๋น๋ฑ๋ฐฉ์ฑ ๊ณต๋ถ์ฐ์ ์ต์ ํํ์ฌ ์ฅ๋ฉด์ ์ ํํ๊ฒ ํํํ๋ฉฐ, ์ต์ ํ์ ๋ฐ๋ ์ ์ด๋ฅผ ๊ต์ฐจ์ ์ผ๋ก ์ํํ๋ค.
๐ก ๋น๋ฑ๋ฐฉ์ฑ ๊ณต๋ถ์ฐ ์ต์ ํ๋?
1. ๋น๋ฑ๋ฐฉ์ฑ(anisotropy)
: ๋น๋ฑ๋ฐฉ์ฑ์ ์ด๋ค ๋ฌผ์ฒด๋ ๊ตฌ์กฐ๊ฐ ๋ฐฉํฅ์ ๋ฐ๋ผ ์ฑ์ง์ด ๋ฌ๋ผ์ง๋ ๊ฒ. ์๋ฅผ ๋ค์ด, ๊ณต์ ๋ชจ๋ ๋ฐฉํฅ์์ ๋์ผํ ๋ชจ์(๋ฑ๋ฐฉ์ฑ, isotropy)์ด์ง๋ง, ํ์์ฒด๋ ๋ฐฉํฅ์ ๋ฐ๋ผ ๊ธธ์ด์ ํญ์ด ๋ฌ๋ผ์ง๋ ๋น๋ฑ๋ฐฉ์ฑ์ด๋ค.
โก 3D ๊ฐ์ฐ์์์์ ๋น๋ฑ๋ฐฉ์ฑ์ ๊ฐ์ฐ์์์ ๋ชจ์์ด ๊ตฌํ์ด ์๋ ํ์์ฒด ํํ๋ก ๋ํ๋๋ฉฐ, ๊ฐ ๋ฐฉํฅ์ผ๋ก ๋ค๋ฅธ ํฌ๊ธฐ์ ํํ๋ฅผ ๊ฐ์ง๋ค.
2. ๊ณต๋ถ์ฐ(covariance)
: ๊ณต๋ถ์ฐ ํ๋ ฌ์ ๋ฐ์ดํฐ๊ฐ ์๋ก ๋ค๋ฅธ ๋ฐฉํฅ์ผ๋ก ์ผ๋ง๋ ํผ์ ธ ์๋์ง๋ฅผ ๋ํ๋ด๋ ์ํ์ ํํ์ด๋ค. ํ๋ ฌ์ ํฌ๊ธฐ์ ๋ฐฉํฅ์ 3D ๊ฐ์ฐ์์์ ํ์์ฒด ํฌ๊ธฐ์ ๋ฐฉํฅ์ ๊ฒฐ์ ํ๋ค. ์๋ฅผ ๋ค์ด, ๋๊ฐ์ ๊ฐ์ ๊ฐ ์ถ์ผ๋ก์ ๋ถ์ฐ(ํผ์ง)์ ๋ํ๋ด๊ณ , ๋น๋๊ฐ์ ๊ฐ์ ์ถ ๊ฐ์ ์๊ด๊ด๊ณ๋ฅผ ๋ํ๋ธ๋ค.
โก ๊ณต๋ถ์ฐ ํ๋ ฌ์ ์กฐ์ ํ๋ฉด ๊ฐ์ฐ์์์ ํํ๋ฅผ ๋ค์ํ ๋ฐฉํฅ์ผ๋ก ๋ณํํ ์ ์๋ค.
3. ๋น๋ฑ๋ฐฉ์ฑ ๊ณต๋ถ์ฐ ์ต์ ํ
- 3D ๊ฐ์ฐ์์์ ์ฅ๋ฉด์ ์ ๋ง๊ฒ ๋ณํ์ํค๊ธฐ ์ํด ๊ณต๋ถ์ฐ ํ๋ ฌ์ ์ต์ ํ ํ๋ ๊ณผ์
- ์ฅ๋ฉด์ ์ธ๋ฐํ ๋ํ ์ผ์ ์ ์งํ๋ฉด์ ํจ์จ์ ์ผ๋ก ํํ
- ๋ถํ์ํ ๊ฐ์ฐ์์์ ์ค์ด๊ณ , ์ค์ํ ์์ญ์ ๋ ์ ํํ ๊ฐ์ฐ์์์ ๋ฐฐ์น
โก ์ต์ ํ๋ ๋น๋ฑ๋ฐฉ์ฑ ๊ฐ์ฐ์์์ ์ฌ์ฉํ๋ฉด, ๊ฑด๋ฌผ์ ๋ฒฝ์ฒ๋ผ ์๊ณ ๊ธด ๊ตฌ์กฐ๋ ๋ณต์กํ ๋ํ ์ผ์ ์์์ ๊ฐ์ฐ์์์ผ๋ก ํจ์จ์ ์ผ๋ก ํํํ ์ ์๋ค.
3. ๊ฐ์์ฑ ์ธ์(visibility-aware) ๋ ๋๋ง ์๊ณ ๋ฆฌ์ฆ: ๋น๋ฑ๋ฐฉ์ฑ Splatting ์ ์ง์ํ๋ ๋น ๋ฅธ ๊ฐ์์ฑ ์ธ์ ๋ ๋๋ง ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ๋ฐํ์ฌ ํ์ต ์๋๋ฅผ ๊ฐ์ํํ๊ณ ์ค์๊ฐ ๋ ๋๋ง์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.


Introduction

1. ๊ธฐ์กด ๋ฐฉ๋ฒ์ ํ๊ณ
- Meshes ์ Points ๋ GPU/CUDA ๊ธฐ๋ฐ์ ๋น ๋ฅธ ๋์คํฐํ์ ์ ํฉํ์ง๋ง ์ฐ์์ ์ธ ํํ์ด ์๋๊ธฐ ๋๋ฌธ์ ์ต์ ํ๊ฐ ์ด๋ ต๋ค.
- NeRF ๊ธฐ๋ฐ์ ์ฐ์์ ์ธ ํํ์ ์ต์ ํ์ ์ ๋ฆฌํ์ง๋ง, ํ๋ฅ ์ ์ํ๋ง ๋ฐฉ์์ ๊ณ์ฐ ๋น์ฉ์ ๋์ด๊ณ ๋
ธ์ด์ฆ๋ฅผ ์ ๋ฐํ๋ค.
- ๊ธฐ์กด SOTA ๋ฐฉ๋ฒ(Min-NeRF360)์ ๋์ ํ์ง์ ์ ๊ณตํ์ง๋ง ์ต๋ 48 ์๊ฐ์ ํ์ต ์๊ฐ์ด ํ์ํ๋ค.
- ๋น ๋ฅธ Radiance Field ๋ฐฉ๋ฒ์ ํ์ต ์๊ฐ์ ๋จ์ถํ์ง๋ง, 10-15fps ์์ ๋ฎ์ ํ์ง์ ๋ ๋๋ง์ ์ ๊ณตํ๋ค.
2. ๋
ผ๋ฌธ ํต์ฌ ๊ธฐ์ฌ
- 3D Gaussian ํํ ๋์
:
- ์นด๋ฉ๋ผ ์บ๋ฆฌ๋ธ๋ ์ด์
(SfM) ์์ ์์ฑ๋ ํฌ์ ํฌ์ธํธ ํด๋ผ์ฐ๋๋ฅผ ๊ธฐ๋ฐ์ผ๋ก 3D Gaussian ์ ์ด๊ธฐํํ๋ค.
- Multi-View Stereo(MVS) ๋ฐ์ดํฐ ์์ด๋ SfM ํฌ์ธํธ๋ง์ผ๋ก ๊ณ ํ์ง ์ฅ๋ฉด ํํ ๊ฐ๋ฅ
- NeRF-synthetic ๋ฐ์ดํฐ์
์์๋ ๋๋ค ์ด๊ธฐํ๋ง์ผ๋ก๋ ๋์ ํ์ง ๋ฌ์ฑ
- 3D Gaussian ์ ์ฐ์์ ์ด๊ณ ๋ฏธ๋ถ ๊ฐ๋ฅํ ๋ณผ๋ฅจ ํํ์ผ๋ก, ํจ์จ์ ์ธ 2D ํฌ์ ๋ฐ ํ์ค ๐ผ-๋ธ๋ ๋ฉ์ ์ง์ํ๋ค.
- 3D Gaussian ์์ฑ์ ์ต์ ํ ๋ฐ ์ ์ํ ๋ฐ๋ ์ ์ด:
- ์ต์ ํ ๋์ ์์ฑ: 3D ์์น, ๋ถํฌ๋ช
๋(๐ผ), ๋น๋ฑ๋ฐฉ์ฑ ๊ณต๋ถ์ฐ, ๊ตฌ๋ฉด ์กฐํ ํจ์(Spherical Harmonics, SH) ๊ณ์
- ์ ์ํ ๋ฐ๋ ์ ์ด: ํ์์ ๋ฐ๋ผ 3D Gaussian ์ ์ถ๊ฐํ๊ฑฐ๋ ์ ๊ฑฐํ์ฌ ์ฅ๋ฉด์ ํํ์ ๊ฐ๊ฒฐํ๊ณ ์ ๋ฐํ๊ฒ ์ ์ง
- ๊ฒฐ๊ณผ: ์คํ ์ฅ๋ฉด์์ ํ๊ท 1~5๋ฐฑ๋ง ๊ฐ์ Gaussian์ผ๋ก ๊ณ ํ์ง, ๋น๊ตฌ์กฐ์ ์ฅ๋ฉด ํํ์ ์์ฑํ๋ค.
- ์ค์๊ฐ GPU ๊ธฐ๋ฐ ๋ ๋๋ง:
- GPU ์ ๋ ฌ ์๊ณ ๋ฆฌ์ฆ๊ณผ ํ์ผํ ๋์คํฐํ๋ฅผ ๊ฒฐํฉํ ๋น ๋ฅธ ๋ ๋๋ง ๋ฐฉ๋ฒ ์ ์
- ๊ฐ์์ฑ ์ ๋ ฌ: ๋น๋ฑ๋ฐฉ์ฑ splatting ์ ์ฌ์ฉํด ๊ฐ์์ฑ ์์๋ฅผ ์ ์งํ๋ฉฐ, ๐ผ-๋ธ๋ ๋ฉ์ ํตํด ์ ํํ ์ด๋ฏธ์ง ์์ฑ
- ์ญ์ ํ ํจ์จ: ์ ๋ ฌ๋ splat ์ ์์ฐจ์ ์ถ์ ์ ํตํด ๋น ๋ฅด๊ณ ์ ํํ ์ญ์ ํ ๊ฐ๋ฅ
3. ์คํ ๊ฒฐ๊ณผ ์์ฝ (๋ ผ๋ฌธ์ ๋ฐ์ดํฐ์ )
- ๊ธฐ์กด์ ๋ฐํ๋ ์ฌ๋ฌ ๋ฐ์ดํฐ์
(Barron et al. 2022; Hedman et al. 2018; Knapitsch et al. 2017)์์ ํ
์คํธ๋ฅผ ์ํ
- ์ต์ข
์ ์ผ๋ก, ์๊ฐ์ ํ์ง์ SOTA ์ธ NeRF ๋ฐฉ๋ฒ์ ํ์ ํ๊ฑฐ๋ ์ฐ์ํ๊ณ ์ต์ด๋ก ๊ณ ํด์๋์์ ์ค์๊ฐ ๋ ๋๋ง(1080p, โฅ30fps)์ ๋ฌ์ฑ

Related Work
๊ธฐ์กด ๋ทฐ ์์ฑ ๊ธฐ์ (light field, MVS(๋ฉํฐ๋ทฐ ์คํ
๋ ์ค))์ ์ ๋ฐํ์ง๋ง ์ฌ๊ตฌ์ฑ ์ค๋ฅ ๋ฌธ์ ๊ฐ ์์์.
NeRF ์ ๊ฐ์ ์ ๊ฒฝ ๋ ๋๋ง์ ๋ ๋์ ํ์ง์ ์ ๊ณตํ์ง๋ง ์๋ ๋ฌธ์ ๊ฐ ์กด์ฌ.
๋ณธ ์ฐ๊ตฌ๋ 3D ๊ฐ์ฐ์์์ ํ์ฉํด ๊ธฐ์กด ๋ฐฉ๋ฒ์ ๋จ์ ๊ทน๋ณตํ๊ณ , ์ค์๊ฐ ๋ ๋๋ง ๋ฐ ๋ณต์กํ ์ฅ๋ฉด ํํ ์คํํ๊ณ ์ ํ๋ค.
Overview
์ด ๋ฐฉ๋ฒ์ ์ ์ ์ฅ๋ฉด์ ๋ณด์ ๋ ์ด๋ฏธ์ง ์ธํธ(SfM ์ ํตํด ์์ฑ๋ sparse point cloud ํฌํจ)๋ฅผ ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํ๋ค.
์ด๋ฌํ ํฌ์ธํธ๋ฅผ ์์น(ํ๊ท ), ๊ณต๋ถ์ฐ ํ๋ ฌ(covariance), ๋ถํฌ๋ช ๋(opacity, ๐ผ) ๋ก ์ ์๋ 3D ๊ฐ์ฐ์์์ผ๋ก ๋ณํํ๋ค. ์ด๋ฅผ ํตํด ์ ์ฐํ๊ณ ์์ถ๋ 3D ์ฅ๋ฉด ํํ์ด ๊ฐ๋ฅํ๋ฉฐ, ํนํ anisotropy(๋น๋ฑ๋ฐฉ์ฑ) volume splatting ์ ์ฌ์ฉํด ์ธ๋ถ ๊ตฌ์กฐ๋ฅผ ํจ์จ์ ์ผ๋ก ํํํ๋ค.
์ฅ๋ฉด์ radiance field (์์)์ ๊ตฌ๋ฉด ์กฐํ ํจ์(Spherical Harmonics, SH) ๋ฅผ ์ฌ์ฉํ์ฌ ํํํ๋ฉฐ, ์ด๋ ๊ธฐ์กด ํ์ค ๋ฐฉ์์ ๋ฐ๋ฅธ๋ค.
์๊ณ ๋ฆฌ์ฆ์ 3D ๊ฐ์ฐ์์ parameter(์์น, ๊ณต๋ถ์ฐ, ๐ผ, SH ๊ณ์)์ ์ต์ ํ์ ๊ฐ์ฐ์์ ๋ฐ๋์ ์ ์์ ์ ์ด๋ฅผ ๋ฐ๋ณต์ ์ผ๋ก ์ํํ์ฌ ๋ฐฉ์ฌ ํ๋ ํํ์ ์์ฑํ๋ค.
์ด ๋ฐฉ๋ฒ์ ํต์ฌ์ ํ์ผ ๊ธฐ๋ฐ rasterizer ๋ก, anisotropy splatting ์ ๐ผ-๋ธ๋ ๋ฉ์ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ณ ๋น ๋ฅธ sorting ์ ํตํด ๊ฐ์์ฑ ์์๋ฅผ ์ค์ํ๋ค. ๋ํ, ๋์ ๋ ๐ผ ๊ฐ์ ์ถ์ ํ๋ ์ญ๋ฐฉํฅ ์ฐ์ฐ(backward) ์ ์ง์ํ์ฌ gradient ๋ฅผ ๊ณ์ฐํ ๋ ๊ฐ์ฐ์์ ๊ฐ์์ ์ ํ์ด ์๋ค.

Differentiable 3D Gaussian Splatting
๋ชฉํ : ๋ฒ์ ์ ๋ณด ์์ด sparse ํ SfM ํฌ์ธํธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ก์ด ๋ทฐ๋ฅผ ์์ฑํ ์ ์๋ ๊ณ ํ์ง์ ์ฅ๋ฉด ํํ์ ์ต์ ํํ๋ ๊ฒ
๊ฐ์ฐ์์ ๋ชจ๋ธ๋ง
: 3D ๊ฐ์ฐ์์์ ์๋ ์ขํ์์ ๊ณต๋ถ์ฐ ํ๋ ฌ ฮฃ์ ํ๊ท ๐๋ก ์ ์๋๋ค.

์ด ๊ฐ์ฐ์์์ ๋ธ๋ ๋ฉ ๊ณผ์ ์์ ๋ถํฌ๋ช ๋(๐ผ)๋ฅผ ๊ณฑํด ์ฌ์ฉ๋๋ค.
2D ๋ก์ projection
: 3D ๊ณต๋ถ์ฐ ฮฃ๋ฅผ ์นด๋ฉ๋ผ ์ขํ๊ณ๋ก ๋ณํํ ฮฃโฒ๋ ๋ค์๊ณผ ๊ฐ์ด ๊ตฌํ๋ค.

์ฌ๊ธฐ์ J ๋ ํฌ์ ๋ณํ์ ์ํ ๊ทผ์ฌ์ ๋ํ ์ผ์ฝ๋น์์ด๋ค.
2D ๋ ๋๋ง์ ์ํด ฮฃโฒ์ 3๋ฒ์งธ ํ๊ณผ ์ด์ ์๋ตํ์ฌ 2ร2 ๊ณต๋ถ์ฐ ํ๋ ฌ๋ก ๋ณํํ๋ค.
๊ณต๋ถ ํ๋ ฌ ์ต์ ํ ๋ฌธ์
: ๊ณต๋ถ์ฐ ํ๋ ฌ ฮฃ๋ ์์ ์ค์ ์ ์(positive semi-definite)์ด์ด์ผ ํ๋ฏ๋ก, ์ด๋ฅผ ์ง์ ์ต์ ํํ๋ ๊ฒ์ ์ด๋ ต๋ค.
์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๊ณต๋ถ์ฐ์ ๋ค์๊ณผ ๊ฐ์ด ๋ถํดํ์ฌ ์ต์ ํ๋ฅผ ํ๋ค.

- S : ํฌ๊ธฐ(์ค์ผ์ผ) ํ๋ ฌ โ 3D ๋ฒกํฐ s ๋ก ํํ
- R : ํ์ ํ๋ ฌ โ ์ฟผํฐ๋์ธ q ๋ก ํํ
ํจ์จ์ ์ต์ ํ
1. s ์ q ๋ฅผ ๋
๋ฆฝ์ ์ผ๋ก ์ ์ฅํ์ฌ ๋ณํ๊ณผ ์กฐํฉ์ ๋จ์ํํ๋ค.
2. q ๋ฅผ ์ ๊ทํํด ์ ํจํ ์ฟผํฐ๋์ธ์ ์ ์ง.
3. ์๋ ๋ฏธ๋ถ์ ๊ณ์ฐ ๋น์ฉ์ ์ค์ด๊ธฐ ์ํด ๋ช
์์ ์ผ๋ก ํ๋ผ๋ฏธํฐ์ ๊ธฐ์ธ๊ธฐ๋ฅผ ์ ๋
์์ ๋ด์ฉ์ ๋ ผ๋ฌธ์ ๋์จ ๋ด์ฉ ๊ทธ๋๋ก ์ ๋ฆฌํด์ ์ ์ด๋ณธ ๊ฒ์ธ๋ฐ, ์ ์ดํด๊ฐ ์๋์ ๋ถ๋ก์ ๋์์๋ algorithm 1์ ํ ๋๋ก ์ ๋ฆฌํด๋ณด์๋ค.



Optimization with Adaptive Density Control of 3D Gaussians
์ต์ ํ(Optimization)
- ์ฅ๋ฉด์ 3D ๊ฐ์ฐ์์์ ์ต์ ํํ์ฌ ์์ ๋ก์ด ๋ทฐ ์์ฑ์ ๊ฐ๋ฅํ๊ฒ ํ๋ค.
- ๊ฐ์ฐ์์์ ์์น(๐), ๋ถํฌ๋ช
๋(๐ผ), ๊ณต๋ถ์ฐ ํ๋ ฌ(ฮฃ), ์์(SH ๊ณ์)๋ฅผ ํจ๊ป ์ต์ ํํ์ฌ ์ฅ๋ฉด์ ๋ทฐ ์์กด์ ํน์ฑ์ ์บก์ฒ
์ต์ ํ ํ๋ก์ธ์ค
1. ๋ ๋๋ง๊ณผ ๋น๊ต
- ๋ ๋๋งํ ์ด๋ฏธ์ง์ ๋ฐ์ดํฐ์ ์ ํธ๋ ์ด๋ ๋ทฐ๋ฅผ ๋น๊ตํด ์ต์ ํ ์ํ
- 3D์์ 2D๋ก์ ํฌ์ ๊ณผ์ ์์ ๋ฐ์ํ๋ ๊ธฐํํ์ ๋ชจํธ์ฑ์ ํด๊ฒฐํ๊ธฐ ์ํด ์๋ชป ๋ฐฐ์น๋ ๊ธฐํํ์ ์์๋ฅผ ์์ ํ๊ฑฐ๋ ์ ๊ฑฐ
2. ๊ธฐ๋ฒ
- ํ๋ฅ ์ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ(SGD)์ ์ฌ์ฉํ๋ฉฐ, GPU ๊ฐ์ ๋ฐ CUDA ์ปค๋์ ํ์ฉํด ํจ์จ์ฑ์ ๊ทน๋ํ
- ์ฃผ์ ๋ณ๋ชฉํ์์ธ ๋น ๋ฅธ ๋์คํฐํ๋ฅผ ํตํด ์ฐ์ฐ ํจ์จ์ฑ ํ๋ณด
3. ํ์ฑํ ํจ์
- ๐ผ: ์๊ทธ๋ชจ์ด๋ ํ์ฑํ ํจ์๋ก [0, 1) ๋ฒ์๋ฅผ ์ ์ง
- ๊ณต๋ถ์ฐ ์ค์ผ์ผ: ์ง์ ํ์ฑํ ํจ์(Exponential) ์ฌ์ฉ
4. ์ด๊ธฐํ ๋ฐ ํ์ต
- ๊ณต๋ถ์ฐ ํ๋ ฌ์ ์ด๊ธฐํ ์, ๊ฐ์ฅ ๊ฐ๊น์ด ์ธ ์ ์ ํ๊ท ๊ฑฐ๋ฆฌ๋ก ๋ฑ๋ฐฉ์ฑ(isotropic) ๊ฐ์ฐ์์์ผ๋ก ์ค์
- ์์ค ํจ์๋ L1๊ณผ D-SSIM์ ์กฐํฉ:

- ์ด ๋ ผ๋ฌธ์์๋ ฮป=0.2๋ก ์ค์ .
3D ๊ฐ์ฐ์์์ ๋ฐ๋ ์กฐ์ (Adaptive Control of 3D Gaussians)
์ ์์ ๋ฐ๋ ์กฐ์ ์ ํ์์ฑ
- ์ด๊ธฐ์ ํฌ์ํ SfM ํฌ์ธํธ ์ธํธ๋ฅผ ์์์ ์ผ๋ก ์ฌ์ฉํด ๊ฐ์ฐ์์ ๋ฐ๋๋ฅผ ์ ์ง์ ์ผ๋ก ์ฆ๊ฐ
- ๋ชฉํ๋ ๊ธฐํํ์ ํน์ฑ์ด ๋ถ์กฑํ ์์ญ(under-reconstruction)๊ณผ ๊ณผ์์ผ๋ก ํํ๋ ์์ญ(over-reconstruction)์ ๋ณด์ํ๋ค.
์ ์์ ๋ฐ๋ ์ฆ๊ฐ
1. ๋ฐ๋ ์ฆ๊ฐ ์กฐ๊ฑด
- ๋ทฐ ๊ณต๊ฐ์์ ์์น ๊ธฐ์ธ๊ธฐ(view-space position gradients)๊ฐ ์๊ณ๊ฐ ๐pos(0.0002) ์ด์์ธ ๊ฒฝ์ฐ ๊ฐ์ฐ์์์ ์ฆ์
2. ์ฒ๋ฆฌ ๋ฐฉ์ (fig. 4 ์ฐธ๊ณ )
- ์์ ๊ฐ์ฐ์์(under-reconstruction): ๋์ผ ํฌ๊ธฐ์ ๋ณต์ฌ๋ณธ์ ์์ฑํ์ฌ ์์น ๊ธฐ์ธ๊ธฐ ๋ฐฉํฅ์ผ๋ก ์ด๋ํ๋ค.
- ํฐ ๊ฐ์ฐ์์(over-reconstruction): ๋ ๊ฐ์ ์์ ๊ฐ์ฐ์์์ผ๋ก ๋ถํ ํ๋ฉฐ, ํฌ๊ธฐ๋ฅผ 1.6(๐)์ผ๋ก ๋๋๋ค.

๋ถํฌ๋ช
๋์ ๊ฐ์ฐ์์ ์ ๊ฑฐ
- ๐ผ ๊ฐ์ด ์๊ณ๊ฐ ๐_๐ผ ์ดํ์ธ ๊ฐ์ฐ์์์ ์ฃผ๊ธฐ์ ์ผ๋ก ์ ๊ฑฐํ๋ค.
- N=3000 ๋ฐ๋ณต๋ง๋ค ๐ผ ๊ฐ์ 0์ ๊ฐ๊น๊ฒ ์ค์ ํด ๋ถํ์ํ ๊ฐ์ฐ์์์ ์ฆ๊ฐ๋ฅผ ์ต์ ํ๋ค.
ํจ์จ์ ๊ด๋ฆฌ
- ์๋ ๊ณต๊ฐ์์ ๋๋ฌด ํฐ ๊ฐ์ฐ์์์ด๋ ๋ทฐ ๊ณต๊ฐ์์ ํฐ ์ํฅ์ ๋ฏธ์น๋ ๊ฐ์ฐ์์์ ์ฃผ๊ธฐ์ ์ผ๋ก ์ ๊ฑฐํ๋ค.
- ์ ํด๋ฆฌ๋ ๊ณต๊ฐ์ ์์ ์์๋ก์ ๊ฐ์ฐ์์์ ์ ์งํ๋ฉฐ, ๋ค๋ฅธ ๊ธฐ๋ฒ์์ ์ฌ์ฉํ๋ ๊ณต๊ฐ ์์ถ, ์๊ณก, ํฌ์ ์ ๋ต์ ์ฌ์ฉํ์ง ์๋๋ค.
์์ ๋ด์ฉ์ ๋ ผ๋ฌธ์ ๋์จ ๋ด์ฉ ๊ทธ๋๋ก ์ ๋ฆฌํด์ ์ ์ด๋ณธ ๊ฒ์ธ๋ฐ, ์ ์ดํด๊ฐ ์๋์ ๋ถ๋ก์ ๋์์๋ algorithm 1์ ํ ๋๋ก ์ ๋ฆฌํด๋ณด์๋ค.

<์๊ณ ๋ฆฌ์ฆ ๊ฐ๋จ ์์ฝ ์ด์ ๋ฆฌ>

์๊ณ ๋ฆฌ์ฆ (Optimization and Densification)
์ ๋ ฅ: SfM ํฌ์ธํธ (M), ์ด๊ธฐ Gaussian ์์ฑ (S, C, A), ๋ฐ๋ณต ํ์ i = 0
1. SampleTrainingView: ์นด๋ฉ๋ผ ๋ทฐ ๋ฐ ์ด๋ฏธ์ง ์ํ๋ง.
2. Rasterize: Gaussian์ 2D ํ๋ฉด์ ํฌ์.
3. Loss ๊ณ์ฐ:
โข L = (1โฮป)L1 + ฮปL_D-SSIM
4. Backprop & Step: ADAM ์ต์ ํ๋ก ํ๋ผ๋ฏธํฐ ์ ๋ฐ์ดํธ.
5. Gaussian ๊ด๋ฆฌ:
โข Pruning: ฮฑ < ฮต ๋๋ ๋๋ฌด ํฐ Gaussian ์ ๊ฑฐ.
โข Densification:
โข Over-reconstruction (๊ณผ์ ์ฌ๊ตฌ์ฑ): Gaussian ๋ถํ .
โข Under-reconstruction (๋ถ์กฑ ์ฌ๊ตฌ์ฑ): Gaussian ๋ณต์ .
6. Iteration ์ฆ๊ฐ ๋ฐ ๋ฐ๋ณต
Fast Differentiable Rasterizer for Gaussians
๋ชฉํ:
- ๋น ๋ฅธ ๋ ๋๋ง๊ณผ ๋น ๋ฅธ ์ ๋ ฌ์ ํตํด ฮฑ-blending์ ํจ์จ์ ์ผ๋ก ์ํํ๋ค.
- ์ด์ ๋ฌธ์ ์ ํด๊ฒฐ
- ์ ๋ ฌ ๋น์ฉ์ ์ค์ด๊ธฐ ์ํด ํฝ์
๋จ์๊ฐ ์๋ ํ์ผ ๋จ์๋ก ์ ๋ ฌ
- ๋์ ๋ฉ๋ชจ๋ฆฌ ๊ด๋ฆฌ๋ฅผ ์ต์ํํ์ฌ ๋ชจ๋ Gaussian ์ ๋ํ ๊ธฐ์ธ๊ธฐ ์
๋ฐ์ดํธ๋ฅผ ์ง์
1. ํ์ผ ๊ธฐ๋ฐ์ ์ ๋ ฌ ๋ฐ ๋์คํฐํ
- ํ๋ฉด์ 16 x 16 ํ์ผ๋ก ๋ถํ ํ๋ค.
- ๊ฐ์ฐ์์ ํ๋๋ง
- 99% ์ ๋ขฐ๊ตฌ๊ฐ์ด ๋ทฐ ํ๋ฌ์คํ
๊ณผ ๊ฒน์น๋ Gaussian ๋ง ์ ์งํ๋ค.
- ๊ทน๋จ์ ์์น(near plane ๊ทผ์ฒ)๋ Gaurd Band ๋ฅผ ์ฌ์ฉํด ๋ฐฐ์ ํ๋ค. (๋ถ์์ ํ ํฌ์ ๋ฐฉ์ง)
- ์ ๋ ฌ ๋ฐฉ์:
- ๊ฐ์ฐ์์์ ํ์ผ ๋จ์๋ก ์ค์ฒฉ๋๋ ๊ฐ์์ ๋ฐ๋ผ ๋ณต์
- ๊ฐ ๊ฐ์ฐ์์์ ๊น์ด ๊ฐ๊ณผ ํ์ผ ID ๋ฅผ ํค๋ก ํ ๋น
- GPU Radix Sort ๋ฅผ ํตํด ๋น ๋ฅด๊ฒ ์ ๋ ฌ
2. ฮฑ-Blending (ํฉ์ฑ)
- ์ ๋ ฌ๋ Gaussian์ ํ์ผ์ ํ ๋น โ ๊ฐ ํ์ผ๋น ๋ฆฌ์คํธ ์์ฑํ๋ค.
- ๋ณ๋ ฌ ์ฒ๋ฆฌ: ํ์ผ ๋จ์๋ก ์ค๋ ๋ ๋ธ๋ก์ ์คํํ๋ค. ๊ณต์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ํ์ฉํด Gaussian ๋ฐ์ดํฐ๋ฅผ ๋ถ๋ฌ์ค๊ณ , ๊ฐ ํฝ์
์ ๋ํด ฮฑ์ ์์์ ๋์
- ๋น ๋ฅธ ์ข
๋ฃ:
- ฮฑ ๊ฐ์ด 1 (ํฌํ) ์ ๋๋ฌํ ํฝ์
์ ์ฒ๋ฆฌ๋ ์ค๋จ
- ํ์ผ์ ๋ชจ๋ ํฝ์
์ด ํฌํ๋๋ฉด ํด๋น ํ์ผ ์ฒ๋ฆฌ๋ฅผ ์ข
๋ฃ
3. Backward Pass (๊ธฐ์ธ๊ธฐ ๊ณ์ฐ)
- ์ด์ ๋ฌธ์ ํด๊ฒฐ: ๋์ ๋ฉ๋ชจ๋ฆฌ ํ ๋น ์์ด ์ ๋ฐฉ ํจ์ค์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฌ์ฉ
- Gradient ๊ณ์ฐ ์ต์ ํ:
- Gaussian์ ์ ๋ ฌ๋ ๋ฆฌ์คํธ์ ํ์ผ ๋ฒ์๋ฅผ ์ฌ์ฌ์ฉํด ๋ค์์ ์์ผ๋ก(back-to-front) ๋ฐ๋ณต ํ์ํ๋ค.
- ๊ฐ ํฝ์
์ ์ ๋ฐฉ ํจ์ค์์ ๊ธฐ์ฌํ ๊น์ด ๊ฐ ์ดํ์ Gaussian๋ง ์ฒ๋ฆฌ
- ์ค๊ฐ ฮฑ ๊ฐ ๋ณต๊ตฌ:
- ์ ๋ฐฉ ํจ์ค์์ ๋์ ๋ ์ต์ข
ฮฑ ๊ฐ๋ง ์ ์ฅ
- ๊ธฐ์ธ๊ธฐ ๊ณ์ฐ ์, ์ต์ข
ฮฑ๋ฅผ ๊ฐ Gaussian์ ฮฑ ๊ฐ์ผ๋ก ๋๋ ์ ์ค๊ฐ ฮฑ ๊ฐ์ ๋ณต๊ตฌ
Result



