๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
๐Ÿ˜ŽAI/Terminology

[Notable] Low Temperature Samples

by SolaKim 2025. 2. 5.

Low Temperature Samples๋Š” ์ƒ์„ฑ ๋ชจ๋ธ์—์„œ ์ƒ˜ํ”Œ ํ’ˆ์งˆ์„ ๋†’์ด๊ณ  ๋‹ค์–‘์„ฑ์„ ์ค„์ด๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค.
์ฃผ๋กœ ํ™•๋ฅ  ๋ถ„ํฌ์˜ "์ƒ˜ํ”Œ๋ง ์˜จ๋„(temperature)"๋ฅผ ์กฐ์ ˆํ•˜์—ฌ ์ƒ์„ฑ ๊ฒฐ๊ณผ์— ์˜ํ–ฅ์„ ์ค๋‹ˆ๋‹ค.

 

1. "Temperature"์˜ ์˜๋ฏธ

  • Temperature๋Š” ํ™•๋ฅ  ๋ถ„ํฌ์˜ "๋‚ ์นด๋กœ์›€(sharpness)" ๋˜๋Š” "๋ถˆํ™•์‹ค์„ฑ(uncertainty)"์„ ์กฐ์ ˆํ•˜๋Š” ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ์ž…๋‹ˆ๋‹ค.
  • ์ˆ˜ํ•™์ ์œผ๋กœ๋Š” ์†Œํ”„ํŠธ๋งฅ์Šค(softmax) ํ•จ์ˆ˜์—์„œ ์ž์ฃผ ์‚ฌ์šฉ๋ฉ๋‹ˆ๋‹ค:

  • ์—ฌ๊ธฐ์„œ:
    • T = temperature (์˜จ๋„)
    • zi = ๋กœ์ง“(logit) ๊ฐ’ (๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ์ ์ˆ˜)
    • P(xi) = ์ตœ์ข… ํ™•๋ฅ 

 

2. Temperature์˜ ์˜ํ–ฅ

    • ๋†’์€ ์˜จ๋„ (Tโ‰ซ1)
      • ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ **ํ‰ํ‰(flat)**ํ•ด์ง€๊ณ , ๋” ๋‹ค์–‘ํ•œ ์ƒ˜ํ”Œ์ด ์ƒ์„ฑ๋จ
      • ๋ชจ๋ธ์ด ๋ถˆํ™•์‹คํ•œ ์„ ํƒ์„ ๋” ๋งŽ์ด ํ•จ → ์ฐฝ์˜์ ์ด์ง€๋งŒ ํ’ˆ์งˆ์ด ๋–จ์–ด์งˆ ์ˆ˜ ์žˆ์Œ
    • ๋‚ฎ์€ ์˜จ๋„ (Tโ‰ช1) → Low Temperature
      • ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ ๋‚ ์นด๋กญ๊ณ (sharp), ๊ณ ํ’ˆ์งˆ์˜ ์ƒ˜ํ”Œ์ด ์ƒ์„ฑ๋จ
      • ๋ชจ๋ธ์ด ๊ฐ€์žฅ ํ™•์‹ ํ•˜๋Š” ์„ ํƒ์„ ๋” ์ž์ฃผ ํ•จ → ์„ ๋ช…ํ•˜๊ณ  ์ผ๊ด€๋œ ๊ฒฐ๊ณผ, ํ•˜์ง€๋งŒ ๋‹ค์–‘์„ฑ ๊ฐ์†Œ

์˜ˆ๋ฅผ ๋“ค์–ด:

    • ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ชจ๋ธ: ๋‚ฎ์€ ์˜จ๋„์—์„œ๋Š” ์งง๊ณ  ์ผ๊ด€๋œ ๋ฌธ์žฅ์„ ์ƒ์„ฑ, ๋†’์€ ์˜จ๋„์—์„œ๋Š” ์ฐฝ์˜์ ์ธ ๋ฌธ์žฅ์„ ์ƒ์„ฑ
    • ์ด๋ฏธ์ง€ ์ƒ์„ฑ ๋ชจ๋ธ: ๋‚ฎ์€ ์˜จ๋„์—์„œ๋Š” ๊ณ ํ’ˆ์งˆ ์ด๋ฏธ์ง€ ์ƒ์„ฑ, ๋†’์€ ์˜จ๋„์—์„œ๋Š” ๋‹ค์–‘ํ•œ ์Šคํƒ€์ผ๊ณผ ํŒจํ„ด ์ƒ์„ฑ