๋ฉํ, LLM ์ฑ๋ฅ ๋์ด๋ '๋ฉํฐ ํ ํฐ ์์ธก' ์ํคํ ์ฒ ๊ณต๊ฐ (๋งํฌ)
๊ธฐ์ฌ ๋ด์ฉ ์์ฝ
๋ฉํ๊ฐ ๋ํ์ธ์ด๋ชจ๋ธ(LLM)์ ์์ธก ํ ํฐ ์๋ฅผ ๋๋ ค, ์ ํ์ฑ๊ณผ ์๋๋ฅผ ๊ฐ์ ํ ์ ์๋ค๋ ์ฐ๊ตฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํํ๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ ์๋๋ฅผ ์ต๋ 3๋ฐฐ ๋น ๋ฅด๊ฒ ํ ์ ์๋ค๊ณ ์ฃผ์ฅํ๋ค.
๋ฒค์ฒ๋นํธ๋ 6์ผ(ํ์ง์๊ฐ) ๋ฉํ์ ์์ฝ ๋ฐ ํ ํ๋ฆฌํ ํฌ, ํ๋ฆฌ ์ฌํด๋ ๋ํ ๋ฑ ์ฐ๊ตฌ์ง์ด ์ฌ๋ฌ ํ ํฐ์ ๋์์ ์์ธกํ๋ '๋ฉํฐ ํ ํฐ' ์์ธก ๊ธฐ๋ฒ์ ๊ดํ ๋ ผ๋ฌธ์ ์จ๋ผ์ธ ์์นด์ด๋ธ์ ๊ฒ์ฌํ๋ค๊ณ ์ ํ๋ค.์ฐ๊ตฌ์ง์ “๋ชจ๋ ์ ํ์ ๋ชจ๋ธ ๋ฐ ์ธ์ด ์์ ์ ๋ณดํธ์ ์ธ ์๋ฃจ์ ์ ์๋์ง๋ง, ์ผ๋ถ ์์ญ์์๋ ์์ฑ ์์ ์์ 3๋ฐฐ์ ์๋์ ๋ ๋์ ์ ํ๋๋ฅผ ์ ๊ณตํ๋ค”๋ผ๊ณ ๋งํ๋ค.
์ฐ๊ตฌ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด ํฐ ๋ชจ๋ธ์ผ์๋ก ๋ฉํฐ ํ ํฐ ์์ธก์ ํจ๊ณผ๊ฐ ์ฆ๊ฐํ๋ฉฐ ํนํ ๋ฐ์ดํธ ์์ค์์ ํ ํฐํ๋ฅผ ์งํํ๋ ์คํ์์๋ ๋ฉํฐ ํ ํฐ ์์ธก์ด ๋จ์ผ ๋ฐ์ดํธ ์์ธก ๋ณด๋ธ์ ํฌ๊ฒ ์์๋ ๊ฒฐ๊ณผ๋ฅผ ๋ํ๋๋ค.
ํต์ฌ ์ฉ์ด
- ํ ํฐ์ด๋?
- ์ธ์ด ๋ชจ๋ธ์ ์ธ๊ฐ์ ์ธ์ด๊ฐ ์๋ ํ ํฐ ID๋ฅผ ์์ฑํ์ฌ ์ฒ๋ฆฌ
- ํ ํฐ ๋จ์๋ก ๋๋๋ ํ ํฐํ(tokenization) ์์ ์ด ํ์
- ๋ค์ ํ ํฐ ์์ธก (Next Token Prediction, NTP) → LLM์ ํ๋ จํ๋ ๊ณ ์ ์ ๋ฐฉ๋ฒ
- ๋ฌธ์ฅ์ ์ผ๋ถ๋ถ์ ์
๋ ฅํ๋ฉด ๋ค์์ ์ฌ ๋จ์ด๋ฅผ ์์ธก
(๋ชจ๋ธ์ ์ผ๋ จ์ ํ ํฐ์ด ์ฃผ์ด์ง๊ณ ๋ค์ ํ ํฐ์ ์์ธกํด์ผ ํ๋ ์๊ธฐ ์ง๋ ํ์ต ๊ธฐ์ ) - ์์ธก๋ ํ ํฐ์ ์ ๋ ฅ์ ์ถ๊ฐํ๊ณ ํ ๋ฒ์ ํ ํฐ ํ๋์ฉ ์ถ๊ฐํ๋ ํ๋ก์ธ์ค๋ฅผ ๋ฐ๋ณต
- ๋ฌธ์ฅ์ ์ผ๋ถ๋ถ์ ์
๋ ฅํ๋ฉด ๋ค์์ ์ฌ ๋จ์ด๋ฅผ ์์ธก
- ๋ฉํฐ ํ ํฐ ์์ธก (Multi Token Prediction) → ๋ฉํ๊ฐ ๋ฐํํ ์๋ก์ด ๋ฐฉ๋ฒ
- ๊ธฐ์กด ํธ๋์คํฌ๋จธ ์ํคํ ์ฒ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ง๋ง ๋จ์ผ ์ถ๋ ฅ ๋์ ์ฌ๋ฌ ๋ ๋ฆฝ์ ์ธ ์ถ๋ ฅ ํค๋๋ก ์ฌ๋ฌ ํ ํฐ ๋์์ ์์ธก
- ์ถ๋ก ๊ณผ์ ์์ ๊ธฐ๋ณธ์ ์ธ ๋ค์ ํ ํฐ ์์ธก์ ์ ์งํ๋ฉด์ ์ถ๊ฐ์ ์ธ ์ถ๋ ฅํค๋๋ฅผ ์ฌ์ฉํด ๋์ฝ๋ฉ ์๋ ์ฆ๊ฐ
โป Reference โป
https://huggingface.co/blog/alonsosilva/nexttokenprediction (ํ ํฐ ID ์ฒ๋ฆฌ์ ๋ํ ์์)
https://wikidocs.net/21698 (ํ ํฐํ ์์ ์์)
https://www.aitimes.com/news/articleView.html?idxno=159080 (๋ผ๋ง3 ํ๊ตญ์ด ๊ฒฝ์๋ ฅ ๊ด๋ จ ๊ธฐ์ฌ)
๋ฉํ์์ ์ถ์ํ ๋ผ๋ง3์์ ํ๊ตญ์ด ๋ฅ๋ ฅ์ ๋ถ์กฑํ๋ค๋ ๊ธฐ์ฌ๋ฅผ ๋ดค๋๋ฐ...๋ฉํฐ ํ ํฐ ์์ธก ๊ธฐ์ ์ ์ฌ์ฉํ์ ๋ ํ๊ตญ์ด์ ์ฑ๋ฅ๋ ๊ถ๊ธํ๋ค. ํ๊ตญ์ด๋ ํ ํฐํํ๊ธฐ ์ด๋ ค์ด ๊ฒ์ผ๋ก ์๊ณ ์๋๋ฐ ๋น ๋ฅธ ์์ผ ๋ด์ ํ๊ตญ์ด๋ ๊ฐ์ ๋์ด์ AI ๊ธฐ์ ์ ํ์ฉํ ์ ์์ผ๋ฉด ์ข๊ฒ ๋ค.