λ©ν, LLM μ±λ₯ λμ΄λ 'λ©ν° ν ν° μμΈ‘' μν€ν μ² κ³΅κ° (λ§ν¬)
κΈ°μ¬ λ΄μ© μμ½
λ©νκ° λνμΈμ΄λͺ¨λΈ(LLM)μ μμΈ‘ ν ν° μλ₯Ό λλ €, μ νμ±κ³Ό μλλ₯Ό κ°μ ν μ μλ€λ μ°κ΅¬ κ²°κ³Όλ₯Ό λ°ννλ€. μ΄λ₯Ό ν΅ν΄ λͺ¨λΈ μλλ₯Ό μ΅λ 3λ°° λΉ λ₯΄κ² ν μ μλ€κ³ μ£Όμ₯νλ€.
λ²€μ²λΉνΈλ 6μΌ(νμ§μκ°) λ©νμ μμ½ λ° ν ν리ν ν¬, ν리 μ¬ν΄λ λν λ± μ°κ΅¬μ§μ΄ μ¬λ¬ ν ν°μ λμμ μμΈ‘νλ 'λ©ν° ν ν°' μμΈ‘ κΈ°λ²μ κ΄ν λ Όλ¬Έμ μ¨λΌμΈ μμΉ΄μ΄λΈμ κ²μ¬νλ€κ³ μ νλ€.μ°κ΅¬μ§μ “λͺ¨λ μ νμ λͺ¨λΈ λ° μΈμ΄ μμ μ 보νΈμ μΈ μ루μ μ μλμ§λ§, μΌλΆ μμμμλ μμ± μμ μμ 3λ°°μ μλμ λ λμ μ νλλ₯Ό μ 곡νλ€”λΌκ³ λ§νλ€.
μ°κ΅¬ κ²°κ³Όμ λ°λ₯΄λ©΄ ν° λͺ¨λΈμΌμλ‘ λ©ν° ν ν° μμΈ‘μ ν¨κ³Όκ° μ¦κ°νλ©° νΉν λ°μ΄νΈ μμ€μμ ν ν°νλ₯Ό μ§ννλ μ€νμμλ λ©ν° ν ν° μμΈ‘μ΄ λ¨μΌ λ°μ΄νΈ μμΈ‘ 보λΈμ ν¬κ² μμλ κ²°κ³Όλ₯Ό λνλλ€.
ν΅μ¬ μ©μ΄
- ν ν°μ΄λ?
- μΈμ΄ λͺ¨λΈμ μΈκ°μ μΈμ΄κ° μλ ν ν° IDλ₯Ό μμ±νμ¬ μ²λ¦¬
- ν ν° λ¨μλ‘ λλλ ν ν°ν(tokenization) μμ μ΄ νμ
- λ€μ ν ν° μμΈ‘ (Next Token Prediction, NTP) → LLMμ νλ ¨νλ κ³ μ μ λ°©λ²
- λ¬Έμ₯μ μΌλΆλΆμ μ
λ ₯νλ©΄ λ€μμ μ¬ λ¨μ΄λ₯Ό μμΈ‘
(λͺ¨λΈμ μΌλ ¨μ ν ν°μ΄ μ£Όμ΄μ§κ³ λ€μ ν ν°μ μμΈ‘ν΄μΌ νλ μκΈ° μ§λ νμ΅ κΈ°μ ) - μμΈ‘λ ν ν°μ μ λ ₯μ μΆκ°νκ³ ν λ²μ ν ν° νλμ© μΆκ°νλ νλ‘μΈμ€λ₯Ό λ°λ³΅
- λ¬Έμ₯μ μΌλΆλΆμ μ
λ ₯νλ©΄ λ€μμ μ¬ λ¨μ΄λ₯Ό μμΈ‘
- λ©ν° ν ν° μμΈ‘ (Multi Token Prediction) → λ©νκ° λ°νν μλ‘μ΄ λ°©λ²
- κΈ°μ‘΄ νΈλμ€ν¬λ¨Έ μν€ν μ²λ₯Ό κΈ°λ°μΌλ‘ νμ§λ§ λ¨μΌ μΆλ ₯ λμ μ¬λ¬ λ 립μ μΈ μΆλ ₯ ν€λλ‘ μ¬λ¬ ν ν° λμμ μμΈ‘
- μΆλ‘ κ³Όμ μμ κΈ°λ³Έμ μΈ λ€μ ν ν° μμΈ‘μ μ μ§νλ©΄μ μΆκ°μ μΈ μΆλ ₯ν€λλ₯Ό μ¬μ©ν΄ λμ½λ© μλ μ¦κ°
β» Reference β»
https://huggingface.co/blog/alonsosilva/nexttokenprediction (ν ν° ID μ²λ¦¬μ λν μμ)
https://wikidocs.net/21698 (ν ν°ν μμ μμ)
https://www.aitimes.com/news/articleView.html?idxno=159080 (λΌλ§3 νκ΅μ΄ κ²½μλ ₯ κ΄λ ¨ κΈ°μ¬)
λ©νμμ μΆμν λΌλ§3μμ νκ΅μ΄ λ₯λ ₯μ λΆμ‘±νλ€λ κΈ°μ¬λ₯Ό λ΄€λλ°...λ©ν° ν ν° μμΈ‘ κΈ°μ μ μ¬μ©νμ λ νκ΅μ΄μ μ±λ₯λ κΆκΈνλ€. νκ΅μ΄λ ν ν°ννκΈ° μ΄λ €μ΄ κ²μΌλ‘ μκ³ μλλ° λΉ λ₯Έ μμΌ λ΄μ νκ΅μ΄λ κ°μ λμ΄μ AI κΈ°μ μ νμ©ν μ μμΌλ©΄ μ’κ² λ€.