메타, LLM μ„±λŠ₯ λ†’μ΄λŠ” 'λ©€ν‹° 토큰 예츑' μ•„ν‚€ν…μ²˜ 곡개 (링크)

기사 λ‚΄μš© μš”μ•½
메타가 λŒ€ν˜•μ–Έμ–΄λͺ¨λΈ(LLM)의 예츑 토큰 수λ₯Ό 늘렀, μ •ν™•μ„±κ³Ό 속도λ₯Ό κ°œμ„ ν•  수 μžˆλ‹€λŠ” 연ꡬ κ²°κ³Όλ₯Ό λ°œν‘œν–ˆλ‹€. 이λ₯Ό 톡해 λͺ¨λΈ 속도λ₯Ό μ΅œλŒ€ 3λ°° λΉ λ₯΄κ²Œ ν•  수 μžˆλ‹€κ³  μ£Όμž₯ν–ˆλ‹€.
λ²€μ²˜λΉ„νŠΈλŠ” 6일(ν˜„μ§€μ‹œκ°„) 메타와 μ—μ½œ 데 퐁 νŒŒλ¦¬ν…Œν¬, 파리 μ‚¬ν΄λ ˆ λŒ€ν•™ λ“± 연ꡬ진이 μ—¬λŸ¬ 토큰을 λ™μ‹œμ— μ˜ˆμΈ‘ν•˜λŠ” 'λ©€ν‹° 토큰' 예츑 기법에 κ΄€ν•œ 논문을 온라인 μ•„μΉ΄μ΄λΈŒμ— κ²Œμž¬ν–ˆλ‹€κ³  μ „ν–ˆλ‹€.연ꡬ진은 “λͺ¨λ“  μœ ν˜•μ˜ λͺ¨λΈ 및 μ–Έμ–΄ μž‘μ—…μ— 보편적인 μ†”λ£¨μ…˜μ€ μ•„λ‹ˆμ§€λ§Œ, 일뢀 μ˜μ—­μ—μ„œλŠ” 생성 μž‘μ—…μ—μ„œ 3배의 속도와 더 λ‚˜μ€ 정확도λ₯Ό μ œκ³΅ν•œλ‹€”라고 λ§ν–ˆλ‹€. 
연ꡬ 결과에 λ”°λ₯΄λ©΄ 큰 λͺ¨λΈμΌμˆ˜λ‘ λ©€ν‹° 토큰 예츑의 νš¨κ³Όκ°€ μ¦κ°€ν•˜λ©° 특히 λ°”μ΄νŠΈ μˆ˜μ€€μ—μ„œ 토큰화λ₯Ό μ§„ν–‰ν•˜λŠ” μ‹€ν—˜μ—μ„œλŠ” λ©€ν‹° 토큰 예츑이 단일 λ°”μ΄νŠΈ 예츑 보델을 크게 μ•žμ„œλŠ” κ²°κ³Όλ₯Ό λ‚˜νƒ€λƒˆλ‹€.

 

핡심 μš©μ–΄
  • ν† ν°μ΄λž€?
    • μ–Έμ–΄ λͺ¨λΈμ€ μΈκ°„μ˜ μ–Έμ–΄κ°€ μ•„λ‹Œ 토큰 IDλ₯Ό μƒμ„±ν•˜μ—¬ 처리
    • 토큰 λ‹¨μœ„λ‘œ λ‚˜λˆ„λŠ” 토큰화(tokenization) μž‘μ—…μ΄ ν•„μš”
  • λ‹€μŒ 토큰 예츑 (Next Token Prediction, NTP) → LLM을 ν›ˆλ ¨ν•˜λŠ” 고전적 방법
    • λ¬Έμž₯의 일뢀뢄을 μž…λ ₯ν•˜λ©΄ λ‹€μŒμ— 올 단어λ₯Ό 예츑
      (λͺ¨λΈμ— 일련의 토큰이 주어지고 λ‹€μŒ 토큰을 μ˜ˆμΈ‘ν•΄μ•Ό ν•˜λŠ” 자기 지도 ν•™μŠ΅ 기술)
    • 예츑된 토큰을 μž…λ ₯에 μΆ”κ°€ν•˜κ³  ν•œ λ²ˆμ— 토큰 ν•˜λ‚˜μ”© μΆ”κ°€ν•˜λŠ” ν”„λ‘œμ„ΈμŠ€λ₯Ό 반볡
  • λ©€ν‹° 토큰 예츑 (Multi Token Prediction) → 메타가 λ°œν‘œν•œ μƒˆλ‘œμš΄ 방법
    • κΈ°μ‘΄ 트랜슀포머 μ•„ν‚€ν…μ²˜λ₯Ό 기반으둜 ν•˜μ§€λ§Œ 단일 좜λ ₯ λŒ€μ‹  μ—¬λŸ¬ 독립적인 좜λ ₯ ν—€λ“œλ‘œ μ—¬λŸ¬ 토큰 λ™μ‹œμ— 예츑
    • μΆ”λ‘  κ³Όμ •μ—μ„œ 기본적인 λ‹€μŒ 토큰 μ˜ˆμΈ‘μ„ μœ μ§€ν•˜λ©΄μ„œ 좔가적인 좜λ ₯ν—€λ“œλ₯Ό μ‚¬μš©ν•΄ λ””μ½”λ”© 속도 증가

 

β€» Reference β€»

https://huggingface.co/blog/alonsosilva/nexttokenprediction (토큰 ID μ²˜λ¦¬μ— λŒ€ν•œ μ˜ˆμ‹œ)

https://wikidocs.net/21698 (토큰화 μž‘μ—… μ˜ˆμ‹œ)

 

https://www.aitimes.com/news/articleView.html?idxno=159080 (라마3 ν•œκ΅­μ–΄ 경쟁λ ₯ κ΄€λ ¨ 기사)


 

λ©”νƒ€μ—μ„œ μΆœμ‹œν•œ 라마3μ—μ„œ ν•œκ΅­μ–΄ λŠ₯λ ₯은 λΆ€μ‘±ν•˜λ‹€λŠ” 기사λ₯Ό λ΄€λŠ”λ°...λ©€ν‹° 토큰 예츑 κΈ°μˆ μ„ μ‚¬μš©ν–ˆμ„ λ•Œ ν•œκ΅­μ–΄μ˜ μ„±λŠ₯도 κΆκΈˆν•˜λ‹€. ν•œκ΅­μ–΄λŠ” ν† ν°ν™”ν•˜κΈ° μ–΄λ €μš΄ κ²ƒμœΌλ‘œ μ•Œκ³  μžˆλŠ”λ° λΉ λ₯Έ μ‹œμΌ 내에 ν•œκ΅­μ–΄λ„ κ°œμ„ λ˜μ–΄μ„œ AI κΈ°μˆ μ„ ν™œμš©ν•  수 있으면 μ’‹κ² λ‹€.

+ Recent posts