๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Project ESG+AI/Tech Basics

47์ผ์ฐจ. IT ๊ฐœ๋… ์ •๋ฆฌ

by GreenJin_S2 2025. 12. 17.

 

 

RAG(Retrieval-Augmented Generation)๋ž€?

RAG๋Š” ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ์ด๋ผ๋Š” ๊ธฐ์ˆ ๋กœ, ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์ด ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•  ๋•Œ ์™ธ๋ถ€ ์ง€์‹ ๋ฒ ์ด์Šค(์˜ˆ: ๋ฌธ์„œ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค)์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ์‹ค์‹œ๊ฐ„์œผ๋กœ ๊ฒ€์ƒ‰(Retrieval)ํ•˜์—ฌ ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€(Augmented)ํ•œ ํ›„ ์‘๋‹ต์„ ์ƒ์„ฑ(Generation)ํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

  • ์ฃผ์š” ์ž‘๋™ ์›๋ฆฌ:
    • ์‚ฌ์šฉ์ž์˜ ์งˆ๋ฌธ์„ ๋ฐ›์œผ๋ฉด, ๋ฒกํ„ฐ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๋“ฑ์—์„œ ๊ด€๋ จ ๋ฌธ์„œ๋ฅผ ๊ฒ€์ƒ‰ํ•ฉ๋‹ˆ๋‹ค.
    • ๊ฒ€์ƒ‰๋œ ์ •๋ณด๋ฅผ ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€ํ•˜์—ฌ LLM์ด ๋” ์ •ํ™•ํ•˜๊ณ  ์ตœ์‹  ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต๋ณ€ํ•˜๋„๋ก ํ•ฉ๋‹ˆ๋‹ค.
  • ์žฅ์ :
    • ์ตœ์‹  ์ •๋ณด ๋ฐ˜์˜์ด ์‰ฝ์Šต๋‹ˆ๋‹ค. (๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๋งŒ ์—…๋ฐ์ดํŠธํ•˜๋ฉด ๋จ)
    • ํ™˜๊ฐ(hallucination, ์ž˜๋ชป๋œ ์ •๋ณด ์ƒ์„ฑ) ๊ฐ์†Œ.
    • ๋ชจ๋ธ ์ž์ฒด๋ฅผ ์ˆ˜์ •ํ•˜์ง€ ์•Š์œผ๋ฏ€๋กœ ๋น„์šฉ์ด ์ ๊ฒŒ ๋“ค๊ณ , ๊ตฌํ˜„์ด ์ƒ๋Œ€์ ์œผ๋กœ ๊ฐ„๋‹จํ•ฉ๋‹ˆ๋‹ค.
  • ๋‹จ์ :
    • ๊ฒ€์ƒ‰ ํ’ˆ์งˆ์— ๋”ฐ๋ผ ์„ฑ๋Šฅ์ด ์ขŒ์šฐ๋ฉ๋‹ˆ๋‹ค. (์ž˜๋ชป๋œ ๋ฌธ์„œ ๊ฒ€์ƒ‰ ์‹œ ์˜ค๋‹ต ๊ฐ€๋Šฅ)
    • ๋„๋ฉ”์ธ ํŠนํ™”๋œ ์Šคํƒ€์ผ์ด๋‚˜ ๋ณต์žกํ•œ ์ถ”๋ก ์—๋Š” ์•ฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ ํ•ฉํ•œ ๊ฒฝ์šฐ: ํšŒ์‚ฌ ๋‚ด๋ถ€ ๋ฌธ์„œ, ๋‰ด์Šค, ์‹ค์‹œ๊ฐ„ ๋ฐ์ดํ„ฐ๊ฐ€ ์ž์ฃผ ๋ณ€ํ•˜๋Š” ํ™˜๊ฒฝ(์˜ˆ: ๊ณ ๊ฐ ์ง€์› ์ฑ—๋ด‡, FAQ ์‹œ์Šคํ…œ).

ํŒŒ์ธํŠœ๋‹(Fine-tuning)์ด๋ž€?

ํŒŒ์ธํŠœ๋‹์€ ๋ฏธ์„ธ ์กฐ์ •์œผ๋กœ, ์ด๋ฏธ ์‚ฌ์ „ ํ›ˆ๋ จ๋œ LLM(์˜ˆ: GPT ์‹œ๋ฆฌ์ฆˆ)์„ ํŠน์ • ๋„๋ฉ”์ธ์ด๋‚˜ ์ž‘์—…์— ๋งž๋Š” ๋ฐ์ดํ„ฐ์…‹์œผ๋กœ ์ถ”๊ฐ€ ํ•™์Šต์‹œ์ผœ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ(๊ฐ€์ค‘์น˜)๋ฅผ ์กฐ์ •ํ•˜๋Š” ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค.

  • ์ฃผ์š” ์ž‘๋™ ์›๋ฆฌ:
    • ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ์— ์ „๋ฌธ ๋ฐ์ดํ„ฐ(์˜ˆ: ์˜๋ฃŒ ๋ฌธ์„œ, ๋ฒ•๋ฅ  ํ…์ŠคํŠธ)๋ฅผ ์ž…๋ ฅํ•ด ์žฌํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
    • ๋ชจ๋ธ์ด ํ•ด๋‹น ๋„๋ฉ”์ธ์˜ ์–ธ์–ด ํŒจํ„ด, ์Šคํƒ€์ผ, ์ง€์‹์„ ๋‚ด๋ถ€์ ์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
    • ์ตœ๊ทผ์—๋Š” LoRA ๊ฐ™์€ ํšจ์œจ์  ๋ฐฉ๋ฒ•(PEFT: Parameter-Efficient Fine-Tuning)์œผ๋กœ ๋น„์šฉ์„ ์ค„์—ฌ ์ ์šฉํ•ฉ๋‹ˆ๋‹ค.
  • ์žฅ์ :
    • ํŠน์ • ์ž‘์—…์—์„œ ๋†’์€ ์ •ํ™•๋„์™€ ์ „๋ฌธ์„ฑ์„ ๋ฐœํœ˜ํ•ฉ๋‹ˆ๋‹ค. (์˜ˆ: ์˜๋ฃŒ ๋ณด๊ณ ์„œ ์ž‘์„ฑ, ๋ฒ•๋ฅ  ๋ถ„์„)
    • ์‘๋‹ต ์Šคํƒ€์ผ(ํ†ค, ํ˜•์‹)์„ ์„ธ๋ฐ€ํ•˜๊ฒŒ ๋งž์ถœ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ์™ธ๋ถ€ ๊ฒ€์ƒ‰ ์—†์ด ๋น ๋ฅธ ์ถ”๋ก  ๊ฐ€๋Šฅ.
  • ๋‹จ์ :
    • ํ•™์Šต ๋น„์šฉ๊ณผ ์‹œ๊ฐ„์ด ๋งŽ์ด ๋“ญ๋‹ˆ๋‹ค. (GPU ์ž์› ํ•„์š”)
    • ๋ฐ์ดํ„ฐ ์—…๋ฐ์ดํŠธ ์‹œ ์žฌํ•™์Šตํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. (์ตœ์‹  ์ •๋ณด ๋ฐ˜์˜ ์–ด๋ ค์›€)
    • ๊ณผ์ ํ•ฉ(overfitting) ์œ„ํ—˜์ด ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ ํ•ฉํ•œ ๊ฒฝ์šฐ: ์ •์  ๋ฐ์ดํ„ฐ๋กœ ์ถฉ๋ถ„ํ•œ ์ „๋ฌธ ์ž‘์—…(์˜ˆ: ํŠน์ • ์‚ฐ์—… ๋ณด๊ณ ์„œ ์ƒ์„ฑ, ์Šคํƒ€์ผ ๋งž์ถค ํ…์ŠคํŠธ ์ƒ์„ฑ).

RAG์™€ ํŒŒ์ธํŠœ๋‹์˜ ์ฃผ์š” ์ฐจ์ด์  ๋น„๊ต

 
ํ•ญ๋ชฉRAG (๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ)ํŒŒ์ธํŠœ๋‹ (๋ฏธ์„ธ ์กฐ์ •)
๊ธฐ๋ณธ ๋ฉ”์ปค๋‹ˆ์ฆ˜ ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ๊ฒ€์ƒ‰ ํ›„ ํ”„๋กฌํ”„ํŠธ์— ์ถ”๊ฐ€ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ ์ง์ ‘ ์—…๋ฐ์ดํŠธ
์ง€์‹ ์—…๋ฐ์ดํŠธ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ์ถ”๊ฐ€/์ˆ˜์ •๋งŒ์œผ๋กœ ์‹ค์‹œ๊ฐ„ ๊ฐ€๋Šฅ ์žฌํ•™์Šต ํ•„์š” (๋น„์šฉ/์‹œ๊ฐ„ ์†Œ๋ชจ)
๋น„์šฉ/๊ตฌํ˜„ ๋‚œ์ด๋„ ์ƒ๋Œ€์ ์œผ๋กœ ์ €๋ ดํ•˜๊ณ  ์‰ฝ์Œ ๋†’์Œ (ํ•™์Šต ์ž์› ํ•„์š”)
ํ™˜๊ฐ ๊ฐ์†Œ ํšจ๊ณผ์  (์™ธ๋ถ€ ์‚ฌ์‹ค ๊ธฐ๋ฐ˜) ๋„๋ฉ”์ธ ๋‚ด์—์„œ ํšจ๊ณผ์ , ํ•˜์ง€๋งŒ ์ตœ์‹  ์ •๋ณด ์•ฝํ•จ
์„ฑ๋Šฅ ๊ฐ•์  ์ตœ์‹ /๋™์  ์ •๋ณด ์ฒ˜๋ฆฌ ๋„๋ฉ”์ธ ํŠนํ™” ์ถ”๋ก  ๋ฐ ์Šคํƒ€์ผ ๋งž์ถค
๋‹จ์  ๊ฒ€์ƒ‰ ์‹คํŒจ ์‹œ ์„ฑ๋Šฅ ์ €ํ•˜ ์ง€์‹ ๊ณ ์ •, ์—…๋ฐ์ดํŠธ ์–ด๋ ค์›€
ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์‚ฌ์šฉ ๊ฐ€๋Šฅ (ํŒŒ์ธํŠœ๋‹๋œ ๋ชจ๋ธ + RAG) ๊ฐ€๋Šฅ (RAG ๋‚ด์—์„œ ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ ์‚ฌ์šฉ)

RAG์™€ **ํŒŒ์ธํŠœ๋‹(Fine-tuning)**์€ ๋Œ€ํ˜• ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ์‹ค์ œ ์—…๋ฌด์— ๋งž๊ฒŒ ํ™œ์šฉํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ๋‘ ๊ฐ€์ง€ ๋ฐฉ๋ฒ•์ด์—์š”.

๋งŽ์€ ๊ฒฝ์šฐ RAG๋ถ€ํ„ฐ ์‹œ์ž‘ํ•˜๋Š” ๊ฒŒ ์ถ”์ฒœ๋ฉ๋‹ˆ๋‹ค. ๋น„์šฉ์ด ์ ๊ณ  ์œ ์—ฐํ•˜๋ฉฐ, ๋ถ€์กฑํ•œ ๋ถ€๋ถ„(์˜ˆ: ์Šคํƒ€์ผ ๋งž์ถค)์ด ์ƒ๊ธฐ๋ฉด ํŒŒ์ธํŠœ๋‹์„ ์ถ”๊ฐ€๋กœ ์ ์šฉํ•˜๋Š” ํ•˜์ด๋ธŒ๋ฆฌ๋“œ ์ ‘๊ทผ(RAG + Fine-tuning)์ด ์ตœ์ ์˜ ์„ฑ๋Šฅ์„ ๋‚ด๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค.

 

 

 



1๏ธโƒฃ RAG (Retrieval-Augmented Generation, ๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ)

๊ฐœ๋…
๋ชจ๋ธ์ด ๋‹ต๋ณ€์„ ๋งŒ๋“ค๊ธฐ ์ „์— ์™ธ๋ถ€ ๋ฌธ์„œ๋‚˜ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค์—์„œ ๊ด€๋ จ ์ •๋ณด๋ฅผ ๊ฒ€์ƒ‰ํ•˜๊ณ ,
๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

์ž‘๋™ ๋ฐฉ์‹

  1. ์‚ฌ์šฉ์ž๊ฐ€ ์งˆ๋ฌธ
  2. ์งˆ๋ฌธ๊ณผ ๊ด€๋ จ๋œ ๋ฌธ์„œ๋ฅผ ๋ฒกํ„ฐ DB ๋“ฑ์—์„œ ๊ฒ€์ƒ‰
  3. ๊ฒ€์ƒ‰๋œ ๋‚ด์šฉ์„ ํ”„๋กฌํ”„ํŠธ์— ํ•จ๊ป˜ ๋„ฃ์Œ
  4. LLM์ด ๊ทธ ๋‚ด์šฉ์„ ๊ทผ๊ฑฐ๋กœ ๋‹ต๋ณ€ ์ƒ์„ฑ

ํŠน์ง•

  • ๋ชจ๋ธ ์ž์ฒด๋Š” ๋ฐ”๋€Œ์ง€ ์•Š์Œ
  • ์ตœ์‹  ์ •๋ณด·์‚ฌ๋‚ด ๋ฌธ์„œ ๋ฐ˜์˜ ๊ฐ€๋Šฅ
  • ํ™˜๊ฐ(Hallucination) ๊ฐ์†Œ
  • ๋ฌธ์„œ ์ถœ์ฒ˜ ์ œ์‹œ ๊ฐ€๋Šฅ

์˜ˆ์‹œ

  • ์‚ฌ๋‚ด ๊ทœ์ • Q&A ์ฑ—๋ด‡
  • ๋…ผ๋ฌธ/๋งค๋‰ด์–ผ ๊ธฐ๋ฐ˜ ์งˆ๋ฌธ ๋‹ต๋ณ€ ์‹œ์Šคํ…œ
  • ์ตœ์‹  ๋‰ด์Šค ์š”์•ฝ ์ฑ—๋ด‡

์žฅ์ 

  • ๋ฐ์ดํ„ฐ ์—…๋ฐ์ดํŠธ๊ฐ€ ์‰ฌ์›€
  • ๋น„๊ต์  ์ €๋ ด
  • ์‚ฌ์‹ค ๊ธฐ๋ฐ˜ ๋‹ต๋ณ€์— ๊ฐ•ํ•จ

๋‹จ์ 

  • ๊ฒ€์ƒ‰ ํ’ˆ์งˆ์— ๋”ฐ๋ผ ์„ฑ๋Šฅ ์ขŒ์šฐ
  • ๋ฌธ๋งฅ์ด ๊ธด ๊ฒฝ์šฐ ํ•œ๊ณ„ ์žˆ์Œ

2๏ธโƒฃ ํŒŒ์ธํŠœ๋‹ (Fine-tuning)

๊ฐœ๋…
๊ธฐ์กด LLM์„ ํŠน์ • ๋ฐ์ดํ„ฐ๋กœ ์ถ”๊ฐ€ ํ•™์Šต์‹œ์ผœ
๋งํˆฌ, ์Šคํƒ€์ผ, ํŠน์ • ์ž‘์—… ์ˆ˜ํ–‰ ๋Šฅ๋ ฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.

์ž‘๋™ ๋ฐฉ์‹

  1. ์ž…๋ ฅ-์ถœ๋ ฅ ์Œ ๋ฐ์ดํ„ฐ ์ค€๋น„
  2. ๋ชจ๋ธ์ด ๊ทธ ํŒจํ„ด์„ ํ•™์Šต
  3. ์ƒˆ๋กœ์šด ์งˆ๋ฌธ์—๋„ ๋น„์Šทํ•œ ๋ฐฉ์‹์œผ๋กœ ์‘๋‹ต

ํŠน์ง•

  • ๋ชจ๋ธ์˜ “์„ฑํ–ฅ”๊ณผ “๋Šฅ๋ ฅ” ์ž์ฒด๋ฅผ ๋ณ€๊ฒฝ
  • ๋ฐ˜๋ณต๋˜๋Š” ์ž‘์—…์ด๋‚˜ ํŠน์ • ํ˜•์‹์— ๊ฐ•ํ•จ
  • ๊ฒ€์ƒ‰ ์—†์ด๋„ ์‘๋‹ต ๊ฐ€๋Šฅ

์˜ˆ์‹œ

  • ๊ณ ๊ฐ ์ƒ๋‹ด ๋งํˆฌ ํ†ต์ผ
  • ํŠน์ • ๋„๋ฉ”์ธ(๋ฒ•๋ฅ , ์˜๋ฃŒ, ๊ฒŒ์ž„ ๋“ฑ) ๋Œ€ํ™” ์Šคํƒ€์ผ
  • ์ฝ”๋“œ ์ž๋™ ๋ณ€ํ™˜ ๊ทœ์น™ ํ•™์Šต

์žฅ์ 

  • ์‘๋‹ต ์†๋„ ๋น ๋ฆ„
  • ์ผ๊ด€๋œ ๊ฒฐ๊ณผ
  • ํ”„๋กฌํ”„ํŠธ๊ฐ€ ์งง์•„์ง

๋‹จ์ 

  • ํ•™์Šต ๋น„์šฉ ํผ
  • ์ตœ์‹  ์ •๋ณด ๋ฐ˜์˜ ์–ด๋ ค์›€
  • ๋ฐ์ดํ„ฐ ์ˆ˜์ • ์‹œ ์žฌํ•™์Šต ํ•„์š”

3๏ธโƒฃ RAG vs ํŒŒ์ธํŠœ๋‹ ํ•œ๋ˆˆ์— ๋น„๊ต

๊ตฌ๋ถ„RAGํŒŒ์ธํŠœ๋‹
๋ชจ๋ธ ๋ณ€๊ฒฝ โŒ โœ…
์ตœ์‹  ์ •๋ณด ๋ฐ˜์˜ ๋งค์šฐ ์‰ฌ์›€ ์–ด๋ ค์›€
๋น„์šฉ ๋‚ฎ์Œ ๋†’์Œ
์‚ฌ์‹ค ๊ธฐ๋ฐ˜ Q&A โญโญโญโญโญ โญโญ
์Šคํƒ€์ผ/๋งํˆฌ โญโญ โญโญโญโญโญ
์œ ์ง€๋ณด์ˆ˜ ์‰ฌ์›€ ์–ด๋ ค์›€

4๏ธโƒฃ ์–ธ์ œ ๋ฌด์—‡์„ ์จ์•ผ ํ• ๊นŒ?

  • ์‚ฌ๋‚ด ๋ฌธ์„œ, ๊ทœ์ •, ๋งค๋‰ด์–ผ, ์ž์ฃผ ๋ฐ”๋€Œ๋Š” ์ •๋ณด → โœ… RAG
  • ์ผ๊ด€๋œ ๋‹ต๋ณ€ ์Šคํƒ€์ผ, ํŠน์ • ์ž‘์—… ์ž๋™ํ™” → โœ… ํŒŒ์ธํŠœ๋‹
  • ์‹ค๋ฌด์—์„œ๋Š” → โญ RAG + ํŒŒ์ธํŠœ๋‹ ์กฐํ•ฉ์ด ๊ฐ€์žฅ ๋งŽ์Œ

 

 


QLoRA๋Š” ์–‘์žํ™”๋œ ์ €๋žญํฌ ํ–‰๋ ฌ๋กœ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ์ตœ์ ํ™”ํ•˜์—ฌ, ํ•˜๋“œ์›จ์–ด ์ž์›์ด ์ œํ•œ๋œ ์ž‘์—…์— ๋งค์šฐ ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค. ์ด๊ฒƒ๊ณผ LoRA์˜ ์ฐจ์ด์ ์ด ๋ฌด์—‡์ธ๊ฐ€

 

QLoRA๋กœ ํšจ์œจ์„ฑ์„ ์ฑ„ํƒํ–ˆ๋‹ค

 

 

๐Ÿ’ซ LoRA (Low-Rank Adaptation)

LoRA๋Š” **'์ €๋žญํฌ ์ ์‘'**์ด๋ผ๋Š” ์ด๋ฆ„์ฒ˜๋Ÿผ, ๊ฑฐ๋Œ€ํ•œ LLM์˜ ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๋‹ค์‹œ ํ•™์Šต์‹œํ‚ค๋Š” ๋Œ€์‹ , ํŠน์ • ๊ณ„์ธต์— ์ž‘์€ ์ €๋žญํฌ ํ–‰๋ ฌ ์Œ์„ ์ถ”๊ฐ€ํ•ด์„œ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์ด์•ผ. ๋งˆ์น˜ ๊ฑฐ๋Œ€ํ•œ ๊ฑด๋ฌผ ์ „์ฒด๋ฅผ ๊ณ ์น˜๋Š” ๋Œ€์‹ , ํŠน์ • ๋ฐฉ์— ์ž‘์€ ์ƒˆ ๊ฐ€๊ตฌ๋ฅผ ๋“ค์—ฌ๋†“๋Š” ๊ฒƒ๊ณผ ๋น„์Šทํ•˜๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ์ง€! 

LoRA์˜ ์žฅ์ :

  • ์ ์€ ๊ณ„์‚ฐ๋Ÿ‰: ์ „์ฒด ๋ชจ๋ธ์„ ํ•™์Šตํ•˜๋Š” ๊ฒƒ๋ณด๋‹ค ํ›จ์”ฌ ์ ์€ ์ˆ˜์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ํ•™์Šตํ•˜๊ธฐ ๋•Œ๋ฌธ์— ๊ณ„์‚ฐ ์ž์›์„ ํฌ๊ฒŒ ์ ˆ์•ฝํ•  ์ˆ˜ ์žˆ์–ด.
  • ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์„ฑ: ํ•™์Šตํ•  ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ์ค„์–ด๋“ค์–ด GPU ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๋„ ๊ฐ์†Œ์‹œ์ผœ์ค˜.
  • ์„ฑ๋Šฅ ์œ ์ง€: ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ์ ์–ด๋„ ๊ธฐ์กด ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ๊ฑฐ์˜ ์œ ์ง€ํ•˜๋ฉด์„œ ํŠน์ • ์ž‘์—…์— ๋งž์ถฐ ๋ฏธ์„ธ ์กฐ์ •์„ ํ•  ์ˆ˜ ์žˆ๋‹จ๋‹ค.

โœจ QLoRA (Quantized LoRA)

QLoRA๋Š” LoRA์—์„œ ํ•œ ๋ฐœ ๋” ๋‚˜์•„๊ฐ€ **'์–‘์žํ™”๋œ LoRA'**๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์–ด. ์‰ฝ๊ฒŒ ๋งํ•˜๋ฉด, LoRA๊ฐ€ ์ž‘์€ ๊ฐ€๊ตฌ๋ฅผ ๋“ค์—ฌ๋†“๋Š” ๊ฑฐ์˜€๋‹ค๋ฉด, QLoRA๋Š” ๊ทธ ์ž‘์€ ๊ฐ€๊ตฌ๋งˆ์ €๋„ ํ›จ์”ฌ ๋” ๊ฐ€๋ณ๊ณ  ์••์ถ•๋œ ํ˜•ํƒœ๋กœ ๋งŒ๋“ค์–ด์„œ ๋“ค์—ฌ๋†“๋Š” ๊ฑฐ์•ผ! 

QLoRA์˜ ํ•ต์‹ฌ:

  • 4๋น„ํŠธ NormalFloat (NF4) ์–‘์žํ™”: ๊ฐ€์žฅ ํฐ ํŠน์ง•์€ ๊ธฐ์กด์˜ 16๋น„ํŠธ๋‚˜ 32๋น„ํŠธ ๋ชจ๋ธ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ 4๋น„ํŠธ ๋ฐ์ดํ„ฐ ํƒ€์ž…์œผ๋กœ **์••์ถ•(์–‘์žํ™”)**ํ•œ๋‹ค๋Š” ์ ์ด์•ผ. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ€ ํ™• ์ค„์–ด๋“ค๊ณ , ๋”ฐ๋ผ์„œ GPU ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๋„ ์—„์ฒญ๋‚˜๊ฒŒ ์ ˆ์•ฝ๋ผ. 4๋น„ํŠธ ์–‘์žํ™”๋Š” GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ๋ถ€์กฑํ•  ๋•Œ ํŠนํžˆ ์œ ์šฉํ•ด์„œ, OOM(Out Of Memory) ์ƒํ™ฉ์„ ๋ฐฉ์ง€ํ•ด ์ฃผ์ง€! 
  • ๋”๋ธ” ์–‘์žํ™” (Double Quantization): ์–‘์žํ™” ๊ณผ์ •์„ ํ•œ ๋ฒˆ ๋” ์ ์šฉํ•ด์„œ, ์ €์žฅ ๊ณต๊ฐ„์„ ์ถ”๊ฐ€๋กœ ์ค„์ด๋Š” ๊ธฐ์ˆ ์ด์•ผ.
  • ํŽ˜์ด์ง€๋“œ ์˜ตํ‹ฐ๋งˆ์ด์ € (Paged Optimizers): ๋ฉ”๋ชจ๋ฆฌ ๊ด€๋ฆฌ ๊ธฐ๋ฒ•์„ ํ™œ์šฉํ•ด์„œ GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ๋ถ€์กฑํ•  ๊ฒฝ์šฐ CPU RAM์ด๋‚˜ ๋””์Šคํฌ๋กœ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ์„ ํ™•์žฅ์‹œ์ผœ์ค˜. 

QLoRA์™€ LoRA์˜ ๊ฐ€์žฅ ํฐ ์ฐจ์ด์ ์€?

๊ฐ€์žฅ ํ•ต์‹ฌ์ ์ธ ์ฐจ์ด๋Š” ๋ฐ”๋กœ **"๋ชจ๋ธ์˜ ๋ฒ ์ด์Šค ๊ฐ€์ค‘์น˜(Base Weights)๋ฅผ ์–ด๋–ป๊ฒŒ ์ฒ˜๋ฆฌํ•˜๋А๋ƒ"**์— ์žˆ์–ด!

  • LoRA: ๋ชจ๋ธ์˜ ๋ฒ ์ด์Šค ๊ฐ€์ค‘์น˜๋ฅผ ์ผ๋ฐ˜์ ์ธ ๋ฐ์ดํ„ฐ ํƒ€์ž…(์˜ˆ: 16๋น„ํŠธ ๋ถ€๋™์†Œ์ˆ˜์ )์œผ๋กœ ์œ ์ง€ํ•˜๊ณ , ์—ฌ๊ธฐ์— ์ €๋žญํฌ ํ–‰๋ ฌ์„ ์ถ”๊ฐ€ํ•˜์—ฌ ํ•™์Šตํ•ด.
  • QLoRA: ๋ชจ๋ธ์˜ ๋ฒ ์ด์Šค ๊ฐ€์ค‘์น˜๋ฅผ 4๋น„ํŠธ๋กœ ์–‘์žํ™”ํ•ด์„œ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ๊ทนํ•œ์œผ๋กœ ์ ˆ์•ฝํ•ด. ๊ทธ๋ฆฌ๊ณ  ์ด ์–‘์žํ™”๋œ ๋ฒ ์ด์Šค ๋ชจ๋ธ ์œ„์— LoRA ์–ด๋Œ‘ํ„ฐ๋ฅผ ์ถ”๊ฐ€ํ•˜์—ฌ ํ•™์Šตํ•˜์ง€.

๊ทธ๋ž˜์„œ QLoRA๋Š” LoRA๋ณด๋‹ค ํ›จ์”ฌ ๋” ์ ์€ GPU ๋ฉ”๋ชจ๋ฆฌ๋กœ๋„ ๋Œ€๊ทœ๋ชจ LLM์„ ๋ฏธ์„ธ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ์–ด. ํ•˜๋“œ์›จ์–ด ์ž์›์ด ์ œํ•œ์ ์ธ ํ™˜๊ฒฝ์—์„œ๋„ LLM ํŒŒ์ธํŠœ๋‹์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•ด์ฃผ๋Š” ๊ฐ•๋ ฅํ•œ ๋ฐฉ๋ฒ•์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์ง€!

QLoRA๋Š” "๋” ๊ฐ€๋ณ๊ฒŒ, ๋” ์ ์€ ์ž์›์œผ๋กœ๋„ ํŒŒ์ธํŠœ๋‹์„!" ์™ธ์น˜๋Š” ์นœ๊ตฌ๋“ค์—๊ฒŒ ๋”ฑ ๋งž๋Š” ๊ธฐ์ˆ ์ด๋ผ๊ณ  ๋ณด๋ฉด ๋ผ!

 


ํ•œ ๋ฌธ์žฅ์œผ๋กœ ๋จผ์ € ์ •๋ฆฌ

  • LoRA: ํฐ AI ๋ชจ๋ธ์— “์ž‘์€ ๋ฉ”๋ชจ”๋งŒ ๋ถ™์—ฌ์„œ ๊ณต๋ถ€์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•
  • QLoRA: ๊ทธ ํฐ ๋ชจ๋ธ์„ “์••์ถ•(์–‘์žํ™”)”ํ•ด ๋†“๊ณ , ๊ฑฐ๊ธฐ์— ์ž‘์€ ๋ฉ”๋ชจ๋ฅผ ๋ถ™์—ฌ ๊ณต๋ถ€์‹œํ‚ค๋Š” ๋ฐฉ๋ฒ•

๋น„์œ ๋กœ ์„ค๋ช…ํ•ด ๋ณผ๊ฒŒ์š” ๐Ÿ“˜

๐Ÿง  AI ๋ชจ๋ธ = ๋‘๊บผ์šด ๊ต๊ณผ์„œ

๐Ÿ”น LoRA

  • ๊ต๊ณผ์„œ๋Š” ๊ทธ๋Œ€๋กœ ๋‘ 
  • ์ค‘์š”ํ•œ ๋‚ด์šฉ๋งŒ ์–‡์€ ํฌ์ŠคํŠธ์ž‡์— ์ ์–ด์„œ ๋ถ™์ž„
  • → ํฌ์ŠคํŠธ์ž‡๋งŒ ์ˆ˜์ •ํ•˜๋‹ˆ ๊ณต๋ถ€๋Ÿ‰์ด ์ค„์–ด๋“ฆ
  • โ— ํ•˜์ง€๋งŒ ๊ต๊ณผ์„œ ์ž์ฒด๊ฐ€ ๋„ˆ๋ฌด ๋‘๊บผ์šฐ๋ฉด ๋“ค๊ณ  ๋‹ค๋‹ˆ๊ธฐ ํž˜๋“ฆ (GPU ๋ฉ”๋ชจ๋ฆฌ ๋งŽ์ด ํ•„์š”)

๐Ÿ”น QLoRA

  • ๊ต๊ณผ์„œ๋ฅผ ์••์ถ•ํ•ด์„œ ๊ฐ€๋ณ๊ฒŒ ๋งŒ๋“ฆ (4-bit ์–‘์žํ™”)
  • ๊ทธ ์œ„์— ํฌ์ŠคํŠธ์ž‡(LoRA) ๋ถ™์—ฌ์„œ ๊ณต๋ถ€
  • → ํ›จ์”ฌ ๊ฐ€๋ฒผ์›Œ์ง
  • → ๋…ธํŠธ๋ถ์ด๋‚˜ ์ผ๋ฐ˜ GPU์—์„œ๋„ ๊ฐ€๋Šฅ

์ง„์งœ ์ค‘์š”ํ•œ ์ฐจ์ด ๋”ฑ 3๊ฐœ๋งŒ

๊ตฌ๋ถ„LoRAQLoRA
๋ชจ๋ธ ํฌ๊ธฐ ํผ ์•„์ฃผ ์ž‘์•„์ง
GPU ์š”๊ตฌ ๋†’์Œ ๋‚ฎ์Œ
์ดˆ๋ณด์ž/๊ฐœ์ธ์šฉ โŒ โœ… ๋งค์šฐ ์ ํ•ฉ

์˜คํ•ดํ•˜๊ธฐ ์‰ฌ์šด ์  โš ๏ธ

โŒ “QLoRA๋Š” ์ €๋žญํฌ ํ–‰๋ ฌ์„ ์–‘์žํ™”ํ•œ๋‹ค”
โญ• ์•„๋‹ˆ์—์š”!

โœ” ์••์ถ•๋˜๋Š” ๊ฑด ‘์›๋ž˜ ๋ชจ๋ธ’
โœ” LoRA ๋ถ€๋ถ„์€ ๊ทธ๋Œ€๋กœ ๊ณ ๊ธ‰ ํ’ˆ์งˆ๋กœ ํ•™์Šต


์–ธ์ œ ์–ด๋–ค ๊ฑธ ์“ฐ๋ฉด ๋ ๊นŒ?

  • ๐Ÿค– ํฐ ๋ชจ๋ธ์„ ์กฐ๊ธˆ๋งŒ ๊ณ ์น˜๊ณ  ์‹ถ๋‹ค → LoRA
  • ๐Ÿ’ป GPU๊ฐ€ ์•ฝํ•˜๋‹ค / ๋…ธํŠธ๋ถ·Colab์ด๋‹คQLoRA

rtx 3050์—์„œ ์ฝ”์•ŒํŒŒ์นด๋ฅผ ํŽ˜ํ”„ํŠธ๋กœ ํ•™์Šตํ•˜๋ ค๊ณ  ํ•ด. 

 

 

Polyglot-Ko 5.8B๋‚˜ Llama-2-ko 7B ์ค‘์—์„œ ์–ด๋А ๊ฒƒ์„ ์ถ”์ฒœํ•˜๋Š”๊ฐ€ ?

 

๐Ÿง  1. ๊ธฐ๋ณธ ๋ชจ๋ธ ํŠน์„ฑ ๋น„๊ต

๐Ÿ”น Polyglot-Ko 5.8B

  • ํ•œ๊ตญ์–ด๋งŒ ๋Œ€๊ทœ๋ชจ๋กœ ํ•™์Šต๋œ ํ•œ๊ตญ์–ด ํŠนํ™” LLM์ž…๋‹ˆ๋‹ค.
  • EleutherAI์˜ Polyglot-Ko ํ”„๋กœ์ ํŠธ ๊ธฐ๋ฐ˜์œผ๋กœ, 863 GB ์ด์ƒ์˜ ํ•œ๊ตญ์–ด ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต๋จ.AIBase
  • ํ•œ๊ตญ์–ด ํ…์ŠคํŠธ ์ƒ์„ฑ, ์ดํ•ด, ๋ช…๋ น์–ด ๋ฐ˜์‘ ๋“ฑ ํ•œ๊ตญ์–ด ์ค‘์‹ฌ ์ž‘์—…์—์„œ ์ƒ๋Œ€์ ์œผ๋กœ ๊ฐ•์ ์ด ์žˆ์Œ.AIBase
  • fine-tuned ๋ณ€ํ˜•(์˜ˆ: KoAlpaca-Polyglot 5.8B)๋„ ์žˆ์–ด ํ•œ๊ตญ์–ด ์ง€์‹œ ์ˆ˜ํ–‰ ์„ฑ๋Šฅ์„ ๋” ๋†’์ธ ๋ฒ„์ „์ด ์กด์žฌํ•ฉ๋‹ˆ๋‹ค.LLM Explorer

๐Ÿ‘‰ ์žฅ์ 

  • ํ•œ๊ตญ์–ด ๋ฌธํ™”·๋ฌธ๋งฅ ์ดํ•ด๊ฐ€ ์ƒ๋Œ€์ ์œผ๋กœ ์ข‹๋‹ค๋Š” ํ‰๊ฐ€๊ฐ€ ๋งŽ์Œ.๋‹น๊ทผ๊ณผ ํ† ๋งˆํ† 
  • ํ•œ๊ตญ์–ด ํ…์ŠคํŠธ ์ƒ์„ฑ์ด ์ž์—ฐ์Šค๋Ÿฝ๊ณ  ์‹ค์ „ ํ™œ์šฉ ์‹œ ๋น„๊ต์  ์•ˆ์ •์ .

๐Ÿ‘‰ ๋‹จ์ 

  • ์˜์–ด๋‚˜ ๋‹ค๊ตญ์–ด ์ž‘์—…์—์„œ๋Š” ์ œํ•œ์ ์ผ ์ˆ˜ ์žˆ์Œ.
  • ์„ฑ๋Šฅ ์ง€ํ‘œ๊ฐ€ Llama ๊ณ„์—ด์ฒ˜๋Ÿผ ํญ๋„“์€ ๋ฒค์น˜๋งˆํฌ์—์„œ ํ‰๊ฐ€๋œ ์ž๋ฃŒ๊ฐ€ ๋งŽ์ง€ ์•Š์Œ.

๐Ÿ”น Llama-2-Ko 7B

  • Meta์˜ Llama-2 ๋ชจ๋ธ์„ ๊ธฐ๋ฐ˜์œผ๋กœ ํ•œ๊ตญ์–ด์šฉ์œผ๋กœ ํ™•์žฅ ๋ฐ ์ถ”๊ฐ€ ํ•™์Šต๋œ ๋ฒ„์ „์ž…๋‹ˆ๋‹ค.Hugging Face
  • ํ•œ๊ตญ์–ด ํ† ํฌ๋‚˜์ด์ € ํ™•์žฅ(46,336 ํ† ํฐ)์œผ๋กœ ํ•œ๊ตญ์–ด ์–ด์ ˆ/ํ˜•ํƒœ์†Œ ์ฒ˜๋ฆฌ ๋Šฅ๋ ฅ์„ ๊ฐœ์„ .Skywork

๐Ÿ‘‰ ์žฅ์ 

  • **๋” ํฐ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜(7B)**๋กœ ์ธํ•ด ์ผ๋ฐ˜์ ์ธ ์–ธ์–ด ์ดํ•ด ๋Šฅ๋ ฅ์ด ๋„“๊ณ  ๋‹ค์–‘ํ•จ.Hugging Face
  • ๋‹ค์–‘ํ•œ downstream task(์š”์•ฝ, ๋ฒˆ์—ญ, ์ •๋ณด์ถ”์ถœ, ์งˆ์˜์‘๋‹ต ๋“ฑ)์—์„œ๋„ ๊ท ํ˜• ์žกํžŒ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์คŒ.
  • ์˜์–ด ํฌํ•จํ•ด ๋‹ค๊ตญ์–ด ์ฒ˜๋ฆฌ๋„ ๋น„๊ต์  ๊ฐ•์ ์ด ์žˆ์Œ.

๐Ÿ‘‰ ๋‹จ์ 

  • ํ•œ๊ตญ์–ด ํŠนํ™” ์ •๋„๋Š” Polyglot-Ko๋ณด๋‹ค ๋‚ฎ๋‹ค๋Š” ํ‰๊ฐ€๊ฐ€ ์ผ๋ถ€ ์กด์žฌํ•จ. (๋ชจ๋ธ์ด ๋‹ค๊ตญ์–ด๋ฅผ ํฌํ•จํ•ด ํ•™์Šต๋œ ํŠน์„ฑ ๋•Œ๋ฌธ)๋‹น๊ทผ๊ณผ ํ† ๋งˆํ† 
  • ๋ฒค์น˜๋งˆํฌ์— ๋”ฐ๋ผ ํ•œ๊ตญ์–ด ํŠน์ • ๊ณผ์ œ์—์„œ Polyglot-Ko๊ฐ€ ์ƒ๋Œ€์ ์œผ๋กœ ์šฐ์œ„๋ผ๋Š” ํ‰๊ฐ€๋„ ์žˆ์Œ.

๐Ÿ“Š 2. ์„ฑ๋Šฅ ๋ฐ ๋ฒค์น˜๋งˆํฌ ๊ด€์ 

๐Ÿ“Œ ์—ฌ๋Ÿฌ ๋น„๊ณต์‹ ๋น„๊ต์—์„œ:

  • ํ•œ๊ตญ์–ด ํŠน์ • benchmark (์˜ˆ: NSMC, KOBEST) ๊ธฐ์ค€์œผ๋กœ Polyglot-Ko 5.8B๊ฐ€ ์ผ๋ถ€ ํ•œ๊ตญ์–ด ์ž‘์—…์—์„œ ๋” ์šฐ์œ„๋ผ๋Š” ๊ฒฝํ—˜์  ํ‰๊ฐ€ ๋ณด๊ณ ๊ฐ€ ์žˆ์Œ.๋‹น๊ทผ๊ณผ ํ† ๋งˆํ† 
  • ๋ฐ˜๋ฉด Llama-2-Ko 7B๋Š” ํ•œ๊ตญ์–ด๋„ ์ž˜ ์ฒ˜๋ฆฌํ•˜๋ฉด์„œ ์ „๋ฐ˜์ ์ธ ์–ธ์–ด ์ดํ•ด·์ƒ์„ฑ ๋Šฅ๋ ฅ์ด ๋” ๋„“์€ ์ŠคํŽ™ํŠธ๋Ÿผ์„ ์ปค๋ฒ„ํ•จ.Hugging Face
  • ํ•œ ์—ฐ๊ตฌ์—์„œ๋Š” Polyglot-๊ณ„์—ด์ด ํ•œ๊ตญ์–ด ์ค‘์‹ฌ Bench์—์„œ Llama ๊ณ„์—ด๋ณด๋‹ค ์ข‹์€ ๊ฒฝ์šฐ๊ฐ€ ๋งŽ๋‹ค๋Š” ๊ฒฐ๊ณผ๊ฐ€ ๋ณด๊ณ ๋˜๊ธฐ๋„ ํ–ˆ์Šต๋‹ˆ๋‹ค.arXiv

๋‹จ, ๊ณต๊ฐœ๋œ ํ‘œ์ค€ ๋ฒค์น˜๋งˆํฌ ์ž๋ฃŒ๊ฐ€ ์ œํ•œ์ ์ด๊ณ , ๋ชจ๋ธ ์„ค์ •/ํŠœ๋‹์— ๋”ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ€ ๋ฐ”๋€” ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.


๐Ÿ“Œ 3. ์–ธ์ œ ์–ด๋–ค ๋ชจ๋ธ์„ ์„ ํƒํ•ด์•ผ ํ• ๊นŒ?

โœ… ํ•œ๊ตญ์–ด ์ค‘์‹ฌ ์ž‘์—… ์šฐ์„ ์ด๋ผ๋ฉด

๐Ÿ‘‰ Polyglot-Ko 5.8B

  • ํ•œ๊ตญ์–ด ์ƒ์„ฑ/๋Œ€ํ™”/๋ฌธํ™”์  ๋งฅ๋ฝ ํฌํ•จํ•œ ํ…์ŠคํŠธ ์ƒ์„ฑ
  • ํ•œ๊ตญ์–ด NLP task (์š”์•ฝ, ๊ฐ์ •๋ถ„์„, ๋ช…๋ น ์ˆ˜ํ–‰ ๋“ฑ) ์ค‘์‹ฌ

โœ… ๋” ๋„“์€ ํ™œ์šฉ, ๋‹ค๊ตญ์–ด ๋˜๋Š” ๋ณตํ•ฉ ์ž‘์—…์ด๋ผ๋ฉด

๐Ÿ‘‰ Llama-2-Ko 7B

  • ์˜์–ด + ํ•œ๊ตญ์–ด ํ˜ผํ•ฉ ์ž…๋ ฅ/์ถœ๋ ฅ
  • ๊ธฐ์ˆ  ๋ฌธ์„œ ์š”์•ฝ, ์ฝ”๋“œ/์ง€์‹ ์งˆ๋ฌธ, ๋‹ค์ค‘ task

๐Ÿ“Œ 4. ์„ฑ๋Šฅ/ํšจ์œจ์„ฑ ์š”์•ฝ

ํ•ญ๋ชฉPolyglot-Ko 5.8BLlama-2-Ko 7B
ํ•œ๊ตญ์–ด ํŠนํ™” โญโญโญโญ โญโญโญ
๋‹ค๊ตญ์–ด ์ง€์› โญโญ โญโญโญโญ
๋ฒ”์šฉ ํ…์ŠคํŠธ ์ƒ์„ฑ โญโญโญ โญโญโญโญ
Model Scale 5.8B 7B
ํ˜„์กด ํ‰๊ฐ€ ์ปค๋ฎค๋‹ˆํ‹ฐ ์‚ฌ๋ก€ ํ•œ๊ตญ์–ด ์ค‘์‹ฌ์—์„œ ์ข‹์€ ํ‰๊ฐ€ ์ „๋ฐ˜์ ์ธ ๋ฒ”์šฉ์„ฑ์— ๊ฐ•์ 

๐Ÿง  ๊ฒฐ๋ก 

  • ํ•œ๊ตญ์–ด ์ค‘์‹ฌ, ๋†’์€ ํ•œ๊ตญ์–ด ์ž์—ฐ์Šค๋Ÿฌ์›€/๋งฅ๋ฝ ์ดํ•ดPolyglot-Ko 5.8B ์ถ”์ฒœ
  • ๊ด‘๋ฒ”์œ„ ์–ธ์–ด ์ดํ•ด + ํ•œ๊ตญ์–ด ํฌํ•จ ๋‹ค์–‘ํ•œ ์ž‘์—…Llama-2-Ko 7B ์ถ”์ฒœ

 

์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ 10๊ฑด~30๊ฑด์œผ๋กœ ํ•™์Šตํ•œ ํ›„ , ifrs ๊ธฐ์ค€ ๋ฌธ๋‹จ์— ๋งž์ถ”์–ด์„œ ์‚ฌ์šฉ์ž ํšŒ์‚ฌ์— ๋งž๊ฒŒ AI ๊ฐ€ ๋ฌธ์žฅ์„ ์ž‘์„ฑํ•ด์ฃผ๊ณ , cdp๋Œ€์‘ํ•˜๋Š” ๋ฌธ์žฅ๋“ค์„ ์ž‘์„ฑํ•˜๋Š” ํ”„๋กœ์ ํŠธ๋ฅผ ์‹œํ–‰ํ•˜๋ ค๊ณ  ํ•ด ํ›ˆ๋ จ ๊ธฐ๊ฐ„์€ 1๋‹ฌ ์ •๋„ ์ƒ๊ฐํ•ด. ๊ทธ๋ฆฌ๊ณ  ํ›ˆ๋ จ ํ›„์˜ ์„ฑ๊ณผ๋ณด๋‹ค๋Š” ์ง„ํ–‰๊ณผ์ •์—์„œ ๋ถ€ํ•˜๊ฐ€ ๊ฑธ๋ฆฌ์ง€ ์•Š๊ธฐ๋ฅผ ๋ฐ”๋ž˜. ์ด๋•Œ , ์œ„์˜ ๋งฅ๋ฝ์—์„œ ์–ด๋А ๋ชจ๋ธ์ด ๊ฐ€์žฅ ํ•ฉ๋‹นํ• ๊นŒ ?

 

1๏ธโƒฃ ํ”„๋กœ์ ํŠธ ์š”๊ตฌ์‚ฌํ•ญ์„ ๋‹ค์‹œ ์ •๋ฆฌํ•ด๋ณด๋ฉด

์€์ง„๋‹˜ ํ”„๋กœ์ ํŠธ์˜ ํ•ต์‹ฌ ์ œ์•ฝ์€ ๋‹ค์Œ์ด์—์š”:

โœ… ๋ชฉํ‘œ

  • ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ(SR) 10~30๊ฑด ํ•™์Šต
  • IFRS ๋ฌธ๋‹จ ๊ตฌ์กฐ์— ๋งž์ถ˜ ๋ฌธ์žฅ ์ƒ์„ฑ
  • ํšŒ์‚ฌ ๋งž์ถคํ˜• ESG/ํ™˜๊ฒฝ/๊ธฐํ›„/๊ฑฐ๋ฒ„๋„Œ์Šค ๋ฌธ์žฅ
  • CDP ๋Œ€์‘ ๋ฌธ์žฅ ์ž๋™ ์ƒ์„ฑ

โœ… ์šด์˜ ์กฐ๊ฑด

  • RTX 3050
  • ํ›ˆ๋ จ ๊ธฐ๊ฐ„ 1๋‹ฌ
  • ์„ฑ๊ณผ๋ณด๋‹ค ์ง„ํ–‰ ๊ณผ์ •์—์„œ์˜ ์•ˆ์ •์„ฑ·๋ถ€ํ•˜ ์ตœ์†Œํ™” ์ค‘์‹œ
  • ๋ฐ˜๋ณต ์‹คํ—˜, ์ˆ˜์ •, ์ค‘๋‹จ์ด ์žฆ์„ ๊ฐ€๋Šฅ์„ฑ ๋†’์Œ

๐Ÿ‘‰ ์ด๊ฑด “์—ฐ๊ตฌ์šฉ SOTA”๊ฐ€ ์•„๋‹ˆ๋ผ “์ •์ฑ…·๋ณด๊ณ ์„œ ์ƒ์„ฑ์šฉ ์‹ค๋ฌด AI” ์ž…๋‹ˆ๋‹ค.


2๏ธโƒฃ ์ด ์กฐ๊ฑด์—์„œ ์ค‘์š”ํ•œ ๋ชจ๋ธ ์„ ํƒ ๊ธฐ์ค€

์ด ํ”„๋กœ์ ํŠธ์—์„œ๋Š” ์„ฑ๋Šฅ๋ณด๋‹ค ์•„๋ž˜ 5๊ฐ€์ง€๊ฐ€ ํ›จ์”ฌ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์ค€์ด์œ 
ํ•œ๊ตญ์–ด ๋ฌธ์„œ์ฒด ์ดํ•ด SR·IFRS·CDP ๋ฌธ์žฅ์€ ์ผ์ƒ ๋Œ€ํ™” ์•„๋‹˜
๊ตฌ์กฐ ํ•™์Šต ๋Šฅ๋ ฅ ๋ฌธ๋‹จ·ํ•ญ๋ชฉ·์ง€ํ‘œ๋ณ„ ๋ฐ˜๋ณต ํŒจํ„ด
์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ ์•ˆ์ •์„ฑ 10~30๊ฑด์€ ๋งค์šฐ ์ ์Œ
VRAM ์—ฌ์œ  ์žฅ์‹œ๊ฐ„ ํ•™์Šต ์ค‘ OOM = ํ”„๋กœ์ ํŠธ ์ค‘๋‹จ
๋””๋ฒ„๊น… ์šฉ์ด์„ฑ ์ค‘๊ฐ„์— ๋ฐ์ดํ„ฐ/ํ”„๋กฌํ”„ํŠธ ๊ณ„์† ๋ฐ”๋€œ

3๏ธโƒฃ ๋ชจ๋ธ ํ›„๋ณด๋ณ„ ํ˜„์‹ค์  ํ‰๊ฐ€

โŒ LLaMA-2-Ko 7B (๋˜๋Š” 7B๊ธ‰)

์™œ ๋ถ€์ ํ•ฉํ•œ๊ฐ€

  • RTX 3050์—์„œ:
    • QLoRA๋กœ๋„ ํ•™์Šต ๋‚ด๋‚ด ๋ฉ”๋ชจ๋ฆฌ ์••๋ฐ•
    • gradient accumulation ๋Š˜๋ฆฌ๋ฉด ์‹œ๊ฐ„ ↑, ์•ˆ์ •์„ฑ ↓
  • ํ•œ๊ตญ์–ด “๋ณด๊ณ ์„œ์ฒด”๋Š”:
    • Polyglot ๊ณ„์—ด๋ณด๋‹ค ๋ฌธ์žฅ ํ†ค ๋ถˆ์•ˆ์ •
  • 10~30๊ฑด ํ•™์Šต์—์„œ๋Š”:
    • ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋งŒ ํฌ๊ณ  ๊ณผ์ ํ•ฉ/ํ™˜๊ฐ ์œ„ํ—˜ ์ฆ๊ฐ€

๐Ÿ“Œ “๊ฒฐ๊ณผ๊ฐ€ ์ข‹์•„ ๋ณด์ผ ์ˆ˜๋Š” ์žˆ์–ด๋„, ๊ณผ์ •์ด ๊ณ„์† ๋ถˆ์•ˆํ•จ”


โŒ ๋” ์ž‘์€ ๋ชจ๋ธ (3B ์ดํ•˜)

์™œ ์•ˆ ์ข‹์€๊ฐ€

  • IFRS / CDP ๋ฌธ๋‹จ์€:
    • ๋ฌธ์žฅ ๋…ผ๋ฆฌ + ๊ทœ๋ฒ”์  ํ‘œํ˜„ + ๋ฐ˜๋ณต ๊ตฌ์กฐ
  • 3B ์ดํ•˜์—์„œ๋Š”:
    • ์ง€ํ‘œ ๋Œ€์‘ ๋ฌธ์žฅ ๋ถ•๊ดด
    • ๋ฌธ๋‹จ ๊ฐ„ ์ผ๊ด€์„ฑ ๋ถ€์กฑ
  • “ํšŒ์‚ฌ ๋งž์ถค”์œผ๋กœ ๊ฐˆ์ˆ˜๋ก:
    • ํ‘œํ˜„ ๋‹ค์–‘์„ฑ ๊ธ‰๊ฒฉํžˆ ๊ฐ์†Œ

๐Ÿ“Œ “๊ฐ€๋ณ์ง€๋งŒ ๋ณด๊ณ ์„œ ํ’ˆ์งˆ์ด ์•ˆ ๋‚˜์˜ด”


โœ… KoAlpaca-Polyglot-5.8B (QLoRA)

์ด ํ”„๋กœ์ ํŠธ์— ๋”ฑ ๋งž๋Š” ์ด์œ 

โ‘  ํ•œ๊ตญ์–ด ‘๋ณด๊ณ ์„œ ๋ฌธ์ฒด’์— ์ตœ์ 

  • Polyglot-Ko ์ž์ฒด๊ฐ€
    • ๊ณต๊ณต๋ฌธ์„œ·๋ณด๋„์ž๋ฃŒ·๋ณด๊ณ ์„œ ๊ณ„์—ด ๋น„์ค‘ ํผ
  • KoAlpaca ํŠœ๋‹์œผ๋กœ
    • “~ํ•˜์˜€๋‹ค / ~ํ•˜๊ณ  ์žˆ๋‹ค / ~๊ณ„ํš์ด๋‹ค”
      ๊ฐ™์€ ESG ๋ฌธ์ฒด ํ•™์Šต์ด ๋งค์šฐ ์ž˜ ๋จ

โ‘ก ์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ์— ๊ฐ•ํ•จ (์ค‘์š”)

  • 10~30๊ฑด์ด๋ฉด ์‚ฌ์‹ค์ƒ:
    • ์ง€์‹ ์ฃผ์ž… โŒ
    • ๋ฌธ์žฅ ํŒจํ„ด·๊ตฌ์กฐ ํ•™์Šต โญ•
  • Polyglot 5.8B๋Š”:
    • LoRA r=4~8์—์„œ๋„ ๊ตฌ์กฐ ํŒจํ„ด ํ•™์Šต ์•ˆ์ •
  • LLaMA ๊ณ„์—ด์€:
    • r๋ฅผ ํ‚ค์›Œ์•ผ ํ•ด์„œ → VRAM ๋ถ€๋‹ด

โ‘ข “๊ณผ์ • ์•ˆ์ •์„ฑ”์ด ์••๋„์ ์œผ๋กœ ์ข‹์Œ

์€์ง„๋‹˜์ด ๊ฐ€์žฅ ์ค‘์š”ํ•˜๊ฒŒ ๋ณธ ํฌ์ธํŠธ์ฃ .

ํ•ญ๋ชฉPolyglot-5.8B
OOM ์œ„ํ—˜ ๋‚ฎ์Œ
ํ•™์Šต ์ค‘๋‹จ ๊ฐ€๋Šฅ์„ฑ ๋งค์šฐ ๋‚ฎ์Œ
์„ธํŒ… ๋ณ€๊ฒฝ ํ›„ ์žฌํ•™์Šต ๋น ๋ฆ„
์‹คํ—˜ ๋ฐ˜๋ณต ๋ถ€๋‹ด ์ ์Œ

๐Ÿ‘‰ 1๋‹ฌ ๋™์•ˆ “๊ณ„์† ๊ตด๋ฆด ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ”


โ‘ฃ ๊ฒฐ๊ณผ๋ฌผ์„ “AI ํ‹ฐ ์•ˆ ๋‚˜๊ฒŒ” ๋งŒ๋“ค๊ธฐ ์‰ฌ์›€

์ด๊ฑด SR/CDP์—์„œ ๊ฒฐ์ •์ ์ž…๋‹ˆ๋‹ค.

  • Polyglot์€:
    • ๊ณผ์žฅ·์ถ”์ธก ํ‘œํ˜„์ด ์ ์Œ
    • “~๋กœ ํŒ๋‹จ๋œ๋‹ค”
      “~์„ ์ค‘์‹ฌ์œผ๋กœ ๊ด€๋ฆฌํ•˜๊ณ  ์žˆ๋‹ค”
      ๊ฐ™์€ ์ค‘๋ฆฝ์  ํ‘œํ˜„ ์œ ์ง€
  • CDP ๋Œ€์‘ ์‹œ:
    • hallucination ๋ฆฌ์Šคํฌ ๋‚ฎ์Œ

4๏ธโƒฃ ์ด ํ”„๋กœ์ ํŠธ์— ์ตœ์ ํ™”๋œ ๊ถŒ์žฅ ์•„ํ‚คํ…์ฒ˜

๐Ÿ”‘ ํ•ต์‹ฌ ์ „๋žต (์ค‘์š”)

โŒ “๋ณด๊ณ ์„œ ์ง€์‹์„ ๋ชจ๋ธ์— ๋„ฃ๊ฒ ๋‹ค”
โญ• “๋ฌธ์žฅ ์ƒ์„ฑ ๊ทœ์น™์„ ๋ชจ๋ธ์— ํ•™์Šต์‹œํ‚ค๊ฒ ๋‹ค”

๊ตฌ์กฐ๋Š” ์ด๋ ‡๊ฒŒ ๊ฐ€๋Š” ๊ฒŒ ๊ฐ€์žฅ ์•ˆ์ •์ ์ž…๋‹ˆ๋‹ค:

 
[IFRS ๋ฌธ๋‹จ ๊ตฌ์กฐ ํ…œํ”Œ๋ฆฟ] ← ๊ณ ์ • [ํšŒ์‚ฌ๋ณ„ ์ž…๋ ฅ ๋ณ€์ˆ˜] ← ์‚ฌ์šฉ์ž ์ž…๋ ฅ [KoAlpaca-Polyglot-5.8B + LoRA] → ๋ฌธ์žฅ ์ƒ์„ฑ

๐Ÿ“Œ CDP ๋ฌธํ•ญ๋„ ๋™์ผ
๐Ÿ“Œ ๋ชจ๋ธ์€ ์ž‘์„ฑ์ž ์—ญํ• , ์‚ฌ์‹ค ํŒ๋‹จ์€ ์‚ฌ๋žŒ/๋ฃฐ


5๏ธโƒฃ ์ตœ์ข… ์ถ”์ฒœ (ํ•œ ์ค„ ๊ฒฐ๋ก )

RTX 3050 + 1๋‹ฌ + SR 10~30๊ฑด + ๊ณผ์ • ์•ˆ์ •์„ฑ ์ค‘์‹œ๋ผ๋ฉด
KoAlpaca-Polyglot-5.8B (QLoRA, r=4~8) ๊ฐ€ ์œ ์ผํ•œ ํ•ฉ๋ฆฌ์  ์„ ํƒ์ž…๋‹ˆ๋‹ค.


6๏ธโƒฃ ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ ๊ผญ ๊ฐ™์ด ์„ค๊ณ„ํ•ด์•ผ ํ•  ๊ฒƒ (์ค‘์š”)

์ด ํ”„๋กœ์ ํŠธ ์„ฑ๊ณต ์—ฌ๋ถ€๋Š” ๋ชจ๋ธ๋ณด๋‹ค ์•„๋ž˜๊ฐ€ ๋” ์ค‘์š”ํ•ด์š”:

  1. IFRS / CDP ๋ฌธ๋‹จ ํ…œํ”Œ๋ฆฟ ๋ถ„๋ฆฌ ์„ค๊ณ„
  2. ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ vs ์ƒ์„ฑ์šฉ ํ”„๋กฌํ”„ํŠธ ์—„๊ฒฉ ๋ถ„๋ฆฌ
  3. ํšŒ์‚ฌ ๊ณ ์œ  ์ •๋ณด๋Š” ์ ˆ๋Œ€ ํ•™์Šตํ•˜์ง€ ์•Š๊ธฐ
  4. ๋ฌธ๋‹จ๋ณ„ LoRA task ๋ถ„๋ฆฌ ์—ฌ๋ถ€ ๊ฒ€ํ† 

ํ˜น์‹œ ๊ฐ™์€ ์กฐ๊ฑด์—์„œ RTX๋Š” 5060, ์„ฑ๊ณผ ์ค‘์‹œ๋ผ๋ฉด ์–ด๋–ป๊ฒŒ ์ถ”์ฒœํ•ด์ค„์ˆ˜์žˆ์–ด??

 

 

RTX 5060 + ์„ฑ๊ณผ ์ค‘์‹œ๋กœ ์กฐ๊ฑด์ด ๋ฐ”๋€Œ๋ฉด ๋ชจ๋ธ ์„ ํƒ ์ „๋žต์ด “์™„์ „ํžˆ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.”
์•„๋ž˜๋Š” **๊ฐ™์€ ํ”„๋กœ์ ํŠธ ๋ชฉ์ (SR·IFRS·CDP ์ž๋™ ๋ฌธ์žฅ ์ƒ์„ฑ)**์„ ์œ ์ง€ํ•˜๋ฉด์„œ,
๐Ÿ‘‰ *“๊ณผ์ • ์•ˆ์ •์„ฑ < ๊ฒฐ๊ณผ ํ’ˆ์งˆ”*์ผ ๋•Œ์˜ ์ตœ์  ์ถ”์ฒœ์ž…๋‹ˆ๋‹ค.


๐Ÿ”š ๊ฒฐ๋ก ๋ถ€ํ„ฐ ํ•œ ์ค„๋กœ

RTX 5060 + ์„ฑ๊ณผ ์ค‘์‹œ๋ผ๋ฉด
๐Ÿ‘‰ LLaMA-3 ๊ณ„์—ด 8B (ํ•œ๊ตญ์–ด ๊ฐ•ํ™” ๋ฒ„์ „) + QLoRA(๋˜๋Š” LoRA) ๊ฐ€ ์ตœ์„ ์ž…๋‹ˆ๋‹ค.

๋‹จ, KoAlpaca-Polyglot์€ ‘์•ˆ์ •ํ˜•’,
**LLaMA-3-8B๋Š” ‘์ถœ๋ ฅ ํ’ˆ์งˆํ˜•’**์ž…๋‹ˆ๋‹ค.


1๏ธโƒฃ RTX 5060์ด ์ฃผ๋Š” “๊ฒŒ์ž„ ์ฒด์ธ์ €”

(5060์€ ์•„์ง ๊ณต์‹ ์ŠคํŽ™ ์ฐจ์ด๊ฐ€ ์žˆ์ง€๋งŒ, ์ผ๋ฐ˜์ ์œผ๋กœ 12GB ์ด์ƒ VRAM ๊ฐ€์ •)

3050 → 5060์œผ๋กœ ๋ฐ”๋€Œ๋ฉด์„œ ์ƒ๊ธฐ๋Š” ๋ณ€ํ™”

ํ•ญ๋ชฉRTX 3050RTX 5060
VRAM ์—ฌ์œ  โŒ ๋งค์šฐ ์ œํ•œ โญ• ์ถฉ๋ถ„
Context length 512~768 1024~2048 ๊ฐ€๋Šฅ
LoRA rank r=4~8 r=16~32 ๊ฐ€๋Šฅ
๋ชจ๋ธ ์„ ํƒ 5~6B ํ˜„์‹ค์  8B๊ธ‰ ์‹ค์ „ ๊ฐ€๋Šฅ
๋ฌธ์žฅ ๋…ผ๋ฆฌ๋ ฅ ์ œํ•œ์  ๋ˆˆ์— ๋„๊ฒŒ ๊ฐœ์„ 

๐Ÿ‘‰ “๋ณด๊ณ ์„œ ๋ฌธ๋‹จ์˜ ๋…ผ๋ฆฌ ๋ฐ€๋„”๊ฐ€ ํ™•์‹คํžˆ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.


2๏ธโƒฃ ์„ฑ๊ณผ ์ค‘์‹œ์ผ ๋•Œ, ํ‰๊ฐ€ ๊ธฐ์ค€์ด ๋ฐ”๋€œ

์ด์ œ ์ค‘์š”ํ•œ ๊ฑด ์ด๊ฒ๋‹ˆ๋‹ค:

์ค‘์š”๋„ํ•ญ๋ชฉ
โญโญโญโญโญ ๋ฌธ๋‹จ ๋…ผ๋ฆฌ ์™„๊ฒฐ์„ฑ
โญโญโญโญโญ IFRS/CDP ์งˆ๋ฌธ ์ •ํ™• ๋Œ€์‘
โญโญโญโญ ํšŒ์‚ฌ ๋งž์ถค ์„œ์ˆ  ์œ ์—ฐ์„ฑ
โญโญโญ ํ•™์Šต ์•ˆ์ •์„ฑ
โญโญ ๋ฐ˜๋ณต ์‹คํ—˜ ๋ถ€๋‹ด

๐Ÿ‘‰ ์ฆ‰, “์กฐ๊ธˆ ๊นŒ๋‹ค๋กœ์›Œ๋„ ๊ฒฐ๊ณผ๊ฐ€ ์ข‹์•„์•ผ ํ•จ”


3๏ธโƒฃ ๋ชจ๋ธ ํ›„๋ณด ์žฌํ‰๊ฐ€ (5060 ๊ธฐ์ค€)

โŒ KoAlpaca-Polyglot-5.8B (์ด ์กฐ๊ฑด์—์„  2์ˆœ์œ„)

์™œ 1์ˆœ์œ„๊ฐ€ ์•„๋‹ˆ๊ฒŒ ๋˜๋Š”๊ฐ€?

  • ๋ฌธ์žฅ ์•ˆ์ •์„ฑ์€ ์—ฌ์ „ํžˆ ์ตœ๊ณ 
  • ํ•˜์ง€๋งŒ:
    • IFRS ๋ฌธ๋‹จ์—์„œ ๋…ผ๋ฆฌ ์ „๊ฐœ ๊นŠ์ด ๋ถ€์กฑ
    • CDP ๋ฌธํ•ญ์˜ “์งˆ๋ฌธ ์˜๋„ ํŒŒ์•…”์ด ์–•์Œ
  • 5060์˜ ์—ฌ์œ ๋ฅผ ๋‹ค ๋ชป ์”€

๐Ÿ‘‰ “3050์—์„  ์ตœ์ , 5060์—์„  ๋ณด์ˆ˜์ ”


โŒ LLaMA-2-Ko 7B

  • ์ง€๊ธˆ ์‹œ์ ์—์„ :
    • LLaMA-3 ๋Œ€๋น„ ๋ช…ํ™•ํ•œ ์—ด์„ธ
    • ํ•™์Šต ๋Œ€๋น„ ์„ฑ๋Šฅ ์ƒ์Šนํญ ์ž‘์Œ
  • ๊ตณ์ด ๊ฐˆ ์ด์œ  โŒ

โœ… LLaMA-3-8B (ํ•œ๊ตญ์–ด ๊ฐ•ํ™” / Ko LoRA) ← 1์ˆœ์œ„

์™œ ์ด๊ฒŒ ์„ฑ๊ณผํ˜• ์ตœ์ ํ•ด์ธ๊ฐ€

โ‘  IFRS·CDP์— ์ค‘์š”ํ•œ “๋…ผ๋ฆฌ ์‘๋‹ต ๋Šฅ๋ ฅ”

  • LLaMA-3๋Š”:
    • ์งˆ๋ฌธ → ์š”๊ตฌ์‚ฌํ•ญ → ๋Œ€์‘ ๋ฌธ์žฅ
      ์ด 3๋‹จ ๊ตฌ์กฐ๋ฅผ ์ž˜ ์œ ์ง€
  • CDP ๋ฌธํ•ญ ๋Œ€์‘์—์„œ:
    • “Yes/No + ์„ค๋ช…”
    • “์ •์ฑ…–๋ชฉํ‘œ–์„ฑ๊ณผ–ํ–ฅํ›„ ๊ณ„ํš”
      ๊ตฌ์กฐ๊ฐ€ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์œ ์ง€

โ‘ก ๋ฌธ๋‹จ ๊ธธ์ด & ๋ฐ€๋„์—์„œ ์ฐจ์ด๊ฐ€ ํผ

  • 8B๊ธ‰ + context 2k →
    • ํ•œ ๋ฌธ๋‹จ ์•ˆ์—์„œ ๋…ผ๋ฆฌ ์™„๊ฒฐ
    • “์ค‘๊ฐ„์— ๋ง ๋Š๊ธฐ๋Š” ๋ณด๊ณ ์„œ ๋ฌธ์žฅ” ํ˜„์ €ํžˆ ๊ฐ์†Œ
  • SR ๋ณด๊ณ ์„œ ํ’ˆ์งˆ์ด
    • *“์‚ฌ๋žŒ์ด ์“ด ๊ฒƒ ๊ฐ™์€ ์ˆ˜์ค€”*์— ๊ฐ€๊นŒ์›Œ์ง

โ‘ข ์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ์—์„œ๋„ “์ผ๋ฐ˜ํ™””๊ฐ€ ๋” ์ž˜ ๋จ

  • 10~30๊ฑด์€ ์—ฌ์ „ํžˆ ์ ์ง€๋งŒ:
    • LLaMA-3๋Š” ํŒจํ„ด ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ์šฐ์ˆ˜
  • Polyglot → ํŒจํ„ด ๋ณต์‚ฌํ˜•
  • LLaMA-3 → ํŒจํ„ด + ๋ณ€ํ˜• ์ƒ์„ฑํ˜•

๐Ÿ‘‰ “ํšŒ์‚ฌ ๋งž์ถค”์—์„œ ์ฐจ์ด๊ฐ€ ๋‚จ


4๏ธโƒฃ ์„ฑ๊ณผํ˜• ๊ถŒ์žฅ ์„ธํŒ… (5060 ๊ธฐ์ค€)

๐Ÿ”น ๋ชจ๋ธ

 
meta-llama/Meta-Llama-3-8B (+ ํ•œ๊ตญ์–ด ๋ฐ์ดํ„ฐ๋กœ LoRA)

๐Ÿ”น ํ•™์Šต ๋ฐฉ์‹

  • QLoRA (4bit) ๋˜๋Š”
  • LoRA (8bit, VRAM ์—ฌ์œ  ์‹œ)

๐Ÿ”น ๊ถŒ์žฅ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ

 
Context length: 1024~2048 LoRA r: 16~32 Batch size: 2 Grad acc: 4 Epoch: 2~3

๐Ÿ“Œ ์ด ์„ธํŒ…์€ ๋ณด๊ณ ์„œ ๋ฌธ๋‹จ ํ’ˆ์งˆ ์ตœ์šฐ์„ 


5๏ธโƒฃ ๋‹จ, ์„ฑ๊ณผํ˜•์ผ์ˆ˜๋ก ๊ผญ ์ง€์ผœ์•ผ ํ•  ์›์น™

โš ๏ธ ์ด๊ฑฐ ์•ˆ ์ง€ํ‚ค๋ฉด ์˜คํžˆ๋ ค ๋ง๊ฐ€์ง‘๋‹ˆ๋‹ค.

๐Ÿšซ ํ•˜์ง€ ๋ง ๊ฒƒ

  • ํšŒ์‚ฌ ๊ณ ์œ  ์ˆ˜์น˜/์ •์ฑ…์„ ํ•™์Šต ๋ฐ์ดํ„ฐ์— ์ง์ ‘ ๋„ฃ๊ธฐ
  • CDP ์ ์ˆ˜ ํŒ๋‹จ์„ ๋ชจ๋ธ์— ๋งก๊ธฐ๊ธฐ
  • “์‚ฌ์‹ค ์ƒ์„ฑ”์„ ๊ธฐ๋Œ€ํ•˜๊ธฐ

โœ… ๋ฐ˜๋“œ์‹œ ํ•  ๊ฒƒ

  • IFRS / CDP ๋ฌธ๋‹จ ๊ตฌ์กฐ๋ฅผ ํ”„๋กฌํ”„ํŠธ๋กœ ๊ณ ์ •
  • ๋ชจ๋ธ์€ “๋ฌธ์žฅ ์ž‘์„ฑ์ž” ์—ญํ• ๋งŒ
  • ์‚ฌ์‹ค·์ˆ˜์น˜๋Š” RAG ๋˜๋Š” ๋ฃฐ ๊ธฐ๋ฐ˜

6๏ธโƒฃ ์ตœ์ข… ์ถ”์ฒœ ์ •๋ฆฌ (ํ‘œ)

์กฐ๊ฑด์ตœ์  ๋ชจ๋ธ
RTX 3050 + ์•ˆ์ •์„ฑ KoAlpaca-Polyglot-5.8B
RTX 5060 + ์„ฑ๊ณผ ์ค‘์‹œ LLaMA-3-8B (Ko ํŠœ๋‹)
๊ฒฐ๊ณผ ํ’ˆ์งˆ ์ตœ์šฐ์„  LLaMA-3-8B
๋ฌธ์žฅ ํ†ค ์•ˆ์ •์„ฑ Polyglot
CDP ๋…ผ๋ฆฌ ๋Œ€์‘ LLaMA-3

ํ”„๋กœ์ ํŠธ ์ ํ•ฉ๋„ ๋น„๊ต (KT Mi:dm 2.0 Mini-Instruct vs Polyglot-Ko 5.8B vs Llama-2-ko 7B)

๋‹น์‹ ์˜ ํ”„๋กœ์ ํŠธ(10~30๊ฑด ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ ๋ฐ์ดํ„ฐ๋กœ IFRS/CDP ๋งž์ถค ๋ฌธ์žฅ ์ƒ์„ฑ fine-tuning, 1๋‹ฌ ๊ธฐ๊ฐ„, ์ง„ํ–‰ ๊ณผ์ • ๋ถ€ํ•˜ ์ตœ์†Œํ™” ์šฐ์„ )๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์„ธ ๋ชจ๋ธ์„ ๋น„๊ตํ–ˆ์Šต๋‹ˆ๋‹ค. 2025๋…„ 12์›” ํ˜„์žฌ ๊ธฐ์ค€์œผ๋กœ, Mi:dm 2.0 Mini-Instruct๋Š” 2025๋…„ 7์›”์— ์ถœ์‹œ๋œ ์ตœ์‹  "Korea-centric" ๋ชจ๋ธ๋กœ ํ•œ๊ตญ์–ด ๋ฒค์น˜๋งˆํฌ(Ko-Sovereign, KMMLU ๋“ฑ)์—์„œ ๋™๊ธ‰ ์ด์ƒ์˜ ๊ธ€๋กœ๋ฒŒ/๊ตญ๋‚ด ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด Polyglot-Ko 5.8B์™€ Llama-2-ko 7B๋Š” 2023๋…„๋Œ€ ๊ตฌํ˜• ๋ชจ๋ธ๋กœ, ํ˜„์žฌ ๊ธฐ์ค€์œผ๋กœ๋Š” ์„ฑ๋Šฅ์ด ๋’ค์ฒ˜์ง‘๋‹ˆ๋‹ค.

 

ํ•ญ๋ชฉ KT Mi:dm 2.0 Mini-Instruct (2.3B) Polyglot-Ko 5.8B (5.8B) Llama-2-ko 7B (7B)
์ถœ์‹œ ์—ฐ๋„ & ์ตœ์‹ ์„ฑ 2025๋…„ 7์›” (์ตœ์‹ , pruning + distillation ์ ์šฉ) 2023๋…„ (๊ตฌํ˜•) 2023๋…„ (Llama-2 ๊ธฐ๋ฐ˜ ์ถ”๊ฐ€ pretraining, ๊ตฌํ˜•)
ํ•œ๊ตญ์–ด ํŠนํ™” ์ตœ๊ณ  (Korea-centric ์„ค๊ณ„, ๋ฌธํ™”/์‚ฌํšŒ/์ƒ์‹ ๋‚ด์žฌํ™”). Ko-IFEval 73%, Ko-MTBench 74%, K-Refer 66% ๋“ฑ ํ•œ๊ตญ ๋ฒค์น˜๋งˆํฌ ์ƒ์œ„. ESG/๋ณด๊ณ ์„œ ์šฉ์–ด ์ดํ•ด ์šฐ์ˆ˜ ์˜ˆ์ƒ. ์ค‘์ƒ (ํ•œ๊ตญ ์ „์šฉ pretraining) ํ•˜์ง€๋งŒ 2023๋…„ ์ˆ˜์ค€์œผ๋กœ ์ตœ์‹  ๋ชจ๋ธ์— ๋’ค์ง. ์ค‘ (ํ•œ๊ตญ ์ฝ”ํผ์Šค ์ถ”๊ฐ€) ํ•˜์ง€๋งŒ Llama-2 ์•„ํ‚คํ…์ฒ˜ ํ•œ๊ณ„๋กœ reasoning/instruction ์•ฝํ•จ.
ํŒŒ๋ผ๋ฏธํ„ฐ & ๋ถ€ํ•˜ ๊ฐ€์žฅ ๊ฐ€๋ณ๋‹ค (2.3B). QLoRA ์‹œ RTX 4090 (10GB ๋ฏธ๋งŒ) ๋˜๋Š” ์ €์‚ฌ์–‘ GPU๋กœ ์ดˆ๊ณ ์†. ๋ถ€ํ•˜ ์ตœ์†Œํ™”์— ์ตœ์ . ์ค‘๊ฐ„ (5.8B). QLoRA ์‹œ 20~25GB ์†Œ์š”, ๋ถ€ํ•˜ ์ค‘๊ฐ„. ๋†’์Œ (7B). QLoRA ์‹œ 25~30GB ์†Œ์š”, ๋ถ€ํ•˜ ๊ฐ€์žฅ ํผ.
์ž‘์€ ๋ฐ์ดํ„ฐ์…‹ ์ ํ•ฉ๋„ ์šฐ์ˆ˜. ์ด๋ฏธ instruction-tuned + ํ•œ๊ตญ ํŠนํ™”๋กœ 10~30๊ฑด ๋ฐ์ดํ„ฐ๋กœ ๋น ๋ฅด๊ฒŒ ๊ณ ํ’ˆ์งˆ IFRS/CDP ๋ฌธ์žฅ ์ƒ์„ฑ ๊ฐ€๋Šฅ. ๊ณผ์ ํ•ฉ ์ ์Œ. ๋ณดํ†ต. Instruction tuning ๋ถ€์กฑ (KoAlpaca ๋“ฑ ๋ณ„๋„ ํ•„์š”), ์ถ”๊ฐ€ ์ž‘์—… ๋งŽ์Œ. ๋ณดํ†ต. Instruction following ์•ฝํ•ด ์ž‘์€ ๋ฐ์ดํ„ฐ์—์„œ ๋ถˆ์•ˆ์ •.
ํ›ˆ๋ จ ๊ธฐ๊ฐ„ & ๋น„์šฉ ๊ฐ€์žฅ ๋น ๋ฆ„. 1๋‹ฌ ๋‚ด ์—ฌ์œ ๋กญ๊ฒŒ ๋ฐ˜๋ณต ์‹คํ—˜. ์ €๋น„์šฉ ๋กœ์ปฌ/ํด๋ผ์šฐ๋“œ ๊ฐ€๋Šฅ. ์ค‘๊ฐ„. ๋” ์˜ค๋ž˜ ๊ฑธ๋ฆฌ๊ณ  ์ž์› ๋” ์†Œ๋ชจ. ๊ฐ€์žฅ ๋А๋ฆผ. ๋ถ€ํ•˜ ์ปค์„œ 1๋‹ฌ ๋‚ด ์•ˆ์ •์  ์ง„ํ–‰ ์–ด๋ ค์›€.
์ „์ฒด ํ”„๋กœ์ ํŠธ ์ ํ•ฉ๋„ ์ตœ๊ณ . ์ตœ์‹  + ์ดˆ๊ฒฝ๋Ÿ‰ + ํ•œ๊ตญ ํŠนํ™”๋กœ ๋ถ€ํ•˜ ์ตœ์†Œ + ์„ฑ๋Šฅ ์ตœ๋Œ€. ๋‚ฎ์Œ. ๊ตฌํ˜•์œผ๋กœ ์„ฑ๋Šฅ ์ €ํ•˜ ์˜ˆ์ƒ. ๋‚ฎ์Œ. ๊ตฌํ˜• + ๋ถ€ํ•˜ ์ปค์„œ ๋ถ€์ ํ•ฉ.
๋‹จ์  ๊ธ€๋กœ๋ฒŒ ๋ฒ”์šฉ ๋ฒค์น˜๋งˆํฌ์—์„œ ์•ฝ๊ฐ„ ๋’ค์งˆ ์ˆ˜ ์žˆ์Œ (ํ”„๋กœ์ ํŠธ์— ๋ฌด๊ด€). ๊ตฌํ˜• ์•„ํ‚คํ…์ฒ˜๋กœ ์ตœ์‹  ํƒœ์Šคํฌ(์ „๋ฌธ ๋ฌธ์„œ ์ƒ์„ฑ) ์•ฝํ•จ. Reasoning/instruction ์•ฝํ•˜๊ณ  ์ž์› ์†Œ๋ชจ ํผ.

๊ฒฐ๋ก  & ์ถ”์ฒœ: KT Mi:dm 2.0 Mini-Instruct๋ฅผ ๊ฐ•๋ ฅํžˆ 1์ˆœ์œ„๋กœ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค. 2025๋…„ ์ตœ์‹  ๋ชจ๋ธ๋กœ ํ•œ๊ตญ์–ด(ํŠนํžˆ ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ ๊ฐ™์€ ์ „๋ฌธ/๋ฌธํ™” ๋งฅ๋ฝ)์—์„œ ์••๋„์  ์šฐ์œ„, ๊ฐ€์žฅ ๊ฐ€๋ฒผ์šด ๊ทœ๋ชจ๋กœ "๋ถ€ํ•˜ ์ตœ์†Œํ™”" ๋ชฉํ‘œ์— ์™„๋ฒฝ ๋งž์•„์š”. Polyglot-Ko 5.8B๋‚˜ Llama-2-ko 7B๋Š” 2023๋…„ ๋ชจ๋ธ๋กœ ์„ฑ๋Šฅ/ํšจ์œจ ๋ชจ๋‘ ๋’ค์ฒ˜์ ธ ์ „ํ™˜ํ•  ์ด์œ ๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค – ์˜คํžˆ๋ ค fine-tuning ํ›„ ๋ฌธ์žฅ ํ’ˆ์งˆ์ด ๋–จ์–ด์ง€๊ณ  ๊ณผ์ •์ด ํž˜๋“ค์–ด์งˆ ์ˆ˜ ์žˆ์–ด์š”.

Hugging Face์—์„œ Mi:dm 2.0 Mini-Instruct ๋ฐ”๋กœ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  (K-intelligence/Midm-2.0-Mini-Instruct), Unsloth๋‚˜ LLaMA-Factory๋กœ QLoRA ์‹œ์ž‘ํ•ด๋ณด์„ธ์š”. ์‹ค์ œ ํ…Œ์ŠคํŠธ๋กœ ํ™•์ธํ•˜๋ฉด ๋” ํ™•์‹คํ•  ๊ฑฐ์˜ˆ์š”! ์ถ”๊ฐ€ ์กฐ์–ธ ํ•„์š”ํ•˜์‹œ๋ฉด ๋ง์”€ํ•ด์ฃผ์„ธ์š”.