๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Project ESG+AI/[์‚ผ์ •KPMG]ESG ๋ฐ์ดํ„ฐ ํ™œ์šฉ ํ’€์Šคํ… ๊ฐœ๋ฐœ

47์ผ์ฐจ. ํ”„๋กœ์ ํŠธ์— ๋งž์ถฐ์„œ AI ๋ชจ๋ธ ์„ ํƒํ•˜๊ณ  ์„ค์ •ํ•˜๊ธฐ

by GreenJin_S2 2025. 12. 18.

 

 

 


rtx 3050์—์„œ ์ฝ”์•ŒํŒŒ์นด๋ฅผ ํŽ˜ํ”„ํŠธ๋กœ ํ•™์Šตํ•˜๋ ค๊ณ  ํ•ด. 

 

 

Polyglot-Ko 5.8B๋‚˜ Llama-2-ko 7B ์ค‘์—์„œ ์–ด๋А ๊ฒƒ์„ ์ถ”์ฒœํ•˜๋Š”๊ฐ€ ?

 

๐Ÿ“Œ 3. ์–ธ์ œ ์–ด๋–ค ๋ชจ๋ธ์„ ์„ ํƒํ•ด์•ผ ํ• ๊นŒ?

โœ… ํ•œ๊ตญ์–ด ์ค‘์‹ฌ ์ž‘์—… ์šฐ์„ ์ด๋ผ๋ฉด

๐Ÿ‘‰ Polyglot-Ko 5.8B

  • ํ•œ๊ตญ์–ด ์ƒ์„ฑ/๋Œ€ํ™”/๋ฌธํ™”์  ๋งฅ๋ฝ ํฌํ•จํ•œ ํ…์ŠคํŠธ ์ƒ์„ฑ
  • ํ•œ๊ตญ์–ด NLP task (์š”์•ฝ, ๊ฐ์ •๋ถ„์„, ๋ช…๋ น ์ˆ˜ํ–‰ ๋“ฑ) ์ค‘์‹ฌ

โœ… ๋” ๋„“์€ ํ™œ์šฉ, ๋‹ค๊ตญ์–ด ๋˜๋Š” ๋ณตํ•ฉ ์ž‘์—…์ด๋ผ๋ฉด

๐Ÿ‘‰ Llama-2-Ko 7B

  • ์˜์–ด + ํ•œ๊ตญ์–ด ํ˜ผํ•ฉ ์ž…๋ ฅ/์ถœ๋ ฅ
  • ๊ธฐ์ˆ  ๋ฌธ์„œ ์š”์•ฝ, ์ฝ”๋“œ/์ง€์‹ ์งˆ๋ฌธ, ๋‹ค์ค‘ task

๐Ÿ“Œ 4. ์„ฑ๋Šฅ/ํšจ์œจ์„ฑ ์š”์•ฝ

ํ•ญ๋ชฉPolyglot-Ko 5.8BLlama-2-Ko 7B
ํ•œ๊ตญ์–ด ํŠนํ™” โญโญโญโญ โญโญโญ
๋‹ค๊ตญ์–ด ์ง€์› โญโญ โญโญโญโญ
๋ฒ”์šฉ ํ…์ŠคํŠธ ์ƒ์„ฑ โญโญโญ โญโญโญโญ
Model Scale 5.8B 7B
ํ˜„์กด ํ‰๊ฐ€ ์ปค๋ฎค๋‹ˆํ‹ฐ ์‚ฌ๋ก€ ํ•œ๊ตญ์–ด ์ค‘์‹ฌ์—์„œ ์ข‹์€ ํ‰๊ฐ€ ์ „๋ฐ˜์ ์ธ ๋ฒ”์šฉ์„ฑ์— ๊ฐ•์ 

๐Ÿง  ๊ฒฐ๋ก 

  • ํ•œ๊ตญ์–ด ์ค‘์‹ฌ, ๋†’์€ ํ•œ๊ตญ์–ด ์ž์—ฐ์Šค๋Ÿฌ์›€/๋งฅ๋ฝ ์ดํ•ด  Polyglot-Ko 5.8B ์ถ”์ฒœ
  • ๊ด‘๋ฒ”์œ„ ์–ธ์–ด ์ดํ•ด + ํ•œ๊ตญ์–ด ํฌํ•จ ๋‹ค์–‘ํ•œ ์ž‘์—…  Llama-2-Ko 7B ์ถ”์ฒœ

 

์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ 10๊ฑด~30๊ฑด์œผ๋กœ ํ•™์Šตํ•œ ํ›„ , ifrs ๊ธฐ์ค€ ๋ฌธ๋‹จ์— ๋งž์ถ”์–ด์„œ ์‚ฌ์šฉ์ž ํšŒ์‚ฌ์— ๋งž๊ฒŒ AI ๊ฐ€ ๋ฌธ์žฅ์„ ์ž‘์„ฑํ•ด์ฃผ๊ณ , cdp๋Œ€์‘ํ•˜๋Š” ๋ฌธ์žฅ๋“ค์„ ์ž‘์„ฑํ•˜๋Š” ํ”„๋กœ์ ํŠธ๋ฅผ ์‹œํ–‰ํ•˜๋ ค๊ณ  ํ•ด ํ›ˆ๋ จ ๊ธฐ๊ฐ„์€ 1๋‹ฌ ์ •๋„ ์ƒ๊ฐํ•ด. ๊ทธ๋ฆฌ๊ณ  ํ›ˆ๋ จ ํ›„์˜ ์„ฑ๊ณผ๋ณด๋‹ค๋Š” ์ง„ํ–‰๊ณผ์ •์—์„œ ๋ถ€ํ•˜๊ฐ€ ๊ฑธ๋ฆฌ์ง€ ์•Š๊ธฐ๋ฅผ ๋ฐ”๋ž˜. ์ด๋•Œ , ์œ„์˜ ๋งฅ๋ฝ์—์„œ ์–ด๋А ๋ชจ๋ธ์ด ๊ฐ€์žฅ ํ•ฉ๋‹นํ• ๊นŒ ?

 

1๏ธโƒฃ ํ”„๋กœ์ ํŠธ ์š”๊ตฌ์‚ฌํ•ญ์„ ๋‹ค์‹œ ์ •๋ฆฌํ•ด๋ณด๋ฉด

์€์ง„๋‹˜ ํ”„๋กœ์ ํŠธ์˜ ํ•ต์‹ฌ ์ œ์•ฝ์€ ๋‹ค์Œ์ด์—์š”:

โœ… ๋ชฉํ‘œ

  • ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ(SR) 10~30๊ฑด ํ•™์Šต
  • IFRS ๋ฌธ๋‹จ ๊ตฌ์กฐ์— ๋งž์ถ˜ ๋ฌธ์žฅ ์ƒ์„ฑ
  • ํšŒ์‚ฌ ๋งž์ถคํ˜• ESG/ํ™˜๊ฒฝ/๊ธฐํ›„/๊ฑฐ๋ฒ„๋„Œ์Šค ๋ฌธ์žฅ
  • CDP ๋Œ€์‘ ๋ฌธ์žฅ ์ž๋™ ์ƒ์„ฑ

โœ… ์šด์˜ ์กฐ๊ฑด

  • RTX 3050
  • ํ›ˆ๋ จ ๊ธฐ๊ฐ„ 1๋‹ฌ
  • ์„ฑ๊ณผ๋ณด๋‹ค ์ง„ํ–‰ ๊ณผ์ •์—์„œ์˜ ์•ˆ์ •์„ฑ·๋ถ€ํ•˜ ์ตœ์†Œํ™” ์ค‘์‹œ
  • ๋ฐ˜๋ณต ์‹คํ—˜, ์ˆ˜์ •, ์ค‘๋‹จ์ด ์žฆ์„ ๊ฐ€๋Šฅ์„ฑ ๋†’์Œ

๐Ÿ‘‰ ์ด๊ฑด “์—ฐ๊ตฌ์šฉ SOTA”๊ฐ€ ์•„๋‹ˆ๋ผ “์ •์ฑ…·๋ณด๊ณ ์„œ ์ƒ์„ฑ์šฉ ์‹ค๋ฌด AI” ์ž…๋‹ˆ๋‹ค.


2๏ธโƒฃ ์ด ์กฐ๊ฑด์—์„œ ์ค‘์š”ํ•œ ๋ชจ๋ธ ์„ ํƒ ๊ธฐ์ค€

์ด ํ”„๋กœ์ ํŠธ์—์„œ๋Š” ์„ฑ๋Šฅ๋ณด๋‹ค ์•„๋ž˜ 5๊ฐ€์ง€๊ฐ€ ํ›จ์”ฌ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

๊ธฐ์ค€์ด์œ 
ํ•œ๊ตญ์–ด ๋ฌธ์„œ์ฒด ์ดํ•ด SR·IFRS·CDP ๋ฌธ์žฅ์€ ์ผ์ƒ ๋Œ€ํ™” ์•„๋‹˜
๊ตฌ์กฐ ํ•™์Šต ๋Šฅ๋ ฅ ๋ฌธ๋‹จ·ํ•ญ๋ชฉ·์ง€ํ‘œ๋ณ„ ๋ฐ˜๋ณต ํŒจํ„ด
์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ ์•ˆ์ •์„ฑ 10~30๊ฑด์€ ๋งค์šฐ ์ ์Œ
VRAM ์—ฌ์œ  ์žฅ์‹œ๊ฐ„ ํ•™์Šต ์ค‘ OOM = ํ”„๋กœ์ ํŠธ ์ค‘๋‹จ
๋””๋ฒ„๊น… ์šฉ์ด์„ฑ ์ค‘๊ฐ„์— ๋ฐ์ดํ„ฐ/ํ”„๋กฌํ”„ํŠธ ๊ณ„์† ๋ฐ”๋€œ

3๏ธโƒฃ ๋ชจ๋ธ ํ›„๋ณด๋ณ„ ํ˜„์‹ค์  ํ‰๊ฐ€

โŒ LLaMA-2-Ko 7B (๋˜๋Š” 7B๊ธ‰)

์™œ ๋ถ€์ ํ•ฉํ•œ๊ฐ€

  • RTX 3050์—์„œ:
    • QLoRA๋กœ๋„ ํ•™์Šต ๋‚ด๋‚ด ๋ฉ”๋ชจ๋ฆฌ ์••๋ฐ•
    • gradient accumulation ๋Š˜๋ฆฌ๋ฉด ์‹œ๊ฐ„ ↑, ์•ˆ์ •์„ฑ ↓
  • ํ•œ๊ตญ์–ด “๋ณด๊ณ ์„œ์ฒด”๋Š”:
    • Polyglot ๊ณ„์—ด๋ณด๋‹ค ๋ฌธ์žฅ ํ†ค ๋ถˆ์•ˆ์ •
  • 10~30๊ฑด ํ•™์Šต์—์„œ๋Š”:
    • ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๋งŒ ํฌ๊ณ  ๊ณผ์ ํ•ฉ/ํ™˜๊ฐ ์œ„ํ—˜ ์ฆ๊ฐ€

๐Ÿ“Œ “๊ฒฐ๊ณผ๊ฐ€ ์ข‹์•„ ๋ณด์ผ ์ˆ˜๋Š” ์žˆ์–ด๋„, ๊ณผ์ •์ด ๊ณ„์† ๋ถˆ์•ˆํ•จ”


โŒ ๋” ์ž‘์€ ๋ชจ๋ธ (3B ์ดํ•˜)

์™œ ์•ˆ ์ข‹์€๊ฐ€

  • IFRS / CDP ๋ฌธ๋‹จ์€:
    • ๋ฌธ์žฅ ๋…ผ๋ฆฌ + ๊ทœ๋ฒ”์  ํ‘œํ˜„ + ๋ฐ˜๋ณต ๊ตฌ์กฐ
  • 3B ์ดํ•˜์—์„œ๋Š”:
    • ์ง€ํ‘œ ๋Œ€์‘ ๋ฌธ์žฅ ๋ถ•๊ดด
    • ๋ฌธ๋‹จ ๊ฐ„ ์ผ๊ด€์„ฑ ๋ถ€์กฑ
  • “ํšŒ์‚ฌ ๋งž์ถค”์œผ๋กœ ๊ฐˆ์ˆ˜๋ก:
    • ํ‘œํ˜„ ๋‹ค์–‘์„ฑ ๊ธ‰๊ฒฉํžˆ ๊ฐ์†Œ

๐Ÿ“Œ “๊ฐ€๋ณ์ง€๋งŒ ๋ณด๊ณ ์„œ ํ’ˆ์งˆ์ด ์•ˆ ๋‚˜์˜ด”


โœ… KoAlpaca-Polyglot-5.8B (QLoRA)

์ด ํ”„๋กœ์ ํŠธ์— ๋”ฑ ๋งž๋Š” ์ด์œ 

โ‘  ํ•œ๊ตญ์–ด ‘๋ณด๊ณ ์„œ ๋ฌธ์ฒด’์— ์ตœ์ 

  • Polyglot-Ko ์ž์ฒด๊ฐ€
    • ๊ณต๊ณต๋ฌธ์„œ·๋ณด๋„์ž๋ฃŒ·๋ณด๊ณ ์„œ ๊ณ„์—ด ๋น„์ค‘ ํผ
  • KoAlpaca ํŠœ๋‹์œผ๋กœ
    • “~ํ•˜์˜€๋‹ค / ~ํ•˜๊ณ  ์žˆ๋‹ค / ~๊ณ„ํš์ด๋‹ค”
      ๊ฐ™์€ ESG ๋ฌธ์ฒด ํ•™์Šต์ด ๋งค์šฐ ์ž˜ ๋จ

โ‘ก ์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ์— ๊ฐ•ํ•จ (์ค‘์š”)

  • 10~30๊ฑด์ด๋ฉด ์‚ฌ์‹ค์ƒ:
    • ์ง€์‹ ์ฃผ์ž… โŒ
    • ๋ฌธ์žฅ ํŒจํ„ด·๊ตฌ์กฐ ํ•™์Šต โญ•
  • Polyglot 5.8B๋Š”:
    • LoRA r=4~8์—์„œ๋„ ๊ตฌ์กฐ ํŒจํ„ด ํ•™์Šต ์•ˆ์ •
  • LLaMA ๊ณ„์—ด์€:
    • r๋ฅผ ํ‚ค์›Œ์•ผ ํ•ด์„œ → VRAM ๋ถ€๋‹ด

โ‘ข “๊ณผ์ • ์•ˆ์ •์„ฑ”์ด ์••๋„์ ์œผ๋กœ ์ข‹์Œ

์€์ง„๋‹˜์ด ๊ฐ€์žฅ ์ค‘์š”ํ•˜๊ฒŒ ๋ณธ ํฌ์ธํŠธ์ฃ .

ํ•ญ๋ชฉPolyglot-5.8B
OOM ์œ„ํ—˜ ๋‚ฎ์Œ
ํ•™์Šต ์ค‘๋‹จ ๊ฐ€๋Šฅ์„ฑ ๋งค์šฐ ๋‚ฎ์Œ
์„ธํŒ… ๋ณ€๊ฒฝ ํ›„ ์žฌํ•™์Šต ๋น ๋ฆ„
์‹คํ—˜ ๋ฐ˜๋ณต ๋ถ€๋‹ด ์ ์Œ

๐Ÿ‘‰ 1๋‹ฌ ๋™์•ˆ “๊ณ„์† ๊ตด๋ฆด ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ”


โ‘ฃ ๊ฒฐ๊ณผ๋ฌผ์„ “AI ํ‹ฐ ์•ˆ ๋‚˜๊ฒŒ” ๋งŒ๋“ค๊ธฐ ์‰ฌ์›€

์ด๊ฑด SR/CDP์—์„œ ๊ฒฐ์ •์ ์ž…๋‹ˆ๋‹ค.

  • Polyglot์€:
    • ๊ณผ์žฅ·์ถ”์ธก ํ‘œํ˜„์ด ์ ์Œ
    • “~๋กœ ํŒ๋‹จ๋œ๋‹ค”
      “~์„ ์ค‘์‹ฌ์œผ๋กœ ๊ด€๋ฆฌํ•˜๊ณ  ์žˆ๋‹ค”
      ๊ฐ™์€ ์ค‘๋ฆฝ์  ํ‘œํ˜„ ์œ ์ง€
  • CDP ๋Œ€์‘ ์‹œ:
    • hallucination ๋ฆฌ์Šคํฌ ๋‚ฎ์Œ

4๏ธโƒฃ ์ด ํ”„๋กœ์ ํŠธ์— ์ตœ์ ํ™”๋œ ๊ถŒ์žฅ ์•„ํ‚คํ…์ฒ˜

๐Ÿ”‘ ํ•ต์‹ฌ ์ „๋žต (์ค‘์š”)

โŒ “๋ณด๊ณ ์„œ ์ง€์‹์„ ๋ชจ๋ธ์— ๋„ฃ๊ฒ ๋‹ค”
โญ• “๋ฌธ์žฅ ์ƒ์„ฑ ๊ทœ์น™์„ ๋ชจ๋ธ์— ํ•™์Šต์‹œํ‚ค๊ฒ ๋‹ค”

๊ตฌ์กฐ๋Š” ์ด๋ ‡๊ฒŒ ๊ฐ€๋Š” ๊ฒŒ ๊ฐ€์žฅ ์•ˆ์ •์ ์ž…๋‹ˆ๋‹ค:

 
[IFRS ๋ฌธ๋‹จ ๊ตฌ์กฐ ํ…œํ”Œ๋ฆฟ] ← ๊ณ ์ • [ํšŒ์‚ฌ๋ณ„ ์ž…๋ ฅ ๋ณ€์ˆ˜] ← ์‚ฌ์šฉ์ž ์ž…๋ ฅ [KoAlpaca-Polyglot-5.8B + LoRA] → ๋ฌธ์žฅ ์ƒ์„ฑ

๐Ÿ“Œ CDP ๋ฌธํ•ญ๋„ ๋™์ผ
๐Ÿ“Œ ๋ชจ๋ธ์€ ์ž‘์„ฑ์ž ์—ญํ• , ์‚ฌ์‹ค ํŒ๋‹จ์€ ์‚ฌ๋žŒ/๋ฃฐ


5๏ธโƒฃ ์ตœ์ข… ์ถ”์ฒœ (ํ•œ ์ค„ ๊ฒฐ๋ก )

RTX 3050 + 1๋‹ฌ + SR 10~30๊ฑด + ๊ณผ์ • ์•ˆ์ •์„ฑ ์ค‘์‹œ๋ผ๋ฉด
KoAlpaca-Polyglot-5.8B (QLoRA, r=4~8) ๊ฐ€ ์œ ์ผํ•œ ํ•ฉ๋ฆฌ์  ์„ ํƒ์ž…๋‹ˆ๋‹ค.


6๏ธโƒฃ ๋‹ค์Œ ๋‹จ๊ณ„์—์„œ ๊ผญ ๊ฐ™์ด ์„ค๊ณ„ํ•ด์•ผ ํ•  ๊ฒƒ (์ค‘์š”)

์ด ํ”„๋กœ์ ํŠธ ์„ฑ๊ณต ์—ฌ๋ถ€๋Š” ๋ชจ๋ธ๋ณด๋‹ค ์•„๋ž˜๊ฐ€ ๋” ์ค‘์š”ํ•ด์š”:

  1. IFRS / CDP ๋ฌธ๋‹จ ํ…œํ”Œ๋ฆฟ ๋ถ„๋ฆฌ ์„ค๊ณ„
  2. ํ•™์Šต์šฉ ๋ฐ์ดํ„ฐ vs ์ƒ์„ฑ์šฉ ํ”„๋กฌํ”„ํŠธ ์—„๊ฒฉ ๋ถ„๋ฆฌ
  3. ํšŒ์‚ฌ ๊ณ ์œ  ์ •๋ณด๋Š” ์ ˆ๋Œ€ ํ•™์Šตํ•˜์ง€ ์•Š๊ธฐ
  4. ๋ฌธ๋‹จ๋ณ„ LoRA task ๋ถ„๋ฆฌ ์—ฌ๋ถ€ ๊ฒ€ํ† 

ํ˜น์‹œ ๊ฐ™์€ ์กฐ๊ฑด์—์„œ RTX๋Š” 5060, ์„ฑ๊ณผ ์ค‘์‹œ๋ผ๋ฉด ์–ด๋–ป๊ฒŒ ์ถ”์ฒœํ•ด์ค„์ˆ˜์žˆ์–ด??

 

 

RTX 5060 + ์„ฑ๊ณผ ์ค‘์‹œ๋กœ ์กฐ๊ฑด์ด ๋ฐ”๋€Œ๋ฉด ๋ชจ๋ธ ์„ ํƒ ์ „๋žต์ด “์™„์ „ํžˆ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.”
์•„๋ž˜๋Š” **๊ฐ™์€ ํ”„๋กœ์ ํŠธ ๋ชฉ์ (SR·IFRS·CDP ์ž๋™ ๋ฌธ์žฅ ์ƒ์„ฑ)**์„ ์œ ์ง€ํ•˜๋ฉด์„œ,
๐Ÿ‘‰ *“๊ณผ์ • ์•ˆ์ •์„ฑ < ๊ฒฐ๊ณผ ํ’ˆ์งˆ”*์ผ ๋•Œ์˜ ์ตœ์  ์ถ”์ฒœ์ž…๋‹ˆ๋‹ค.


๐Ÿ”š ๊ฒฐ๋ก ๋ถ€ํ„ฐ ํ•œ ์ค„๋กœ

RTX 5060 + ์„ฑ๊ณผ ์ค‘์‹œ๋ผ๋ฉด
๐Ÿ‘‰ LLaMA-3 ๊ณ„์—ด 8B (ํ•œ๊ตญ์–ด ๊ฐ•ํ™” ๋ฒ„์ „) + QLoRA(๋˜๋Š” LoRA) ๊ฐ€ ์ตœ์„ ์ž…๋‹ˆ๋‹ค.

๋‹จ, KoAlpaca-Polyglot์€ ‘์•ˆ์ •ํ˜•’,
**LLaMA-3-8B๋Š” ‘์ถœ๋ ฅ ํ’ˆ์งˆํ˜•’**์ž…๋‹ˆ๋‹ค.


1๏ธโƒฃ RTX 5060์ด ์ฃผ๋Š” “๊ฒŒ์ž„ ์ฒด์ธ์ €”

(5060์€ ์•„์ง ๊ณต์‹ ์ŠคํŽ™ ์ฐจ์ด๊ฐ€ ์žˆ์ง€๋งŒ, ์ผ๋ฐ˜์ ์œผ๋กœ 12GB ์ด์ƒ VRAM ๊ฐ€์ •)

3050 → 5060์œผ๋กœ ๋ฐ”๋€Œ๋ฉด์„œ ์ƒ๊ธฐ๋Š” ๋ณ€ํ™”

ํ•ญ๋ชฉRTX 3050RTX 5060
VRAM ์—ฌ์œ  โŒ ๋งค์šฐ ์ œํ•œ โญ• ์ถฉ๋ถ„
Context length 512~768 1024~2048 ๊ฐ€๋Šฅ
LoRA rank r=4~8 r=16~32 ๊ฐ€๋Šฅ
๋ชจ๋ธ ์„ ํƒ 5~6B ํ˜„์‹ค์  8B๊ธ‰ ์‹ค์ „ ๊ฐ€๋Šฅ
๋ฌธ์žฅ ๋…ผ๋ฆฌ๋ ฅ ์ œํ•œ์  ๋ˆˆ์— ๋„๊ฒŒ ๊ฐœ์„ 

๐Ÿ‘‰ “๋ณด๊ณ ์„œ ๋ฌธ๋‹จ์˜ ๋…ผ๋ฆฌ ๋ฐ€๋„”๊ฐ€ ํ™•์‹คํžˆ ๋‹ฌ๋ผ์ง‘๋‹ˆ๋‹ค.


2๏ธโƒฃ ์„ฑ๊ณผ ์ค‘์‹œ์ผ ๋•Œ, ํ‰๊ฐ€ ๊ธฐ์ค€์ด ๋ฐ”๋€œ

์ด์ œ ์ค‘์š”ํ•œ ๊ฑด ์ด๊ฒ๋‹ˆ๋‹ค:

์ค‘์š”๋„ํ•ญ๋ชฉ
โญโญโญโญโญ ๋ฌธ๋‹จ ๋…ผ๋ฆฌ ์™„๊ฒฐ์„ฑ
โญโญโญโญโญ IFRS/CDP ์งˆ๋ฌธ ์ •ํ™• ๋Œ€์‘
โญโญโญโญ ํšŒ์‚ฌ ๋งž์ถค ์„œ์ˆ  ์œ ์—ฐ์„ฑ
โญโญโญ ํ•™์Šต ์•ˆ์ •์„ฑ
โญโญ ๋ฐ˜๋ณต ์‹คํ—˜ ๋ถ€๋‹ด

๐Ÿ‘‰ ์ฆ‰, “์กฐ๊ธˆ ๊นŒ๋‹ค๋กœ์›Œ๋„ ๊ฒฐ๊ณผ๊ฐ€ ์ข‹์•„์•ผ ํ•จ”


3๏ธโƒฃ ๋ชจ๋ธ ํ›„๋ณด ์žฌํ‰๊ฐ€ (5060 ๊ธฐ์ค€)

โŒ KoAlpaca-Polyglot-5.8B (์ด ์กฐ๊ฑด์—์„  2์ˆœ์œ„)

์™œ 1์ˆœ์œ„๊ฐ€ ์•„๋‹ˆ๊ฒŒ ๋˜๋Š”๊ฐ€?

  • ๋ฌธ์žฅ ์•ˆ์ •์„ฑ์€ ์—ฌ์ „ํžˆ ์ตœ๊ณ 
  • ํ•˜์ง€๋งŒ:
    • IFRS ๋ฌธ๋‹จ์—์„œ ๋…ผ๋ฆฌ ์ „๊ฐœ ๊นŠ์ด ๋ถ€์กฑ
    • CDP ๋ฌธํ•ญ์˜ “์งˆ๋ฌธ ์˜๋„ ํŒŒ์•…”์ด ์–•์Œ
  • 5060์˜ ์—ฌ์œ ๋ฅผ ๋‹ค ๋ชป ์”€

๐Ÿ‘‰ “3050์—์„  ์ตœ์ , 5060์—์„  ๋ณด์ˆ˜์ ”


โŒ LLaMA-2-Ko 7B

  • ์ง€๊ธˆ ์‹œ์ ์—์„ :
    • LLaMA-3 ๋Œ€๋น„ ๋ช…ํ™•ํ•œ ์—ด์„ธ
    • ํ•™์Šต ๋Œ€๋น„ ์„ฑ๋Šฅ ์ƒ์Šนํญ ์ž‘์Œ
  • ๊ตณ์ด ๊ฐˆ ์ด์œ  โŒ

โœ… LLaMA-3-8B (ํ•œ๊ตญ์–ด ๊ฐ•ํ™” / Ko LoRA) ← 1์ˆœ์œ„

์™œ ์ด๊ฒŒ ์„ฑ๊ณผํ˜• ์ตœ์ ํ•ด์ธ๊ฐ€

โ‘  IFRS·CDP์— ์ค‘์š”ํ•œ “๋…ผ๋ฆฌ ์‘๋‹ต ๋Šฅ๋ ฅ”

  • LLaMA-3๋Š”:
    • ์งˆ๋ฌธ → ์š”๊ตฌ์‚ฌํ•ญ → ๋Œ€์‘ ๋ฌธ์žฅ
      ์ด 3๋‹จ ๊ตฌ์กฐ๋ฅผ ์ž˜ ์œ ์ง€
  • CDP ๋ฌธํ•ญ ๋Œ€์‘์—์„œ:
    • “Yes/No + ์„ค๋ช…”
    • “์ •์ฑ…–๋ชฉํ‘œ–์„ฑ๊ณผ–ํ–ฅํ›„ ๊ณ„ํš”
      ๊ตฌ์กฐ๊ฐ€ ์ž์—ฐ์Šค๋Ÿฝ๊ฒŒ ์œ ์ง€

โ‘ก ๋ฌธ๋‹จ ๊ธธ์ด & ๋ฐ€๋„์—์„œ ์ฐจ์ด๊ฐ€ ํผ

  • 8B๊ธ‰ + context 2k →
    • ํ•œ ๋ฌธ๋‹จ ์•ˆ์—์„œ ๋…ผ๋ฆฌ ์™„๊ฒฐ
    • “์ค‘๊ฐ„์— ๋ง ๋Š๊ธฐ๋Š” ๋ณด๊ณ ์„œ ๋ฌธ์žฅ” ํ˜„์ €ํžˆ ๊ฐ์†Œ
  • SR ๋ณด๊ณ ์„œ ํ’ˆ์งˆ์ด
    • *“์‚ฌ๋žŒ์ด ์“ด ๊ฒƒ ๊ฐ™์€ ์ˆ˜์ค€”*์— ๊ฐ€๊นŒ์›Œ์ง

โ‘ข ์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ์—์„œ๋„ “์ผ๋ฐ˜ํ™””๊ฐ€ ๋” ์ž˜ ๋จ

  • 10~30๊ฑด์€ ์—ฌ์ „ํžˆ ์ ์ง€๋งŒ:
    • LLaMA-3๋Š” ํŒจํ„ด ์ผ๋ฐ˜ํ™” ๋Šฅ๋ ฅ ์šฐ์ˆ˜
  • Polyglot → ํŒจํ„ด ๋ณต์‚ฌํ˜•
  • LLaMA-3 → ํŒจํ„ด + ๋ณ€ํ˜• ์ƒ์„ฑํ˜•

๐Ÿ‘‰ “ํšŒ์‚ฌ ๋งž์ถค”์—์„œ ์ฐจ์ด๊ฐ€ ๋‚จ


4๏ธโƒฃ ์„ฑ๊ณผํ˜• ๊ถŒ์žฅ ์„ธํŒ… (5060 ๊ธฐ์ค€)

๐Ÿ”น ๋ชจ๋ธ

 
meta-llama/Meta-Llama-3-8B (+ ํ•œ๊ตญ์–ด ๋ฐ์ดํ„ฐ๋กœ LoRA)

๐Ÿ”น ํ•™์Šต ๋ฐฉ์‹

  • QLoRA (4bit) ๋˜๋Š”
  • LoRA (8bit, VRAM ์—ฌ์œ  ์‹œ)

๐Ÿ”น ๊ถŒ์žฅ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ

 
Context length: 1024~2048 LoRA r: 16~32 Batch size: 2 Grad acc: 4 Epoch: 2~3

๐Ÿ“Œ ์ด ์„ธํŒ…์€ ๋ณด๊ณ ์„œ ๋ฌธ๋‹จ ํ’ˆ์งˆ ์ตœ์šฐ์„ 


5๏ธโƒฃ ๋‹จ, ์„ฑ๊ณผํ˜•์ผ์ˆ˜๋ก ๊ผญ ์ง€์ผœ์•ผ ํ•  ์›์น™

โš ๏ธ ์ด๊ฑฐ ์•ˆ ์ง€ํ‚ค๋ฉด ์˜คํžˆ๋ ค ๋ง๊ฐ€์ง‘๋‹ˆ๋‹ค.

๐Ÿšซ ํ•˜์ง€ ๋ง ๊ฒƒ

  • ํšŒ์‚ฌ ๊ณ ์œ  ์ˆ˜์น˜/์ •์ฑ…์„ ํ•™์Šต ๋ฐ์ดํ„ฐ์— ์ง์ ‘ ๋„ฃ๊ธฐ
  • CDP ์ ์ˆ˜ ํŒ๋‹จ์„ ๋ชจ๋ธ์— ๋งก๊ธฐ๊ธฐ
  • “์‚ฌ์‹ค ์ƒ์„ฑ”์„ ๊ธฐ๋Œ€ํ•˜๊ธฐ

โœ… ๋ฐ˜๋“œ์‹œ ํ•  ๊ฒƒ

  • IFRS / CDP ๋ฌธ๋‹จ ๊ตฌ์กฐ๋ฅผ ํ”„๋กฌํ”„ํŠธ๋กœ ๊ณ ์ •
  • ๋ชจ๋ธ์€ “๋ฌธ์žฅ ์ž‘์„ฑ์ž” ์—ญํ• ๋งŒ
  • ์‚ฌ์‹ค·์ˆ˜์น˜๋Š” RAG ๋˜๋Š” ๋ฃฐ ๊ธฐ๋ฐ˜

6๏ธโƒฃ ์ตœ์ข… ์ถ”์ฒœ ์ •๋ฆฌ (ํ‘œ)

์กฐ๊ฑด์ตœ์  ๋ชจ๋ธ
RTX 3050 + ์•ˆ์ •์„ฑ KoAlpaca-Polyglot-5.8B
RTX 5060 + ์„ฑ๊ณผ ์ค‘์‹œ LLaMA-3-8B (Ko ํŠœ๋‹)
๊ฒฐ๊ณผ ํ’ˆ์งˆ ์ตœ์šฐ์„  LLaMA-3-8B
๋ฌธ์žฅ ํ†ค ์•ˆ์ •์„ฑ Polyglot
CDP ๋…ผ๋ฆฌ ๋Œ€์‘ LLaMA-3

ํ”„๋กœ์ ํŠธ ์ ํ•ฉ๋„ ๋น„๊ต (KT Mi:dm 2.0 Mini-Instruct vs Polyglot-Ko 5.8B vs Llama-2-ko 7B)

๋‹น์‹ ์˜ ํ”„๋กœ์ ํŠธ(10~30๊ฑด ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ ๋ฐ์ดํ„ฐ๋กœ IFRS/CDP ๋งž์ถค ๋ฌธ์žฅ ์ƒ์„ฑ fine-tuning, 1๋‹ฌ ๊ธฐ๊ฐ„, ์ง„ํ–‰ ๊ณผ์ • ๋ถ€ํ•˜ ์ตœ์†Œํ™” ์šฐ์„ )๋ฅผ ๊ธฐ์ค€์œผ๋กœ ์„ธ ๋ชจ๋ธ์„ ๋น„๊ตํ–ˆ์Šต๋‹ˆ๋‹ค. 2025๋…„ 12์›” ํ˜„์žฌ ๊ธฐ์ค€์œผ๋กœ, Mi:dm 2.0 Mini-Instruct๋Š” 2025๋…„ 7์›”์— ์ถœ์‹œ๋œ ์ตœ์‹  "Korea-centric" ๋ชจ๋ธ๋กœ ํ•œ๊ตญ์–ด ๋ฒค์น˜๋งˆํฌ(Ko-Sovereign, KMMLU ๋“ฑ)์—์„œ ๋™๊ธ‰ ์ด์ƒ์˜ ๊ธ€๋กœ๋ฒŒ/๊ตญ๋‚ด ๋ชจ๋ธ์„ ๋Šฅ๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด Polyglot-Ko 5.8B์™€ Llama-2-ko 7B๋Š” 2023๋…„๋Œ€ ๊ตฌํ˜• ๋ชจ๋ธ๋กœ, ํ˜„์žฌ ๊ธฐ์ค€์œผ๋กœ๋Š” ์„ฑ๋Šฅ์ด ๋’ค์ฒ˜์ง‘๋‹ˆ๋‹ค.

 

ํ•ญ๋ชฉ KT Mi:dm 2.0 Mini-Instruct (2.3B) Polyglot-Ko 5.8B (5.8B) Llama-2-ko 7B (7B)
์ถœ์‹œ ์—ฐ๋„ & ์ตœ์‹ ์„ฑ 2025๋…„ 7์›” (์ตœ์‹ , pruning + distillation ์ ์šฉ) 2023๋…„ (๊ตฌํ˜•) 2023๋…„ (Llama-2 ๊ธฐ๋ฐ˜ ์ถ”๊ฐ€ pretraining, ๊ตฌํ˜•)
ํ•œ๊ตญ์–ด ํŠนํ™” ์ตœ๊ณ  (Korea-centric ์„ค๊ณ„, ๋ฌธํ™”/์‚ฌํšŒ/์ƒ์‹ ๋‚ด์žฌํ™”). Ko-IFEval 73%, Ko-MTBench 74%, K-Refer 66% ๋“ฑ ํ•œ๊ตญ ๋ฒค์น˜๋งˆํฌ ์ƒ์œ„. ESG/๋ณด๊ณ ์„œ ์šฉ์–ด ์ดํ•ด ์šฐ์ˆ˜ ์˜ˆ์ƒ. ์ค‘์ƒ (ํ•œ๊ตญ ์ „์šฉ pretraining) ํ•˜์ง€๋งŒ 2023๋…„ ์ˆ˜์ค€์œผ๋กœ ์ตœ์‹  ๋ชจ๋ธ์— ๋’ค์ง. ์ค‘ (ํ•œ๊ตญ ์ฝ”ํผ์Šค ์ถ”๊ฐ€) ํ•˜์ง€๋งŒ Llama-2 ์•„ํ‚คํ…์ฒ˜ ํ•œ๊ณ„๋กœ reasoning/instruction ์•ฝํ•จ.
ํŒŒ๋ผ๋ฏธํ„ฐ & ๋ถ€ํ•˜ ๊ฐ€์žฅ ๊ฐ€๋ณ๋‹ค (2.3B). QLoRA ์‹œ RTX 4090 (10GB ๋ฏธ๋งŒ) ๋˜๋Š” ์ €์‚ฌ์–‘ GPU๋กœ ์ดˆ๊ณ ์†. ๋ถ€ํ•˜ ์ตœ์†Œํ™”์— ์ตœ์ . ์ค‘๊ฐ„ (5.8B). QLoRA ์‹œ 20~25GB ์†Œ์š”, ๋ถ€ํ•˜ ์ค‘๊ฐ„. ๋†’์Œ (7B). QLoRA ์‹œ 25~30GB ์†Œ์š”, ๋ถ€ํ•˜ ๊ฐ€์žฅ ํผ.
์ž‘์€ ๋ฐ์ดํ„ฐ์…‹ ์ ํ•ฉ๋„ ์šฐ์ˆ˜. ์ด๋ฏธ instruction-tuned + ํ•œ๊ตญ ํŠนํ™”๋กœ 10~30๊ฑด ๋ฐ์ดํ„ฐ๋กœ ๋น ๋ฅด๊ฒŒ ๊ณ ํ’ˆ์งˆ IFRS/CDP ๋ฌธ์žฅ ์ƒ์„ฑ ๊ฐ€๋Šฅ. ๊ณผ์ ํ•ฉ ์ ์Œ. ๋ณดํ†ต. Instruction tuning ๋ถ€์กฑ (KoAlpaca ๋“ฑ ๋ณ„๋„ ํ•„์š”), ์ถ”๊ฐ€ ์ž‘์—… ๋งŽ์Œ. ๋ณดํ†ต. Instruction following ์•ฝํ•ด ์ž‘์€ ๋ฐ์ดํ„ฐ์—์„œ ๋ถˆ์•ˆ์ •.
ํ›ˆ๋ จ ๊ธฐ๊ฐ„ & ๋น„์šฉ ๊ฐ€์žฅ ๋น ๋ฆ„. 1๋‹ฌ ๋‚ด ์—ฌ์œ ๋กญ๊ฒŒ ๋ฐ˜๋ณต ์‹คํ—˜. ์ €๋น„์šฉ ๋กœ์ปฌ/ํด๋ผ์šฐ๋“œ ๊ฐ€๋Šฅ. ์ค‘๊ฐ„. ๋” ์˜ค๋ž˜ ๊ฑธ๋ฆฌ๊ณ  ์ž์› ๋” ์†Œ๋ชจ. ๊ฐ€์žฅ ๋А๋ฆผ. ๋ถ€ํ•˜ ์ปค์„œ 1๋‹ฌ ๋‚ด ์•ˆ์ •์  ์ง„ํ–‰ ์–ด๋ ค์›€.
์ „์ฒด ํ”„๋กœ์ ํŠธ ์ ํ•ฉ๋„ ์ตœ๊ณ . ์ตœ์‹  + ์ดˆ๊ฒฝ๋Ÿ‰ + ํ•œ๊ตญ ํŠนํ™”๋กœ ๋ถ€ํ•˜ ์ตœ์†Œ + ์„ฑ๋Šฅ ์ตœ๋Œ€. ๋‚ฎ์Œ. ๊ตฌํ˜•์œผ๋กœ ์„ฑ๋Šฅ ์ €ํ•˜ ์˜ˆ์ƒ. ๋‚ฎ์Œ. ๊ตฌํ˜• + ๋ถ€ํ•˜ ์ปค์„œ ๋ถ€์ ํ•ฉ.
๋‹จ์  ๊ธ€๋กœ๋ฒŒ ๋ฒ”์šฉ ๋ฒค์น˜๋งˆํฌ์—์„œ ์•ฝ๊ฐ„ ๋’ค์งˆ ์ˆ˜ ์žˆ์Œ (ํ”„๋กœ์ ํŠธ์— ๋ฌด๊ด€). ๊ตฌํ˜• ์•„ํ‚คํ…์ฒ˜๋กœ ์ตœ์‹  ํƒœ์Šคํฌ(์ „๋ฌธ ๋ฌธ์„œ ์ƒ์„ฑ) ์•ฝํ•จ. Reasoning/instruction ์•ฝํ•˜๊ณ  ์ž์› ์†Œ๋ชจ ํผ.

๊ฒฐ๋ก  & ์ถ”์ฒœ: KT Mi:dm 2.0 Mini-Instruct๋ฅผ ๊ฐ•๋ ฅํžˆ 1์ˆœ์œ„๋กœ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค. 2025๋…„ ์ตœ์‹  ๋ชจ๋ธ๋กœ ํ•œ๊ตญ์–ด(ํŠนํžˆ ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ ๊ฐ™์€ ์ „๋ฌธ/๋ฌธํ™” ๋งฅ๋ฝ)์—์„œ ์••๋„์  ์šฐ์œ„, ๊ฐ€์žฅ ๊ฐ€๋ฒผ์šด ๊ทœ๋ชจ๋กœ "๋ถ€ํ•˜ ์ตœ์†Œํ™”" ๋ชฉํ‘œ์— ์™„๋ฒฝ ๋งž์•„์š”. Polyglot-Ko 5.8B๋‚˜ Llama-2-ko 7B๋Š” 2023๋…„ ๋ชจ๋ธ๋กœ ์„ฑ๋Šฅ/ํšจ์œจ ๋ชจ๋‘ ๋’ค์ฒ˜์ ธ ์ „ํ™˜ํ•  ์ด์œ ๊ฐ€ ์—†์Šต๋‹ˆ๋‹ค – ์˜คํžˆ๋ ค fine-tuning ํ›„ ๋ฌธ์žฅ ํ’ˆ์งˆ์ด ๋–จ์–ด์ง€๊ณ  ๊ณผ์ •์ด ํž˜๋“ค์–ด์งˆ ์ˆ˜ ์žˆ์–ด์š”.

Hugging Face์—์„œ Mi:dm 2.0 Mini-Instruct ๋ฐ”๋กœ ๋‹ค์šด๋กœ๋“œํ•˜๊ณ  (K-intelligence/Midm-2.0-Mini-Instruct), Unsloth๋‚˜ LLaMA-Factory๋กœ QLoRA ์‹œ์ž‘ํ•ด๋ณด์„ธ์š”. ์‹ค์ œ ํ…Œ์ŠคํŠธ๋กœ ํ™•์ธํ•˜๋ฉด ๋” ํ™•์‹คํ•  ๊ฑฐ์˜ˆ์š”! ์ถ”๊ฐ€ ์กฐ์–ธ ํ•„์š”ํ•˜์‹œ๋ฉด ๋ง์”€ํ•ด์ฃผ์„ธ์š”.

 

 

 

 

 

 

 

 

 



RTX 3050์—์„œ ์ฝ”์•ŒํŒŒ์นด๋ฅผ ํŽ˜ํ”„ํŠธ๋กœ ํ•™์Šตํ•˜๋ ค๊ณ  ํ•ด. ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ 10๊ฑด~30๊ฑด์œผ๋กœ ํ•™์Šตํ•œ ํ›„ , ifrs ๊ธฐ์ค€ ๋ฌธ๋‹จ์— ๋งž์ถ”์–ด์„œ ์‚ฌ์šฉ์ž ํšŒ์‚ฌ์— ๋งž๊ฒŒ AI ๊ฐ€ ๋ฌธ์žฅ์„ ์ž‘์„ฑํ•ด์ฃผ๊ณ , cdp๋Œ€์‘ํ•˜๋Š” ๋ฌธ์žฅ๋“ค์„ ์ž‘์„ฑํ•˜๋Š” ํ”„๋กœ์ ํŠธ๋ฅผ ์‹œํ–‰ํ•˜๋ ค๊ณ  ํ•ด ํ›ˆ๋ จ ๊ธฐ๊ฐ„์€ 1๋‹ฌ ์ •๋„ ์ƒ๊ฐํ•ด. ๊ทธ๋ฆฌ๊ณ  ํ›ˆ๋ จ ํ›„์˜ ์„ฑ๊ณผ๋ณด๋‹ค๋Š” ์ง„ํ–‰๊ณผ์ •์—์„œ ๋ถ€ํ•˜๊ฐ€ ๊ฑธ๋ฆฌ์ง€ ์•Š๊ธฐ๋ฅผ ๋ฐ”๋ž˜. ์ด๋•Œ , ์œ„์˜ ๋งฅ๋ฝ์—์„œ ์–ด๋А ๋ชจ๋ธ์ด ๊ฐ€์žฅ ํ•ฉ๋‹นํ• ๊นŒ ? KT Mi:dm 2.0 Mini-Instruct, Polyglot-Ko 5.8B๋‚˜ Llama-2-ko 7B ์ค‘์—์„œ ์–ด๋А ๊ฒƒ์„ ์ถ”์ฒœํ•˜๋Š”๊ฐ€ ?

 

 

**gpt

 

์•„์ฃผ ์ข‹์€ ๊ธฐํš์ด์‹ญ๋‹ˆ๋‹ค. ๋ง์”€ ์ฃผ์‹  ์กฐ๊ฑด์„ ์ข…ํ•ฉํ•˜๋ฉด **“์„ฑ๊ณผ๋ณด๋‹ค ์•ˆ์ •์ ์ธ ์ง„ํ–‰ + RTX 3050 + PEFT + ํ•œ๊ตญ์–ด ESG/IFRS/CDP ๋ฌธ์„œ ์ƒ์„ฑ”**์ด ํ•ต์‹ฌ์ž…๋‹ˆ๋‹ค.
๊ฒฐ๋ก ๋ถ€ํ„ฐ ๋ง์”€๋“œ๋ฆฌ๋ฉด KT Mi:dm 2.0 Mini-Instruct๋ฅผ ๊ฐ€์žฅ ์ถ”์ฒœ๋“œ๋ฆฝ๋‹ˆ๋‹ค.

์•„๋ž˜์—์„œ ์™œ ๊ทธ๋Ÿฐ์ง€, ๊ทธ๋ฆฌ๊ณ  ๋‹ค๋ฅธ ๋ชจ๋ธ์ด ์™œ ๋œ ์ ํ•ฉํ•œ์ง€๋ฅผ ํ˜„์‹ค์ ์œผ๋กœ ์„ค๋ช…๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค.


โœ… ํ•ต์‹ฌ ์š”์•ฝ (๋จผ์ € ๊ฒฐ๋ก )

RTX 3050 / 1๊ฐœ์›” / PEFT / ๋ฌธ์„œ ํŠนํ™” / ์•ˆ์ •์„ฑ ์ค‘์‹œ๋ผ๋ฉด

๐Ÿ‘‰ KT Mi:dm 2.0 Mini-Instruct โญโญโญโญ (์ตœ์ )
๐Ÿ‘‰ Polyglot-Ko 5.8B โญโญ
๐Ÿ‘‰ Llama-2-ko 7B โญ (๋น„์ถ”์ฒœ)


๐Ÿ“Œ ์š”๊ตฌ ์กฐ๊ฑด ๋‹ค์‹œ ์ •๋ฆฌ

์งˆ๋ฌธ ์ฃผ์‹  ๋งฅ๋ฝ์„ ๊ธฐ์ค€์œผ๋กœ ๋ณด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

  • GPU: RTX 3050 (VRAM 8GB ์ˆ˜์ค€ ๊ฐ€์ •)
  • ํ•™์Šต ๋ฐฉ์‹: PEFT (LoRA / QLoRA)
  • ๋ฐ์ดํ„ฐ: ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ 10~30๊ฑด
  • ๋ชฉ์ :
    • IFRS ๊ธฐ์ค€ ๋ฌธ๋‹จ ๊ตฌ์กฐ์— ๋งž๋Š” ๋ฌธ์žฅ ์ƒ์„ฑ
    • ์‚ฌ์šฉ์ž ํšŒ์‚ฌ ๋งž์ถค ESG ๋ฌธ์žฅ
    • CDP ๋Œ€์‘ ๋ฌธ์žฅ ์ž๋™ ์ž‘์„ฑ
  • ์ค‘์š” ํฌ์ธํŠธ:
    • ํ›ˆ๋ จ ๊ณผ์ •์—์„œ GPU/์‹œ์Šคํ…œ ๋ถ€ํ•˜ ์ตœ์†Œํ™”
    • ์žฅ์‹œ๊ฐ„ ์•ˆ์ •์  ํ•™์Šต (1๊ฐœ์›”)
    • ํ•œ๊ตญ์–ด ๋ฌธ์„œ ํ’ˆ์งˆ

๐Ÿฅ‡ 1์œ„: KT Mi:dm 2.0 Mini-Instruct (๊ฐ•๋ ฅ ์ถ”์ฒœ)

โœ” ์™œ ๊ฐ€์žฅ ์ ํ•ฉํ•œ๊ฐ€?

1๏ธโƒฃ ๋ชจ๋ธ ํฌ๊ธฐ & ๊ตฌ์กฐ๊ฐ€ RTX 3050์— ๋”ฑ ๋งž์Œ

  • Mini ๋ฒ„์ „์€ ๊ฒฝ๋Ÿ‰ํ™” + Instruct ํŠœ๋‹ ์™„๋ฃŒ
  • QLoRA + LoRA ์กฐํ•ฉ ์‹œ OOM ์œ„ํ—˜ ๋งค์šฐ ๋‚ฎ์Œ
  • VRAM 8GB์—์„œ๋„ batch size ์•ˆ์ •์  ์œ ์ง€ ๊ฐ€๋Šฅ

๐Ÿ‘‰ “ํ•™์Šตํ•˜๋‹ค ํ„ฐ์ง€๋Š” ์ƒํ™ฉ”์„ ๊ฑฐ์˜ ํ”ผํ•  ์ˆ˜ ์žˆ์Œ


2๏ธโƒฃ ํ•œ๊ตญ์–ด ‘๊ณต์‹ ๋ฌธ์„œ์ฒด’์— ๊ฐ•ํ•จ

  • ESG / ๊ณต๊ณต / ๊ธฐ์—… ๋ฌธ์„œ ์Šคํƒ€์ผ์— ์œ ๋ฆฌ
  • IFRS ๋ฌธ๋‹จ ํŠน์œ ์˜:
    • ์ค‘๋ฆฝ์  ํ‘œํ˜„
    • ์กฐ๊ฑด·๊ทผ๊ฑฐ ์ค‘์‹ฌ ๋ฌธ์žฅ
    • ๋ฐ˜๋ณต ๊ตฌ์กฐ

์ด ๋ถ€๋ถ„์—์„œ Polyglot๋ณด๋‹ค ๋ฌธ์žฅ ์•ˆ์ •์„ฑ์ด ๋†’์Œ


3๏ธโƒฃ Instruct ๋ชจ๋ธ์ด๋ผ ํ›„์ฒ˜๋ฆฌ ๋ถ€๋‹ด ↓

  • ์‚ฌ์šฉ์ž ์ž…๋ ฅ
    → “์šฐ๋ฆฌ ํšŒ์‚ฌ๋Š” ์ œ์กฐ์—…์ด๊ณ  Scope 3 ๋ฐฐ์ถœ์ด ์ค‘์š”ํ•จ”
  • ์ถœ๋ ฅ
    → ๋ฐ”๋กœ ๋ณด๊ณ ์„œ ๋ฌธ๋‹จ ํ˜•ํƒœ๋กœ ์ƒ์„ฑ ๊ฐ€๋Šฅ

๐Ÿ‘‰ ๋ณ„๋„ ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง ๋ถ€๋‹ด์ด ์ ์Œ
๐Ÿ‘‰ “์ง„ํ–‰ ๊ณผ์ •์—์„œ ๋ถ€ํ•˜๊ฐ€ ์ ๋‹ค”๋Š” ์š”๊ตฌ์— ์ •ํ™•ํžˆ ๋ถ€ํ•ฉ


4๏ธโƒฃ 10~30๊ฑด ์†Œ๋Ÿ‰ ๋ฐ์ดํ„ฐ์— ์ ํ•ฉ

  • ๋Œ€๊ทœ๋ชจ ํ•™์Šต ํ•„์š” ์—†์Œ
  • **๋„๋ฉ”์ธ ์ ์‘ํ˜• ๋ฏธ์„ธ์กฐ์ •(DA-PEFT)**์— ์ž˜ ๋งž์Œ
  • ๊ณผ์ ํ•ฉ ์œ„ํ—˜๋„ ์ƒ๋Œ€์ ์œผ๋กœ ๋‚ฎ์Œ

๐Ÿฅˆ 2์œ„: Polyglot-Ko 5.8B

โœ” ์žฅ์ 

  • ์ˆœ์ˆ˜ ํ•œ๊ตญ์–ด ์ดํ•ด๋ ฅ์€ ๋งค์šฐ ์ข‹์Œ
  • ๊ธฐ์ˆ ์  ์šฉ์–ด, ์žฅ๋ฌธ ์ดํ•ด๋ ฅ ์šฐ์ˆ˜

โŒ ๋‹จ์  (์ค‘์š”)

  • Base ๋ชจ๋ธ ์„ฑ๊ฒฉ → Instruct ์•„๋‹˜
  • ๋ณด๊ณ ์„œ ๋ฌธ์žฅ ์ƒ์„ฑ ์‹œ:
    • ํ†ค์ด ํ”๋“ค๋ฆผ
    • ๊ตฌ์–ด์ฒด/์„ค๋ช…์ฒด๋กœ ํ๋ฅด๊ธฐ ์‰ฌ์›€
  • RTX 3050์—์„œ:
    • batch size ๋งค์šฐ ์ž‘๊ฒŒ ์จ์•ผ ํ•จ
    • ํ•™์Šต ์•ˆ์ •์„ฑ ↓

๐Ÿ‘‰ “์„ฑ๊ณผ๋ณด๋‹ค ์•ˆ์ •์„ฑ”์„ ์ค‘์‹œํ•˜์‹ ๋‹ค๋ฉด ์• ๋งคํ•œ ์„ ํƒ


๐Ÿฅ‰ 3์œ„: Llama-2-ko 7B (๋น„์ถ”์ฒœ)

โŒ ์ด์œ 

  • ๋ชจ๋ธ ํฌ๊ธฐ ์ž์ฒด๊ฐ€ RTX 3050์— ๊ณผ๋ถ€ํ•˜
  • QLoRA ์‚ฌ์šฉํ•ด๋„:
    • VRAM ๋งˆ์ง„ ๊ฑฐ์˜ ์—†์Œ
    • ํ•™์Šต ์ค‘ ์ค‘๋‹จ ๊ฐ€๋Šฅ์„ฑ ๋†’์Œ
  • ํ•œ๊ตญ์–ด ๋ณด๊ณ ์„œ ํ†ค:
    • ๋ฒˆ์—ญ์ฒด ๋А๋‚Œ
    • IFRS ๋ฌธ๋‹จ ๊ตฌ์กฐ์— ๋œ ๋งž์Œ

๐Ÿ‘‰ “1๋‹ฌ ๋™์•ˆ ์•ˆ์ •์ ์œผ๋กœ ๋Œ๋ฆฐ๋‹ค”๋Š” ๋ชฉํ‘œ์™€ ์ •๋ฉด ์ถฉ๋Œ

 

 


์ถ”์ฒœ ๋ชจ๋ธ: KT Mi:dm 2.0 Mini-Instruct

RTX 3050(๋Œ€๋ถ€๋ถ„ laptop ๋ฒ„์ „์€ 4GB VRAM)์—์„œ PEFT(QLoRA ๋“ฑ)๋กœ fine-tuning์„ ํ•  ๋•Œ, ๋ถ€ํ•˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๊ฒƒ์ด ์ตœ์šฐ์„ ์ด๋ผ๋ฉด **KT Mi:dm 2.0 Mini-Instruct(2.3B ํŒŒ๋ผ๋ฏธํ„ฐ)**๋ฅผ ๊ฐ€์žฅ ๊ฐ•๋ ฅํžˆ ์ถ”์ฒœํ•ฉ๋‹ˆ๋‹ค.

์ด์œ  ์š”์•ฝ

  • ๋ชจ๋ธ ํฌ๊ธฐ์™€ VRAM ๋ถ€ํ•˜
    • KT Mi:dm 2.0 Mini-Instruct: 2.3B ํŒŒ๋ผ๋ฏธํ„ฐ → QLoRA fine-tuning ์‹œ 4GB VRAM์—์„œ๋„ ์ถฉ๋ถ„ํžˆ ์•ˆ์ •์ ์œผ๋กœ ํ•™์Šต ๊ฐ€๋Šฅ(์‹ค์ œ ์‚ฌ๋ก€ ๋‹ค์ˆ˜). ๋ฉ”๋ชจ๋ฆฌ ์—ฌ์œ ๊ฐ€ ์ปค์„œ ๋ฐฐ์น˜ ์‚ฌ์ด์ฆˆ๋ฅผ ํฌ๊ฒŒ ์žก์„ ์ˆ˜ ์žˆ๊ณ , OOM(Out of Memory) ์œ„ํ—˜์ด ๊ฑฐ์˜ ์—†์Œ.
    • Polyglot-Ko 5.8B: 5.8B ํŒŒ๋ผ๋ฏธํ„ฐ → 4GB VRAM์—์„œ๋Š” QLoRA๋ผ๋„ ๊ฐ„์‹ ํžˆ ๊ฐ€๋Šฅํ•˜๊ฑฐ๋‚˜ ๋ถˆ์•ˆ์ •(๋ฐฐ์น˜ ์‚ฌ์ด์ฆˆ 1~2๋กœ ์ œํ•œ, ํ•™์Šต ์†๋„ ๋А๋ฆผ).
    • Llama-2-ko 7B: 7B ํŒŒ๋ผ๋ฏธํ„ฐ → 4GB VRAM์—์„œ๋Š” QLoRA๋กœ๋„ ๋งค์šฐ ํž˜๋“ค๊ฑฐ๋‚˜ ๋ถˆ๊ฐ€๋Šฅ(๋Œ€๋ถ€๋ถ„ 8~12GB ์ด์ƒ ๊ถŒ์žฅ). ๋ถ€ํ•˜๊ฐ€ ๊ฐ€์žฅ ํฌ๊ณ  ํ•™์Šต ์ค‘ ์ถฉ๋Œ ์œ„ํ—˜ ๋†’์Œ.
  • ํ•™์Šต ๊ณผ์ • ๋ถ€ํ•˜ ์ตœ์†Œํ™” (์‚ฌ์šฉ์ž ์ตœ์šฐ์„  ์š”๊ตฌ)
    • ๋ฐ์ดํ„ฐ๊ฐ€ 10~30๊ฑด ๋ณด๊ณ ์„œ(์ƒ๋Œ€์ ์œผ๋กœ ์ ์€ ์–‘)์ด๊ณ  ํ›ˆ๋ จ ๊ธฐ๊ฐ„์ด 1๋‹ฌ ์ •๋„๋กœ ์—ฌ์œ ๋กญ๊ธฐ ๋•Œ๋ฌธ์—, ์ž‘์€ ๋ชจ๋ธ์ด ํ›จ์”ฌ ๋น ๋ฅด๊ณ  ์•ˆ์ •์ ์ž…๋‹ˆ๋‹ค. 2.3B ๋ชจ๋ธ์€ ํ•˜๋ฃจ~๋ช‡ ์ผ ๋งŒ์— ์—ฌ๋Ÿฌ epoch ๋Œ๋ฆด ์ˆ˜ ์žˆ์–ด ๋ถ€ํ•˜๊ฐ€ ๊ฑฐ์˜ ์—†์Œ.
    • 5.8B/7B ๋ชจ๋ธ์€ epoch๋‹น ์‹œ๊ฐ„์ด 2~3๋ฐฐ ์ด์ƒ ๊ฑธ๋ฆฌ๊ณ , VRAM ํ•œ๊ณ„๋กœ ์ธํ•ด ์ž์ฃผ ์žฌ์‹œ์ž‘ํ•˜๊ฑฐ๋‚˜ ์„ค์ • ํŠœ๋‹์ด ํ•„์š” → ์ง„ํ–‰ ๊ณผ์ •์—์„œ ์ŠคํŠธ๋ ˆ์Šค ํผ.
  • ํ•œ๊ตญ์–ด ์„ฑ๋Šฅ ๋ฐ ์ž‘์—… ์ ํ•ฉ์„ฑ
    • ์„ธ ๋ชจ๋ธ ๋ชจ๋‘ ํ•œ๊ตญ์–ด์— ๊ฐ•ํ•˜์ง€๋งŒ, Mi:dm 2.0 Mini๋Š” ์ตœ๊ทผ(2025๋…„) KT์—์„œ ๊ฐœ๋ฐœ๋œ ์ˆœ์ˆ˜ ํ•œ๊ตญ์–ด ํŠนํ™” ๋ชจ๋ธ๋กœ, Instruct ๋ฒ„์ „์ด ์žˆ์–ด ์ง€์‹œ์‚ฌํ•ญ(์˜ˆ: IFRS/CDP ๋ฌธ๋‹จ ๋งž์ถค ์ƒ์„ฑ)์— ๋ฐ”๋กœ ์ž˜ ๋ฐ˜์‘ํ•ฉ๋‹ˆ๋‹ค.
    • Polyglot-Ko์™€ Llama-2-ko๋Š” ์ข‹์€ ๊ธฐ๋ฐ˜์ด์ง€๋งŒ ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ์ปค์„œ ์ž‘์€ ๋ฐ์ดํ„ฐ์…‹์—์„œ ๊ณผ์ ํ•ฉ ์œ„ํ—˜์ด ์ƒ๋Œ€์ ์œผ๋กœ ๋†’๊ณ , ์ง€์†๊ฐ€๋Šฅ๊ฒฝ์˜๋ณด๊ณ ์„œ ๊ฐ™์€ ์ „๋ฌธ ๋„๋ฉ”์ธ์—์„œ Mi:dm Mini๊ฐ€ ๋” ๊ฐ€๋ณ๊ฒŒ ์ ์‘ํ•  ๊ฐ€๋Šฅ์„ฑ ๋†’์Œ.
  • ํ›ˆ๋ จ ํ›„ ์„ฑ๊ณผ ๊ณ ๋ ค(๋ถ€์ฐจ์ )
    • ๋ฐ์ดํ„ฐ ์–‘์ด ์ ๊ธฐ ๋•Œ๋ฌธ์— 7B๊ธ‰ ๋Œ€ํ˜• ๋ชจ๋ธ์ด ๊ผญ ๋” ์ข‹์€ ๊ฒฐ๊ณผ ๋‚ด๋Š” ๊ฑด ์•„๋‹˜. 2.3B๋ผ๋„ ๋„๋ฉ”์ธ ํŠนํ™” fine-tuning ํ›„ ์ถฉ๋ถ„ํžˆ ์‹ค๋ฌด ์ˆ˜์ค€ ๋ฌธ์žฅ ์ƒ์„ฑ ๊ฐ€๋Šฅ(ํŠนํžˆ ๋ณด๊ณ ์„œ ์Šคํƒ€์ผ ํ…์ŠคํŠธ๋Š” ํŒจํ„ด์ด ๋ช…ํ™•ํ•จ).

์‹ค์ „ ํŒ (RTX 3050 4GB ๊ธฐ์ค€)

  • QLoRA ์„ค์ • ์ถ”์ฒœ: bitsandbytes 4-bit quantization + LoRA r=16~32, alpha=32, dropout=0.05 ์ •๋„๋กœ ์‹œ์ž‘.
  • ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ: peft + transformers + accelerate ์‚ฌ์šฉ. Unsloth ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์“ฐ๋ฉด ์†๋„ 2๋ฐฐ ์ด์ƒ ๋นจ๋ผ์ง(3050์—์„œ๋„ ์ž˜ ๋™์ž‘).
  • ์˜ˆ์ƒ ํ•™์Šต ์‹œ๊ฐ„: 2.3B ๋ชจ๋ธ → 10~30๊ฑด ๋ฐ์ดํ„ฐ๋กœ 1~3์ผ ๋‚ด ์ถฉ๋ถ„ (1๋‹ฌ ์—ฌ์œ  ์žˆ์œผ๋‹ˆ ์—ฌ๋Ÿฌ ์‹คํ—˜ ๊ฐ€๋Šฅ).

๋งŒ์•ฝ VRAM์ด 6~8GB์ธ desktop RTX 3050์ด๋ผ๋ฉด 5.8B๋„ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ์ง€๋งŒ, ๋ถ€ํ•˜ ์ตœ์†Œํ™” ์šฐ์„ ์ด๋ผ๋ฉด ์—ฌ์ „ํžˆ Mi:dm 2.0 Mini๊ฐ€ ์ตœ์ ์ž…๋‹ˆ๋‹ค. Hugging Face์—์„œ "K-intelligence/Midm-2.0-Mini-Instruct"๋กœ ๋ฐ”๋กœ ๋‹ค์šด๋กœ๋“œ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค!

 

 

 

 

 

 

 

 

'Project ESG+AI > [์‚ผ์ •KPMG]ESG ๋ฐ์ดํ„ฐ ํ™œ์šฉ ํ’€์Šคํ… ๊ฐœ๋ฐœ' ์นดํ…Œ๊ณ ๋ฆฌ์˜ ๋‹ค๋ฅธ ๊ธ€

51์ผ์ฐจ.  (0) 2025.12.24
49์ผ์ฐจ.  (0) 2025.12.19
46์ผ์ฐจ.  (1) 2025.12.16
45์ผ์ฐจ.  (0) 2025.12.15
44์ผ์ฐจ.  (0) 2025.12.15