
RAG(Retrieval-Augmented Generation)๋?
RAG๋ ๊ฒ์ ์ฆ๊ฐ ์์ฑ์ด๋ผ๋ ๊ธฐ์ ๋ก, ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ด ๋ต๋ณ์ ์์ฑํ ๋ ์ธ๋ถ ์ง์ ๋ฒ ์ด์ค(์: ๋ฌธ์, ๋ฐ์ดํฐ๋ฒ ์ด์ค)์์ ๊ด๋ จ ์ ๋ณด๋ฅผ ์ค์๊ฐ์ผ๋ก ๊ฒ์(Retrieval)ํ์ฌ ํ๋กฌํํธ์ ์ถ๊ฐ(Augmented)ํ ํ ์๋ต์ ์์ฑ(Generation)ํ๋ ๋ฐฉ์์ ๋๋ค.
- ์ฃผ์ ์๋ ์๋ฆฌ:
- ์ฌ์ฉ์์ ์ง๋ฌธ์ ๋ฐ์ผ๋ฉด, ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๋ฑ์์ ๊ด๋ จ ๋ฌธ์๋ฅผ ๊ฒ์ํฉ๋๋ค.
- ๊ฒ์๋ ์ ๋ณด๋ฅผ ํ๋กฌํํธ์ ์ถ๊ฐํ์ฌ LLM์ด ๋ ์ ํํ๊ณ ์ต์ ์ ๋ณด๋ฅผ ๋ฐํ์ผ๋ก ๋ต๋ณํ๋๋ก ํฉ๋๋ค.
- ์ฅ์ :
- ์ต์ ์ ๋ณด ๋ฐ์์ด ์ฝ์ต๋๋ค. (๋ฐ์ดํฐ๋ฒ ์ด์ค๋ง ์ ๋ฐ์ดํธํ๋ฉด ๋จ)
- ํ๊ฐ(hallucination, ์๋ชป๋ ์ ๋ณด ์์ฑ) ๊ฐ์.
- ๋ชจ๋ธ ์์ฒด๋ฅผ ์์ ํ์ง ์์ผ๋ฏ๋ก ๋น์ฉ์ด ์ ๊ฒ ๋ค๊ณ , ๊ตฌํ์ด ์๋์ ์ผ๋ก ๊ฐ๋จํฉ๋๋ค.
- ๋จ์ :
- ๊ฒ์ ํ์ง์ ๋ฐ๋ผ ์ฑ๋ฅ์ด ์ข์ฐ๋ฉ๋๋ค. (์๋ชป๋ ๋ฌธ์ ๊ฒ์ ์ ์ค๋ต ๊ฐ๋ฅ)
- ๋๋ฉ์ธ ํนํ๋ ์คํ์ผ์ด๋ ๋ณต์กํ ์ถ๋ก ์๋ ์ฝํ ์ ์์ต๋๋ค.
- ์ ํฉํ ๊ฒฝ์ฐ: ํ์ฌ ๋ด๋ถ ๋ฌธ์, ๋ด์ค, ์ค์๊ฐ ๋ฐ์ดํฐ๊ฐ ์์ฃผ ๋ณํ๋ ํ๊ฒฝ(์: ๊ณ ๊ฐ ์ง์ ์ฑ๋ด, FAQ ์์คํ ).
ํ์ธํ๋(Fine-tuning)์ด๋?
ํ์ธํ๋์ ๋ฏธ์ธ ์กฐ์ ์ผ๋ก, ์ด๋ฏธ ์ฌ์ ํ๋ จ๋ LLM(์: GPT ์๋ฆฌ์ฆ)์ ํน์ ๋๋ฉ์ธ์ด๋ ์์ ์ ๋ง๋ ๋ฐ์ดํฐ์ ์ผ๋ก ์ถ๊ฐ ํ์ต์์ผ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ(๊ฐ์ค์น)๋ฅผ ์กฐ์ ํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
- ์ฃผ์ ์๋ ์๋ฆฌ:
- ์ฌ์ ํ๋ จ๋ ๋ชจ๋ธ์ ์ ๋ฌธ ๋ฐ์ดํฐ(์: ์๋ฃ ๋ฌธ์, ๋ฒ๋ฅ ํ ์คํธ)๋ฅผ ์ ๋ ฅํด ์ฌํ์ตํฉ๋๋ค.
- ๋ชจ๋ธ์ด ํด๋น ๋๋ฉ์ธ์ ์ธ์ด ํจํด, ์คํ์ผ, ์ง์์ ๋ด๋ถ์ ์ผ๋ก ํ์ตํฉ๋๋ค.
- ์ต๊ทผ์๋ LoRA ๊ฐ์ ํจ์จ์ ๋ฐฉ๋ฒ(PEFT: Parameter-Efficient Fine-Tuning)์ผ๋ก ๋น์ฉ์ ์ค์ฌ ์ ์ฉํฉ๋๋ค.
- ์ฅ์ :
- ํน์ ์์ ์์ ๋์ ์ ํ๋์ ์ ๋ฌธ์ฑ์ ๋ฐํํฉ๋๋ค. (์: ์๋ฃ ๋ณด๊ณ ์ ์์ฑ, ๋ฒ๋ฅ ๋ถ์)
- ์๋ต ์คํ์ผ(ํค, ํ์)์ ์ธ๋ฐํ๊ฒ ๋ง์ถ ์ ์์ต๋๋ค.
- ์ธ๋ถ ๊ฒ์ ์์ด ๋น ๋ฅธ ์ถ๋ก ๊ฐ๋ฅ.
- ๋จ์ :
- ํ์ต ๋น์ฉ๊ณผ ์๊ฐ์ด ๋ง์ด ๋ญ๋๋ค. (GPU ์์ ํ์)
- ๋ฐ์ดํฐ ์ ๋ฐ์ดํธ ์ ์ฌํ์ตํด์ผ ํฉ๋๋ค. (์ต์ ์ ๋ณด ๋ฐ์ ์ด๋ ค์)
- ๊ณผ์ ํฉ(overfitting) ์ํ์ด ์์ต๋๋ค.
- ์ ํฉํ ๊ฒฝ์ฐ: ์ ์ ๋ฐ์ดํฐ๋ก ์ถฉ๋ถํ ์ ๋ฌธ ์์ (์: ํน์ ์ฐ์ ๋ณด๊ณ ์ ์์ฑ, ์คํ์ผ ๋ง์ถค ํ ์คํธ ์์ฑ).
RAG์ ํ์ธํ๋์ ์ฃผ์ ์ฐจ์ด์ ๋น๊ต
| ๊ธฐ๋ณธ ๋ฉ์ปค๋์ฆ | ์ธ๋ถ ๋ฐ์ดํฐ ๊ฒ์ ํ ํ๋กฌํํธ์ ์ถ๊ฐ | ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ ์ง์ ์ ๋ฐ์ดํธ |
| ์ง์ ์ ๋ฐ์ดํธ | ๋ฐ์ดํฐ๋ฒ ์ด์ค ์ถ๊ฐ/์์ ๋ง์ผ๋ก ์ค์๊ฐ ๊ฐ๋ฅ | ์ฌํ์ต ํ์ (๋น์ฉ/์๊ฐ ์๋ชจ) |
| ๋น์ฉ/๊ตฌํ ๋์ด๋ | ์๋์ ์ผ๋ก ์ ๋ ดํ๊ณ ์ฝ์ | ๋์ (ํ์ต ์์ ํ์) |
| ํ๊ฐ ๊ฐ์ | ํจ๊ณผ์ (์ธ๋ถ ์ฌ์ค ๊ธฐ๋ฐ) | ๋๋ฉ์ธ ๋ด์์ ํจ๊ณผ์ , ํ์ง๋ง ์ต์ ์ ๋ณด ์ฝํจ |
| ์ฑ๋ฅ ๊ฐ์ | ์ต์ /๋์ ์ ๋ณด ์ฒ๋ฆฌ | ๋๋ฉ์ธ ํนํ ์ถ๋ก ๋ฐ ์คํ์ผ ๋ง์ถค |
| ๋จ์ | ๊ฒ์ ์คํจ ์ ์ฑ๋ฅ ์ ํ | ์ง์ ๊ณ ์ , ์ ๋ฐ์ดํธ ์ด๋ ค์ |
| ํ์ด๋ธ๋ฆฌ๋ ์ฌ์ฉ | ๊ฐ๋ฅ (ํ์ธํ๋๋ ๋ชจ๋ธ + RAG) | ๊ฐ๋ฅ (RAG ๋ด์์ ํ์ธํ๋ ๋ชจ๋ธ ์ฌ์ฉ) |
RAG์ **ํ์ธํ๋(Fine-tuning)**์ ๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ค์ ์ ๋ฌด์ ๋ง๊ฒ ํ์ฉํ๋ ๋ํ์ ์ธ ๋ ๊ฐ์ง ๋ฐฉ๋ฒ์ด์์.
๋ง์ ๊ฒฝ์ฐ RAG๋ถํฐ ์์ํ๋ ๊ฒ ์ถ์ฒ๋ฉ๋๋ค. ๋น์ฉ์ด ์ ๊ณ ์ ์ฐํ๋ฉฐ, ๋ถ์กฑํ ๋ถ๋ถ(์: ์คํ์ผ ๋ง์ถค)์ด ์๊ธฐ๋ฉด ํ์ธํ๋์ ์ถ๊ฐ๋ก ์ ์ฉํ๋ ํ์ด๋ธ๋ฆฌ๋ ์ ๊ทผ(RAG + Fine-tuning)์ด ์ต์ ์ ์ฑ๋ฅ์ ๋ด๋ ๊ฒฝ์ฐ๊ฐ ๋ง์ต๋๋ค.
1๏ธโฃ RAG (Retrieval-Augmented Generation, ๊ฒ์ ์ฆ๊ฐ ์์ฑ)
๊ฐ๋
๋ชจ๋ธ์ด ๋ต๋ณ์ ๋ง๋ค๊ธฐ ์ ์ ์ธ๋ถ ๋ฌธ์๋ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ๊ด๋ จ ์ ๋ณด๋ฅผ ๊ฒ์ํ๊ณ ,
๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ๋ต๋ณ์ ์์ฑํ๋ ๋ฐฉ์์
๋๋ค.
์๋ ๋ฐฉ์
- ์ฌ์ฉ์๊ฐ ์ง๋ฌธ
- ์ง๋ฌธ๊ณผ ๊ด๋ จ๋ ๋ฌธ์๋ฅผ ๋ฒกํฐ DB ๋ฑ์์ ๊ฒ์
- ๊ฒ์๋ ๋ด์ฉ์ ํ๋กฌํํธ์ ํจ๊ป ๋ฃ์
- LLM์ด ๊ทธ ๋ด์ฉ์ ๊ทผ๊ฑฐ๋ก ๋ต๋ณ ์์ฑ
ํน์ง
- ๋ชจ๋ธ ์์ฒด๋ ๋ฐ๋์ง ์์
- ์ต์ ์ ๋ณด·์ฌ๋ด ๋ฌธ์ ๋ฐ์ ๊ฐ๋ฅ
- ํ๊ฐ(Hallucination) ๊ฐ์
- ๋ฌธ์ ์ถ์ฒ ์ ์ ๊ฐ๋ฅ
์์
- ์ฌ๋ด ๊ท์ Q&A ์ฑ๋ด
- ๋ ผ๋ฌธ/๋งค๋ด์ผ ๊ธฐ๋ฐ ์ง๋ฌธ ๋ต๋ณ ์์คํ
- ์ต์ ๋ด์ค ์์ฝ ์ฑ๋ด
์ฅ์
- ๋ฐ์ดํฐ ์ ๋ฐ์ดํธ๊ฐ ์ฌ์
- ๋น๊ต์ ์ ๋ ด
- ์ฌ์ค ๊ธฐ๋ฐ ๋ต๋ณ์ ๊ฐํจ
๋จ์
- ๊ฒ์ ํ์ง์ ๋ฐ๋ผ ์ฑ๋ฅ ์ข์ฐ
- ๋ฌธ๋งฅ์ด ๊ธด ๊ฒฝ์ฐ ํ๊ณ ์์
2๏ธโฃ ํ์ธํ๋ (Fine-tuning)
๊ฐ๋
๊ธฐ์กด LLM์ ํน์ ๋ฐ์ดํฐ๋ก ์ถ๊ฐ ํ์ต์์ผ
๋งํฌ, ์คํ์ผ, ํน์ ์์
์ํ ๋ฅ๋ ฅ์ ๊ฐ์ ํ๋ ๋ฐฉ์์
๋๋ค.
์๋ ๋ฐฉ์
- ์ ๋ ฅ-์ถ๋ ฅ ์ ๋ฐ์ดํฐ ์ค๋น
- ๋ชจ๋ธ์ด ๊ทธ ํจํด์ ํ์ต
- ์๋ก์ด ์ง๋ฌธ์๋ ๋น์ทํ ๋ฐฉ์์ผ๋ก ์๋ต
ํน์ง
- ๋ชจ๋ธ์ “์ฑํฅ”๊ณผ “๋ฅ๋ ฅ” ์์ฒด๋ฅผ ๋ณ๊ฒฝ
- ๋ฐ๋ณต๋๋ ์์ ์ด๋ ํน์ ํ์์ ๊ฐํจ
- ๊ฒ์ ์์ด๋ ์๋ต ๊ฐ๋ฅ
์์
- ๊ณ ๊ฐ ์๋ด ๋งํฌ ํต์ผ
- ํน์ ๋๋ฉ์ธ(๋ฒ๋ฅ , ์๋ฃ, ๊ฒ์ ๋ฑ) ๋ํ ์คํ์ผ
- ์ฝ๋ ์๋ ๋ณํ ๊ท์น ํ์ต
์ฅ์
- ์๋ต ์๋ ๋น ๋ฆ
- ์ผ๊ด๋ ๊ฒฐ๊ณผ
- ํ๋กฌํํธ๊ฐ ์งง์์ง
๋จ์
- ํ์ต ๋น์ฉ ํผ
- ์ต์ ์ ๋ณด ๋ฐ์ ์ด๋ ค์
- ๋ฐ์ดํฐ ์์ ์ ์ฌํ์ต ํ์
3๏ธโฃ RAG vs ํ์ธํ๋ ํ๋์ ๋น๊ต
| ๋ชจ๋ธ ๋ณ๊ฒฝ | โ | โ |
| ์ต์ ์ ๋ณด ๋ฐ์ | ๋งค์ฐ ์ฌ์ | ์ด๋ ค์ |
| ๋น์ฉ | ๋ฎ์ | ๋์ |
| ์ฌ์ค ๊ธฐ๋ฐ Q&A | โญโญโญโญโญ | โญโญ |
| ์คํ์ผ/๋งํฌ | โญโญ | โญโญโญโญโญ |
| ์ ์ง๋ณด์ | ์ฌ์ | ์ด๋ ค์ |
4๏ธโฃ ์ธ์ ๋ฌด์์ ์จ์ผ ํ ๊น?
- ์ฌ๋ด ๋ฌธ์, ๊ท์ , ๋งค๋ด์ผ, ์์ฃผ ๋ฐ๋๋ ์ ๋ณด → โ RAG
- ์ผ๊ด๋ ๋ต๋ณ ์คํ์ผ, ํน์ ์์ ์๋ํ → โ ํ์ธํ๋
- ์ค๋ฌด์์๋ → โญ RAG + ํ์ธํ๋ ์กฐํฉ์ด ๊ฐ์ฅ ๋ง์
QLoRA๋ ์์ํ๋ ์ ๋ญํฌ ํ๋ ฌ๋ก ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ต์ ํํ์ฌ, ํ๋์จ์ด ์์์ด ์ ํ๋ ์์ ์ ๋งค์ฐ ํจ์จ์ ์ ๋๋ค. ์ด๊ฒ๊ณผ LoRA์ ์ฐจ์ด์ ์ด ๋ฌด์์ธ๊ฐ
QLoRA๋ก ํจ์จ์ฑ์ ์ฑํํ๋ค
๐ซ LoRA (Low-Rank Adaptation)
LoRA๋ **'์ ๋ญํฌ ์ ์'**์ด๋ผ๋ ์ด๋ฆ์ฒ๋ผ, ๊ฑฐ๋ํ LLM์ ๋ชจ๋ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ค์ ํ์ต์ํค๋ ๋์ , ํน์ ๊ณ์ธต์ ์์ ์ ๋ญํฌ ํ๋ ฌ ์์ ์ถ๊ฐํด์ ํ์ตํ๋ ๋ฐฉ์์ด์ผ. ๋ง์น ๊ฑฐ๋ํ ๊ฑด๋ฌผ ์ ์ฒด๋ฅผ ๊ณ ์น๋ ๋์ , ํน์ ๋ฐฉ์ ์์ ์ ๊ฐ๊ตฌ๋ฅผ ๋ค์ฌ๋๋ ๊ฒ๊ณผ ๋น์ทํ๋ค๊ณ ๋ณผ ์ ์์ง!
LoRA์ ์ฅ์ :
- ์ ์ ๊ณ์ฐ๋: ์ ์ฒด ๋ชจ๋ธ์ ํ์ตํ๋ ๊ฒ๋ณด๋ค ํจ์ฌ ์ ์ ์์ ํ๋ผ๋ฏธํฐ๋ง ํ์ตํ๊ธฐ ๋๋ฌธ์ ๊ณ์ฐ ์์์ ํฌ๊ฒ ์ ์ฝํ ์ ์์ด.
- ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ฑ: ํ์ตํ ํ๋ผ๋ฏธํฐ ์๊ฐ ์ค์ด๋ค์ด GPU ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋๋ ๊ฐ์์์ผ์ค.
- ์ฑ๋ฅ ์ ์ง: ํ๋ผ๋ฏธํฐ ์๊ฐ ์ ์ด๋ ๊ธฐ์กด ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฑฐ์ ์ ์งํ๋ฉด์ ํน์ ์์ ์ ๋ง์ถฐ ๋ฏธ์ธ ์กฐ์ ์ ํ ์ ์๋จ๋ค.
โจ QLoRA (Quantized LoRA)
QLoRA๋ LoRA์์ ํ ๋ฐ ๋ ๋์๊ฐ **'์์ํ๋ LoRA'**๋ผ๊ณ ํ ์ ์์ด. ์ฝ๊ฒ ๋งํ๋ฉด, LoRA๊ฐ ์์ ๊ฐ๊ตฌ๋ฅผ ๋ค์ฌ๋๋ ๊ฑฐ์๋ค๋ฉด, QLoRA๋ ๊ทธ ์์ ๊ฐ๊ตฌ๋ง์ ๋ ํจ์ฌ ๋ ๊ฐ๋ณ๊ณ ์์ถ๋ ํํ๋ก ๋ง๋ค์ด์ ๋ค์ฌ๋๋ ๊ฑฐ์ผ!
QLoRA์ ํต์ฌ:
- 4๋นํธ NormalFloat (NF4) ์์ํ: ๊ฐ์ฅ ํฐ ํน์ง์ ๊ธฐ์กด์ 16๋นํธ๋ 32๋นํธ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ฅผ 4๋นํธ ๋ฐ์ดํฐ ํ์ ์ผ๋ก **์์ถ(์์ํ)**ํ๋ค๋ ์ ์ด์ผ. ์ด๋ ๊ฒ ํ๋ฉด ๋ชจ๋ธ ํฌ๊ธฐ๊ฐ ํ ์ค์ด๋ค๊ณ , ๋ฐ๋ผ์ GPU ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋๋ ์์ฒญ๋๊ฒ ์ ์ฝ๋ผ. 4๋นํธ ์์ํ๋ GPU ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ถ์กฑํ ๋ ํนํ ์ ์ฉํด์, OOM(Out Of Memory) ์ํฉ์ ๋ฐฉ์งํด ์ฃผ์ง!
- ๋๋ธ ์์ํ (Double Quantization): ์์ํ ๊ณผ์ ์ ํ ๋ฒ ๋ ์ ์ฉํด์, ์ ์ฅ ๊ณต๊ฐ์ ์ถ๊ฐ๋ก ์ค์ด๋ ๊ธฐ์ ์ด์ผ.
- ํ์ด์ง๋ ์ตํฐ๋ง์ด์ (Paged Optimizers): ๋ฉ๋ชจ๋ฆฌ ๊ด๋ฆฌ ๊ธฐ๋ฒ์ ํ์ฉํด์ GPU ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ถ์กฑํ ๊ฒฝ์ฐ CPU RAM์ด๋ ๋์คํฌ๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ์ ํ์ฅ์์ผ์ค.
QLoRA์ LoRA์ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์?
๊ฐ์ฅ ํต์ฌ์ ์ธ ์ฐจ์ด๋ ๋ฐ๋ก **"๋ชจ๋ธ์ ๋ฒ ์ด์ค ๊ฐ์ค์น(Base Weights)๋ฅผ ์ด๋ป๊ฒ ์ฒ๋ฆฌํ๋๋"**์ ์์ด!
- LoRA: ๋ชจ๋ธ์ ๋ฒ ์ด์ค ๊ฐ์ค์น๋ฅผ ์ผ๋ฐ์ ์ธ ๋ฐ์ดํฐ ํ์ (์: 16๋นํธ ๋ถ๋์์์ )์ผ๋ก ์ ์งํ๊ณ , ์ฌ๊ธฐ์ ์ ๋ญํฌ ํ๋ ฌ์ ์ถ๊ฐํ์ฌ ํ์ตํด.
- QLoRA: ๋ชจ๋ธ์ ๋ฒ ์ด์ค ๊ฐ์ค์น๋ฅผ 4๋นํธ๋ก ์์ํํด์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๊ทนํ์ผ๋ก ์ ์ฝํด. ๊ทธ๋ฆฌ๊ณ ์ด ์์ํ๋ ๋ฒ ์ด์ค ๋ชจ๋ธ ์์ LoRA ์ด๋ํฐ๋ฅผ ์ถ๊ฐํ์ฌ ํ์ตํ์ง.
๊ทธ๋์ QLoRA๋ LoRA๋ณด๋ค ํจ์ฌ ๋ ์ ์ GPU ๋ฉ๋ชจ๋ฆฌ๋ก๋ ๋๊ท๋ชจ LLM์ ๋ฏธ์ธ ์กฐ์ ํ ์ ์์ด. ํ๋์จ์ด ์์์ด ์ ํ์ ์ธ ํ๊ฒฝ์์๋ LLM ํ์ธํ๋์ ๊ฐ๋ฅํ๊ฒ ํด์ฃผ๋ ๊ฐ๋ ฅํ ๋ฐฉ๋ฒ์ด๋ผ๊ณ ํ ์ ์์ง!
QLoRA๋ "๋ ๊ฐ๋ณ๊ฒ, ๋ ์ ์ ์์์ผ๋ก๋ ํ์ธํ๋์!" ์ธ์น๋ ์น๊ตฌ๋ค์๊ฒ ๋ฑ ๋ง๋ ๊ธฐ์ ์ด๋ผ๊ณ ๋ณด๋ฉด ๋ผ!
ํ ๋ฌธ์ฅ์ผ๋ก ๋จผ์ ์ ๋ฆฌ
- LoRA: ํฐ AI ๋ชจ๋ธ์ “์์ ๋ฉ๋ชจ”๋ง ๋ถ์ฌ์ ๊ณต๋ถ์ํค๋ ๋ฐฉ๋ฒ
- QLoRA: ๊ทธ ํฐ ๋ชจ๋ธ์ “์์ถ(์์ํ)”ํด ๋๊ณ , ๊ฑฐ๊ธฐ์ ์์ ๋ฉ๋ชจ๋ฅผ ๋ถ์ฌ ๊ณต๋ถ์ํค๋ ๋ฐฉ๋ฒ
๋น์ ๋ก ์ค๋ช ํด ๋ณผ๊ฒ์ ๐
๐ง AI ๋ชจ๋ธ = ๋๊บผ์ด ๊ต๊ณผ์
๐น LoRA
- ๊ต๊ณผ์๋ ๊ทธ๋๋ก ๋
- ์ค์ํ ๋ด์ฉ๋ง ์์ ํฌ์คํธ์์ ์ ์ด์ ๋ถ์
- → ํฌ์คํธ์๋ง ์์ ํ๋ ๊ณต๋ถ๋์ด ์ค์ด๋ฆ
- โ ํ์ง๋ง ๊ต๊ณผ์ ์์ฒด๊ฐ ๋๋ฌด ๋๊บผ์ฐ๋ฉด ๋ค๊ณ ๋ค๋๊ธฐ ํ๋ฆ (GPU ๋ฉ๋ชจ๋ฆฌ ๋ง์ด ํ์)
๐น QLoRA
- ๊ต๊ณผ์๋ฅผ ์์ถํด์ ๊ฐ๋ณ๊ฒ ๋ง๋ฆ (4-bit ์์ํ)
- ๊ทธ ์์ ํฌ์คํธ์(LoRA) ๋ถ์ฌ์ ๊ณต๋ถ
- → ํจ์ฌ ๊ฐ๋ฒผ์์ง
- → ๋ ธํธ๋ถ์ด๋ ์ผ๋ฐ GPU์์๋ ๊ฐ๋ฅ
์ง์ง ์ค์ํ ์ฐจ์ด ๋ฑ 3๊ฐ๋ง
| ๋ชจ๋ธ ํฌ๊ธฐ | ํผ | ์์ฃผ ์์์ง |
| GPU ์๊ตฌ | ๋์ | ๋ฎ์ |
| ์ด๋ณด์/๊ฐ์ธ์ฉ | โ | โ ๋งค์ฐ ์ ํฉ |
์คํดํ๊ธฐ ์ฌ์ด ์ โ ๏ธ
โ “QLoRA๋ ์ ๋ญํฌ ํ๋ ฌ์ ์์ํํ๋ค”
โญ ์๋์์!
โ ์์ถ๋๋ ๊ฑด ‘์๋ ๋ชจ๋ธ’
โ LoRA ๋ถ๋ถ์ ๊ทธ๋๋ก ๊ณ ๊ธ ํ์ง๋ก ํ์ต
์ธ์ ์ด๋ค ๊ฑธ ์ฐ๋ฉด ๋ ๊น?
- ๐ค ํฐ ๋ชจ๋ธ์ ์กฐ๊ธ๋ง ๊ณ ์น๊ณ ์ถ๋ค → LoRA
- ๐ป GPU๊ฐ ์ฝํ๋ค / ๋ ธํธ๋ถ·Colab์ด๋ค → QLoRA
rtx 3050์์ ์ฝ์ํ์นด๋ฅผ ํํํธ๋ก ํ์ตํ๋ ค๊ณ ํด.
Polyglot-Ko 5.8B๋ Llama-2-ko 7B ์ค์์ ์ด๋ ๊ฒ์ ์ถ์ฒํ๋๊ฐ ?
๐ง 1. ๊ธฐ๋ณธ ๋ชจ๋ธ ํน์ฑ ๋น๊ต
๐น Polyglot-Ko 5.8B
- ํ๊ตญ์ด๋ง ๋๊ท๋ชจ๋ก ํ์ต๋ ํ๊ตญ์ด ํนํ LLM์ ๋๋ค.
- EleutherAI์ Polyglot-Ko ํ๋ก์ ํธ ๊ธฐ๋ฐ์ผ๋ก, 863 GB ์ด์์ ํ๊ตญ์ด ๋ฐ์ดํฐ๋ก ํ์ต๋จ.AIBase
- ํ๊ตญ์ด ํ ์คํธ ์์ฑ, ์ดํด, ๋ช ๋ น์ด ๋ฐ์ ๋ฑ ํ๊ตญ์ด ์ค์ฌ ์์ ์์ ์๋์ ์ผ๋ก ๊ฐ์ ์ด ์์.AIBase
- fine-tuned ๋ณํ(์: KoAlpaca-Polyglot 5.8B)๋ ์์ด ํ๊ตญ์ด ์ง์ ์ํ ์ฑ๋ฅ์ ๋ ๋์ธ ๋ฒ์ ์ด ์กด์ฌํฉ๋๋ค.LLM Explorer
๐ ์ฅ์
- ํ๊ตญ์ด ๋ฌธํ·๋ฌธ๋งฅ ์ดํด๊ฐ ์๋์ ์ผ๋ก ์ข๋ค๋ ํ๊ฐ๊ฐ ๋ง์.๋น๊ทผ๊ณผ ํ ๋งํ
- ํ๊ตญ์ด ํ ์คํธ ์์ฑ์ด ์์ฐ์ค๋ฝ๊ณ ์ค์ ํ์ฉ ์ ๋น๊ต์ ์์ ์ .
๐ ๋จ์
- ์์ด๋ ๋ค๊ตญ์ด ์์ ์์๋ ์ ํ์ ์ผ ์ ์์.
- ์ฑ๋ฅ ์งํ๊ฐ Llama ๊ณ์ด์ฒ๋ผ ํญ๋์ ๋ฒค์น๋งํฌ์์ ํ๊ฐ๋ ์๋ฃ๊ฐ ๋ง์ง ์์.
๐น Llama-2-Ko 7B
- Meta์ Llama-2 ๋ชจ๋ธ์ ๊ธฐ๋ฐ์ผ๋ก ํ๊ตญ์ด์ฉ์ผ๋ก ํ์ฅ ๋ฐ ์ถ๊ฐ ํ์ต๋ ๋ฒ์ ์ ๋๋ค.Hugging Face
- ํ๊ตญ์ด ํ ํฌ๋์ด์ ํ์ฅ(46,336 ํ ํฐ)์ผ๋ก ํ๊ตญ์ด ์ด์ /ํํ์ ์ฒ๋ฆฌ ๋ฅ๋ ฅ์ ๊ฐ์ .Skywork
๐ ์ฅ์
- **๋ ํฐ ํ๋ผ๋ฏธํฐ ์(7B)**๋ก ์ธํด ์ผ๋ฐ์ ์ธ ์ธ์ด ์ดํด ๋ฅ๋ ฅ์ด ๋๊ณ ๋ค์ํจ.Hugging Face
- ๋ค์ํ downstream task(์์ฝ, ๋ฒ์ญ, ์ ๋ณด์ถ์ถ, ์ง์์๋ต ๋ฑ)์์๋ ๊ท ํ ์กํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค.
- ์์ด ํฌํจํด ๋ค๊ตญ์ด ์ฒ๋ฆฌ๋ ๋น๊ต์ ๊ฐ์ ์ด ์์.
๐ ๋จ์
- ํ๊ตญ์ด ํนํ ์ ๋๋ Polyglot-Ko๋ณด๋ค ๋ฎ๋ค๋ ํ๊ฐ๊ฐ ์ผ๋ถ ์กด์ฌํจ. (๋ชจ๋ธ์ด ๋ค๊ตญ์ด๋ฅผ ํฌํจํด ํ์ต๋ ํน์ฑ ๋๋ฌธ)๋น๊ทผ๊ณผ ํ ๋งํ
- ๋ฒค์น๋งํฌ์ ๋ฐ๋ผ ํ๊ตญ์ด ํน์ ๊ณผ์ ์์ Polyglot-Ko๊ฐ ์๋์ ์ผ๋ก ์ฐ์๋ผ๋ ํ๊ฐ๋ ์์.
๐ 2. ์ฑ๋ฅ ๋ฐ ๋ฒค์น๋งํฌ ๊ด์
๐ ์ฌ๋ฌ ๋น๊ณต์ ๋น๊ต์์:
- ํ๊ตญ์ด ํน์ benchmark (์: NSMC, KOBEST) ๊ธฐ์ค์ผ๋ก Polyglot-Ko 5.8B๊ฐ ์ผ๋ถ ํ๊ตญ์ด ์์ ์์ ๋ ์ฐ์๋ผ๋ ๊ฒฝํ์ ํ๊ฐ ๋ณด๊ณ ๊ฐ ์์.๋น๊ทผ๊ณผ ํ ๋งํ
- ๋ฐ๋ฉด Llama-2-Ko 7B๋ ํ๊ตญ์ด๋ ์ ์ฒ๋ฆฌํ๋ฉด์ ์ ๋ฐ์ ์ธ ์ธ์ด ์ดํด·์์ฑ ๋ฅ๋ ฅ์ด ๋ ๋์ ์คํํธ๋ผ์ ์ปค๋ฒํจ.Hugging Face
- ํ ์ฐ๊ตฌ์์๋ Polyglot-๊ณ์ด์ด ํ๊ตญ์ด ์ค์ฌ Bench์์ Llama ๊ณ์ด๋ณด๋ค ์ข์ ๊ฒฝ์ฐ๊ฐ ๋ง๋ค๋ ๊ฒฐ๊ณผ๊ฐ ๋ณด๊ณ ๋๊ธฐ๋ ํ์ต๋๋ค.arXiv
๋จ, ๊ณต๊ฐ๋ ํ์ค ๋ฒค์น๋งํฌ ์๋ฃ๊ฐ ์ ํ์ ์ด๊ณ , ๋ชจ๋ธ ์ค์ /ํ๋์ ๋ฐ๋ผ ๊ฒฐ๊ณผ๊ฐ ๋ฐ๋ ์ ์์ต๋๋ค.
๐ 3. ์ธ์ ์ด๋ค ๋ชจ๋ธ์ ์ ํํด์ผ ํ ๊น?
โ ํ๊ตญ์ด ์ค์ฌ ์์ ์ฐ์ ์ด๋ผ๋ฉด
๐ Polyglot-Ko 5.8B
- ํ๊ตญ์ด ์์ฑ/๋ํ/๋ฌธํ์ ๋งฅ๋ฝ ํฌํจํ ํ ์คํธ ์์ฑ
- ํ๊ตญ์ด NLP task (์์ฝ, ๊ฐ์ ๋ถ์, ๋ช ๋ น ์ํ ๋ฑ) ์ค์ฌ
โ ๋ ๋์ ํ์ฉ, ๋ค๊ตญ์ด ๋๋ ๋ณตํฉ ์์ ์ด๋ผ๋ฉด
๐ Llama-2-Ko 7B
- ์์ด + ํ๊ตญ์ด ํผํฉ ์ ๋ ฅ/์ถ๋ ฅ
- ๊ธฐ์ ๋ฌธ์ ์์ฝ, ์ฝ๋/์ง์ ์ง๋ฌธ, ๋ค์ค task
๐ 4. ์ฑ๋ฅ/ํจ์จ์ฑ ์์ฝ
| ํ๊ตญ์ด ํนํ | โญโญโญโญ | โญโญโญ |
| ๋ค๊ตญ์ด ์ง์ | โญโญ | โญโญโญโญ |
| ๋ฒ์ฉ ํ ์คํธ ์์ฑ | โญโญโญ | โญโญโญโญ |
| Model Scale | 5.8B | 7B |
| ํ์กด ํ๊ฐ ์ปค๋ฎค๋ํฐ ์ฌ๋ก | ํ๊ตญ์ด ์ค์ฌ์์ ์ข์ ํ๊ฐ | ์ ๋ฐ์ ์ธ ๋ฒ์ฉ์ฑ์ ๊ฐ์ |
๐ง ๊ฒฐ๋ก
- ํ๊ตญ์ด ์ค์ฌ, ๋์ ํ๊ตญ์ด ์์ฐ์ค๋ฌ์/๋งฅ๋ฝ ์ดํด → Polyglot-Ko 5.8B ์ถ์ฒ
- ๊ด๋ฒ์ ์ธ์ด ์ดํด + ํ๊ตญ์ด ํฌํจ ๋ค์ํ ์์ → Llama-2-Ko 7B ์ถ์ฒ
1๏ธโฃ ํ๋ก์ ํธ ์๊ตฌ์ฌํญ์ ๋ค์ ์ ๋ฆฌํด๋ณด๋ฉด
์์ง๋ ํ๋ก์ ํธ์ ํต์ฌ ์ ์ฝ์ ๋ค์์ด์์:
โ ๋ชฉํ
- ์ง์๊ฐ๋ฅ๊ฒฝ์๋ณด๊ณ ์(SR) 10~30๊ฑด ํ์ต
- IFRS ๋ฌธ๋จ ๊ตฌ์กฐ์ ๋ง์ถ ๋ฌธ์ฅ ์์ฑ
- ํ์ฌ ๋ง์ถคํ ESG/ํ๊ฒฝ/๊ธฐํ/๊ฑฐ๋ฒ๋์ค ๋ฌธ์ฅ
- CDP ๋์ ๋ฌธ์ฅ ์๋ ์์ฑ
โ ์ด์ ์กฐ๊ฑด
- RTX 3050
- ํ๋ จ ๊ธฐ๊ฐ 1๋ฌ
- ์ฑ๊ณผ๋ณด๋ค ์งํ ๊ณผ์ ์์์ ์์ ์ฑ·๋ถํ ์ต์ํ ์ค์
- ๋ฐ๋ณต ์คํ, ์์ , ์ค๋จ์ด ์ฆ์ ๊ฐ๋ฅ์ฑ ๋์
๐ ์ด๊ฑด “์ฐ๊ตฌ์ฉ SOTA”๊ฐ ์๋๋ผ “์ ์ฑ ·๋ณด๊ณ ์ ์์ฑ์ฉ ์ค๋ฌด AI” ์ ๋๋ค.
2๏ธโฃ ์ด ์กฐ๊ฑด์์ ์ค์ํ ๋ชจ๋ธ ์ ํ ๊ธฐ์ค
์ด ํ๋ก์ ํธ์์๋ ์ฑ๋ฅ๋ณด๋ค ์๋ 5๊ฐ์ง๊ฐ ํจ์ฌ ์ค์ํฉ๋๋ค.
| ํ๊ตญ์ด ๋ฌธ์์ฒด ์ดํด | SR·IFRS·CDP ๋ฌธ์ฅ์ ์ผ์ ๋ํ ์๋ |
| ๊ตฌ์กฐ ํ์ต ๋ฅ๋ ฅ | ๋ฌธ๋จ·ํญ๋ชฉ·์งํ๋ณ ๋ฐ๋ณต ํจํด |
| ์๋ ๋ฐ์ดํฐ ์์ ์ฑ | 10~30๊ฑด์ ๋งค์ฐ ์ ์ |
| VRAM ์ฌ์ | ์ฅ์๊ฐ ํ์ต ์ค OOM = ํ๋ก์ ํธ ์ค๋จ |
| ๋๋ฒ๊น ์ฉ์ด์ฑ | ์ค๊ฐ์ ๋ฐ์ดํฐ/ํ๋กฌํํธ ๊ณ์ ๋ฐ๋ |
3๏ธโฃ ๋ชจ๋ธ ํ๋ณด๋ณ ํ์ค์ ํ๊ฐ
โ LLaMA-2-Ko 7B (๋๋ 7B๊ธ)
์ ๋ถ์ ํฉํ๊ฐ
- RTX 3050์์:
- QLoRA๋ก๋ ํ์ต ๋ด๋ด ๋ฉ๋ชจ๋ฆฌ ์๋ฐ
- gradient accumulation ๋๋ฆฌ๋ฉด ์๊ฐ ↑, ์์ ์ฑ ↓
- ํ๊ตญ์ด “๋ณด๊ณ ์์ฒด”๋:
- Polyglot ๊ณ์ด๋ณด๋ค ๋ฌธ์ฅ ํค ๋ถ์์
- 10~30๊ฑด ํ์ต์์๋:
- ํ๋ผ๋ฏธํฐ ์๋ง ํฌ๊ณ ๊ณผ์ ํฉ/ํ๊ฐ ์ํ ์ฆ๊ฐ
๐ “๊ฒฐ๊ณผ๊ฐ ์ข์ ๋ณด์ผ ์๋ ์์ด๋, ๊ณผ์ ์ด ๊ณ์ ๋ถ์ํจ”
โ ๋ ์์ ๋ชจ๋ธ (3B ์ดํ)
์ ์ ์ข์๊ฐ
- IFRS / CDP ๋ฌธ๋จ์:
- ๋ฌธ์ฅ ๋ ผ๋ฆฌ + ๊ท๋ฒ์ ํํ + ๋ฐ๋ณต ๊ตฌ์กฐ
- 3B ์ดํ์์๋:
- ์งํ ๋์ ๋ฌธ์ฅ ๋ถ๊ดด
- ๋ฌธ๋จ ๊ฐ ์ผ๊ด์ฑ ๋ถ์กฑ
- “ํ์ฌ ๋ง์ถค”์ผ๋ก ๊ฐ์๋ก:
- ํํ ๋ค์์ฑ ๊ธ๊ฒฉํ ๊ฐ์
๐ “๊ฐ๋ณ์ง๋ง ๋ณด๊ณ ์ ํ์ง์ด ์ ๋์ด”
โ KoAlpaca-Polyglot-5.8B (QLoRA)
์ด ํ๋ก์ ํธ์ ๋ฑ ๋ง๋ ์ด์
โ ํ๊ตญ์ด ‘๋ณด๊ณ ์ ๋ฌธ์ฒด’์ ์ต์
- Polyglot-Ko ์์ฒด๊ฐ
- ๊ณต๊ณต๋ฌธ์·๋ณด๋์๋ฃ·๋ณด๊ณ ์ ๊ณ์ด ๋น์ค ํผ
- KoAlpaca ํ๋์ผ๋ก
- “~ํ์๋ค / ~ํ๊ณ ์๋ค / ~๊ณํ์ด๋ค”
๊ฐ์ ESG ๋ฌธ์ฒด ํ์ต์ด ๋งค์ฐ ์ ๋จ
- “~ํ์๋ค / ~ํ๊ณ ์๋ค / ~๊ณํ์ด๋ค”
โก ์๋ ๋ฐ์ดํฐ์ ๊ฐํจ (์ค์)
- 10~30๊ฑด์ด๋ฉด ์ฌ์ค์:
- ์ง์ ์ฃผ์ โ
- ๋ฌธ์ฅ ํจํด·๊ตฌ์กฐ ํ์ต โญ
- Polyglot 5.8B๋:
- LoRA r=4~8์์๋ ๊ตฌ์กฐ ํจํด ํ์ต ์์
- LLaMA ๊ณ์ด์:
- r๋ฅผ ํค์์ผ ํด์ → VRAM ๋ถ๋ด
โข “๊ณผ์ ์์ ์ฑ”์ด ์๋์ ์ผ๋ก ์ข์
์์ง๋์ด ๊ฐ์ฅ ์ค์ํ๊ฒ ๋ณธ ํฌ์ธํธ์ฃ .
| OOM ์ํ | ๋ฎ์ |
| ํ์ต ์ค๋จ ๊ฐ๋ฅ์ฑ | ๋งค์ฐ ๋ฎ์ |
| ์ธํ ๋ณ๊ฒฝ ํ ์ฌํ์ต | ๋น ๋ฆ |
| ์คํ ๋ฐ๋ณต | ๋ถ๋ด ์ ์ |
๐ 1๋ฌ ๋์ “๊ณ์ ๊ตด๋ฆด ์ ์๋ ๋ชจ๋ธ”
โฃ ๊ฒฐ๊ณผ๋ฌผ์ “AI ํฐ ์ ๋๊ฒ” ๋ง๋ค๊ธฐ ์ฌ์
์ด๊ฑด SR/CDP์์ ๊ฒฐ์ ์ ์ ๋๋ค.
- Polyglot์:
- ๊ณผ์ฅ·์ถ์ธก ํํ์ด ์ ์
- “~๋ก ํ๋จ๋๋ค”
“~์ ์ค์ฌ์ผ๋ก ๊ด๋ฆฌํ๊ณ ์๋ค”
๊ฐ์ ์ค๋ฆฝ์ ํํ ์ ์ง
- CDP ๋์ ์:
- hallucination ๋ฆฌ์คํฌ ๋ฎ์
4๏ธโฃ ์ด ํ๋ก์ ํธ์ ์ต์ ํ๋ ๊ถ์ฅ ์ํคํ ์ฒ
๐ ํต์ฌ ์ ๋ต (์ค์)
โ “๋ณด๊ณ ์ ์ง์์ ๋ชจ๋ธ์ ๋ฃ๊ฒ ๋ค”
โญ “๋ฌธ์ฅ ์์ฑ ๊ท์น์ ๋ชจ๋ธ์ ํ์ต์ํค๊ฒ ๋ค”
๊ตฌ์กฐ๋ ์ด๋ ๊ฒ ๊ฐ๋ ๊ฒ ๊ฐ์ฅ ์์ ์ ์ ๋๋ค:
๐ CDP ๋ฌธํญ๋ ๋์ผ
๐ ๋ชจ๋ธ์ ์์ฑ์ ์ญํ , ์ฌ์ค ํ๋จ์ ์ฌ๋/๋ฃฐ
5๏ธโฃ ์ต์ข ์ถ์ฒ (ํ ์ค ๊ฒฐ๋ก )
RTX 3050 + 1๋ฌ + SR 10~30๊ฑด + ๊ณผ์ ์์ ์ฑ ์ค์๋ผ๋ฉด
KoAlpaca-Polyglot-5.8B (QLoRA, r=4~8) ๊ฐ ์ ์ผํ ํฉ๋ฆฌ์ ์ ํ์ ๋๋ค.
6๏ธโฃ ๋ค์ ๋จ๊ณ์์ ๊ผญ ๊ฐ์ด ์ค๊ณํด์ผ ํ ๊ฒ (์ค์)
์ด ํ๋ก์ ํธ ์ฑ๊ณต ์ฌ๋ถ๋ ๋ชจ๋ธ๋ณด๋ค ์๋๊ฐ ๋ ์ค์ํด์:
- IFRS / CDP ๋ฌธ๋จ ํ ํ๋ฆฟ ๋ถ๋ฆฌ ์ค๊ณ
- ํ์ต์ฉ ๋ฐ์ดํฐ vs ์์ฑ์ฉ ํ๋กฌํํธ ์๊ฒฉ ๋ถ๋ฆฌ
- ํ์ฌ ๊ณ ์ ์ ๋ณด๋ ์ ๋ ํ์ตํ์ง ์๊ธฐ
- ๋ฌธ๋จ๋ณ LoRA task ๋ถ๋ฆฌ ์ฌ๋ถ ๊ฒํ
ํน์ ๊ฐ์ ์กฐ๊ฑด์์ RTX๋ 5060, ์ฑ๊ณผ ์ค์๋ผ๋ฉด ์ด๋ป๊ฒ ์ถ์ฒํด์ค์์์ด??
RTX 5060 + ์ฑ๊ณผ ์ค์๋ก ์กฐ๊ฑด์ด ๋ฐ๋๋ฉด ๋ชจ๋ธ ์ ํ ์ ๋ต์ด “์์ ํ ๋ฌ๋ผ์ง๋๋ค.”
์๋๋ **๊ฐ์ ํ๋ก์ ํธ ๋ชฉ์ (SR·IFRS·CDP ์๋ ๋ฌธ์ฅ ์์ฑ)**์ ์ ์งํ๋ฉด์,
๐ *“๊ณผ์ ์์ ์ฑ < ๊ฒฐ๊ณผ ํ์ง”*์ผ ๋์ ์ต์ ์ถ์ฒ์
๋๋ค.
๐ ๊ฒฐ๋ก ๋ถํฐ ํ ์ค๋ก
RTX 5060 + ์ฑ๊ณผ ์ค์๋ผ๋ฉด
๐ LLaMA-3 ๊ณ์ด 8B (ํ๊ตญ์ด ๊ฐํ ๋ฒ์ ) + QLoRA(๋๋ LoRA) ๊ฐ ์ต์ ์ ๋๋ค.๋จ, KoAlpaca-Polyglot์ ‘์์ ํ’,
**LLaMA-3-8B๋ ‘์ถ๋ ฅ ํ์งํ’**์ ๋๋ค.
1๏ธโฃ RTX 5060์ด ์ฃผ๋ “๊ฒ์ ์ฒด์ธ์ ”
(5060์ ์์ง ๊ณต์ ์คํ ์ฐจ์ด๊ฐ ์์ง๋ง, ์ผ๋ฐ์ ์ผ๋ก 12GB ์ด์ VRAM ๊ฐ์ )
3050 → 5060์ผ๋ก ๋ฐ๋๋ฉด์ ์๊ธฐ๋ ๋ณํ
| VRAM ์ฌ์ | โ ๋งค์ฐ ์ ํ | โญ ์ถฉ๋ถ |
| Context length | 512~768 | 1024~2048 ๊ฐ๋ฅ |
| LoRA rank | r=4~8 | r=16~32 ๊ฐ๋ฅ |
| ๋ชจ๋ธ ์ ํ | 5~6B ํ์ค์ | 8B๊ธ ์ค์ ๊ฐ๋ฅ |
| ๋ฌธ์ฅ ๋ ผ๋ฆฌ๋ ฅ | ์ ํ์ | ๋์ ๋๊ฒ ๊ฐ์ |
๐ “๋ณด๊ณ ์ ๋ฌธ๋จ์ ๋ ผ๋ฆฌ ๋ฐ๋”๊ฐ ํ์คํ ๋ฌ๋ผ์ง๋๋ค.
2๏ธโฃ ์ฑ๊ณผ ์ค์์ผ ๋, ํ๊ฐ ๊ธฐ์ค์ด ๋ฐ๋
์ด์ ์ค์ํ ๊ฑด ์ด๊ฒ๋๋ค:
| โญโญโญโญโญ | ๋ฌธ๋จ ๋ ผ๋ฆฌ ์๊ฒฐ์ฑ |
| โญโญโญโญโญ | IFRS/CDP ์ง๋ฌธ ์ ํ ๋์ |
| โญโญโญโญ | ํ์ฌ ๋ง์ถค ์์ ์ ์ฐ์ฑ |
| โญโญโญ | ํ์ต ์์ ์ฑ |
| โญโญ | ๋ฐ๋ณต ์คํ ๋ถ๋ด |
๐ ์ฆ, “์กฐ๊ธ ๊น๋ค๋ก์๋ ๊ฒฐ๊ณผ๊ฐ ์ข์์ผ ํจ”
3๏ธโฃ ๋ชจ๋ธ ํ๋ณด ์ฌํ๊ฐ (5060 ๊ธฐ์ค)
โ KoAlpaca-Polyglot-5.8B (์ด ์กฐ๊ฑด์์ 2์์)
์ 1์์๊ฐ ์๋๊ฒ ๋๋๊ฐ?
- ๋ฌธ์ฅ ์์ ์ฑ์ ์ฌ์ ํ ์ต๊ณ
- ํ์ง๋ง:
- IFRS ๋ฌธ๋จ์์ ๋ ผ๋ฆฌ ์ ๊ฐ ๊น์ด ๋ถ์กฑ
- CDP ๋ฌธํญ์ “์ง๋ฌธ ์๋ ํ์ ”์ด ์์
- 5060์ ์ฌ์ ๋ฅผ ๋ค ๋ชป ์
๐ “3050์์ ์ต์ , 5060์์ ๋ณด์์ ”
โ LLaMA-2-Ko 7B
- ์ง๊ธ ์์ ์์ :
- LLaMA-3 ๋๋น ๋ช ํํ ์ด์ธ
- ํ์ต ๋๋น ์ฑ๋ฅ ์์นํญ ์์
- ๊ตณ์ด ๊ฐ ์ด์ โ
โ LLaMA-3-8B (ํ๊ตญ์ด ๊ฐํ / Ko LoRA) ← 1์์
์ ์ด๊ฒ ์ฑ๊ณผํ ์ต์ ํด์ธ๊ฐ
โ IFRS·CDP์ ์ค์ํ “๋ ผ๋ฆฌ ์๋ต ๋ฅ๋ ฅ”
- LLaMA-3๋:
- ์ง๋ฌธ → ์๊ตฌ์ฌํญ → ๋์ ๋ฌธ์ฅ
์ด 3๋จ ๊ตฌ์กฐ๋ฅผ ์ ์ ์ง
- ์ง๋ฌธ → ์๊ตฌ์ฌํญ → ๋์ ๋ฌธ์ฅ
- CDP ๋ฌธํญ ๋์์์:
- “Yes/No + ์ค๋ช ”
- “์ ์ฑ
–๋ชฉํ–์ฑ๊ณผ–ํฅํ ๊ณํ”
๊ตฌ์กฐ๊ฐ ์์ฐ์ค๋ฝ๊ฒ ์ ์ง
โก ๋ฌธ๋จ ๊ธธ์ด & ๋ฐ๋์์ ์ฐจ์ด๊ฐ ํผ
- 8B๊ธ + context 2k →
- ํ ๋ฌธ๋จ ์์์ ๋ ผ๋ฆฌ ์๊ฒฐ
- “์ค๊ฐ์ ๋ง ๋๊ธฐ๋ ๋ณด๊ณ ์ ๋ฌธ์ฅ” ํ์ ํ ๊ฐ์
- SR ๋ณด๊ณ ์ ํ์ง์ด
- *“์ฌ๋์ด ์ด ๊ฒ ๊ฐ์ ์์ค”*์ ๊ฐ๊น์์ง
โข ์๋ ๋ฐ์ดํฐ์์๋ “์ผ๋ฐํ”๊ฐ ๋ ์ ๋จ
- 10~30๊ฑด์ ์ฌ์ ํ ์ ์ง๋ง:
- LLaMA-3๋ ํจํด ์ผ๋ฐํ ๋ฅ๋ ฅ ์ฐ์
- Polyglot → ํจํด ๋ณต์ฌํ
- LLaMA-3 → ํจํด + ๋ณํ ์์ฑํ
๐ “ํ์ฌ ๋ง์ถค”์์ ์ฐจ์ด๊ฐ ๋จ
4๏ธโฃ ์ฑ๊ณผํ ๊ถ์ฅ ์ธํ (5060 ๊ธฐ์ค)
๐น ๋ชจ๋ธ
๐น ํ์ต ๋ฐฉ์
- QLoRA (4bit) ๋๋
- LoRA (8bit, VRAM ์ฌ์ ์)
๐น ๊ถ์ฅ ํ์ดํผํ๋ผ๋ฏธํฐ
๐ ์ด ์ธํ ์ ๋ณด๊ณ ์ ๋ฌธ๋จ ํ์ง ์ต์ฐ์
5๏ธโฃ ๋จ, ์ฑ๊ณผํ์ผ์๋ก ๊ผญ ์ง์ผ์ผ ํ ์์น
โ ๏ธ ์ด๊ฑฐ ์ ์งํค๋ฉด ์คํ๋ ค ๋ง๊ฐ์ง๋๋ค.
๐ซ ํ์ง ๋ง ๊ฒ
- ํ์ฌ ๊ณ ์ ์์น/์ ์ฑ ์ ํ์ต ๋ฐ์ดํฐ์ ์ง์ ๋ฃ๊ธฐ
- CDP ์ ์ ํ๋จ์ ๋ชจ๋ธ์ ๋งก๊ธฐ๊ธฐ
- “์ฌ์ค ์์ฑ”์ ๊ธฐ๋ํ๊ธฐ
โ ๋ฐ๋์ ํ ๊ฒ
- IFRS / CDP ๋ฌธ๋จ ๊ตฌ์กฐ๋ฅผ ํ๋กฌํํธ๋ก ๊ณ ์
- ๋ชจ๋ธ์ “๋ฌธ์ฅ ์์ฑ์” ์ญํ ๋ง
- ์ฌ์ค·์์น๋ RAG ๋๋ ๋ฃฐ ๊ธฐ๋ฐ
6๏ธโฃ ์ต์ข ์ถ์ฒ ์ ๋ฆฌ (ํ)
| RTX 3050 + ์์ ์ฑ | KoAlpaca-Polyglot-5.8B |
| RTX 5060 + ์ฑ๊ณผ ์ค์ | LLaMA-3-8B (Ko ํ๋) |
| ๊ฒฐ๊ณผ ํ์ง ์ต์ฐ์ | LLaMA-3-8B |
| ๋ฌธ์ฅ ํค ์์ ์ฑ | Polyglot |
| CDP ๋ ผ๋ฆฌ ๋์ | LLaMA-3 |
ํ๋ก์ ํธ ์ ํฉ๋ ๋น๊ต (KT Mi:dm 2.0 Mini-Instruct vs Polyglot-Ko 5.8B vs Llama-2-ko 7B)
๋น์ ์ ํ๋ก์ ํธ(10~30๊ฑด ์ง์๊ฐ๋ฅ๊ฒฝ์๋ณด๊ณ ์ ๋ฐ์ดํฐ๋ก IFRS/CDP ๋ง์ถค ๋ฌธ์ฅ ์์ฑ fine-tuning, 1๋ฌ ๊ธฐ๊ฐ, ์งํ ๊ณผ์ ๋ถํ ์ต์ํ ์ฐ์ )๋ฅผ ๊ธฐ์ค์ผ๋ก ์ธ ๋ชจ๋ธ์ ๋น๊ตํ์ต๋๋ค. 2025๋ 12์ ํ์ฌ ๊ธฐ์ค์ผ๋ก, Mi:dm 2.0 Mini-Instruct๋ 2025๋ 7์์ ์ถ์๋ ์ต์ "Korea-centric" ๋ชจ๋ธ๋ก ํ๊ตญ์ด ๋ฒค์น๋งํฌ(Ko-Sovereign, KMMLU ๋ฑ)์์ ๋๊ธ ์ด์์ ๊ธ๋ก๋ฒ/๊ตญ๋ด ๋ชจ๋ธ์ ๋ฅ๊ฐํฉ๋๋ค. ๋ฐ๋ฉด Polyglot-Ko 5.8B์ Llama-2-ko 7B๋ 2023๋ ๋ ๊ตฌํ ๋ชจ๋ธ๋ก, ํ์ฌ ๊ธฐ์ค์ผ๋ก๋ ์ฑ๋ฅ์ด ๋ค์ฒ์ง๋๋ค.
| ํญ๋ชฉ | KT Mi:dm 2.0 Mini-Instruct (2.3B) | Polyglot-Ko 5.8B (5.8B) | Llama-2-ko 7B (7B) |
| ์ถ์ ์ฐ๋ & ์ต์ ์ฑ | 2025๋ 7์ (์ต์ , pruning + distillation ์ ์ฉ) | 2023๋ (๊ตฌํ) | 2023๋ (Llama-2 ๊ธฐ๋ฐ ์ถ๊ฐ pretraining, ๊ตฌํ) |
| ํ๊ตญ์ด ํนํ | ์ต๊ณ (Korea-centric ์ค๊ณ, ๋ฌธํ/์ฌํ/์์ ๋ด์ฌํ). Ko-IFEval 73%, Ko-MTBench 74%, K-Refer 66% ๋ฑ ํ๊ตญ ๋ฒค์น๋งํฌ ์์. ESG/๋ณด๊ณ ์ ์ฉ์ด ์ดํด ์ฐ์ ์์. | ์ค์ (ํ๊ตญ ์ ์ฉ pretraining) ํ์ง๋ง 2023๋ ์์ค์ผ๋ก ์ต์ ๋ชจ๋ธ์ ๋ค์ง. | ์ค (ํ๊ตญ ์ฝํผ์ค ์ถ๊ฐ) ํ์ง๋ง Llama-2 ์ํคํ ์ฒ ํ๊ณ๋ก reasoning/instruction ์ฝํจ. |
| ํ๋ผ๋ฏธํฐ & ๋ถํ | ๊ฐ์ฅ ๊ฐ๋ณ๋ค (2.3B). QLoRA ์ RTX 4090 (10GB ๋ฏธ๋ง) ๋๋ ์ ์ฌ์ GPU๋ก ์ด๊ณ ์. ๋ถํ ์ต์ํ์ ์ต์ . | ์ค๊ฐ (5.8B). QLoRA ์ 20~25GB ์์, ๋ถํ ์ค๊ฐ. | ๋์ (7B). QLoRA ์ 25~30GB ์์, ๋ถํ ๊ฐ์ฅ ํผ. |
| ์์ ๋ฐ์ดํฐ์ ์ ํฉ๋ | ์ฐ์. ์ด๋ฏธ instruction-tuned + ํ๊ตญ ํนํ๋ก 10~30๊ฑด ๋ฐ์ดํฐ๋ก ๋น ๋ฅด๊ฒ ๊ณ ํ์ง IFRS/CDP ๋ฌธ์ฅ ์์ฑ ๊ฐ๋ฅ. ๊ณผ์ ํฉ ์ ์. | ๋ณดํต. Instruction tuning ๋ถ์กฑ (KoAlpaca ๋ฑ ๋ณ๋ ํ์), ์ถ๊ฐ ์์ ๋ง์. | ๋ณดํต. Instruction following ์ฝํด ์์ ๋ฐ์ดํฐ์์ ๋ถ์์ . |
| ํ๋ จ ๊ธฐ๊ฐ & ๋น์ฉ | ๊ฐ์ฅ ๋น ๋ฆ. 1๋ฌ ๋ด ์ฌ์ ๋กญ๊ฒ ๋ฐ๋ณต ์คํ. ์ ๋น์ฉ ๋ก์ปฌ/ํด๋ผ์ฐ๋ ๊ฐ๋ฅ. | ์ค๊ฐ. ๋ ์ค๋ ๊ฑธ๋ฆฌ๊ณ ์์ ๋ ์๋ชจ. | ๊ฐ์ฅ ๋๋ฆผ. ๋ถํ ์ปค์ 1๋ฌ ๋ด ์์ ์ ์งํ ์ด๋ ค์. |
| ์ ์ฒด ํ๋ก์ ํธ ์ ํฉ๋ | ์ต๊ณ . ์ต์ + ์ด๊ฒฝ๋ + ํ๊ตญ ํนํ๋ก ๋ถํ ์ต์ + ์ฑ๋ฅ ์ต๋. | ๋ฎ์. ๊ตฌํ์ผ๋ก ์ฑ๋ฅ ์ ํ ์์. | ๋ฎ์. ๊ตฌํ + ๋ถํ ์ปค์ ๋ถ์ ํฉ. |
| ๋จ์ | ๊ธ๋ก๋ฒ ๋ฒ์ฉ ๋ฒค์น๋งํฌ์์ ์ฝ๊ฐ ๋ค์ง ์ ์์ (ํ๋ก์ ํธ์ ๋ฌด๊ด). | ๊ตฌํ ์ํคํ ์ฒ๋ก ์ต์ ํ์คํฌ(์ ๋ฌธ ๋ฌธ์ ์์ฑ) ์ฝํจ. | Reasoning/instruction ์ฝํ๊ณ ์์ ์๋ชจ ํผ. |
๊ฒฐ๋ก & ์ถ์ฒ: KT Mi:dm 2.0 Mini-Instruct๋ฅผ ๊ฐ๋ ฅํ 1์์๋ก ์ถ์ฒํฉ๋๋ค. 2025๋ ์ต์ ๋ชจ๋ธ๋ก ํ๊ตญ์ด(ํนํ ์ง์๊ฐ๋ฅ๊ฒฝ์๋ณด๊ณ ์ ๊ฐ์ ์ ๋ฌธ/๋ฌธํ ๋งฅ๋ฝ)์์ ์๋์ ์ฐ์, ๊ฐ์ฅ ๊ฐ๋ฒผ์ด ๊ท๋ชจ๋ก "๋ถํ ์ต์ํ" ๋ชฉํ์ ์๋ฒฝ ๋ง์์. Polyglot-Ko 5.8B๋ Llama-2-ko 7B๋ 2023๋ ๋ชจ๋ธ๋ก ์ฑ๋ฅ/ํจ์จ ๋ชจ๋ ๋ค์ฒ์ ธ ์ ํํ ์ด์ ๊ฐ ์์ต๋๋ค – ์คํ๋ ค fine-tuning ํ ๋ฌธ์ฅ ํ์ง์ด ๋จ์ด์ง๊ณ ๊ณผ์ ์ด ํ๋ค์ด์ง ์ ์์ด์.
Hugging Face์์ Mi:dm 2.0 Mini-Instruct ๋ฐ๋ก ๋ค์ด๋ก๋ํ๊ณ (K-intelligence/Midm-2.0-Mini-Instruct), Unsloth๋ LLaMA-Factory๋ก QLoRA ์์ํด๋ณด์ธ์. ์ค์ ํ ์คํธ๋ก ํ์ธํ๋ฉด ๋ ํ์คํ ๊ฑฐ์์! ์ถ๊ฐ ์กฐ์ธ ํ์ํ์๋ฉด ๋ง์ํด์ฃผ์ธ์.
'Project ESG+AI > Tech Basics' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| 58์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (0) | 2026.01.06 |
|---|---|
| 51์ผ์ฐจ. ๊ฐ๋ ์ ๋ฆฌ (0) | 2025.12.24 |
| 46์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (0) | 2025.12.16 |
| 44์ผ, 45์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (1) | 2025.12.16 |
| 43์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (1) | 2025.12.11 |