
- ๊ธ์์ผ
์ด๋ก ์์ ์ด๊ฑฐ๋ณด๊ณ ํ์ฌ
01. ์์ฐ์ด ์ฒ๋ฆฌ(natural language processing)
์์ฐ์ด(natural language)๋ ์ฐ๋ฆฌ๊ฐ ์ผ์ ์ํ์์ ์ฌ์ฉํ๋ ์ธ์ด๋ฅผ ๋งํฉ๋๋ค. ์์ฐ์ด ์ฒ๋ฆฌ(natural language processing)๋ ์ด๋ฌํ ์์ฐ์ด์ ์๋ฏธ๋ฅผ ๋ถ์ํ์ฌ ์ปดํจํฐ๊ฐ ์ฒ๋ฆฌํ ์ ์๋๋ก ํ๋ ์ผ์ ๋งํฉ๋๋ค.
์์ฐ์ด ์ฒ๋ฆฌ๋ ์์ฑ ์ธ์, ๋ด์ฉ ์์ฝ, ๋ฒ์ญ, ์ฌ์ฉ์์ ๊ฐ์ฑ ๋ถ์, ํ ์คํธ ๋ถ๋ฅ ์์ (์คํธ ๋ฉ์ผ ๋ถ๋ฅ, ๋ด์ค ๊ธฐ์ฌ ์นดํ ๊ณ ๋ฆฌ ๋ถ๋ฅ), ์ง์ ์๋ต ์์คํ , ์ฑ๋ด๊ณผ ๊ฐ์ ๊ณณ์์ ์ฌ์ฉ๋๋ ๋ถ์ผ์ ๋๋ค.
์ต๊ทผ ๋ฅ ๋ฌ๋์ ๋ฐ์ด๋ ์ฑ๋ฅ์ด ๊ด๋ชฉํ ๋งํ ์ฑ๊ณผ๋ฅผ ์ป์ผ๋ฉด์, ์ธ๊ณต์ง๋ฅ์ด IT ๋ถ์ผ์ ์ค์ ํค์๋๋ก ๋ ์ค๋ฅด๊ณ ์์ต๋๋ค. ์์ฐ์ด ์ฒ๋ฆฌ๋ ๊ธฐ๊ณ์๊ฒ ์ธ๊ฐ์ ์ธ์ด๋ฅผ ์ดํด์ํจ๋ค๋ ์ ์์ ์ธ๊ณต์ง๋ฅ์์ ๊ฐ์ฅ ์๋ฏธ์๋ ์ฐ๊ตฌ ๋ถ์ผ์ด๋ฉด์๋ ์์ง๋ ์ ๋ณต๋์ด์ผ ํ ์ฐ์ด ๋ง์ ๋ถ์ผ์ ๋๋ค.
1. ํ๋ค์ค(Pandas)
ํ๋ค์ค(Pandas)๋ ํ์ด์ฌ ๋ฐ์ดํฐ ์ฒ๋ฆฌ๋ฅผ ์ํ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋๋ค. ํ์ด์ฌ์ ์ด์ฉํ ๋ฐ์ดํฐ ๋ถ์๊ณผ ๊ฐ์ ์์ ์์ ํ์ ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ก ์๋ ค์ ธ์์ต๋๋ค. ์ฐธ๊ณ ํ ์ ์๋ Pandas ๋งํฌ๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๋งํฌ : http://pandas.pydata.org/pandas-docs/stable/
์๋์ฝ๋ค๋ฅผ ์ค์นํ์ง ์์๋ค๋ฉด ์๋์ ์ปค๋งจ๋๋ก Pandas๋ฅผ ๋ณ๋ ์ค์นํ ์ ์์ต๋๋ค.
1. ๋จธ์ ๋ฌ๋ ์ํฌํ๋ก์ฐ(Machine Learning Workflow)
๋ฐ์ดํฐ๋ฅผ ์์งํ๊ณ ๋จธ์ ๋ฌ๋์ ํ๋ ๊ณผ์ ์ ํฌ๊ฒ 6๊ฐ์ง๋ก ๋๋๋ฉด, ์๋์ ๊ทธ๋ฆผ๊ณผ ๊ฐ์ต๋๋ค.

1. ์ธ์ด ๋ชจ๋ธ(Language Model)
์ธ์ด ๋ชจ๋ธ์ ๋จ์ด ์ํ์ค์ ํ๋ฅ ์ ํ ๋น(assign) ํ๋ ์ผ์ ํ๋ ๋ชจ๋ธ์ ๋๋ค. ์ด๋ฅผ ์กฐ๊ธ ํ์ด์ ์ฐ๋ฉด, ์ธ์ด ๋ชจ๋ธ์ ๊ฐ์ฅ ์์ฐ์ค๋ฌ์ด ๋จ์ด ์ํ์ค๋ฅผ ์ฐพ์๋ด๋ ๋ชจ๋ธ์ ๋๋ค. ๋จ์ด ์ํ์ค์ ํ๋ฅ ์ ํ ๋นํ๊ฒ ํ๊ธฐ ์ํด์ ๊ฐ์ฅ ๋ณดํธ์ ์ผ๋ก ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ์ ์ธ์ด ๋ชจ๋ธ์ด ์ด์ ๋จ์ด๋ค์ด ์ฃผ์ด์ก์ ๋ ๋ค์ ๋จ์ด๋ฅผ ์์ธกํ๋๋ก ํ๋ ๊ฒ์ ๋๋ค.

1๏ธโฃ ๋จธ์ ๋ฌ๋(Machine Learning) ์ ์
- ๋จธ์ ๋ฌ๋์ ์ปดํจํฐ๊ฐ ๋ฐ์ดํฐ์์ ํจํด์ ํ์ตํ์ฌ ์ค์ค๋ก ์์ธก/ํ๋จํ ์ ์๊ฒ ๋ง๋๋ ๊ธฐ์ ์ด์์.
- ์ ํต์ ์ธ ํ๋ก๊ทธ๋๋ฐ๊ณผ ๋ฌ๋ฆฌ ๋ช ๋ น์ด๋ฅผ ์ผ์ผ์ด ์ฝ๋ฉํ์ง ์๊ณ , ๋ฐ์ดํฐ๋ฅผ ํตํด ๊ท์น์ ์๋์ผ๋ก ํ์ตํฉ๋๋ค.
๐ก ์ฝ๊ฒ ๋งํ๋ฉด:
์ปดํจํฐ์๊ฒ ์ ๋ต์ ์๋ ค์ฃผ๊ณ , ๊ทธ ๋ฐ์ดํฐ๋ฅผ ๋ฐํ์ผ๋ก ์ค์ค๋ก ๋ฌธ์ ๋ฅผ ํ๊ฒ ํ๋ ๊ฒ”
3๏ธโฃ ๋จธ์ ๋ฌ๋ ์ข ๋ฅ
- ์ง๋ํ์ต(Supervised Learning)
- ์ ๋ต(๋ผ๋ฒจ)์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ํ์ต
- ์์: ์ด๋ฉ์ผ ์คํธ ๋ถ๋ฅ, ์ง ๊ฐ๊ฒฉ ์์ธก
- ๋น์ง๋ํ์ต(Unsupervised Learning)
- ์ ๋ต ์์ด ๋ฐ์ดํฐ์ ํจํด์ด๋ ๊ทธ๋ฃน์ ์ฐพ์ ํ์ต
- ์์: ๊ณ ๊ฐ ๊ตฐ์งํ, ์ด์์น ํ์ง
- ๊ฐํํ์ต(Reinforcement Learning)
- ์ํ์ฐฉ์ค๋ฅผ ํตํด ๋ณด์์ ์ต๋ํํ๋๋ก ํ์ต
- ์์: ๊ฒ์ AI, ๋ก๋ด ์์จ ์ฃผํ
4๏ธโฃ ๋จธ์ ๋ฌ๋ ๊ณผ์
- ๋ฐ์ดํฐ ์์ง – ํ์ตํ ๋ฐ์ดํฐ ํ๋ณด
- ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ – ๊ฒฐ์ธก์น ์ฒ๋ฆฌ, ์ ๊ทํ, ํน์ง ์ถ์ถ
- ๋ชจ๋ธ ํ์ต – ์๊ณ ๋ฆฌ์ฆ์ ํตํด ํจํด ํ์ต
- ๋ชจ๋ธ ํ๊ฐ – ์ ํ๋, ์ค๋ฅ์จ ๋ฑ์ผ๋ก ์ฑ๋ฅ ํ์ธ
- ์์ธก/ํ์ฉ – ํ์ตํ ๋ชจ๋ธ๋ก ์ค์ ๋ฌธ์ ํด๊ฒฐ
๋ฅ ๋ฌ๋(Deep Learning)์ ๋จธ์ ๋ฌ๋(Machine Learning)์ ํน์ ํ ํ ๋ถ์ผ๋ก์ ์ธ๊ณต ์ ๊ฒฝ๋ง(Artificial Neural Network)์ ์ธต์ ์ฐ์์ ์ผ๋ก ๊น๊ฒ ์์์ฌ๋ ค ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ ๋ฐฉ์
์ธ๊ณต ์ ๊ฒฝ๋ง์ ์๋ง์ ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ ์ค ํ๋์ ๋๋ค. ํ์ง๋ง ์ต๊ทผ ์ธ๊ณต ์ ๊ฒฝ๋ง์ ๋ณต์กํ๊ฒ ์์ ์ฌ๋ฆฐ ๋ฅ ๋ฌ๋์ด ๋ค๋ฅธ ๋จธ์ ๋ฌ๋ ๋ฐฉ๋ฒ๋ค์ ๋ฐ์ด๋๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ ์ฌ๋ก๊ฐ ๋๋ฉด์, ์ ํต์ ์ธ ๋จธ์ ๋ฌ๋๊ณผ ๋ฅ ๋ฌ๋์ ๊ตฌ๋ถํด์ ์ดํดํด์ผ ํ๋ค๋ ๋ชฉ์๋ฆฌ๊ฐ ์ปค์ง๊ณ ์์ต๋๋ค. ๋ฅ ๋ฌ๋์ ์ดํดํ๊ธฐ ์ํด์๋ ์ฐ์ ์ธ๊ณต ์ ๊ฒฝ๋ง์ ๋ํ ์ดํด๊ฐ ํ์ํ๋ฐ, ์ฌ๊ธฐ์๋ ์ด๊ธฐ์ ์ธ๊ณต ์ ๊ฒฝ๋ง์ธ ํผ์ ํธ๋ก (Perceptron)์ ๋ํด์ ์ดํดํฉ๋๋ค.
1. ํผ์ ํธ๋ก (Perceptron)
ํผ์ ํธ๋ก (Perceptron)์ ํ๋ํฌ ๋ก์ ๋ธ๋ผํธ(Frank Rosenblatt)๊ฐ 1957๋ ์ ์ ์ํ ์ด๊ธฐ ํํ์ ์ธ๊ณต ์ ๊ฒฝ๋ง์ผ๋ก ๋ค์์ ์ ๋ ฅ์ผ๋ก๋ถํฐ ํ๋์ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ณด๋ด๋ ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ํผ์ ํธ๋ก ์ ์ค์ ๋๋ฅผ ๊ตฌ์ฑํ๋ ์ ๊ฒฝ ์ธํฌ ๋ด๋ฐ์ ๋์๊ณผ ์ ์ฌํ๋ฐ, ์ ๊ฒฝ ์ธํฌ ๋ด๋ฐ์ ๊ทธ๋ฆผ์ ๋จผ์ ๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค. ๋ด๋ฐ์ ๊ฐ์ง๋๊ธฐ์์ ์ ํธ๋ฅผ ๋ฐ์๋ค์ด๊ณ , ์ด ์ ํธ๊ฐ ์ผ์ ์น ์ด์์ ํฌ๊ธฐ๋ฅผ ๊ฐ์ง๋ฉด ์ถ์ญ๋๊ธฐ๋ฅผ ํตํด์ ์ ํธ๋ฅผ ์ ๋ฌํฉ๋๋ค.
2. ๋จ์ธต ํผ์ ํธ๋ก (Single-Layer Perceptron)
์์์ ๋ฐฐ์ด ํผ์ ํธ๋ก ์ ๋จ์ธต ํผ์ ํธ๋ก ์ด๋ผ๊ณ ํฉ๋๋ค. ํผ์ ํธ๋ก ์ ๋จ์ธต ํผ์ ํธ๋ก ๊ณผ ๋ค์ธต ํผ์ ํธ๋ก ์ผ๋ก ๋๋์ด์ง๋๋ฐ, ๋จ์ธต ํผ์ ํธ๋ก ์ ๊ฐ์ ๋ณด๋ด๋ ๋จ๊ณ๊ณผ ๊ฐ์ ๋ฐ์์ ์ถ๋ ฅํ๋ ๋ ๋จ๊ณ๋ก๋ง ์ด๋ฃจ์ด์ง๋๋ค. ์ด๋ ์ด ๊ฐ ๋จ๊ณ๋ฅผ ๋ณดํต ์ธต(layer)์ด๋ผ๊ณ ๋ถ๋ฅด๋ฉฐ, ์ด ๋ ๊ฐ์ ์ธต์ ์ ๋ ฅ์ธต(input layer)๊ณผ ์ถ๋ ฅ์ธต(output layer)์ด๋ผ๊ณ ํฉ๋๋ค.
3. ๋ค์ธต ํผ์ ํธ๋ก (MultiLayer Perceptron, MLP)
XOR ๊ฒ์ดํธ๋ ๊ธฐ์กด์ AND, NAND, OR ๊ฒ์ดํธ๋ฅผ ์กฐํฉํ๋ฉด ๋ง๋ค ์ ์์ต๋๋ค. ํผ์ ํธ๋ก ๊ด์ ์์ ๋งํ๋ฉด ์ธต์ ๋ ์์ผ๋ฉด ๋ง๋ค ์ ์์ต๋๋ค. ๋ค์ธต ํผ์ ํธ๋ก ๊ณผ ๋จ์ธต ํผ์ ํธ๋ก ์ ์ฐจ์ด๋ ๋จ์ธต ํผ์ ํธ๋ก ์ ์ ๋ ฅ์ธต๊ณผ ์ถ๋ ฅ์ธต๋ง ์กด์ฌํ์ง๋ง, ๋ค์ธต ํผ์ ํธ๋ก ์ ์ค๊ฐ์ ์ธต์ ๋ ์ถ๊ฐํ์๋ค๋ ์ ์ ๋๋ค. ์ด๋ ๊ฒ ์ ๋ ฅ์ธต๊ณผ ์ถ๋ ฅ์ธต ์ฌ์ด์ ์กด์ฌํ๋ ์ธต์ ์๋์ธต(hidden layer)์ด๋ผ๊ณ ํฉ๋๋ค. ์ฆ, ๋ค์ธต ํผ์ ํธ๋ก ์ ์ค๊ฐ์ ์๋์ธต์ด ์กด์ฌํ๋ค๋ ์ ์ด ๋จ์ธต ํผ์ ํธ๋ก ๊ณผ ๋ค๋ฆ ๋๋ค. ๋ค์ธต ํผ์ ํธ๋ก ์ ์ค์ฌ์ MLP๋ผ๊ณ ๋ ๋ถ๋ฆ ๋๋ค.

์์ ๊ฐ์ด ์๋์ธต์ด 2๊ฐ ์ด์์ธ ์ ๊ฒฝ๋ง์ ์ฌ์ธต ์ ๊ฒฝ๋ง(Deep Neural Network, DNN) ์ด๋ผ๊ณ ํฉ๋๋ค. ์ฌ์ธต ์ ๊ฒฝ๋ง์ ๋ค์ธต ํผ์ ํธ๋ก ๋ง ์ด์ผ๊ธฐ ํ๋ ๊ฒ์ด ์๋๋ผ, ์ฌ๋ฌ ๋ณํ๋ ๋ค์ํ ์ ๊ฒฝ๋ง๋ค๋ ์๋์ธต์ด 2๊ฐ ์ด์์ด ๋๋ฉด ์ฌ์ธต ์ ๊ฒฝ๋ง์ด๋ผ๊ณ ํฉ๋๋ค.
์ง๊ธ๊น์ง๋ OR, AND, XOR ๊ฒ์ดํธ ๋ฑ. ํผ์ ํธ๋ก ์ด ์ ๋๋ก ๋ ์ ๋ต์ ์ถ๋ ฅํ ๋๊น์ง ์ ์๊ฐ ์ง์ ๊ฐ์ค์น๋ฅผ ๋ฐ๊ฟ๋ณด๋ฉด์ ์ ์ ํ ๊ฐ์ค์น๋ฅผ ์๋์ผ๋ก ์ฐพ์์ต๋๋ค. ํ์ง๋ง ์ด์ ๋ ๊ธฐ๊ณ๊ฐ ๊ฐ์ค์น๋ฅผ ์ค์ค๋ก ์ฐพ์๋ด๋๋ก ์๋ํ์์ผ์ผํ๋๋ฐ, ์ด๊ฒ์ด ๋จธ์ ๋ฌ๋์์ ๋งํ๋ ํ๋ จ(training) ๋๋ ํ์ต(learning) ๋จ๊ณ์ ํด๋น๋ฉ๋๋ค. ์์ ์ ํ ํ๊ท์ ๋ก์ง์คํฑ ํ๊ท์์ ๋ณด์๋ฏ์ด ์์ค ํจ์(Loss function)์ ์ตํฐ๋ง์ด์ (Optimizer)๋ฅผ ์ฌ์ฉํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ๋ง์ฝ ํ์ต์ ์ํค๋ ์ธ๊ณต ์ ๊ฒฝ๋ง์ด ์ฌ์ธต ์ ๊ฒฝ๋ง์ผ ๊ฒฝ์ฐ์๋ ์ด๋ฅผ ์ฌ์ธต ์ ๊ฒฝ๋ง์ ํ์ต์ํจ๋ค๊ณ ํ์ฌ, ๋ฅ ๋ฌ๋(Deep Learning)์ด๋ผ๊ณ ํฉ๋๋ค.
1๏ธโฃ ๋ฅ๋ฌ๋(Deep Learning) ์ ์
- ๋ฅ๋ฌ๋์ ๋จธ์ ๋ฌ๋์ ํ ๋ถ์ผ๋ก, ์ธ๊ณต์ ๊ฒฝ๋ง(Artificial Neural Network, ANN)์ ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ํ์ตํ๋ ๊ธฐ์ ์ด์์.
- “๊น๊ฒ(Deep)” ํ์ตํ๋ค๋ ๋ง์ฒ๋ผ ์ฌ๋ฌ ์ธต(Layer)์ ์ ๊ฒฝ๋ง์ ํตํด ๋ณต์กํ ํจํด์ ์๋์ผ๋ก ํ์ตํฉ๋๋ค.
๐ก ์ฝ๊ฒ ๋งํ๋ฉด:
“์ฌ๋ ๋์ ์ ๊ฒฝ๋ง ๊ตฌ์กฐ๋ฅผ ํ๋ด ๋ด์ด, ์ปดํจํฐ๊ฐ ์ค์ค๋ก ํน์ง์ ์ถ์ถํ๊ณ ํ๋จํ๋ ๊ธฐ์ ”
2๏ธโฃ ๋จธ์ ๋ฌ๋ vs ๋ฅ๋ฌ๋
| ํน์ง ์ถ์ถ | ์ฌ๋์ด ์ง์ ์ค๊ณ | ์ ๊ฒฝ๋ง์ด ์๋์ผ๋ก ์ถ์ถ |
| ๋ฐ์ดํฐ ํ์๋ | ์๋์ ์ผ๋ก ์ ์ | ๋ง์์๋ก ์ฑ๋ฅ ํฅ์ |
| ๊ณ์ฐ๋ | ์ ์ | ๋งค์ฐ ๋ง์, GPU ํ์ |
| ์ฑ๋ฅ | ๋จ์ ๋ฌธ์ ์ ํฉ | ์ด๋ฏธ์ง, ์์ฑ, ์์ฐ์ด ๋ฑ ๋ณต์ก ๋ฌธ์ ์ ํฉ |
์์:
- ๋จธ์ ๋ฌ๋: ์ผ๊ตด ์ฌ์ง์์ ๋, ์ฝ, ์ ์์น๋ฅผ ์ฌ๋์ด ์ง์ → ๋ถ๋ฅ
- ๋ฅ๋ฌ๋: ์ผ๊ตด ์ฌ์ง์ ๊ทธ๋ฅ ๋ฃ์ผ๋ฉด ์ ๊ฒฝ๋ง์ด ์ค์ค๋ก ํน์ง ์ถ์ถ → ๋ถ๋ฅ
3๏ธโฃ ๋ฅ๋ฌ๋ ๊ตฌ์กฐ
- ์ ๋ ฅ์ธต(Input Layer) – ๋ฐ์ดํฐ ์ ๋ ฅ
- ์๋์ธต(Hidden Layer) – ์ฌ๋ฌ ์ธต์ผ๋ก ๊ตฌ์ฑ, ํน์ง์ ์ ์ ์ถ์ถ
- ์ถ๋ ฅ์ธต(Output Layer) – ์์ธก/๋ถ๋ฅ ๊ฒฐ๊ณผ ์ถ๋ ฅ
๐ก ์ธต์ด ๋ง์์๋ก “๋ฅ(Deep)”ํ๊ฒ ํ์ต ๊ฐ๋ฅ
4๏ธโฃ ๋ฅ๋ฌ๋ ํ์ฉ ๋ถ์ผ
- ์ปดํจํฐ ๋น์ : ์ด๋ฏธ์ง ๋ถ๋ฅ, ์ผ๊ตด ์ธ์, ์์จ์ฃผํ
- ์์ฐ์ด ์ฒ๋ฆฌ(NLP): ๋ฒ์ญ, ์ฑ๋ด, ๊ฐ์ ๋ถ์
- ์์ฑ ์ฒ๋ฆฌ: ์์ฑ์ธ์, ์์ ์ถ์ฒ
- ๊ฒ์/๋ก๋ด: ๊ฐํํ์ต๊ณผ ๊ฒฐํฉํด ์์จ ํ๋
2๏ธโฃ ๋ฅ๋ฌ๋์ ํต์ฌ ๊ตฌ์ฑ ์์
(1) ์ธ๊ณต์ ๊ฒฝ๋ง(Artificial Neural Network, ANN)
- ๋ด๋ฐ(Neuron)์ ๋ชจ๋ฐฉํ ์ฐ์ฐ ๋จ์๋ก ๊ตฌ์ฑ๋จ
- ์ฃผ์ ๊ตฌ์กฐ:
- ์ ๋ ฅ์ธต(Input Layer): ๋ฐ์ดํฐ๋ฅผ ๋ฐ์๋ค์ด๋ ์ธต
- ์๋์ธต(Hidden Layer): ๋ฐ์ดํฐ๋ฅผ ๋ณํํ๋ฉฐ ํน์ง์ ์ถ์ถ
- ์ธต์ด ๋ง์์๋ก ๋ฅ๋ฌ๋์ด “๊น๊ฒ” ํ์ต ๊ฐ๋ฅ
- ์ถ๋ ฅ์ธต(Output Layer): ์์ธก๊ฐ์ด๋ ๋ถ๋ฅ ๊ฒฐ๊ณผ ์ถ๋ ฅ
(2) ํ์ฑํ ํจ์(Activation Function)
- ๋ด๋ฐ์ด ๋ค์ ์ธต์ผ๋ก ์ ํธ๋ฅผ ์ ๋ฌํ ์ง ๊ฒฐ์ ํ๋ ํจ์
- ์ฃผ์ ์ข ๋ฅ: ReLU, Sigmoid, Tanh ๋ฑ
- ์ญํ : ๋น์ ํ์ฑ(Non-linearity) ๋ถ์ฌ → ๋ณต์กํ ํจํด ํ์ต ๊ฐ๋ฅ
(3) ์์ค ํจ์(Loss Function)
- ๋ชจ๋ธ ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ ์ฐจ์ด๋ฅผ ์์นํ
- ํ์ต ๋ชฉํ: ์์ค ํจ์๋ฅผ ์ต์ํํ๋ ๋ฐฉํฅ์ผ๋ก ๊ฐ์ค์น(W, Weight)๋ฅผ ์กฐ์
(4) ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ(Optimizer)
- ์์ค ํจ์๋ฅผ ์ต์ํํ๊ธฐ ์ํด ๊ฐ์ค์น๋ฅผ ์ ๋ฐ์ดํธ
- ๋ํ์ ์๊ณ ๋ฆฌ์ฆ: SGD, Adam, RMSProp
3๏ธโฃ ๋ฅ๋ฌ๋ ํ์ต ๊ณผ์
- ์์ ํ(Forward Propagation): ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ ๊ฒฝ๋ง์ ๋ฃ๊ณ ์ถ๋ ฅ ๊ณ์ฐ
- ์์ค ๊ณ์ฐ(Loss Calculation): ์์ธก๊ฐ๊ณผ ์ค์ ๊ฐ ๋น๊ต
- ์ญ์ ํ(Backpropagation): ์ค์ฐจ๋ฅผ ๊ฐ ์ธต์ ๊ฐ์ค์น์ ๋ง๊ฒ ์ ๋ฌํ๋ฉฐ ์ ๋ฐ์ดํธ
- ๊ฐ์ค์น ์ ๋ฐ์ดํธ(Weight Update): ์ต์ ํ ์๊ณ ๋ฆฌ์ฆ ์ฌ์ฉ
- ๋ฐ๋ณต(Epochs): ๋ฐ์ดํฐ ์ ์ฒด๋ฅผ ์ฌ๋ฌ ๋ฒ ํ์ตํ์ฌ ์ฑ๋ฅ ํฅ์
๐ก ์ฆ, ๋ฅ๋ฌ๋์ ๋ฐ์ดํฐ๋ฅผ ๋ฃ๊ณ , ์ ๊ฒฝ๋ง์ด ์ค์ค๋ก ํน์ง์ ํ์ตํ๋ฉฐ, ๋ฐ๋ณต์ ์ผ๋ก ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ๊ณผ์ ์ ๋๋ค.
4๏ธโฃ ๋ฅ๋ฌ๋ ๋ชจ๋ธ ์ข ๋ฅ
| MLP (Multi-Layer Perceptron) | ๊ธฐ๋ณธ ์ ๊ฒฝ๋ง, ์์ ์ฐ๊ฒฐ์ธต(Fully Connected) | ์ซ์ ๋ถ๋ฅ, ๊ฐ๋จํ ๋ฐ์ดํฐ |
| CNN (Convolutional Neural Network) | ์ด๋ฏธ์ง ๋ฐ์ดํฐ์ ํนํ, ํน์ง ์ถ์ถ ์๋ | ์ด๋ฏธ์ง ๋ถ๋ฅ, ๊ฐ์ฒด ํ์ง, ์์จ์ฃผํ |
| RNN (Recurrent Neural Network) | ์ํ์ค ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ์ํ ๊ตฌ์กฐ | ์์ฐ์ด ์ฒ๋ฆฌ, ์๊ณ์ด ์์ธก |
| LSTM / GRU | RNN ๊ฐ์ , ์ฅ๊ธฐ ์์กด์ฑ ๋ฌธ์ ํด๊ฒฐ | ๋ฒ์ญ, ์์ฑ์ธ์, ์ฃผ๊ฐ ์์ธก |
| Transformer / BERT / GPT | Attention ๋ฉ์ปค๋์ฆ, ๋ณ๋ ฌ ์ฒ๋ฆฌ ๊ฐ๋ฅ | ๋ฒ์ญ, ์ฑ๋ด, ๋๊ท๋ชจ NLP ๋ชจ๋ธ |
5๏ธโฃ ๋ฅ๋ฌ๋์ ํน์ง
- ์๋ ํน์ง ์ถ์ถ: ์ฌ๋์ด ์ง์ ํน์ง(feature)์ ์ค๊ณํ์ง ์์๋ ๋จ
- ๋์ฉ๋ ๋ฐ์ดํฐ์ GPU ์ต์ ํ: ๋ฐ์ดํฐ๊ฐ ๋ง์์๋ก ์ฑ๋ฅ ํฅ์
- ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ ๊ฐ๋ฅ: ์ด๋ฏธ์ง, ์์ฑ, ์์ฐ์ด ๋ฑ ๋ณต์กํ ํจํด ํ์ต
6๏ธโฃ ๋ฅ๋ฌ๋ ํ์ฉ ์ฌ๋ก
- ์ปดํจํฐ ๋น์ : ์ผ๊ตด ์ธ์, ์๋ฃ ์ด๋ฏธ์ง ์ง๋จ, ์์จ์ฃผํ
- ์์ฐ์ด ์ฒ๋ฆฌ: ๋ฒ์ญ, ์ฑ๋ด, ๋ฌธ์ ์์ฝ, ๊ฐ์ ๋ถ์
- ์์ฑ ์ฒ๋ฆฌ: ์์ฑ ์ธ์, ์์ ์ถ์ฒ
- ๊ฒ์·๋ก๋ด: ๊ฐํํ์ต ๊ธฐ๋ฐ AI, ์์จ ๋ก๋ด
3. ์๋ ์๋ฒ ๋ฉ(Word Embedding)
๋จ์ด๋ฅผ ๋ฐ์ง ๋ฒกํฐ(dense vector)์ ํํ๋ก ํํํ๋ ๋ฐฉ๋ฒ์ ์๋ ์๋ฒ ๋ฉ(word embedding)์ด๋ผ๊ณ ํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ด ๋ฐ์ง ๋ฒกํฐ๋ฅผ ์๋ ์๋ฒ ๋ฉ ๊ณผ์ ์ ํตํด ๋์จ ๊ฒฐ๊ณผ๋ผ๊ณ ํ์ฌ ์๋ฒ ๋ฉ ๋ฒกํฐ(embedding vector)
09. ์๋ ์๋ฒ ๋ฉ(Word Embedding)
ํ ์คํธ๋ฅผ ์ปดํจํฐ๊ฐ ์ดํดํ๊ณ , ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌํ๊ฒ ํ๊ธฐ ์ํด์๋ ์ปดํจํฐ๊ฐ ์ดํดํ ์ ์๋๋ก ํ ์คํธ๋ฅผ ์ ์ ํ ์ซ์๋ก ๋ณํํด์ผ ํฉ๋๋ค. ๋จ์ด๋ฅผ ํํํ๋ ๋ฐฉ๋ฒ์ ๋ฐ๋ผ์ ์์ฐ์ด ์ฒ๋ฆฌ์ ์ฑ๋ฅ์ด ํฌ๊ฒ ๋ฌ๋ผ์ง๊ธฐ ๋๋ฌธ์ ๋จ์ด๋ฅผ ์์นํ ํ๊ธฐ ์ํ ๋ง์ ์ฐ๊ตฌ๊ฐ ์์๊ณ , ํ์ฌ์ ์ด๋ฅด๋ฌ์๋ ๊ฐ ๋จ์ด๋ฅผ ์ธ๊ณต ์ ๊ฒฝ๋ง ํ์ต์ ํตํด ๋ฒกํฐํํ๋ ์๋ ์๋ฒ ๋ฉ์ด๋ผ๋ ๋ฐฉ๋ฒ์ด ๊ฐ์ฅ ๋ง์ด ์ฌ์ฉ๋๊ณ ์์ต๋๋ค.
'Project ESG+AI > Tech Basics' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| 47์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (0) | 2025.12.17 |
|---|---|
| 46์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (0) | 2025.12.16 |
| 43์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (1) | 2025.12.11 |
| 41์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (0) | 2025.12.09 |
| 40์ผ์ฐจ. IT ๊ฐ๋ ์ ๋ฆฌ (0) | 2025.12.08 |