๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
Project ESG+AI/Tech Basics

44์ผ, 45์ผ์ฐจ. IT ๊ฐœ๋… ์ •๋ฆฌ

by GreenJin_S2 2025. 12. 16.

 

  1.  ๋”ฅ ๋Ÿฌ๋‹์„ ์ด์šฉํ•œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ ์ž…๋ฌธ


https://wikidocs.net/150781

- ๊ธˆ์š”์ผ 

 

์ด๋ก  ์ˆ˜์—… ์ด๊ฑฐ๋ณด๊ณ  ํ•˜์‹ฌ

 

01. ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(natural language processing) 

์ž์—ฐ์–ด(natural language)๋ž€ ์šฐ๋ฆฌ๊ฐ€ ์ผ์ƒ ์ƒํ™œ์—์„œ ์‚ฌ์šฉํ•˜๋Š” ์–ธ์–ด๋ฅผ ๋งํ•ฉ๋‹ˆ๋‹ค. ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(natural language processing)๋ž€ ์ด๋Ÿฌํ•œ ์ž์—ฐ์–ด์˜ ์˜๋ฏธ๋ฅผ ๋ถ„์„ํ•˜์—ฌ ์ปดํ“จํ„ฐ๊ฐ€ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋„๋ก ํ•˜๋Š” ์ผ์„ ๋งํ•ฉ๋‹ˆ๋‹ค.

 

์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋Š” ์Œ์„ฑ ์ธ์‹, ๋‚ด์šฉ ์š”์•ฝ, ๋ฒˆ์—ญ, ์‚ฌ์šฉ์ž์˜ ๊ฐ์„ฑ ๋ถ„์„, ํ…์ŠคํŠธ ๋ถ„๋ฅ˜ ์ž‘์—…(์ŠคํŒธ ๋ฉ”์ผ ๋ถ„๋ฅ˜, ๋‰ด์Šค ๊ธฐ์‚ฌ ์นดํ…Œ๊ณ ๋ฆฌ ๋ถ„๋ฅ˜), ์งˆ์˜ ์‘๋‹ต ์‹œ์Šคํ…œ, ์ฑ—๋ด‡๊ณผ ๊ฐ™์€ ๊ณณ์—์„œ ์‚ฌ์šฉ๋˜๋Š” ๋ถ„์•ผ์ž…๋‹ˆ๋‹ค.

 

์ตœ๊ทผ ๋”ฅ ๋Ÿฌ๋‹์˜ ๋›ฐ์–ด๋‚œ ์„ฑ๋Šฅ์ด ๊ด„๋ชฉํ• ๋งŒํ•œ ์„ฑ๊ณผ๋ฅผ ์–ป์œผ๋ฉด์„œ, ์ธ๊ณต์ง€๋Šฅ์ด IT ๋ถ„์•ผ์˜ ์ค‘์š” ํ‚ค์›Œ๋“œ๋กœ ๋– ์˜ค๋ฅด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ๋Š” ๊ธฐ๊ณ„์—๊ฒŒ ์ธ๊ฐ„์˜ ์–ธ์–ด๋ฅผ ์ดํ•ด์‹œํ‚จ๋‹ค๋Š” ์ ์—์„œ ์ธ๊ณต์ง€๋Šฅ์—์„œ ๊ฐ€์žฅ ์˜๋ฏธ์žˆ๋Š” ์—ฐ๊ตฌ ๋ถ„์•ผ์ด๋ฉด์„œ๋„ ์•„์ง๋„ ์ •๋ณต๋˜์–ด์•ผ ํ•  ์‚ฐ์ด ๋งŽ์€ ๋ถ„์•ผ์ž…๋‹ˆ๋‹ค.

 

 

1. ํŒ๋‹ค์Šค(Pandas)

ํŒ๋‹ค์Šค(Pandas)๋Š” ํŒŒ์ด์ฌ ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•œ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์ž…๋‹ˆ๋‹ค. ํŒŒ์ด์ฌ์„ ์ด์šฉํ•œ ๋ฐ์ดํ„ฐ ๋ถ„์„๊ณผ ๊ฐ™์€ ์ž‘์—…์—์„œ ํ•„์ˆ˜ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ๋กœ ์•Œ๋ ค์ ธ์žˆ์Šต๋‹ˆ๋‹ค. ์ฐธ๊ณ  ํ•  ์ˆ˜ ์žˆ๋Š” Pandas ๋งํฌ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

๋งํฌ : http://pandas.pydata.org/pandas-docs/stable/

์•„๋‚˜์ฝ˜๋‹ค๋ฅผ ์„ค์น˜ํ•˜์ง€ ์•Š์•˜๋‹ค๋ฉด ์•„๋ž˜์˜ ์ปค๋งจ๋“œ๋กœ Pandas๋ฅผ ๋ณ„๋„ ์„ค์น˜ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

 

 

1. ๋จธ์‹  ๋Ÿฌ๋‹ ์›Œํฌํ”Œ๋กœ์šฐ(Machine Learning Workflow)

๋ฐ์ดํ„ฐ๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ  ๋จธ์‹  ๋Ÿฌ๋‹์„ ํ•˜๋Š” ๊ณผ์ •์„ ํฌ๊ฒŒ 6๊ฐ€์ง€๋กœ ๋‚˜๋ˆ„๋ฉด, ์•„๋ž˜์˜ ๊ทธ๋ฆผ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

 

 

 

1. ์–ธ์–ด ๋ชจ๋ธ(Language Model)

์–ธ์–ด ๋ชจ๋ธ์€ ๋‹จ์–ด ์‹œํ€€์Šค์— ํ™•๋ฅ ์„ ํ• ๋‹น(assign) ํ•˜๋Š” ์ผ์„ ํ•˜๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ์กฐ๊ธˆ ํ’€์–ด์„œ ์“ฐ๋ฉด, ์–ธ์–ด ๋ชจ๋ธ์€ ๊ฐ€์žฅ ์ž์—ฐ์Šค๋Ÿฌ์šด ๋‹จ์–ด ์‹œํ€€์Šค๋ฅผ ์ฐพ์•„๋‚ด๋Š” ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋‹จ์–ด ์‹œํ€€์Šค์— ํ™•๋ฅ ์„ ํ• ๋‹นํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด์„œ ๊ฐ€์žฅ ๋ณดํŽธ์ ์œผ๋กœ ์‚ฌ์šฉ๋˜๋Š” ๋ฐฉ๋ฒ•์€ ์–ธ์–ด ๋ชจ๋ธ์ด ์ด์ „ ๋‹จ์–ด๋“ค์ด ์ฃผ์–ด์กŒ์„ ๋•Œ ๋‹ค์Œ ๋‹จ์–ด๋ฅผ ์˜ˆ์ธกํ•˜๋„๋ก ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

 

 


1๏ธโƒฃ ๋จธ์‹ ๋Ÿฌ๋‹(Machine Learning) ์ •์˜

  • ๋จธ์‹ ๋Ÿฌ๋‹์€ ์ปดํ“จํ„ฐ๊ฐ€ ๋ฐ์ดํ„ฐ์—์„œ ํŒจํ„ด์„ ํ•™์Šตํ•˜์—ฌ ์Šค์Šค๋กœ ์˜ˆ์ธก/ํŒ๋‹จํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“œ๋Š” ๊ธฐ์ˆ ์ด์—์š”.
  • ์ „ํ†ต์ ์ธ ํ”„๋กœ๊ทธ๋ž˜๋ฐ๊ณผ ๋‹ฌ๋ฆฌ ๋ช…๋ น์–ด๋ฅผ ์ผ์ผ์ด ์ฝ”๋”ฉํ•˜์ง€ ์•Š๊ณ , ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ๊ทœ์น™์„ ์ž๋™์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ’ก ์‰ฝ๊ฒŒ ๋งํ•˜๋ฉด:


์ปดํ“จํ„ฐ์—๊ฒŒ ์ •๋‹ต์„ ์•Œ๋ ค์ฃผ๊ณ , ๊ทธ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ์Šค์Šค๋กœ ๋ฌธ์ œ๋ฅผ ํ’€๊ฒŒ ํ•˜๋Š” ๊ฒƒ”

 

 

3๏ธโƒฃ ๋จธ์‹ ๋Ÿฌ๋‹ ์ข…๋ฅ˜

  1. ์ง€๋„ํ•™์Šต(Supervised Learning)
    • ์ •๋‹ต(๋ผ๋ฒจ)์ด ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šต
    • ์˜ˆ์‹œ: ์ด๋ฉ”์ผ ์ŠคํŒธ ๋ถ„๋ฅ˜, ์ง‘ ๊ฐ€๊ฒฉ ์˜ˆ์ธก
  2. ๋น„์ง€๋„ํ•™์Šต(Unsupervised Learning)
    • ์ •๋‹ต ์—†์ด ๋ฐ์ดํ„ฐ์˜ ํŒจํ„ด์ด๋‚˜ ๊ทธ๋ฃน์„ ์ฐพ์•„ ํ•™์Šต
    • ์˜ˆ์‹œ: ๊ณ ๊ฐ ๊ตฐ์ง‘ํ™”, ์ด์ƒ์น˜ ํƒ์ง€
  3. ๊ฐ•ํ™”ํ•™์Šต(Reinforcement Learning)
    • ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ํ†ตํ•ด ๋ณด์ƒ์„ ์ตœ๋Œ€ํ™”ํ•˜๋„๋ก ํ•™์Šต
    • ์˜ˆ์‹œ: ๊ฒŒ์ž„ AI, ๋กœ๋ด‡ ์ž์œจ ์ฃผํ–‰

4๏ธโƒฃ ๋จธ์‹ ๋Ÿฌ๋‹ ๊ณผ์ •

  1. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ – ํ•™์Šตํ•  ๋ฐ์ดํ„ฐ ํ™•๋ณด
  2. ๋ฐ์ดํ„ฐ ์ „์ฒ˜๋ฆฌ – ๊ฒฐ์ธก์น˜ ์ฒ˜๋ฆฌ, ์ •๊ทœํ™”, ํŠน์ง• ์ถ”์ถœ
  3. ๋ชจ๋ธ ํ•™์Šต – ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํ†ตํ•ด ํŒจํ„ด ํ•™์Šต
  4. ๋ชจ๋ธ ํ‰๊ฐ€ – ์ •ํ™•๋„, ์˜ค๋ฅ˜์œจ ๋“ฑ์œผ๋กœ ์„ฑ๋Šฅ ํ™•์ธ
  5. ์˜ˆ์ธก/ํ™œ์šฉ – ํ•™์Šตํ•œ ๋ชจ๋ธ๋กœ ์‹ค์ œ ๋ฌธ์ œ ํ•ด๊ฒฐ

๋”ฅ ๋Ÿฌ๋‹(Deep Learning)์€ ๋จธ์‹  ๋Ÿฌ๋‹(Machine Learning)์˜ ํŠน์ •ํ•œ ํ•œ ๋ถ„์•ผ๋กœ์„œ ์ธ๊ณต ์‹ ๊ฒฝ๋ง(Artificial Neural Network)์˜ ์ธต์„ ์—ฐ์†์ ์œผ๋กœ ๊นŠ๊ฒŒ ์Œ“์•„์˜ฌ๋ ค ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹

 

 

์ธ๊ณต ์‹ ๊ฒฝ๋ง์€ ์ˆ˜๋งŽ์€ ๋จธ์‹  ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ตœ๊ทผ ์ธ๊ณต ์‹ ๊ฒฝ๋ง์„ ๋ณต์žกํ•˜๊ฒŒ ์Œ“์•„ ์˜ฌ๋ฆฐ ๋”ฅ ๋Ÿฌ๋‹์ด ๋‹ค๋ฅธ ๋จธ์‹  ๋Ÿฌ๋‹ ๋ฐฉ๋ฒ•๋“ค์„ ๋›ฐ์–ด๋„˜๋Š” ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋Š” ์‚ฌ๋ก€๊ฐ€ ๋Š˜๋ฉด์„œ, ์ „ํ†ต์ ์ธ ๋จธ์‹  ๋Ÿฌ๋‹๊ณผ ๋”ฅ ๋Ÿฌ๋‹์„ ๊ตฌ๋ถ„ํ•ด์„œ ์ดํ•ดํ•ด์•ผ ํ•œ๋‹ค๋Š” ๋ชฉ์†Œ๋ฆฌ๊ฐ€ ์ปค์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋”ฅ ๋Ÿฌ๋‹์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์šฐ์„  ์ธ๊ณต ์‹ ๊ฒฝ๋ง์— ๋Œ€ํ•œ ์ดํ•ด๊ฐ€ ํ•„์š”ํ•œ๋ฐ, ์—ฌ๊ธฐ์„œ๋Š” ์ดˆ๊ธฐ์˜ ์ธ๊ณต ์‹ ๊ฒฝ๋ง์ธ ํผ์…‰ํŠธ๋ก (Perceptron)์— ๋Œ€ํ•ด์„œ ์ดํ•ดํ•ฉ๋‹ˆ๋‹ค.

1. ํผ์…‰ํŠธ๋ก (Perceptron)

ํผ์…‰ํŠธ๋ก (Perceptron)์€ ํ”„๋ž‘ํฌ ๋กœ์  ๋ธ”๋ผํŠธ(Frank Rosenblatt)๊ฐ€ 1957๋…„์— ์ œ์•ˆํ•œ ์ดˆ๊ธฐ ํ˜•ํƒœ์˜ ์ธ๊ณต ์‹ ๊ฒฝ๋ง์œผ๋กœ ๋‹ค์ˆ˜์˜ ์ž…๋ ฅ์œผ๋กœ๋ถ€ํ„ฐ ํ•˜๋‚˜์˜ ๊ฒฐ๊ณผ๋ฅผ ๋‚ด๋ณด๋‚ด๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์ž…๋‹ˆ๋‹ค. ํผ์…‰ํŠธ๋ก ์€ ์‹ค์ œ ๋‡Œ๋ฅผ ๊ตฌ์„ฑํ•˜๋Š” ์‹ ๊ฒฝ ์„ธํฌ ๋‰ด๋Ÿฐ์˜ ๋™์ž‘๊ณผ ์œ ์‚ฌํ•œ๋ฐ, ์‹ ๊ฒฝ ์„ธํฌ ๋‰ด๋Ÿฐ์˜ ๊ทธ๋ฆผ์„ ๋จผ์ € ๋ณด๋„๋ก ํ•˜๊ฒ ์Šต๋‹ˆ๋‹ค. ๋‰ด๋Ÿฐ์€ ๊ฐ€์ง€๋Œ๊ธฐ์—์„œ ์‹ ํ˜ธ๋ฅผ ๋ฐ›์•„๋“ค์ด๊ณ , ์ด ์‹ ํ˜ธ๊ฐ€ ์ผ์ •์น˜ ์ด์ƒ์˜ ํฌ๊ธฐ๋ฅผ ๊ฐ€์ง€๋ฉด ์ถ•์‚ญ๋Œ๊ธฐ๋ฅผ ํ†ตํ•ด์„œ ์‹ ํ˜ธ๋ฅผ ์ „๋‹ฌํ•ฉ๋‹ˆ๋‹ค.

 

 

2. ๋‹จ์ธต ํผ์…‰ํŠธ๋ก (Single-Layer Perceptron)

์œ„์—์„œ ๋ฐฐ์šด ํผ์…‰ํŠธ๋ก ์„ ๋‹จ์ธต ํผ์…‰ํŠธ๋ก ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ํผ์…‰ํŠธ๋ก ์€ ๋‹จ์ธต ํผ์…‰ํŠธ๋ก ๊ณผ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์œผ๋กœ ๋‚˜๋ˆ„์–ด์ง€๋Š”๋ฐ, ๋‹จ์ธต ํผ์…‰ํŠธ๋ก ์€ ๊ฐ’์„ ๋ณด๋‚ด๋Š” ๋‹จ๊ณ„๊ณผ ๊ฐ’์„ ๋ฐ›์•„์„œ ์ถœ๋ ฅํ•˜๋Š” ๋‘ ๋‹จ๊ณ„๋กœ๋งŒ ์ด๋ฃจ์–ด์ง‘๋‹ˆ๋‹ค. ์ด๋•Œ ์ด ๊ฐ ๋‹จ๊ณ„๋ฅผ ๋ณดํ†ต ์ธต(layer)์ด๋ผ๊ณ  ๋ถ€๋ฅด๋ฉฐ, ์ด ๋‘ ๊ฐœ์˜ ์ธต์„ ์ž…๋ ฅ์ธต(input layer)๊ณผ ์ถœ๋ ฅ์ธต(output layer)์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

 

3. ๋‹ค์ธต ํผ์…‰ํŠธ๋ก (MultiLayer Perceptron, MLP)

XOR ๊ฒŒ์ดํŠธ๋Š” ๊ธฐ์กด์˜ AND, NAND, OR ๊ฒŒ์ดํŠธ๋ฅผ ์กฐํ•ฉํ•˜๋ฉด ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํผ์…‰ํŠธ๋ก  ๊ด€์ ์—์„œ ๋งํ•˜๋ฉด ์ธต์„ ๋” ์Œ“์œผ๋ฉด ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ๊ณผ ๋‹จ์ธต ํผ์…‰ํŠธ๋ก ์˜ ์ฐจ์ด๋Š” ๋‹จ์ธต ํผ์…‰ํŠธ๋ก ์€ ์ž…๋ ฅ์ธต๊ณผ ์ถœ๋ ฅ์ธต๋งŒ ์กด์žฌํ•˜์ง€๋งŒ, ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ์ค‘๊ฐ„์— ์ธต์„ ๋” ์ถ”๊ฐ€ํ•˜์˜€๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ์ž…๋ ฅ์ธต๊ณผ ์ถœ๋ ฅ์ธต ์‚ฌ์ด์— ์กด์žฌํ•˜๋Š” ์ธต์„ ์€๋‹‰์ธต(hidden layer)์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ์ค‘๊ฐ„์— ์€๋‹‰์ธต์ด ์กด์žฌํ•œ๋‹ค๋Š” ์ ์ด ๋‹จ์ธต ํผ์…‰ํŠธ๋ก ๊ณผ ๋‹ค๋ฆ…๋‹ˆ๋‹ค. ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ์€ ์ค„์—ฌ์„œ MLP๋ผ๊ณ ๋„ ๋ถ€๋ฆ…๋‹ˆ๋‹ค.

 

 

์œ„์™€ ๊ฐ™์ด ์€๋‹‰์ธต์ด 2๊ฐœ ์ด์ƒ์ธ ์‹ ๊ฒฝ๋ง์„ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง(Deep Neural Network, DNN) ์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์€ ๋‹ค์ธต ํผ์…‰ํŠธ๋ก ๋งŒ ์ด์•ผ๊ธฐ ํ•˜๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์—ฌ๋Ÿฌ ๋ณ€ํ˜•๋œ ๋‹ค์–‘ํ•œ ์‹ ๊ฒฝ๋ง๋“ค๋„ ์€๋‹‰์ธต์ด 2๊ฐœ ์ด์ƒ์ด ๋˜๋ฉด ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

์ง€๊ธˆ๊นŒ์ง€๋Š” OR, AND, XOR ๊ฒŒ์ดํŠธ ๋“ฑ. ํผ์…‰ํŠธ๋ก ์ด ์ œ๋Œ€๋กœ ๋œ ์ •๋‹ต์„ ์ถœ๋ ฅํ•  ๋•Œ๊นŒ์ง€ ์ €์ž๊ฐ€ ์ง์ ‘ ๊ฐ€์ค‘์น˜๋ฅผ ๋ฐ”๊ฟ”๋ณด๋ฉด์„œ ์ ์ ˆํ•œ ๊ฐ€์ค‘์น˜๋ฅผ ์ˆ˜๋™์œผ๋กœ ์ฐพ์•˜์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ด์ œ๋Š” ๊ธฐ๊ณ„๊ฐ€ ๊ฐ€์ค‘์น˜๋ฅผ ์Šค์Šค๋กœ ์ฐพ์•„๋‚ด๋„๋ก ์ž๋™ํ™”์‹œ์ผœ์•ผํ•˜๋Š”๋ฐ, ์ด๊ฒƒ์ด ๋จธ์‹  ๋Ÿฌ๋‹์—์„œ ๋งํ•˜๋Š” ํ›ˆ๋ จ(training) ๋˜๋Š” ํ•™์Šต(learning) ๋‹จ๊ณ„์— ํ•ด๋‹น๋ฉ๋‹ˆ๋‹ค. ์•ž์„œ ์„ ํ˜• ํšŒ๊ท€์™€ ๋กœ์ง€์Šคํ‹ฑ ํšŒ๊ท€์—์„œ ๋ณด์•˜๋“ฏ์ด ์†์‹ค ํ•จ์ˆ˜(Loss function)์™€ ์˜ตํ‹ฐ๋งˆ์ด์ €(Optimizer)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋งŒ์•ฝ ํ•™์Šต์„ ์‹œํ‚ค๋Š” ์ธ๊ณต ์‹ ๊ฒฝ๋ง์ด ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์ผ ๊ฒฝ์šฐ์—๋Š” ์ด๋ฅผ ์‹ฌ์ธต ์‹ ๊ฒฝ๋ง์„ ํ•™์Šต์‹œํ‚จ๋‹ค๊ณ  ํ•˜์—ฌ, ๋”ฅ ๋Ÿฌ๋‹(Deep Learning)์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค.

 

1๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹(Deep Learning) ์ •์˜

  • ๋”ฅ๋Ÿฌ๋‹์€ ๋จธ์‹ ๋Ÿฌ๋‹์˜ ํ•œ ๋ถ„์•ผ๋กœ, ์ธ๊ณต์‹ ๊ฒฝ๋ง(Artificial Neural Network, ANN)์„ ๊ธฐ๋ฐ˜์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ•˜๋Š” ๊ธฐ์ˆ ์ด์—์š”.
  • “๊นŠ๊ฒŒ(Deep)” ํ•™์Šตํ•œ๋‹ค๋Š” ๋ง์ฒ˜๋Ÿผ ์—ฌ๋Ÿฌ ์ธต(Layer)์˜ ์‹ ๊ฒฝ๋ง์„ ํ†ตํ•ด ๋ณต์žกํ•œ ํŒจํ„ด์„ ์ž๋™์œผ๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ’ก ์‰ฝ๊ฒŒ ๋งํ•˜๋ฉด:

“์‚ฌ๋žŒ ๋‡Œ์˜ ์‹ ๊ฒฝ๋ง ๊ตฌ์กฐ๋ฅผ ํ‰๋‚ด ๋‚ด์–ด, ์ปดํ“จํ„ฐ๊ฐ€ ์Šค์Šค๋กœ ํŠน์ง•์„ ์ถ”์ถœํ•˜๊ณ  ํŒ๋‹จํ•˜๋Š” ๊ธฐ์ˆ ”

 

2๏ธโƒฃ ๋จธ์‹ ๋Ÿฌ๋‹ vs ๋”ฅ๋Ÿฌ๋‹

๊ตฌ๋ถ„๋จธ์‹ ๋Ÿฌ๋‹๋”ฅ๋Ÿฌ๋‹
ํŠน์ง• ์ถ”์ถœ ์‚ฌ๋žŒ์ด ์ง์ ‘ ์„ค๊ณ„ ์‹ ๊ฒฝ๋ง์ด ์ž๋™์œผ๋กœ ์ถ”์ถœ
๋ฐ์ดํ„ฐ ํ•„์š”๋Ÿ‰ ์ƒ๋Œ€์ ์œผ๋กœ ์ ์Œ ๋งŽ์„์ˆ˜๋ก ์„ฑ๋Šฅ ํ–ฅ์ƒ
๊ณ„์‚ฐ๋Ÿ‰ ์ ์Œ ๋งค์šฐ ๋งŽ์Œ, GPU ํ•„์š”
์„ฑ๋Šฅ ๋‹จ์ˆœ ๋ฌธ์ œ ์ ํ•ฉ ์ด๋ฏธ์ง€, ์Œ์„ฑ, ์ž์—ฐ์–ด ๋“ฑ ๋ณต์žก ๋ฌธ์ œ ์ ํ•ฉ

์˜ˆ์‹œ:

  • ๋จธ์‹ ๋Ÿฌ๋‹: ์–ผ๊ตด ์‚ฌ์ง„์—์„œ ๋ˆˆ, ์ฝ”, ์ž… ์œ„์น˜๋ฅผ ์‚ฌ๋žŒ์ด ์ง€์ • → ๋ถ„๋ฅ˜
  • ๋”ฅ๋Ÿฌ๋‹: ์–ผ๊ตด ์‚ฌ์ง„์„ ๊ทธ๋ƒฅ ๋„ฃ์œผ๋ฉด ์‹ ๊ฒฝ๋ง์ด ์Šค์Šค๋กœ ํŠน์ง• ์ถ”์ถœ → ๋ถ„๋ฅ˜

3๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹ ๊ตฌ์กฐ

  1. ์ž…๋ ฅ์ธต(Input Layer) – ๋ฐ์ดํ„ฐ ์ž…๋ ฅ
  2. ์€๋‹‰์ธต(Hidden Layer) – ์—ฌ๋Ÿฌ ์ธต์œผ๋กœ ๊ตฌ์„ฑ, ํŠน์ง•์„ ์ ์  ์ถ”์ถœ
  3. ์ถœ๋ ฅ์ธต(Output Layer) – ์˜ˆ์ธก/๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ ์ถœ๋ ฅ

๐Ÿ’ก ์ธต์ด ๋งŽ์„์ˆ˜๋ก “๋”ฅ(Deep)”ํ•˜๊ฒŒ ํ•™์Šต ๊ฐ€๋Šฅ


4๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹ ํ™œ์šฉ ๋ถ„์•ผ

  • ์ปดํ“จํ„ฐ ๋น„์ „: ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜, ์–ผ๊ตด ์ธ์‹, ์ž์œจ์ฃผํ–‰
  • ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ(NLP): ๋ฒˆ์—ญ, ์ฑ—๋ด‡, ๊ฐ์ • ๋ถ„์„
  • ์Œ์„ฑ ์ฒ˜๋ฆฌ: ์Œ์„ฑ์ธ์‹, ์Œ์•… ์ถ”์ฒœ
  • ๊ฒŒ์ž„/๋กœ๋ด‡: ๊ฐ•ํ™”ํ•™์Šต๊ณผ ๊ฒฐํ•ฉํ•ด ์ž์œจ ํ–‰๋™

 

2๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹์˜ ํ•ต์‹ฌ ๊ตฌ์„ฑ ์š”์†Œ

(1) ์ธ๊ณต์‹ ๊ฒฝ๋ง(Artificial Neural Network, ANN)

  • ๋‰ด๋Ÿฐ(Neuron)์„ ๋ชจ๋ฐฉํ•œ ์—ฐ์‚ฐ ๋‹จ์œ„๋กœ ๊ตฌ์„ฑ๋จ
  • ์ฃผ์š” ๊ตฌ์กฐ:
    1. ์ž…๋ ฅ์ธต(Input Layer): ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ›์•„๋“ค์ด๋Š” ์ธต
    2. ์€๋‹‰์ธต(Hidden Layer): ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ€ํ™˜ํ•˜๋ฉฐ ํŠน์ง•์„ ์ถ”์ถœ
      • ์ธต์ด ๋งŽ์„์ˆ˜๋ก ๋”ฅ๋Ÿฌ๋‹์ด “๊นŠ๊ฒŒ” ํ•™์Šต ๊ฐ€๋Šฅ
    3. ์ถœ๋ ฅ์ธต(Output Layer): ์˜ˆ์ธก๊ฐ’์ด๋‚˜ ๋ถ„๋ฅ˜ ๊ฒฐ๊ณผ ์ถœ๋ ฅ

(2) ํ™œ์„ฑํ™” ํ•จ์ˆ˜(Activation Function)

  • ๋‰ด๋Ÿฐ์ด ๋‹ค์Œ ์ธต์œผ๋กœ ์‹ ํ˜ธ๋ฅผ ์ „๋‹ฌํ• ์ง€ ๊ฒฐ์ •ํ•˜๋Š” ํ•จ์ˆ˜
  • ์ฃผ์š” ์ข…๋ฅ˜: ReLU, Sigmoid, Tanh ๋“ฑ
  • ์—ญํ• : ๋น„์„ ํ˜•์„ฑ(Non-linearity) ๋ถ€์—ฌ → ๋ณต์žกํ•œ ํŒจํ„ด ํ•™์Šต ๊ฐ€๋Šฅ

(3) ์†์‹ค ํ•จ์ˆ˜(Loss Function)

  • ๋ชจ๋ธ ์˜ˆ์ธก๊ฐ’๊ณผ ์‹ค์ œ๊ฐ’ ์ฐจ์ด๋ฅผ ์ˆ˜์น˜ํ™”
  • ํ•™์Šต ๋ชฉํ‘œ: ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ๊ฐ€์ค‘์น˜(W, Weight)๋ฅผ ์กฐ์ •

(4) ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜(Optimizer)

  • ์†์‹ค ํ•จ์ˆ˜๋ฅผ ์ตœ์†Œํ™”ํ•˜๊ธฐ ์œ„ํ•ด ๊ฐ€์ค‘์น˜๋ฅผ ์—…๋ฐ์ดํŠธ
  • ๋Œ€ํ‘œ์  ์•Œ๊ณ ๋ฆฌ์ฆ˜: SGD, Adam, RMSProp
 

3๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹ ํ•™์Šต ๊ณผ์ •

  1. ์ˆœ์ „ํŒŒ(Forward Propagation): ์ž…๋ ฅ ๋ฐ์ดํ„ฐ๋ฅผ ์‹ ๊ฒฝ๋ง์— ๋„ฃ๊ณ  ์ถœ๋ ฅ ๊ณ„์‚ฐ
  2. ์†์‹ค ๊ณ„์‚ฐ(Loss Calculation): ์˜ˆ์ธก๊ฐ’๊ณผ ์‹ค์ œ๊ฐ’ ๋น„๊ต
  3. ์—ญ์ „ํŒŒ(Backpropagation): ์˜ค์ฐจ๋ฅผ ๊ฐ ์ธต์˜ ๊ฐ€์ค‘์น˜์— ๋งž๊ฒŒ ์ „๋‹ฌํ•˜๋ฉฐ ์—…๋ฐ์ดํŠธ
  4. ๊ฐ€์ค‘์น˜ ์—…๋ฐ์ดํŠธ(Weight Update): ์ตœ์ ํ™” ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์‚ฌ์šฉ
  5. ๋ฐ˜๋ณต(Epochs): ๋ฐ์ดํ„ฐ ์ „์ฒด๋ฅผ ์—ฌ๋Ÿฌ ๋ฒˆ ํ•™์Šตํ•˜์—ฌ ์„ฑ๋Šฅ ํ–ฅ์ƒ

๐Ÿ’ก ์ฆ‰, ๋”ฅ๋Ÿฌ๋‹์€ ๋ฐ์ดํ„ฐ๋ฅผ ๋„ฃ๊ณ , ์‹ ๊ฒฝ๋ง์ด ์Šค์Šค๋กœ ํŠน์ง•์„ ํ•™์Šตํ•˜๋ฉฐ, ๋ฐ˜๋ณต์ ์œผ๋กœ ์„ฑ๋Šฅ์„ ๊ฐœ์„ ํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.


4๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹ ๋ชจ๋ธ ์ข…๋ฅ˜

๋ชจ๋ธํŠน์ง•ํ™œ์šฉ ๋ถ„์•ผ
MLP (Multi-Layer Perceptron) ๊ธฐ๋ณธ ์‹ ๊ฒฝ๋ง, ์™„์ „ ์—ฐ๊ฒฐ์ธต(Fully Connected) ์ˆซ์ž ๋ถ„๋ฅ˜, ๊ฐ„๋‹จํ•œ ๋ฐ์ดํ„ฐ
CNN (Convolutional Neural Network) ์ด๋ฏธ์ง€ ๋ฐ์ดํ„ฐ์— ํŠนํ™”, ํŠน์ง• ์ถ”์ถœ ์ž๋™ ์ด๋ฏธ์ง€ ๋ถ„๋ฅ˜, ๊ฐ์ฒด ํƒ์ง€, ์ž์œจ์ฃผํ–‰
RNN (Recurrent Neural Network) ์‹œํ€€์Šค ๋ฐ์ดํ„ฐ ์ฒ˜๋ฆฌ, ์ˆœํ™˜ ๊ตฌ์กฐ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ, ์‹œ๊ณ„์—ด ์˜ˆ์ธก
LSTM / GRU RNN ๊ฐœ์„ , ์žฅ๊ธฐ ์˜์กด์„ฑ ๋ฌธ์ œ ํ•ด๊ฒฐ ๋ฒˆ์—ญ, ์Œ์„ฑ์ธ์‹, ์ฃผ๊ฐ€ ์˜ˆ์ธก
Transformer / BERT / GPT Attention ๋ฉ”์ปค๋‹ˆ์ฆ˜, ๋ณ‘๋ ฌ ์ฒ˜๋ฆฌ ๊ฐ€๋Šฅ ๋ฒˆ์—ญ, ์ฑ—๋ด‡, ๋Œ€๊ทœ๋ชจ NLP ๋ชจ๋ธ

5๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹์˜ ํŠน์ง•

  • ์ž๋™ ํŠน์ง• ์ถ”์ถœ: ์‚ฌ๋žŒ์ด ์ง์ ‘ ํŠน์ง•(feature)์„ ์„ค๊ณ„ํ•˜์ง€ ์•Š์•„๋„ ๋จ
  • ๋Œ€์šฉ๋Ÿ‰ ๋ฐ์ดํ„ฐ์™€ GPU ์ตœ์ ํ™”: ๋ฐ์ดํ„ฐ๊ฐ€ ๋งŽ์„์ˆ˜๋ก ์„ฑ๋Šฅ ํ–ฅ์ƒ
  • ๋ณต์žกํ•œ ๋ฌธ์ œ ํ•ด๊ฒฐ ๊ฐ€๋Šฅ: ์ด๋ฏธ์ง€, ์Œ์„ฑ, ์ž์—ฐ์–ด ๋“ฑ ๋ณต์žกํ•œ ํŒจํ„ด ํ•™์Šต

6๏ธโƒฃ ๋”ฅ๋Ÿฌ๋‹ ํ™œ์šฉ ์‚ฌ๋ก€

  • ์ปดํ“จํ„ฐ ๋น„์ „: ์–ผ๊ตด ์ธ์‹, ์˜๋ฃŒ ์ด๋ฏธ์ง€ ์ง„๋‹จ, ์ž์œจ์ฃผํ–‰
  • ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ: ๋ฒˆ์—ญ, ์ฑ—๋ด‡, ๋ฌธ์„œ ์š”์•ฝ, ๊ฐ์ • ๋ถ„์„
  • ์Œ์„ฑ ์ฒ˜๋ฆฌ: ์Œ์„ฑ ์ธ์‹, ์Œ์•… ์ถ”์ฒœ
  • ๊ฒŒ์ž„·๋กœ๋ด‡: ๊ฐ•ํ™”ํ•™์Šต ๊ธฐ๋ฐ˜ AI, ์ž์œจ ๋กœ๋ด‡

3. ์›Œ๋“œ ์ž„๋ฒ ๋”ฉ(Word Embedding)

๋‹จ์–ด๋ฅผ ๋ฐ€์ง‘ ๋ฒกํ„ฐ(dense vector)์˜ ํ˜•ํƒœ๋กœ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ์›Œ๋“œ ์ž„๋ฒ ๋”ฉ(word embedding)์ด๋ผ๊ณ  ํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ์ด ๋ฐ€์ง‘ ๋ฒกํ„ฐ๋ฅผ ์›Œ๋“œ ์ž„๋ฒ ๋”ฉ ๊ณผ์ •์„ ํ†ตํ•ด ๋‚˜์˜จ ๊ฒฐ๊ณผ๋ผ๊ณ  ํ•˜์—ฌ ์ž„๋ฒ ๋”ฉ ๋ฒกํ„ฐ(embedding vector)

 

 

09. ์›Œ๋“œ ์ž„๋ฒ ๋”ฉ(Word Embedding)

ํ…์ŠคํŠธ๋ฅผ ์ปดํ“จํ„ฐ๊ฐ€ ์ดํ•ดํ•˜๊ณ , ํšจ์œจ์ ์œผ๋กœ ์ฒ˜๋ฆฌํ•˜๊ฒŒ ํ•˜๊ธฐ ์œ„ํ•ด์„œ๋Š” ์ปดํ“จํ„ฐ๊ฐ€ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ํ…์ŠคํŠธ๋ฅผ ์ ์ ˆํžˆ ์ˆซ์ž๋กœ ๋ณ€ํ™˜ํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ๋‹จ์–ด๋ฅผ ํ‘œํ˜„ํ•˜๋Š” ๋ฐฉ๋ฒ•์— ๋”ฐ๋ผ์„œ ์ž์—ฐ์–ด ์ฒ˜๋ฆฌ์˜ ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ๋‹ฌ๋ผ์ง€๊ธฐ ๋•Œ๋ฌธ์— ๋‹จ์–ด๋ฅผ ์ˆ˜์น˜ํ™” ํ•˜๊ธฐ ์œ„ํ•œ ๋งŽ์€ ์—ฐ๊ตฌ๊ฐ€ ์žˆ์—ˆ๊ณ , ํ˜„์žฌ์— ์ด๋ฅด๋Ÿฌ์„œ๋Š” ๊ฐ ๋‹จ์–ด๋ฅผ ์ธ๊ณต ์‹ ๊ฒฝ๋ง ํ•™์Šต์„ ํ†ตํ•ด ๋ฒกํ„ฐํ™”ํ•˜๋Š” ์›Œ๋“œ ์ž„๋ฒ ๋”ฉ์ด๋ผ๋Š” ๋ฐฉ๋ฒ•์ด ๊ฐ€์žฅ ๋งŽ์ด ์‚ฌ์šฉ๋˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.