๋ณธ๋ฌธ ๋ฐ”๋กœ๊ฐ€๊ธฐ
AI/NLP

NLP / ์ง€๋„ํ•™์Šต

by ๋™๊ธฐ 2022. 1. 24.
๋ฐ˜์‘ํ˜•

๐ŸฆŠ์ž์—ฐ์–ด์ฒ˜๋ฆฌ (NLP - Natural Language Process)๋ž€?

์–ธ์–ดํ•™ ์ง€์‹์— ์ƒ๊ด€์—†์ด ํ…์ŠคํŠธ๋ฅผ ์ดํ•ดํ•˜๋Š” ํ†ต๊ณ„์ ์ธ ๋ฐฉ๋ฒ•์„ ์‚ฌ์šฉํ•ด ์‹ค์ „ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ธฐ์ˆ .

์—ฌ๊ธฐ์„œ ํ…์ŠคํŠธ์˜ '์ดํ•ด'๋Š” ์ฃผ๋กœ ํ…์ŠคํŠธ๋ฅผ ๊ณ„์‚ฐ ๊ฐ€๋Šฅํ•œ ํ‘œํ˜„์œผ๋กœ ๋ณ€ํ™˜ํ•จ์œผ๋กœ์จ ์ด๋ฃจ์–ด์ง.

์ด ํ‘œํ˜„์€ ๋ฒกํ„ฐ, ํ…์„œ, ๊ทธ๋ž˜ํ”„, ํŠธ๋ฆฌ ๊ฐ™์ด ์ด์‚ฐ์ ์ด๊ฑฐ๋‚˜ ์—ฐ์†์ ์œผ๋กœ ์กฐํ•ฉํ•œ ๊ตฌ์กฐ์ด๋‹ค.

 

์ตœ๊ทผ์—๋Š” ๋”ฅ๋Ÿฌ๋‹( Deep learning ) ์ด๋ผ๋Š” ๋จธ์‹ ๋Ÿฌ๋‹ ๊ธฐ์ˆ ์ด ๋ฐœ์ „์„ ๊ฑฐ๋“ญํ•˜์—ฌ ์—ฌ๋Ÿฌ ์ธ๊ณต์ง€๋Šฅ ์ž‘์—…์—์„œ ํšจ๊ณผ์„ฑ์„ ์ž…์ฆ๋ฐ›์•˜๋‹ค. ๋”ฅ๋Ÿฌ๋‹์€ ๊ณ„์‚ฐ ๊ทธ๋ž˜ํ”„์™€ ์ˆ˜์น˜ ์ตœ์ ํ™” ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•ด ๋ฐ์ดํ„ฐ์—์„œ ํ‘œํ˜„์„ ํšจ๊ณผ์ ์œผ๋กœ ํ•™์Šตํ•˜๋Š” ๊ธฐ์ˆ ์ด๋‹ค.

 

๐ŸฆŠ์ง€๋„ ํ•™์Šต

๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ์ง€๋„ํ•™์Šต์€ ์ƒ˜ํ”Œ์— ๋Œ€์‘ํ•˜๋Š” ํƒ€๊นƒ(์˜ˆ์ธกํ•˜๋Š” ๊ฐ’)์˜ ์ •๋‹ต์„ ์ œ๊ณตํ•˜๋Š” ๋ฐฉ์‹.

๊ธฐ๊ณ„๋ฒˆ์—ญ์—์„œ ์ƒ˜ํ”Œ์€ ํ•œ ์–ธ์–ด์˜ ๋ฌธ์žฅ์ด๊ณ  ํƒ€๊นƒ์€ ๋‹ค๋ฅธ ์–ธ์–ด์˜ ๋ฌธ์žฅ์ด๋‹ค.

 

์ง€๋„ํ•™์Šต ์‹œ์Šคํ…œ์˜ ์ฃผ์š” 6๊ฐœ ๊ฐœ๋…

์ƒ˜ํ”Œ(sample) or ์ž…๋ ฅ(input)

์˜ˆ์ธก์— ์‚ฌ์šฉํ•˜๋Š” ์•„์ดํ…œ.

x๋กœ ํ‘œ๊ธฐ.

 

ํƒ€๊นƒ(target) or ์ •๋‹ต(ground truth)

ํƒ€๊นƒ์— ์ƒ์‘ํ•˜๋Š” ๋ ˆ์ด๋ธ”, ์˜ˆ์ธก๋˜๋Š” ๋Œ€์ƒ.

y ๋กœ ํ‘œ๊ธฐ.

 

๋ชจ๋ธ(model)

์ˆ˜ํ•™์‹์ด๋‚˜ ์ƒ˜ํ”Œx๋ฅผ ๋ฐ›์•„ ํƒ€๊นƒ ๋ ˆ์ด๋ธ”๊ฐ’์„ ์˜ˆ์ธกํ•˜๋Š” ํ•จ์ˆ˜.

 

ํŒŒ๋ผ๋ฏธํ„ฐ(parameter) or ๊ฐ€์ค‘์น˜(weight)

ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ๋ชจ๋ธ์„ ๊ทœ์ •.

w ๋กœ ํ‘œ๊ธฐ.

 

์˜ˆ์ธก(prediction) or ์ถ”์ •(estimate)

๋ชจ๋ธ์ด ์ถ”์ธกํ•˜๋Š” ํƒ€๊นƒ๊ฐ’.

ํ–‡(^) ํ‘œ๊ธฐ๋ฅผ ์‚ฌ์šฉ.

 

์†์‹คํ•จ์ˆ˜( loss function)

ํ›ˆ๋ จ ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์˜ˆ์ธก์ด ํƒ€๊นƒ๊ณผ ์–ผ๋งˆ๋‚˜ ๋ฉ€๋ฆฌ ๋–จ์–ด์ ธ ์žˆ๋Š”์ง€ ๋น„๊ตํ•˜๋Š” ํ•จ์ˆ˜.

ํƒ€๊นƒ๊ณผ ์˜ˆ์ธก์ด ์ฃผ์–ด์ง€๋ฉด ์†์‹ค์ด๋ผ ๋ถ€๋ฅด๋Š” ์‹ค์ˆ˜ ์Šค์นผ๋ผ๊ฐ’์„ ๊ณ„์‚ฐํ•จ.

์†์‹ค์ด ๋‚ฎ์„์ˆ˜๋ก ํƒ€๊นƒ ์˜ˆ์ธก์„ ๋” ์ž˜ํ•˜๋Š” ๋ชจ๋ธ.

L๋กœ ํ‘œ๊ธฐ.

 

๐ŸฆŠ๊ฒฐ๋ก 

์ง€๋„ํ•™์Šต์€ ์ƒ˜ํ”Œ n๊ฐœ ์ „์ฒด์˜ ๋ˆ„์  ์†์‹ค์„ ์ตœ์†Œํ™” ํ•˜๋Š” ์ตœ์ ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ( ํ˜น์€ ๊ฐ€์ค‘์น˜) w๋ฅผ ์ฐพ๋Š” ๊ณผ์ •

๋ฐ˜์‘ํ˜•

๋Œ“๊ธ€