๐ฆ์์ฐ์ด์ฒ๋ฆฌ (NLP - Natural Language Process)๋?
์ธ์ดํ ์ง์์ ์๊ด์์ด ํ ์คํธ๋ฅผ ์ดํดํ๋ ํต๊ณ์ ์ธ ๋ฐฉ๋ฒ์ ์ฌ์ฉํด ์ค์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ธฐ์ .
์ฌ๊ธฐ์ ํ ์คํธ์ '์ดํด'๋ ์ฃผ๋ก ํ ์คํธ๋ฅผ ๊ณ์ฐ ๊ฐ๋ฅํ ํํ์ผ๋ก ๋ณํํจ์ผ๋ก์จ ์ด๋ฃจ์ด์ง.
์ด ํํ์ ๋ฒกํฐ, ํ ์, ๊ทธ๋ํ, ํธ๋ฆฌ ๊ฐ์ด ์ด์ฐ์ ์ด๊ฑฐ๋ ์ฐ์์ ์ผ๋ก ์กฐํฉํ ๊ตฌ์กฐ์ด๋ค.
์ต๊ทผ์๋ ๋ฅ๋ฌ๋( Deep learning ) ์ด๋ผ๋ ๋จธ์ ๋ฌ๋ ๊ธฐ์ ์ด ๋ฐ์ ์ ๊ฑฐ๋ญํ์ฌ ์ฌ๋ฌ ์ธ๊ณต์ง๋ฅ ์์ ์์ ํจ๊ณผ์ฑ์ ์ ์ฆ๋ฐ์๋ค. ๋ฅ๋ฌ๋์ ๊ณ์ฐ ๊ทธ๋ํ์ ์์น ์ต์ ํ ๊ธฐ์ ์ ์ฌ์ฉํด ๋ฐ์ดํฐ์์ ํํ์ ํจ๊ณผ์ ์ผ๋ก ํ์ตํ๋ ๊ธฐ์ ์ด๋ค.
๐ฆ์ง๋ ํ์ต
๋จธ์ ๋ฌ๋์์ ์ง๋ํ์ต์ ์ํ์ ๋์ํ๋ ํ๊น(์์ธกํ๋ ๊ฐ)์ ์ ๋ต์ ์ ๊ณตํ๋ ๋ฐฉ์.
๊ธฐ๊ณ๋ฒ์ญ์์ ์ํ์ ํ ์ธ์ด์ ๋ฌธ์ฅ์ด๊ณ ํ๊น์ ๋ค๋ฅธ ์ธ์ด์ ๋ฌธ์ฅ์ด๋ค.
์ง๋ํ์ต ์์คํ ์ ์ฃผ์ 6๊ฐ ๊ฐ๋
์ํ(sample) or ์ ๋ ฅ(input)
์์ธก์ ์ฌ์ฉํ๋ ์์ดํ .
x๋ก ํ๊ธฐ.
ํ๊น(target) or ์ ๋ต(ground truth)
ํ๊น์ ์์ํ๋ ๋ ์ด๋ธ, ์์ธก๋๋ ๋์.
y ๋ก ํ๊ธฐ.
๋ชจ๋ธ(model)
์ํ์์ด๋ ์ํx๋ฅผ ๋ฐ์ ํ๊น ๋ ์ด๋ธ๊ฐ์ ์์ธกํ๋ ํจ์.
ํ๋ผ๋ฏธํฐ(parameter) or ๊ฐ์ค์น(weight)
ํ๋ผ๋ฏธํฐ๊ฐ ๋ชจ๋ธ์ ๊ท์ .
w ๋ก ํ๊ธฐ.
์์ธก(prediction) or ์ถ์ (estimate)
๋ชจ๋ธ์ด ์ถ์ธกํ๋ ํ๊น๊ฐ.
ํ(^) ํ๊ธฐ๋ฅผ ์ฌ์ฉ.
์์คํจ์( loss function)
ํ๋ จ ๋ฐ์ดํฐ์ ๋ํ ์์ธก์ด ํ๊น๊ณผ ์ผ๋ง๋ ๋ฉ๋ฆฌ ๋จ์ด์ ธ ์๋์ง ๋น๊ตํ๋ ํจ์.
ํ๊น๊ณผ ์์ธก์ด ์ฃผ์ด์ง๋ฉด ์์ค์ด๋ผ ๋ถ๋ฅด๋ ์ค์ ์ค์นผ๋ผ๊ฐ์ ๊ณ์ฐํจ.
์์ค์ด ๋ฎ์์๋ก ํ๊น ์์ธก์ ๋ ์ํ๋ ๋ชจ๋ธ.
L๋ก ํ๊ธฐ.
๐ฆ๊ฒฐ๋ก
์ง๋ํ์ต์ ์ํ n๊ฐ ์ ์ฒด์ ๋์ ์์ค์ ์ต์ํ ํ๋ ์ต์ ์ ํ๋ผ๋ฏธํฐ( ํน์ ๊ฐ์ค์น) w๋ฅผ ์ฐพ๋ ๊ณผ์
'AI > NLP' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
์ํ๊ณผ ํ๊น์ ์ธ์ฝ๋ฉ (0) | 2022.02.09 |
---|---|
BERT๋ก ๋ค์ด๋ฒ ์ํ ๋ฆฌ๋ทฐ๋ฐ์ดํฐ ๋ถ๋ฅํ๊ธฐ ์ค์ต (2) | 2022.02.04 |
Some weights of the model checkpoint at bert-base-multilingual-cased were not used when initializing (0) | 2022.02.04 |
์์ฐ์ด ์ฒ๋ฆฌ ์์ (0) | 2022.01.24 |
๋๊ธ