샘플과 타깃의 인코딩
샘플을 머신러닝 알고리즘에 사용하려면 수치로 표현해야 한다. 입력인코딩 : 샘플과 타깃을 벡터나 텐서의 수치로 표현 🦊원-핫 표현 ( one-hot representation ) 0 벡터에서 시작해 문장이나 문서에 등장하는 단어에 상응하는 원소를 1로 설정한다. Time flies like an arrow Fruit flies like a banana 문장을 토큰으로 나누면 {time, fruit, flies, like, a, an, arrow, banana} 8개가 된다. 각 단어를 8차원 원-핫 벡터로 표현이 가능하다. 여기에서는 0과 1이 한 단어의 등장 여부를 나타낸다. 'like a banana'의 이진 인코딩은 [0,0,0,1,1,0,0,1] 이 된다. time fruit flies like ..
2022. 2. 9.