one-hot-vector
[NLP] BoW(Bag of words)
Bag of Words 단어 및 문서를 숫자형태로 나타내는 가장 간단한 기법으로서 TextMining 분야에서 딥러닝 기술이 적용되기 이전에 많이 활용되던 방식이라고 한다. Step 1. Constructing the vocabulary containing unique words Example sentences: "John really really loves this movie", "Jane really likes this song" 이 문장에서 really와 this는 중복되기에 한 번만 포함하면 된다. Vocabulary: {"John", "really", "loves", "this", "movie", "Jane", "likes", "song"} Step 2. Encoding unique words ..