一.count-based word vectos
1.co-occurrence matrix
求出corpus的词频矩阵
注意:每句话的开头结尾都加上了start,end标识符
斯坦福课程(word2vec)
2.distinct words
计算出所有不同词

3.reduce_to_k_dim
应用SVD方法将co-occurance matix降维

相关文章: