【发布时间】:2016-10-11 02:23:06
【问题描述】:
我正在使用 mahout 在包含 12 个文档的目录上进行 k-means 聚类,并借助以下命令:
mahout seq2sparse -i /user/manisha1414/dir_001-seqfiles -o /user/manisha1414/dir_001-vectors --maxDFPercent 85 --namedVector
mahout seqdumper -i /user/manisha1414/dir_001-kmeans-clusters/clusteredPoints/part-m-00000 > ./dir_001-cluster-docs.txt
我得到以下输出
Key: 0: Value: wt: 1.0 distance: 47.44299700930014 vec: [{"0":2.386},{"2":1.875},{"9":2.386},{"14":2.386.........
Key: 11: Value: wt: 1.0 distance: 217.4603558919857 vec: [{"0":2.386},{"2":1.875},{".........
我在上面的输出中没有得到矢量 ID。
请帮助我在输出中也获取矢量 ID!
【问题讨论】: