【发布时间】:2014-08-19 12:10:41
【问题描述】:
我有一个带有键值作为标量字符串的散列。该值是另一个散列,它以字符串中的单词为键,以它们的频率为值。
结构:
{
doc1 => { w1 => freq1 , w2 => freq2, .....} ,
doc2 => { w1 => freq1 , w2 => freq2, .....} ,
.
.
.
}
我想比较两个键(doc1、doc2...)并找到两个文档之间的常用词。对于所有文档对,所需的输出是两个文档之间常用词的频率总和。
最好的方法是什么?
【问题讨论】:
-
你试过什么?你遇到了什么问题?请显示您的 Perl 代码,以及输入和所需输出的示例。请阅读How do I ask a good question?