【发布时间】:2014-05-18 01:36:55
【问题描述】:
我的 Oracle 数据库中有 2 个表:
DF (term, doccount)TF (abstractid, term, freq)
一个用于文档频率 (DF),具有术语和 documentCount,另一个用于称为 TF 的术语频率表,具有 documentID、术语、频率。 我想计算 TF*IDF,其中 TF = 术语出现在文章中的次数(表 TF 中的频率列)和 IDF = log (132225)-log(docCount)+1
我想将我的结果存储在一个包含 documentID、Terms 和计算出的 TF*IDF 的表 (TFIDF) 中
有什么想法吗?
【问题讨论】: