【发布时间】:2016-05-11 07:32:22
【问题描述】:
您好,我正在尝试计算包含 5 个单词的给定数组的句子之间的余弦相似度。所以我有一个 asp.net 项目,我在其中编写了代码来计算文本中的前 5 个单词(按频率)(大约 50-60 个句子),我在数组 K 中有这些单词。直到这里一切正常。我想从文本中获取每个句子(这是我的问题中的一个输入,并且应用程序中有一个文本区域,用户可以在其中粘贴任何内容文本或文章)并建立了向量。例如; 让我们假设数组
K={technology, product,player}
给定的文本是这样的;
Apple Inc. 是一家美国跨国科技公司 总部位于加利福尼亚州库比蒂诺,设计、开发和 销售消费电子产品、计算机软件和在线服务。 其硬件产品包括iPhone智能手机、iPad平板电脑 电脑、Mac 个人电脑、iPod 便携式媒体播放器、 和 Apple Watch 智能手表。苹果的消费者软件包括 OS X 和 iOS 操作系统、iTunes 媒体播放器、Safari Web 浏览器,以及 iLife 和 iWork 的创造力和生产力 套房。其在线服务包括 iTunes Store、iOS 应用 Store 和 Mac App Store,以及 iCloud。
所以四个句子的四个向量应该是这样的
s1={1,0,0} s2={0,1,1} s3={0,0,1} s4={0,0,0}
如何在 asp.net 上建立这些向量?
【问题讨论】:
标签: asp.net string text vector