【发布时间】:2015-09-29 17:25:04
【问题描述】:
我正在编写一个R 脚本并且正在使用库(ngram)。
假设我有一个字符串,
“质量好的狗粮买了一些重要的罐头狗粮产品发现质量好的产品看起来像炖肉过程肉味道更好拉布拉多finicki appreci产品更好”
并且想找到二元组。
ngram 库给我的 bi-gram 如下:
“欣赏产品”“加工肉类”“食品”“购买的食品”“质量狗”“找到的产品”“产品外观”“看起来像”“像炖肉”“质量好”“拉布拉多犬”“购买的服务器” ” “优质产品” “更好的拉布拉多” “狗粮”“味道更好”“重要罐头”“肉味”“发现好”“切断重要”“炖制过程”“狗粮”“finicki appreci”“产品更好”
由于句子包含两次“狗粮”,所以我要两次这个双元词。但我得到它一次!
thengram 库或任何其他库中是否有一个选项可以在 R 中提供我句子的所有二元组?
【问题讨论】: