【发布时间】:2021-03-26 14:22:54
【问题描述】:
我正在尝试根据感兴趣的单词子集计算单词在 dict 列中存在的次数。
首先我导入我的数据
products = graphlab.SFrame('amazon_baby.gl/')
products['word_count'] = graphlab.text_analytics.count_words(products['review'])
products.head(5)
数据可以在这里找到:https://drive.google.com/open?id=0BzbhZp-qIglxM3VSVWRsVFRhTWc
然后我创建我感兴趣的单词列表:
words = ['awesome', 'great', 'fantastic']
我想计算“words”中每个单词在 products['word_count'] 中出现的次数。
我不喜欢使用 graphlab。这是同事向我建议的。
【问题讨论】:
-
欢迎来到 SO。我们希望看到您努力完成代码的证据。看起来您拥有裸露的结构并且不知道如何完成它,这不是 SO 的用途。请阅读“How to Ask”,包括链接和“minimal reproducible example”。我还建议阅读meta.stackoverflow.com/q/261592/128421。
标签: python word-count graphlab sframe