【发布时间】:2016-12-16 07:32:17
【问题描述】:
我正在尝试抓取博客的 cmets 并确定它是否具有情感性和信息性。
我找出了最常用的名词(前 10 名)。
在这个过程之后,我制作了两个 txt 文件。
第一个文件包含情感名词。第二个文件包含信息名词。
最后,我想知道一个博客是否有更多的情感名词或更多的信息名词。最后一个流程需要制作哪些代码?
【问题讨论】:
-
文件有多大?如果文件很小并且可以轻松处理,您可以将这两个文件作为字典导入并在python中编写带有计数器的for循环,如果字典中的单词,则增加计数器。哪个计数器更高,这就是博客包含的更多
-
你能给我看看粗略的代码吗?请..TT
-
您自己尝试过什么了吗? SO 不是免费的编码服务,你知道吗?
-
您是否尝试在插入每个文件时对名词进行计数?
标签: string if-statement for-loop blogs