【发布时间】:2010-10-07 15:07:38
【问题描述】:
有没有办法将特定的句子/段落归类为有趣。很少有人指出应该在这方面走得更远。
【问题讨论】:
标签: nlp classification
有没有办法将特定的句子/段落归类为有趣。很少有人指出应该在这方面走得更远。
【问题讨论】:
标签: nlp classification
另外,如果您想进入该领域,请尝试Computational Humor @ Google Scholar。也提到了情绪分析,请参阅wikipedia。
当然,这一切都取决于你的范围和目标是什么......
【讨论】:
您可以使用与垃圾邮件过滤器相同的技术。而不是垃圾邮件/非垃圾邮件,您将其分类为有趣/不有趣。查看朴素贝叶斯分类器以获取更多信息。
【讨论】:
对此有研究,称为Computational Humor。这是一个跨学科领域,包含计算语言学、心理语言学、人工智能、机器学习等方面的元素。他们试图找出是什么让故事或笑话变得有趣(例如,意想不到的联系,或以令人惊讶的方式使用禁忌话题)等)并将其应用于文本(生成有趣的故事或衡量文本的“有趣性”)。
有books 和有关它的文章(例如Graeme Ritchie)。
【讨论】:
是的,您应该使用训练语料库来构建能够检测有趣句子的预测模型。有时这在文献中被称为“情绪分析”。看看这篇关于Sentiment Analysis with LingPipe的文章。
如果你会使用 Java,你可以使用他们的库(见license matrix)。我发现它非常有用,与您的上下文不完全相同。
【讨论】:
实现这一目标的唯一方法是让几千人(猴子不会这样做,抱歉)浏览数千个有趣的句子/故事,对它们进行评分,然后构建某种专家系统/神经网络出它。考虑到问题的范围和它的主观性(一件有趣的事情对一个人来说可能并不有趣 - 甚至令人反感 - 对另一个人来说),我会说这是一项不可能完成的任务。
【讨论】: