【发布时间】:2013-07-01 23:05:40
【问题描述】:
我正在开展一个项目,该项目需要我解析新闻文章并确定其中最好的文章。我发现要确定一篇文章的质量,我需要三个主要参数:一篇文章的长度、Facebook 分享/转发以及文章发布后的时间。
我现在面临的问题是如何将所有三个参数放在一个数学函数中,并为每篇文章得出一个分数?分配给他们每个人的分数将帮助我对文章进行排名并将其展示给用户。
如果在确定质量时我需要考虑任何其他参数,请告诉我。
【问题讨论】:
-
如果你能准确解决这个问题,你在学生论文评分自动化方面大有可为!
-
@emschorsch 这并不遥远,几个 Pearson 测试已经自动评分。或者查看开源解决方案kaggle.com/c/ASAP-AES。可以在论坛中找到技术跟进:kaggle.com/c/asap-aes/forums/t/2100/what-approach-did-you-use
-
kaggle 很棒,我真的很想尝试更多他们的比赛。然而,话虽如此,我对任何自动化论文评分的尝试持怀疑态度。这是一个独特的领域,因为它的主要用例,评分,是学生积极尝试操纵系统的地方。学生将很快掌握诸如长度加权、词汇加权等特征。考虑到不断变化的竞争环境,似乎无法准确地做到这一点。
标签: algorithm nlp data-mining data-modeling text-parsing