【问题标题】:Finding low-voted posts on Reddit在 Reddit 上查找低票数的帖子
【发布时间】:2012-11-10 13:58:49
【问题描述】:

Reddit API 提供任何给定帖子的得分信息,包括赞成票数、反对票数和总分。我想使用这些信息对故事标题进行一些分析,并最终分析故事链接到的内容(自我帖子、博客文章等),以尝试预测哪些帖子会受欢迎,哪些帖子会失败。

Reddit 的 API 可让您轻松访问任何给定 subreddit(包括 r/all)中得分最高的帖子,但没有一种简单的方法可以找到低分的帖子,尤其是考虑到有不同类型的低分.

例如,您可以有一个新的故事,它有 0 次上涨、0 次下跌和 0 分。这个故事是失败的吗?不必要。这只是新的。然而,由于 Reddit 的工作方式,一个故事可能有 0 次上涨、50 次下跌和 0 分。这篇文章很可能是可恶的、垃圾邮件或其他旨在攻击的内容。我认为我需要区分这两种类型的故事以获得更准确的表示。

我希望前 10% 和最低 10% 的故事得分明智,所以如果您知道一种方法来查找提交到子版块的故事总数,我很想听听!

查找低分报道的最佳方法是什么?我是否应该从头版开始并使用蛮力算法,检查每个故事的起伏和得分,直到我有足够的数据?我还需要考虑哪些其他变量?

【问题讨论】:

    标签: python analytics reddit data-analysis


    【解决方案1】:

    查找低分报道的最佳方法是什么?

    reddit 的search functionality 很可能是您通过 subreddit 或一组 subreddit 查找低分提交的最佳选择。不幸的是,指数中似乎既没有得分,也没有投票数(上升或下降)。或许如果你在/r/redditdev上问这个问题,你可能会得到/u/kemitche的好评。

    我是否应该从首页开始,使用蛮力算法,检查每个故事的起伏和得分,直到我有足够的数据?

    您可能还想联系/u/Deimorz,因为 Deimorz 已经这样做了 [1, 2] 并且可以为您提供问题的答案。

    我希望前 10% 和最低 10% 的故事得分明智,所以如果您知道一种方法来查找提交到子版块的故事总数,我很想听听!

    不幸的是,如果没有随着时间的推移监控所有提交到 subreddit 的提交,或者追溯尝试抓取所有 reddit 的提交(正如 Deimorz 所做的那样),唯一可能的方法是直接询问 reddit 管理员。

    【讨论】:

    • 我考虑过使用搜索功能,但如果不包括分数,我将如何过滤掉分数较高的故事?我肯定会四处询问 r/redditdev,看看他们要说什么。不过,联系 Deimorz 的小费可能会得到回报。我以前不知道他的工作,所以谢谢!
    • 我只是建议询问 /u/kemitche,因为如果碰巧包含该信息,他会知道如何访问该信息。此外,如果投票信息尚未包括在内,他将是建议将投票信息添加为可搜索功能的人。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-01-21
    • 2014-08-20
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多