【问题标题】:How to extract a dataset from twitter?如何从 Twitter 中提取数据集?
【发布时间】:2014-07-15 21:54:11
【问题描述】:

我打算写关于机器学习的学士学位论文,我想知道是否有任何方法可以提取大量推文数据集,以便将它们用于我的论文。我知道有几个推文数据集,但我想用西班牙语提取一个,因为这种语言没有。我已经准备好尝试使用此脚本twitterstream.py,但我不知道获取令牌的过程如何,如果获得令牌,我将获得什么样的推文?我的意思是我只会获得我朋友的推文吗?获取数据集的过程如何?,我似乎有点迷失了如何接近这个任务。

【问题讨论】:

  • 您是否阅读过 twitter API 文档?你的问题在那里得到了详细的解答。

标签: machine-learning nlp social-networking data-mining sentiment-analysis


【解决方案1】:

您需要访问令牌来授权自己使用 twitter API。 (https://dev.twitter.com/docs/auth/obtaining-access-tokens) 完成后,您可以使用 Twitter API。当然,如果推文是私人的,您将无法看到它们(除非您是该帐户的“朋友”)。

然后我建议您查看流 API 以找到您需要的推文。 (https://dev.twitter.com/docs/api/streaming) 据我所知,没有用于搜索 Twitter API 的语言过滤器,所以我建议您需要一个西班牙语过滤器分类器。

【讨论】:

    猜你喜欢
    • 2013-09-01
    • 1970-01-01
    • 2011-04-18
    • 2019-10-07
    • 2020-06-21
    • 1970-01-01
    • 1970-01-01
    • 2013-06-14
    • 1970-01-01
    相关资源
    最近更新 更多