【问题标题】:Streaming twitter data and saving to csv in Python在 Python 中流式传输 twitter 数据并保存到 csv
【发布时间】:2018-07-29 20:07:24
【问题描述】:

我正在尝试关注 tutorial 将推文从 twitter 流式传输到数据库,然后再将数据库转换为 CSV 文件。我可以实现流 API 功能来很好地捕获数据,但是当尝试将数据保存在 csv 文件中时,我遇到了问题。

起初我遇到了与this question 类似的问题,我收到以下错误。

    AttributeError: module 'dataset' has no attribute 'freeze'

解决方案在运行脚本时消除了错误,但我没有 CSV 文件和空 DB 文件。

我查看了所有文档,但我真的不确定我做错了什么以及如何继续。

My GitHub with all source code can be found here

【问题讨论】:

  • 您能否首先验证代码是否正确接收推文?
  • 老实说,我对此很陌生,所以我有点不确定和困惑。我已经尝试过更简单的版本,它可以提取推文并写入一个运行良好的 .JSON 文件,这似乎是当我尝试执行下一步时我遇到了问题简单脚本示例 - pastebin.com/z0FKLCJm跨度>
  • 重现了错误。推文保存到数据库就好了。也许有必要使用特定版本的 python 和/或使用的包?

标签: python python-3.x twitter export-to-csv sentiment-analysis


【解决方案1】:

首先,我认为将流中的推文存储在 CSV 文件中是一个坏主意,请使用 MongoDB 或其他数据库来存储数据。

如何在数据库中组织流式传输和存储推文的好例子,您可以在 this github repository 上找到

在将推文插入数据库之前,最好提前计算推文的情绪分数。情感分析可以使用VADER情感分析工具来完成。

祝你好运)

【讨论】:

    猜你喜欢
    • 2014-05-01
    • 2020-10-07
    • 1970-01-01
    • 2021-02-21
    • 2021-01-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多