【问题标题】:How can I python twitter crawling (scraping) several keywordpython twitter如何抓取(抓取)几个关键字
【发布时间】:2017-04-16 14:26:20
【问题描述】:

我写了代码。

但我不认为它会起作用。

我想从“或”的概念而不是“和”的概念中提取词。

似乎只提取了“关键字 1”。

如何进行更正?

import tweepy
import time
import os

search_term = 'keyword1'
search_term2= 'keyword2'

lat = "37.6"
lon = "127.0"
radius = "200km"
location = "%s,%s,%s" % (lat, lon, radius)


API_key = "11111"
API_secret = "22222"
Access_token = "33333"
Access_token_secret = "444"


auth = tweepy.OAuthHandler(API_key, API_secret)
auth.set_access_token(Access_token, Access_token_secret)

api = tweepy.API(auth)

c=tweepy.Cursor(api.search,
            q=(search_term or search_term2),
            rpp=1000,
            geocode=location,
            include_entities=True)

data = {}
i = 1
for tweet in c.items():
    data['text'] = tweet.text
    print(i, ":", data)
    i += 1
time.sleep(1)


wfile = open(os.getcwd()+"/twtw2.txt", mode='w')   
data = {}   
i = 0       

for tweet in c.items():
    data['text'] = tweet.text   
    wfile.write(data['text']+'\n')  
    i += 1
    time.sleep(1)

wfile.close()

【问题讨论】:

  • 不清楚你到底在问什么。此外,您不应在公开发布的代码中包含您的秘密和令牌。

标签: python twitter web-crawler keyword


【解决方案1】:

也许改变这一行

q=(search_term or search_term2),

q="{}+OR+{}".format(search_term,search_term2),
  • 这里的案例对 OR 运算符很重要
  • 输入 q 作为字符串,而不是作为短路计算的表达式

顺便说一句,您的凭据(来自您的帖子)也适用于我。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-10-06
    • 2021-03-23
    • 1970-01-01
    相关资源
    最近更新 更多