【发布时间】:2019-02-13 12:41:40
【问题描述】:
我正在使用 Python 做一个用于表情符号推荐系统的项目。第一步是从 twitter 收集数据。具体来说,我需要使用热门表情符号的推文。我正在考虑抓取网站或使用 twitter API。但我在 twitter 文档中没有看到任何关于如何使用特定表情符号进行搜索的内容(可能使用其 unicode,例如 U+1F602)。
提前致谢!
【问题讨论】:
标签: python twitter web-crawler emoji
我正在使用 Python 做一个用于表情符号推荐系统的项目。第一步是从 twitter 收集数据。具体来说,我需要使用热门表情符号的推文。我正在考虑抓取网站或使用 twitter API。但我在 twitter 文档中没有看到任何关于如何使用特定表情符号进行搜索的内容(可能使用其 unicode,例如 U+1F602)。
提前致谢!
【问题讨论】:
标签: python twitter web-crawler emoji
Twitter Rest API 指定调用search/tweets
返回与指定查询匹配的相关推文集合。
查询参数 q 应该是 UTF-8 编码的,因此请尝试传递您要查找的表情符号的 UTF-8 编码。
编辑:我刚刚浏览了带有表情符号的推文,它们是图像,所以看起来你无法搜索它们。
【讨论】:
在这篇文章的帮助下我做到了 https://medium.com/@mroth/how-i-built-emojitracker-179cfd8238ac#a5d7
我没有搜索u'\U0001F602',而是搜索了1F602
我开始得到以下结果:
api = tweepy.API(auth)
print api
query = '1F602' # u'\U0001F602'
print query
max_tweets = 10
search = tweepy.Cursor(api.search, q=query).items(max_tweets)
for status in search:
print status.text
【讨论】:
通过 UTF-8 编码搜索对我来说不起作用,但我很幸运,只是在查询中复制并粘贴了表情符号。 I think this became supported in 2017。
更新后的代码如下所示:
api = tweepy.API(auth)
print api
query = ? #U+1F601
print query
max_tweets = 10
search = tweepy.Cursor(api.search, q=query).items(max_tweets)
for status in search:
print status.text
我不知道为什么这行得通,而使用编码却不行。如果您尝试搜索编码,它会搜索文字字符串。
【讨论】: