【问题标题】:How to search tweets with certain emoji如何使用某些表情符号搜索推文
【发布时间】:2019-02-13 12:41:40
【问题描述】:

我正在使用 Python 做一个用于表情符号推荐系统的项目。第一步是从 twitter 收集数据。具体来说,我需要使用热门表情符号的推文。我正在考虑抓取网站或使用 twitter API。但我在 twitter 文档中没有看到任何关于如何使用特定表情符号进行搜索的内容(可能使用其 unicode,例如 U+1F602)。

提前致谢!

【问题讨论】:

    标签: python twitter web-crawler emoji


    【解决方案1】:

    Twitter Rest API 指定调用search/tweets

    返回与指定查询匹配的相关推文集合。

    查询参数 q 应该是 UTF-8 编码的,因此请尝试传递您要查找的表情符号的 UTF-8 编码。

    编辑:我刚刚浏览了带有表情符号的推文,它们是图像,所以看起来你无法搜索它们。

    【讨论】:

    • 是的,但是对于如何使用 EMOJI 仅搜索推文没有任何帮助!
    • 谢谢,我已经尝试过了,但我认为它不起作用:(
    【解决方案2】:

    在这篇文章的帮助下我做到了 https://medium.com/@mroth/how-i-built-emojitracker-179cfd8238ac#a5d7

    我没有搜索u'\U0001F602',而是搜索了1F602 我开始得到以下结果:

    api = tweepy.API(auth)
    print api
    query = '1F602' # u'\U0001F602'   
    print query
    max_tweets = 10
    search = tweepy.Cursor(api.search, q=query).items(max_tweets)
    for status in search:
        print status.text
    

    【讨论】:

      【解决方案3】:

      通过 UTF-8 编码搜索对我来说不起作用,但我很幸运,只是在查询中复制并粘贴了表情符号。 I think this became supported in 2017

      更新后的代码如下所示:

      api = tweepy.API(auth)
      print api
      query = ? #U+1F601   
      print query
      max_tweets = 10
      search = tweepy.Cursor(api.search, q=query).items(max_tweets)
      for status in search:
          print status.text
      

      我不知道为什么这行得通,而使用编码却不行。如果您尝试搜索编码,它会搜索文字字符串。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2011-06-21
        • 2013-03-13
        • 2018-01-07
        • 2017-04-30
        • 1970-01-01
        • 1970-01-01
        • 2015-04-12
        相关资源
        最近更新 更多