【问题标题】:Searching for Tweets with Unicode Character / Apple Emoji?正在搜索带有 Unicode 字符/Apple 表情符号的推文?
【发布时间】:2013-03-13 10:37:06
【问题描述】:

我正在编译一个推文语料库以进行情绪分析,并试图抓取带有 Apple Emoji 字符的推文。

我发现其中一张面孔的 unicode 字符为:U+1F604 (U+D83D U+DE04), UTF-8: F0 9F 98 84

到目前为止,我还没有得到任何有意义的结果。如果我搜索\ud83d\ude04,我会收到一些推文,但没什么用处。 \U0001f604 在搜索中不返回任何内容。

我有什么方法可以在 Twitter 上查询这些字符吗?

我正在为 API 使用 python-twitter 包装器,但如果存在更好的替代方案,我愿意使用其他东西。

【问题讨论】:

  • 我知道这是可能的,因为iemoji.com 有一连串包含表情符号的推文,从而提高了奖金。

标签: twitter


【解决方案1】:

这是可能的 - 但有点棘手....

您不能使用标准 Twitter 搜索 - 但可以使用流式搜索。

在 Ruby 和 Node 中,https://github.com/mroth/emojitrack-feeder 提供了开源库。

【讨论】:

    【解决方案2】:

    正如@Terence Eden 指出的那样,twitter 的 REST 搜索 API 不适用于表情符号字符,但流 API 可以(截至 2016 年 1 月)。

    有一些工具可以在 python 中访问 twitters API。我最常用的那个tweepy。可以用pip安装。

    tweepy docs on setting up the streaming api 很容易理解。您过滤的字符串需要包含实际的表情符号字符(例如:'?')。

    请注意,这会将表情符号搜索为“单词”:即被空格包围。找不到像“免费?”这样的东西!

    【讨论】:

    • 很奇怪。我自己注意到了这一点。知道为什么流媒体可以做到但不能搜索吗?无论如何,这个答案应该已经被 OP 接受了。
    猜你喜欢
    • 1970-01-01
    • 2019-04-03
    • 1970-01-01
    • 2020-06-03
    • 2014-02-28
    • 1970-01-01
    • 2018-08-28
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多