【问题标题】:Twitter Search for All Words Ending with... (Corpus Linguistics)Twitter 搜索所有以...结尾的词(语料库语言学)
【发布时间】:2019-01-02 09:59:47
【问题描述】:

我正在使用 Twitter 创建一个语料库,我需要搜索包含特定语法结构的推文,例如以 -ing 结尾的动词。

例如:我想搜索包含该结构的推文:

I enjoy + any verb ending in -ing

结果应包括所有带有I enjoy + verb ending in -ing 实例的推文,例如“我喜欢游泳”、“我喜欢听音乐”等。

我了解 Twitter API 不支持正则表达式,因此欢迎提出任何想法。 谢谢!

【问题讨论】:

    标签: twitter corpus linguistics


    【解决方案1】:

    您可以尝试两件事。

    首先是创建要搜索的动词列表,然后搜索确切的短语潜在动词列表:

    "I enjoy" doing OR eating OR seeing

    https://twitter.com/search?l=&q=%22I%20enjoy%22%20doing%20OR%20eating%20OR%20seeing&src=typd

    第二种是只是搜索"I enjoy"然后过滤结果客户端。如果您想获得最大的结果,我建议您使用流式 API。

    祝你好运!

    【讨论】:

    • 谢谢,特伦斯。但是,一旦我使用第二种方法获得了结果,我该如何过滤它们以便为所有可能的动词找到“我喜欢”+“动词”的所有实例?
    • 您需要一份英语中每个动词的列表。对于过滤,请提出一个新问题并指明您使用的编程语言。
    • 谢谢,但我想我已经通过 P.O.S. 找到了解决方法。标记(用于 Python 3 的 NLTK)您建议的第二种方法的所有结果。这使我可以简单地搜索例如“我喜欢”+ GERUND。
    • 酷。如果这个答案有帮助,请点击勾选按钮。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-12-21
    • 2019-02-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多