【问题标题】:Searching for known phrases in text using Azure Cognitive Services使用 Azure 认知服务搜索文本中的已知短语
【发布时间】:2021-12-09 00:00:30
【问题描述】:

我正在尝试在这里确定“适合这项工作的工具”,我相信认知服务可以做到这一点,但不会消失在研发兔子洞中,我想我会确保我正在朝着正确的方向挖掘首先。

所以,这里是简短的:

我有一组我想要查找的已知现有短语,但这些短语的书写方式可能略有不同,无论是语法还是语言。

我希望能够解析(可能很大)大量文本以扫描并查找这些短语,以便识别它们。

例如,我的短语可能是“活动将亲自举行”,但这也需要识别语言的不同用途;例如“in-person event”、“face to face event”或“on-site event” - 以及您可以从这些事物中获得的各种同义词和变体。

LUIS 最初似乎是此类事情的首选工具,并且包括编写您自己的特征(又名短语列表)以增强模型的能力,但事实并非如此明确这是否符合简报 - LUIS 似乎更多地关注“意图”和用户交互(例如构建聊天机器人,或从电子邮件中理解意图)。

文本分析似乎也是一个可能的候选者,但似乎更侧重于识别“实体”(例如人/地点/组织)而不是自然语言“短语” - 这个工具是否有效如果我是在定义自己的“主题”,还是真的只是在找错树?

.. 或者...实际上还有什么我应该看完全不同的东西吗?

此时 - 我真的在寻找“我应该花大量时间学习哪种工具”。

在此先感谢大家 - 我很欣赏这是一个相当开放的要求。

【问题讨论】:

    标签: nlp microsoft-cognitive azure-language-understanding azure-cognitive-services luis.ai


    【解决方案1】:

    您的方案似乎更符合我们的文本分析服务。我打算推荐Key Phrase Extraction API,它评估非结构化文本并返回关键短语列表。但是,由于您需要使用已知(自定义)短语列表,它可能不是您正在寻找的解决方案。我们目前不支持自定义关键字提取,但它在我们的路线图中。如果有兴趣,我们可以将您与产品团队联系,以了解有关您的方案的更多信息。

    更新: 请尝试custom NER 能力。

    【讨论】:

    • 与产品团队聊天会非常有用,我已经与 SharePoint Syntex 团队的工程师和项目经理进行过交谈,因此从 Cog 服务角度了解将非常宝贵。
    • 好的,听起来不错。请发送电子邮件至 [AzCommunity][at][microsoft][dot][com] 并附上此主题的标题以及联系方式,以便我们与产品团队联系。谢谢!
    • 感谢您发送电子邮件。我已将您的联系方式转发给产品团队。一位会员会尽快回复您。谢谢!
    • 嗨,产品团队建议尝试自定义 NER(上面更新了链接)。希望这会有所帮助。
    • 感谢您的通知 - 我一定会调查的。
    猜你喜欢
    • 2020-07-03
    • 2020-08-12
    • 1970-01-01
    • 2020-03-27
    • 2021-11-28
    • 2021-10-19
    • 2021-11-04
    • 2021-09-21
    • 1970-01-01
    相关资源
    最近更新 更多