【问题标题】:Reading SMS info using NLP使用 NLP 读取短信信息
【发布时间】:2017-09-09 18:38:30
【问题描述】:

我有一组未分类的 SMS 消息,我想从中提取与交易相关的消息,然后根据借方或贷方对它们进行分类。我还想提取交易金额、日期和受益人。

有没有办法在 NLP 中解决这个问题?我不想进行正则表达式匹配,因为我的 SMS 数据库可以是多种多样的,包括电子钱包、现金转账、ATM 取款、电子资金转账以及与多个提供商的其他此类事情。

【问题讨论】:

  • 很难理解你想写什么。我会帮助英语,但是这个问题太宽泛了,不适合 Stack Overflow。请尝试自己解决问题,只有在遇到特定问题/错误时才来这里,然后在可重现的示例中向我们展示代码和数据。
  • @Hack-R 来自 StackOverflows 问题提问指南,并非所有问题都受益于包含代码。但是如果你的问题出在你写的代码上,你应该包括一些。但不要只是复制整个程序!我的语言可能有问题,但我没有发现这个问题本身有问题。
  • 您的问题太宽泛、离题,需要一个最小的、完整的、可验证的示例。我已经投票关闭它。我知道您是 Stack Overflow 的新手,但这很明显。 请查看如何提问和 MCVE 指南Stack Overflow 不是论坛。
  • 我认为这是一个很好的问题。你能添加几个@Akshat 的例子吗?
  • 嗨@Daniel 我想我已经找到了使用这些论文的出路。我可以寻找解决方案。 iosrjournals.org/iosr-jce/papers/Conf-%20ICFTE%E2%80%9916/…repositorio.pucrs.br/dspace/bitstream/10923/7249/1/…

标签: nlp data-science


【解决方案1】:

你可以做几件事

  • 检查 spacy 库,它可以帮助您进行命名实体和货币相关的提取。我仍然觉得,如果您在谈论自动短信,使用正则表达式提取这些细节可能会更好。
  • 我不确定您所说的借方或贷方是什么意思

【讨论】:

  • 谢谢@Shrikar 我的意思是来自我的储蓄账户的交易信息。
【解决方案2】:

鉴于输入产生的复杂性,我同意这是一个难题。以下是 CogCompNLP 能够对您的输入进行挖掘的内容:

您可以看到它对日期和组织很敏感。

一)。交易价值:- $50 b)。交易类型:- 借方 c)。时间 :- 2017 年 9 月 18 日 15:45 d)。目的:- 麦当劳餐厅 e)。最终余额:- 41276.00 美元)。关联帐户:- xxxxxxx1234。

我要做的是将一堆规则与这些自动提取的标签结合起来。不幸的是,没有 100% 保证提取这些标签,但是如果它在 99% 的示例中有效,那么它应该足够可靠。

您可以在这里玩演示:http://nlp.cogcomp.org

披露:我是该软件的作者之一。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-12-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多