【问题标题】:Text parsing in pythonpython中的文本解析
【发布时间】:2017-07-15 18:19:16
【问题描述】:

我的文件很少,其中包含用于发布职位的电子邮件对话。我想从其主题行中提取职位名称、位置和持续时间,但很难弄清楚我该怎么做。 以下是一些主题行示例。

主题:寻找软件开发人员:Cranbury New Jersey - 12 个月合同

主题:立即要求在华沙 IN 全职数学老师。

主题:AP FICO 顾问-----北卡罗来纳州

【问题讨论】:

  • 你是怎么做到的?你写代码。如果您在编写代码时遇到具体问题,请在此处提出问题,但“我该如何解决 [这个大问题] 对于本网站来说不是一个合适的问题。

标签: python regex parsing


【解决方案1】:

如果数据集没有像您发布的示例那样明确的格式,则无法使用正则表达式将数据集准确过滤到您需要的类别中

【讨论】:

    【解决方案2】:

    您需要更深入地研究并弄清楚如何分析您正在寻找的关键字的这些主题行。您需要交叉引用地点名称、职位名称并过滤掉浮夸的单词和字符。

    如果你真的想了解这个,你应该查看Deep Machine LearningNeural Networks 来处理这些主题行以提取相关信息。只有当您能够执行此操作(或类似操作)时,您才能对电子邮件进行分类并突出显示这些关键字以进行排序/组织。

    这不是一个容易的过程,如果你追求它,祝你好运!

    【讨论】:

      猜你喜欢
      • 2019-07-05
      • 1970-01-01
      • 2022-01-17
      • 1970-01-01
      • 2017-02-02
      • 1970-01-01
      • 1970-01-01
      • 2017-01-23
      • 1970-01-01
      相关资源
      最近更新 更多