【发布时间】:2020-09-25 02:32:07
【问题描述】:
我有一个相当大的帐户,在 Outlook 中有大约 2 万封电子邮件,我需要从这些电子邮件中提取电话号码。
电子邮件的一个例子是:
From: Amy Schwartz <amy@blahdyblah.com>
Dear Anatoliy,
I want you to do blahdy blahdy blah.
Amy Schwartz
(347) 555-1212 <---- I want this
Blahdy Blah Company
我们的想法是通过每封电子邮件并通过正则表达式匹配最后一个电话号码并以以下格式导出列表:
- 姓名:来自“发件人”字段的姓名
- 电子邮件:来自“发件人”字段的电子邮件
- 电话:电子邮件文本中匹配的最后一个电话号码
您对如何执行此操作有任何想法吗?
更新:没有找到任何预构建的解决方案,但我正在拼凑我自己的using this。 codeTwo Outlook Express。您可以将任何电子邮件字段(正文、HTML 正文、发件人、发件人姓名)导出为 CSV。这有点慢(在运行 Win7 VM 的 i7 iMac 上显示一条消息 3 秒)。但它有效:) 从那里我可能只是放入一个数据库并做一些正则表达式魔术。完成后将发布过程。
【问题讨论】:
-
我建议首先获取所有包含数字的行,无论它是什么。如果您处理 20K 大小,我假设电话号码的形式可能会非常不同。然后玩一个正则表达式,它选择任何只包含 - 或 ) 的数字。希望这会有所帮助