【发布时间】:2020-03-25 11:51:06
【问题描述】:
我已将收件箱提取到 csv,每封电子邮件的正文都以以下格式输出:
"From: Name email@email.co.uk mailto:Name@email.co.uk text text text"
这些几乎都是长链电子邮件,但我需要一种方法来获取原始发件人。
目前,我一直在使用正则表达式模式从每个文本正文中抓取电子邮件,然后抓取该列表中的最后一封电子邮件:
list_emails = unlist(regmatches(text, gregexpr("([_a-z0-9-]+(\\.[_a-z0-9-]+)*@[a-z0-9-]+(\\.[a-z0-9-]+)*(\\.[a-z]{2,4}))",
text, ignore.case = TRUE)))
# The last item in that list is the last one found within the body of the email and our likely original sender
list_emails[length(list_emails)]
如果原始电子邮件的签名中有他们的地址,但如果没有,则获取最后一个复制的人(抄送)。
我想要编辑它以仅获取以字符串模式“发件人:”开头的电子邮件,然后我可以获取此新列表中的最后一项。这将是获取原始发件人的最快方式。
有没有办法编辑我的原始模式来完成这个?
【问题讨论】: