【发布时间】:2011-07-04 10:57:46
【问题描述】:
我需要解析相似但不完全相同的 html 电子邮件。我会寻找日期、金额、供应商等信息,但根据电子邮件的发件人,标记会有所不同。
如何从 python 中的许多不同的 html 标记中解析出这些常见的东西?
感谢您的建议。
【问题讨论】:
-
只是不要使用正则表达式:)
我需要解析相似但不完全相同的 html 电子邮件。我会寻找日期、金额、供应商等信息,但根据电子邮件的发件人,标记会有所不同。
如何从 python 中的许多不同的 html 标记中解析出这些常见的东西?
感谢您的建议。
【问题讨论】:
您绝对需要考虑Beautiful Soup 库。
【讨论】:
您可以使用Beautiful Soup 在 Python 中解析 HTML。
【讨论】:
BeautifulSoup 或 lxml 是不错的 HTML 解析器。 BeautifulSoup 更方便一些,但也有一些零碎的东西。
【讨论】: