【问题标题】:String & Regex manipulation in HTML file using Python使用 Python 在 HTML 文件中进行字符串和正则表达式操作
【发布时间】:2011-07-12 13:49:35
【问题描述】:

我是 Python 的新手。我有一个 HTML 文件,我需要在其中执行一些“使用正则表达式查找和替换操作”。最好的方法是什么?

我可以将 HTML 文件的内容作为字符串获取并执行此操作吗?还是有更好的办法?

【问题讨论】:

  • “最好的方法是什么?”不要使用正则表达式。最好的方法是(1)在此处搜索此问题的重复项。 (2) 使用 Beautiful Soup,这是所有重复的答案。
  • -1 今天提出第三个 HTML 解析 + 正则表达式问题......请在提问前先研究一下。要求用正则表达式解析 HTML 总是会给你很多反对意见。

标签: python html regex file


【解决方案1】:

看看像 Beautiful Soup 这样的 HTML 解析器。 使用正则表达式解析 HTML 是a bad idea

编辑:

美汤许可证:

Beautiful Soup 的许可条款与 Python 本身相同

Pythons license

注意: GPL 兼容并不意味着我们在 GPL 下分发 Python。与 GPL 不同,所有 Python 许可证都允许您分发修改后的版本,而无需将您的更改开源。与 GPL 兼容的许可证可以将 Python 与在 GPL 下发布的其他软件结合起来;其他人没有。

【讨论】:

  • @cularis 我将使用此脚本进行分发。那么如果我使用漂亮的 Soap 或者 html5lib,部署是否可行?
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2013-04-01
  • 2011-12-16
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多