【发布时间】:2013-10-07 16:48:21
【问题描述】:
我正在尝试从 HTML 页面解析(窃取)大量信息。很多信息都在块中。比如:用户名:1.age 2.gender 3.country 等等。这是一个非常大的块,因此我的正则表达式模式很大。我所有的正则表达式开发工具都有一个用于模式的单行和一个用于文本的文本框。这使得开发这种大型模式变得不可能。我应该怎么做才能开发大型正则表达式模式或者我应该避免它们?
【问题讨论】:
-
HTML 页面基本上是一个 DOM 结构。所以最好使用 DOM 解析器而不是正则表达式来获取所需的信息。
-
我开始不关心持有的问题和否决票。这太烦人了。反正我得到了答案。呵呵~