【发布时间】:2012-04-04 17:59:02
【问题描述】:
我想获取 html 页面的 td 标签之间的文本..
以下是页面html代码的简短sn-p
<tr align="right"><td>989</td><td>Kristoffer</td><td>Shameka</td> <tr align="right"><td>990</td><td>Lazaro</td><td>Deirdre</td> <tr align="right"><td>991</td><td>Torey</td><td>Shantell</td> <tr align="right"><td>992</td><td>Bill</td><td>Cherish</td> <tr align="right"><td>993</td><td>Bruno</td><td>Linsey</td> <tr align="right"><td>994</td><td>Genaro</td><td>Hali</td> <tr align="right"><td>995</td><td>Waylon</td><td>Tarah</td> <tr align="right"><td>996</td><td>Brittany</td><td>Annemarie</td>。 . .等等。
我想使用正则表达式提取单个单元格值(例如:对于第一列 989,Kristoffer 和 Shameka)。帮助!
【问题讨论】:
-
为什么?!编写 DOM 是为了让您不必使用正则表达式解析 html 文档!为什么你认为你需要这样做?
-
你有使用正则表达式吗?您知道这确实是 HTML 的格式(总是)并且格式正确吗?如果没有,请阅读this 了解为什么正则表达式是一个糟糕的解决方案。
-
@Neil - DOM 应该如何在 C# 中工作?
-
你不能!请改用 javascript/jQuery。
-
同意,这是 DOM 解析器而不是正则表达式的工作。