【发布时间】:2009-12-12 21:11:13
【问题描述】:
我正在尝试从 HTML 文件中过滤某些数据。例如HTML文件如下:
<tr><td valign="top"><img src="/icons/unknown.gif" alt="[ ]">software_0.1-0.log</td><td align="right">17-Nov-2009 13:46 </td><td align="right">186K</td></tr>
我需要提取 software_0.1-0 部分以及 17-Nov-2009 部分。我怎样才能做到这一点?
非常感谢。
【问题讨论】:
-
从这个例子中,过滤的标准是什么并不清楚 - 它看起来可能是“
<td>标签之间的文本”,但这不太合适(有一个@ 987654323@ 你似乎不想要)。你能详细说明一下吗?