【发布时间】:2014-04-29 17:35:35
【问题描述】:
我已尝试使用以下代码在 html 文件中查找带下划线的文本,但它不起作用。
f=open("jk.html","r")
while True:
for line in f.read():
for i in line.split():
j=i.find("<ul>")
k=i.find("</ul>")
for m in range(j, k):
print(m)
f.close()
这是我的 HTML 文件:
<html>
<body>
<ul> hill </ul>
<p> millfhhf </p>
</body>
</html>
【问题讨论】:
-
解析html内容,建议使用python的xml解析模块之一。
-
顺便说一句
<ul>是无序列表。<u>是带下划线的文本。 -
如果您预计
while循环会中断,那么您将等待一段时间。
标签: python