【发布时间】:2014-03-01 02:36:17
【问题描述】:
我在 Python 中使用 lxml 解析 JS 时遇到问题。当我执行下面的代码时,我的输出是:
""
from lxml.html.clean import Cleaner
cleaner = Cleaner()
cleaner.javascript = True
text = urllib2.urlopen("URL").read().decode("utf-8")
test = lxml.html.fromstring(cleaner.clean_html(text))
print test
我想要得到的是没有 js 东西的解析文本。有人可以解释一下吗?谢谢。
【问题讨论】: