【发布时间】:2008-10-23 20:08:42
【问题描述】:
我已经开始使用 Jython,因为它似乎是一门优秀的语言,并且到目前为止已经证明是这样。
我正在使用 dom4j 从我在磁盘上的一堆 HTML 文件的 DOM 中操作和检索数据。我编写了下面的脚本来检查使用 Xpath 的 H1 标签和抓取文本的投掷 DOM,如果 H1 标签不存在于 DOM 中,它会搜索 title 标签并从中获取文本。
我对 Jython 很陌生,但我确信有一种方法可以比下面的方法更优雅地执行所需的任务,如果我的想法是正确的,有没有人可以告诉我一个更好的方法吗?
elemHolder = dom.createXPath('//xhtml:h1')
elemHolder.setNamespaceURIs(map)
elem = elemHolder.selectSingleNode(dom)
if elem != None:
h1 = elem.getText()
else:
elemHolder = dom.createXPath('//xhtml:title')
elemHolder.setNamespaceURIs(map)
elem = elemHolder.selectSingleNode(dom)
if elem != None:
title = elem.getText()
else:
title = "Page does not contain a H1 or title tag"
如果有人可以提供帮助,那就太好了。干杯
【问题讨论】:
标签: jython refactoring dom4j