【发布时间】:2019-01-04 17:53:11
【问题描述】:
我正在尝试使用pup 解析一个简单的 HTML 页面。 这是一个命令行 HTML 解析器,它接受一般的 HTML 选择器。
我要选择:
'div.aclass text{}' #(would be SampleA)
我也想选择:
'div.bclass text{}' #(would be SampleB)
我想连接它们并插入一些自定义文本以获得:
SampleA;MYEXTRASTRING;SampleB
我想避免多次调用 pup,因为它很慢。
我可以选择多个标签:
'div.aclass text{}, div.bclass text{}'
但这会导致:
SampleA
SampleB
有没有比 pup 更好的选择?
(注意:Python 不是一个选项,因为它对我的需求来说非常慢。)
【问题讨论】: