【发布时间】:2012-04-25 13:13:55
【问题描述】:
我有使用 xpath 抓取的 HTML 网页。某个节点的etree.tostring 给了我这个字符串:
<script>
<!--
function escramble_758(){
var a,b,c
a='+1 '
b='84-'
a+='425-'
b+='7450'
c='9'
document.write(a+c+b)
}
escramble_758()
//-->
</script>
我只需要escramble_758() 的输出。我可以编写一个正则表达式来弄清楚整个事情,但我希望我的代码保持整洁。最好的选择是什么?
我正在浏览以下库,但没有看到确切的解决方案。他们中的大多数人都在尝试模拟浏览器,这让事情变得非常缓慢。
-
http://code.google.com/p/python-spidermonkey/(明明是
it's not yet possible to call a function defined in Javascript) - http://code.google.com/p/webscraping/(看不到任何关于 Javascript 的内容,我可能错了)
- http://pypi.python.org/pypi/selenium(模拟浏览器)
编辑:一个例子会很棒..(准系统就可以了)
【问题讨论】:
-
等等。这是骗子吗?还是睡衣错了,以至于有人删除了他们的答案?
-
@ErikReppen 我检查了睡衣,没有例子。
-
@RanRag 要求您尽可能展示一个示例。
-
我删除了它,因为我意识到它非常错误。
标签: javascript python screen-scraping