【发布时间】:2012-07-04 11:05:12
【问题描述】:
我正在尝试抓取一个网站,我需要获取一个嵌入元素,但是因为我使用的是 Python 和 lxml.html,所以该网站准确地断定我没有安装 Flash,而不是向我展示嵌入元素,它向我展示了这个:
<div>
<font>
<u>
<b>
<a href="http://get.adobe.com/flashplayer/">
ATTENTION:<br>This video will not play. You currently do not have Adobe Flash installed on this computer. Please click here to download it (it's free!)
</a>
</b>
</u>
</font>
</div>
显然这是一个问题,所以我想知道是否有可能为了检索正确的元素而欺骗浏览器,让浏览器认为你安装了 Flash,即使你没有安装?
希望有人能帮忙!
【问题讨论】:
-
该部分是否被某些客户端 JavaScript 替换为实际加载时的
<embed>? -
其中 s1 是:
-
你不需要评论你自己的问题,你可以update it代替
标签: python screen-scraping web-scraping lxml