【发布时间】:2016-06-27 06:27:47
【问题描述】:
一天中的美好时光,SO 社区。这是我最近遇到的问题:
我在主页上得到了这个 HTML 源代码:
<div id="contents_layout">
<iframe name="contentsFrame" id="contentsFrameID" src=""
width="100%" height="100%" scrolling="no" frameborder="0"
marginheight="0" marginwidth="0"></iframe>
</div>
我已经阅读了很多关于解析 iframe 的材料,但他们所做的只是从 iframe 获取 src 属性,然后再发出另一个请求。我不能在这里做同样的伎俩,因为 src 属性是空白的,下面是 web 逻辑。
我正在使用 Python 3.5、bs4 和请求。
页面源代码-http://collabedit.com/kqp88 框架源码-http://collabedit.com/hwuj7
不知道能不能分享原网页...
【问题讨论】:
-
拿到 iframe 后想做什么?
-
@PadraicCunningham 当然,我想解析它的内容。
-
我在任何一个源中都看不到 contents_layout 或 contentsFrameID
-
没错,我也是。这就是问题所在 - 我只是无法区分 iframe 加载的页面链接是什么。当我查看源代码时,它全是空白的,并且只有变量名,例如 contentFrameID 或 contentTextID。
-
第二个链接中的 iframe 的 id 为
vis_frame,这是你想要的吗?还有第一个链接如何适应这个?
标签: python parsing iframe beautifulsoup