【发布时间】:2016-05-11 11:29:29
【问题描述】:
这将用于删除我的自动化中不需要的内容 硒脚本!
我的问题: 客户端是否可以使用 JavaScript 或其他技术删除不需要的 HTML 代码?
示例场景:
- Facebook 时间线默认设置为随时在屏幕上最多显示 10 个帖子
- 我加载了 facebook 并生成了 10 个帖子 [其中 2 个帖子由用户“John”发布]
- 我运行了一个 [JavaScript?] 脚本,该脚本将抓取用户“John”发布内容的所有 div,并将它们从我的浏览器中删除
- ** 自动生成 2 个新帖子 - 或不自动生成! (要求是删除不需要的内容(类似于 AdBlocker?).. 如果该网站生成了 2 个新帖子,那就太好了!)
我不是在找人为我编写这个问题的解决方案,而是将我推向正确的方向(解决方案是一种奖励!)
然后我将使用我提出的解决方案更新这个问题(如果它存在的话)并清理帖子!
注意:我知道 Facebook 已经有一个内置的“停止关注”按钮来解决这个问题。 这种情况可能是,如果内容包括“您可能认识的人!”然后我想从我的浏览器中删除这部分 HTML !
更新: 由于没有代码,我添加了另一个示例场景!
- 我在 selenium 中加载了这个 SO 问题
- 我非常有信心,这篇文章会得到支持而不是反对!
HTML 当前包含:
<div id="content"> <p> <em>prepares for -10 within seconds<em> </p> </div>
- 我在当前浏览器中运行 [JavaScript?] 脚本,该脚本在 HTML 中搜索“在几秒钟内准备好 -10”
- 如果找到,我想删除父部分及其所有内容
HTML 然后包含:
<div id="content"> </div>
【问题讨论】:
标签: javascript python selenium