【问题标题】:Remove unwanted content on client side browser删除客户端浏览器上不需要的内容
【发布时间】:2016-05-11 11:29:29
【问题描述】:

这将用于删除我的自动化中不需要的内容 硒脚本!

我的问题: 客户端是否可以使用 JavaScript 或其他技术删除不需要的 HTML 代码?

示例场景:

  • Facebook 时间线默认设置为随时在屏幕上最多显示 10 个帖子
  • 我加载了 facebook 并生成了 10 个帖子 [其中 2 个帖子由用户“John”发布]
  • 我运行了一个 [JavaScript?] 脚本,该脚本将抓取用户“John”发布内容的所有 div,并将它们从我的浏览器中删除
  • ** 自动生成 2 个新帖子 - 或不自动生成! (要求是删除不需要的内容(类似于 AdBlocker?).. 如果该网站生成了 2 个新帖子,那就太好了!)

我不是在找人为我编写这个问题的解决方案,而是将我推向正确的方向(解决方案是一种奖励!)

然后我将使用我提出的解决方案更新这个问题(如果它存在的话)并清理帖子!

注意:我知道 Facebook 已经有一个内置的“停止关注”按钮来解决这个问题。 这种情况可能是,如果内容包括“您可能认识的人!”然后我想从我的浏览器中删除这部分 HTML !

更新: 由于没有代码,我添加了另一个示例场景!

  • 我在 selenium 中加载了这个 SO 问题
  • 我非常有信心,这篇文章会得到支持而不是反对!

HTML 当前包含:

 <div id="content">
     <p>
         <em>prepares for -10 within seconds<em>
     </p>
 </div>
  • 我在当前浏览器中运行 [JavaScript?] 脚本,该脚本在 HTML 中搜索“在几秒钟内准备好 -10”
  • 如果找到,我想删除父部分及其所有内容

HTML 然后包含:

 <div id="content">
 </div>

【问题讨论】:

    标签: javascript python selenium


    【解决方案1】:

    BrowserMob Proxy这样的代理怎么样...他们的登陆页面显示,

    它可以捕获网络应用程序的性能数据(通过 HAR 格式),如 以及操纵浏览器行为和流量,例如白名单 并将内容列入黑名单,模拟网络流量和延迟,以及 重写 HTTP 请求和响应。

    您可以使用代理过滤掉您希望删除的那些元素。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-04-20
      • 2018-12-14
      • 2018-01-19
      • 1970-01-01
      • 2011-10-08
      • 2012-08-23
      • 2016-07-04
      • 1970-01-01
      相关资源
      最近更新 更多