【问题标题】:Recursive wget: alter links递归 wget:更改链接
【发布时间】:2015-05-13 10:12:17
【问题描述】:

我正在尝试为 Google 爬虫优化我的 AJAX 片段链接(其中替换 "#!...""?_escaped_fragment_=..." 的链接,如 here 所述)。我想检查整个网站是否可以通过我实现的_escaped_fragment_ 链接访问。

我很好奇是否可以使用wget递归站点下载到此并使其替代"#!""_escaped_fragment_"链接,以便wget看到

abc.com?_escaped_fragment=arg=value

而不是

abc.com#!arg=值

【问题讨论】:

    标签: ajax linux web web-crawler wget


    【解决方案1】:

    不,您不能在 # 之后字符串不发送到服务器...它们用于 JavaScript 路由。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2023-03-28
      • 2017-01-02
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多