【问题标题】:Sensible way to create filenames for files based on URLs?为基于 URL 的文件创建文件名的明智方法?
【发布时间】:2016-06-01 21:14:46
【问题描述】:

我正在使用 Python 和 Selenium 截取一堆网页。我想在本地保存 PNG 以供参考。 URL 列表如下所示:

www.mysite.com/dir1/pageA
www.mysite.com/dir1/pageB

我的问题是给截图的 PNG 提供什么文件名。

如果我调用图像文件,例如www.mysite.com/dir1/pageA.png 无意义的斜线在某些时候不可避免地会导致问题。

我可以将 URL 中的所有 / 字符替换为 _,但我怀疑这也可能会导致问题,例如如果 URL 中已经有 _ 字符。 (我并不严格需要能够从文件名反向工作到 URL,但这不会是一件坏事。)

什么是处理命名的明智方法?

【问题讨论】:

    标签: python filesystems naming


    【解决方案1】:

    在服务器上表示几乎可以肯定的目录结构的最简单方法是像wget 所做的那样在本地计算机上复制该结构。

    因此/ 字符成为目录分隔符,您的www.mysite.com/dir1/pageA.png 将成为名为@9​​87654324@ 的PNG 文件,位于名为dir1 的目录中,而dir1 位于名为www.mysite.com 的目录中。

    它很简单,保证是可逆的,并且不会冒模棱两可的结果。

    【讨论】:

      【解决方案2】:

      如果您使用“%2F”会怎样?它是 '/' 但 html 编码。

      来源: http://www.w3schools.com/tags/ref_urlencode.asp

      【讨论】:

      猜你喜欢
      • 2011-07-28
      • 2011-04-05
      • 1970-01-01
      • 2015-07-25
      • 2021-12-06
      • 1970-01-01
      • 2021-10-08
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多