【问题标题】:get site name from a URL in python从python中的URL获取站点名称
【发布时间】:2009-02-03 17:53:30
【问题描述】:

我是 Python 新手,它似乎有很多我不知道的好功能。我可以使用什么函数来获取根站点名称?例如,如果我为函数提供 URL“http://www.faqs.org/docs/diveintopython/kgp_commandline.html”,我将如何获得 faqs.org

【问题讨论】:

  • 澄清一下,您真的只想要“faqs.org”还是想要“www.faqs.org”?试图获得前者是一个坏主意,因为它不能移植到像“www.amazon.co.uk”这样的域。

标签: python


【解决方案1】:
 >>> from urllib.parse import urlparse
 >>> urlparse('http://www.cwi.nl:80/%7Eguido/Python.html').hostname
 'www.cwi.nl'

【讨论】:

    【解决方案2】:

    被忽视的urlparse 模块:

    from urlparse import urlparse
    scheme, netloc, path, params, query, fragment = urlparse("http://www.faqs.org/docs/diveintopython/kgp_commandline.html")
    print netloc
    

    【讨论】:

    • netloc 可能包含端口号
    【解决方案3】:

    您正在学习哪个版本的 Python?请注意,SilentGhost 的答案适用于 Python 3.0,而 Alabaster Codify 的答案适用于 2.x 系列。

    【讨论】:

      猜你喜欢
      • 2013-03-03
      • 2012-12-20
      • 2018-06-26
      • 2010-12-11
      • 2019-07-13
      • 1970-01-01
      • 2016-05-13
      • 1970-01-01
      • 2013-11-01
      相关资源
      最近更新 更多