【问题标题】:Pythonic way to split string then split again on result?Pythonic 分割字符串然后在结果上再次分割的方法?
【发布时间】:2016-09-29 15:55:10
【问题描述】:

有没有更pythonic的方式来做到这一点

def parse_address(hostname, addresses):
    netmask=''
    for address in addresses:
        if hostname in address:
            _hostname, _netmask = address.strip().split('/')
            hostname = _hostname.split()[-1]
            netmask = '/' + _netmask.split()[0]
            break

    return netmask

测试用例

如果你做 TDD

def test_parse_netmask(self):
        hostname = '127.0.0.1'

        stdout = [
            "1: lo    inet 127.0.0.1/8 scope host lo\       valid_lft forever preferred_lft forever",
            "3: wlp4s0    inet 192.168.2.133/24 brd 192.168.2.255 scope global dynamic wlp4s0\       valid_lft 58984sec preferred_lft 58984sec",
            "4: docker0    inet 172.17.0.1/16 scope global docker0\       valid_lft forever preferred_lft forever",
            "5: br-a49026d1a341    inet 172.18.0.1/16 scope global br-a49026d1a341\       valid_lft forever preferred_lft forever",
            "6: br-d26f2005f732    inet 172.19.0.1/16 scope global br-d26f2005f732\       valid_lft forever preferred_lft forever",
        ]

        netmask = scanner.parse_address(hostname, stdout)

        self.assertEqual(netmask, '/8')

【问题讨论】:

  • 所以你基本上只想要你的主机名后面的数字?
  • 哈哈是的,我很早就在获取主机名
  • 不,您真正想问自己的问题是,“如何使源输入机器可解析?”
  • @CivFan 这是unix command on a remote device 的结果,这是我能得到的最好的结构化格式
  • 如果你可以控制远程代码,并且可以使用psutil模块,看看psutil.net_if_addrs()

标签: python split idioms


【解决方案1】:
def x(hostname,addresses):
    import re 
    for address in addresses:
        result = re.search(hostname+r"/\d", address)
        if result:
            return result.group(0).split(hostname)[1]

不知道它是否更“Pythonic”,但我会这样做。它对其他人来说是可读的,但它足够短,不会拖到函数上。

【讨论】:

    【解决方案2】:
    import re
    hostname = '127.0.0.1'
    stdout = [
                "1: lo    inet 127.0.0.1/8 scope host lo\       valid_lft forever preferred_lft forever",
                "3: wlp4s0    inet 192.168.2.133/24 brd 192.168.2.255 scope global dynamic wlp4s0\       valid_lft 58984sec preferred_lft 58984sec",
                "4: docker0    inet 172.17.0.1/16 scope global docker0\       valid_lft forever preferred_lft forever",
                "5: br-a49026d1a341    inet 172.18.0.1/16 scope global br-a49026d1a341\       valid_lft forever preferred_lft forever",
                "6: br-d26f2005f732    inet 172.19.0.1/16 scope global br-d26f2005f732\       valid_lft forever preferred_lft forever",
            ]
    
    print [item.split('/')[-1] for item in re.findall(r'(?:\d+\.){3}\d+\/\d+',''.join(stdout)) if hostname  in item]
    
    ['8']
    

    【讨论】:

    • 我建议在循环之前使用 re.compile() 。如果没有别的,在理解部分之外有一些代码会更易读
    • 正则表达式是一个强大的工具,但我认为你做得过火了,你的代码根本不明确。一个更“可读”的解决方案是re.findall('\d/(?P<netmask>\d+)', line)
    【解决方案3】:

    你能以这样的代码为基础吗?

    from urllib.parse import urlparse
    
    parseResult = urlparse('http://www.fake.ca/185')
    print ( parseResult )
    

    parseResult 是一个结构,其元素显示在 print 语句的输出中。

    ParseResult(scheme='http', netloc='www.fake.ca', path='/185', params='', query='', fragment='')

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-03-26
      • 1970-01-01
      • 2016-08-29
      • 1970-01-01
      • 2012-11-16
      相关资源
      最近更新 更多