Pythonic 分割字符串然后在结果上再次分割的方法？答案

【问题标题】：Pythonic way to split string then split again on result?Pythonic 分割字符串然后在结果上再次分割的方法？
【发布时间】：2016-09-29 15:55:10
【问题描述】：

有没有更pythonic的方式来做到这一点

def parse_address(hostname, addresses):
    netmask=''
    for address in addresses:
        if hostname in address:
            _hostname, _netmask = address.strip().split('/')
            hostname = _hostname.split()[-1]
            netmask = '/' + _netmask.split()[0]
            break

    return netmask

测试用例

如果你做 TDD

def test_parse_netmask(self):
        hostname = '127.0.0.1'

        stdout = [
            "1: lo    inet 127.0.0.1/8 scope host lo\       valid_lft forever preferred_lft forever",
            "3: wlp4s0    inet 192.168.2.133/24 brd 192.168.2.255 scope global dynamic wlp4s0\       valid_lft 58984sec preferred_lft 58984sec",
            "4: docker0    inet 172.17.0.1/16 scope global docker0\       valid_lft forever preferred_lft forever",
            "5: br-a49026d1a341    inet 172.18.0.1/16 scope global br-a49026d1a341\       valid_lft forever preferred_lft forever",
            "6: br-d26f2005f732    inet 172.19.0.1/16 scope global br-d26f2005f732\       valid_lft forever preferred_lft forever",
        ]

        netmask = scanner.parse_address(hostname, stdout)

        self.assertEqual(netmask, '/8')

【问题讨论】：

所以你基本上只想要你的主机名后面的数字？
哈哈是的，我很早就在获取主机名
不，您真正想问自己的问题是，“如何使源输入机器可解析？”
@CivFan 这是unix command on a remote device 的结果，这是我能得到的最好的结构化格式
如果你可以控制远程代码，并且可以使用psutil模块，看看psutil.net_if_addrs()。

标签： python split idioms

【解决方案1】：

def x(hostname,addresses):
    import re 
    for address in addresses:
        result = re.search(hostname+r"/\d", address)
        if result:
            return result.group(0).split(hostname)[1]

不知道它是否更“Pythonic”，但我会这样做。它对其他人来说是可读的，但它足够短，不会拖到函数上。

【讨论】：

【解决方案2】：

import re
hostname = '127.0.0.1'
stdout = [
            "1: lo    inet 127.0.0.1/8 scope host lo\       valid_lft forever preferred_lft forever",
            "3: wlp4s0    inet 192.168.2.133/24 brd 192.168.2.255 scope global dynamic wlp4s0\       valid_lft 58984sec preferred_lft 58984sec",
            "4: docker0    inet 172.17.0.1/16 scope global docker0\       valid_lft forever preferred_lft forever",
            "5: br-a49026d1a341    inet 172.18.0.1/16 scope global br-a49026d1a341\       valid_lft forever preferred_lft forever",
            "6: br-d26f2005f732    inet 172.19.0.1/16 scope global br-d26f2005f732\       valid_lft forever preferred_lft forever",
        ]

print [item.split('/')[-1] for item in re.findall(r'(?:\d+\.){3}\d+\/\d+',''.join(stdout)) if hostname  in item]

['8']

【讨论】：

我建议在循环之前使用 re.compile() 。如果没有别的，在理解部分之外有一些代码会更易读
正则表达式是一个强大的工具，但我认为你做得过火了，你的代码根本不明确。一个更“可读”的解决方案是re.findall('\d/(?P<netmask>\d+)', line)

【解决方案3】：

你能以这样的代码为基础吗？

from urllib.parse import urlparse

parseResult = urlparse('http://www.fake.ca/185')
print ( parseResult )

parseResult 是一个结构，其元素显示在 print 语句的输出中。

ParseResult(scheme='http', netloc='www.fake.ca', path='/185', params='', query='', fragment='')

【讨论】：