【发布时间】:2022-06-15 19:11:52
【问题描述】:
我确实有两个包含域的文件,在使用 readlines() 读取它之后,我得到了两个列表: a = ['abc.com','cde.com','efg.com'] b = ['yabc.com','cde.com','abce.com','efg.com']
现在我需要找到两者的共同点。
- 不允许部分匹配。(上面的 abc.com 有两个部分匹配)
- 没有订单
输出应该是:[''cde.com,'efg.com'] 我正在手动处理一个问题,在某些文件行中,我们有多个带有“|”的域分隔符如: abc.com|cde.com|efg.com 被视为一个字符串,并为我提供如下列表: ['abc.com|cde.com|efg.com\n','xyz.com'] 在这种情况下,abc、cde 和 efg.com 将再次丢失。
我试过set、intersection、两个for循环、re.search,但结果不准确。
【问题讨论】:
-
在处理之前尝试清理您的数据。如果您有类似 ['abc.com|cde.com|efg.com\n','xyz.com'] 的列表,则应首先将它们转换为 ['abc.com','cde.com','efg .com\n','xyz.com']
标签: python-3.6