【发布时间】:2017-06-06 18:01:22
【问题描述】:
我有一个字符串列表。每个字符串都包含我需要的特定字符序列——我正在寻找三到四个确切的序列——其余的包含需要从字符串中消除的不可预测的数据。即:
sequences = ['sequenceA', 'sequenceB', 'sequenceC']
bigList = ['Garbage sequenceB blahblah', 'sequenceA nonsense', 'silliness sequenceC', 'total nonsense']
goalList = ['sequenceB', 'sequenceA', 'sequenceC', '']
我可以使用 sub 或 .replace 删除特定字符,但这是反转:我需要删除除特定字符串之外的所有内容,对于没有特定序列实例的列表元素,我仍然需要保留元素,以便列表保持有序。我对正则表达式还是新手 - 有没有办法做到这一点我还没有找到?
【问题讨论】: