【发布时间】:2020-12-18 14:24:34
【问题描述】:
我正在尝试弄清楚如何处理以下情况:
我有手动输入的原始数据和几个不必要的字符,我需要清理该列。
如果少于 5 个字母,则应删除 (-,/,!,#) 等符号后面的任何内容。
原始数据
美国纽约 - LND 英国
GBKTG-U
DUB AE-EUUSA
美国-TY
SG !S
CNZOS !C 海
嘎嘎"T
AEU DGR# UK,GBR
期望的输出
LND 英国
GBKTG
欧洲美国
美国
SG
CNZOS
嘎嘎
英国GBR
【问题讨论】:
-
我不清楚“任何少于 5 个字母的内容”?你能详细说明一下吗?例如:在“NYC USA - LND UK”中,“NYC USA”不少于 5 个字母但您在输出中删除了,为什么?
-
@uguros 嗨,该列有时有起点和终点,我只需要终点。所以这就是为什么我需要删除 NYC USA。有时一个人只有随机的符号和没有意义的字母,例如 GAGAX"T 必须是 GAGAX。
标签: python regex replace python-re