【发布时间】:2017-03-09 21:43:40
【问题描述】:
我有一个这样的熊猫数据框:
idx name
1 "NM_014855.2(AP5Z1):c.80_83delGGATinsTGCTGTAAACTGTAACTGTAAA (p.Arg27_Ala362delinsLeuLeuTer)"
2 "NM_014630.2(ZNF592):c.3136G>A (p.Gly1046Arg)"
3 "NM_000410.3(HFE):c.892+48G>A"
4 "NC_000014.9:g.(31394019_31414809)_(31654321_31655889)del"
我需要提取':' 字符后面的任何内容,直到出现以下任何内容:
" (""del"{end of string}
我尝试了以下方法:
df.str.extract(r"\):(.*) \(|\n")
但它并不适用于所有情况。
如何正确指定我需要的条件?
【问题讨论】:
标签: regex python-3.x pandas