【发布时间】:2013-03-13 20:22:05
【问题描述】:
这个问题可能不是一个特定的编程问题,但我尝试在科学文本中找到 H20、C02 等化学公式,然后我使用这个:
(?<=[\l\u]|\.)\d+
这可行 - 但现在也可以找到“点”之后的每个浮点数:
0.1234 -> 1234 is selected.
有没有机会阻止这种情况?提前致谢!
【问题讨论】:
-
也许从后面删除点?
-
你到底想匹配什么? SMILES 格式的字符串?你能提供一些例子吗?
-
只是化学式,如 H20 或 SO2,请参阅编辑 :)