【发布时间】:2021-09-03 07:43:20
【问题描述】:
我正在尝试使用我认为是 python 版本的数据提取数据,到目前为止它一直在工作,但现在我遇到了一些数据,其中包含不需要的数字(这将在我尝试处理的文档中发生变化),所以我想知道是否有办法跳过这些数字。我使用的锚将是相同的,在下面的示例中是乔治亚州。单词和数字都被小圆圈隔开,所以它很容易,只是在实现一些 stackoverflow 帮助解决我的问题时遇到了麻烦。
我用过的,我需要的会加粗:
格鲁吉亚 * 372,000 * 0 * 0 * 145,982 * 36,000 * 0.09216
我一直使用这个公式来抓取锚字,然后使用另一个代码来抓取下面的单词或数字,它一直有效。 (Match(0).Value) 我尝试将 0 更改为 5 以尝试获取第 6 个值,但它不允许我这样做。 (?RegEx skip word 更新:从某人那里得到了一些帮助,建议我尝试使用它:
(Georgia)(?:\s*\*\s*\S+)(?:\s*\*\s*\S+)(?:\s*\*\s*\S+)(?:\s*\*\s*\S+)(?:\s*\*\s*\S+)\s*\*\s*([0-9,.]+)
,我可以使用这部分
(Georgia)(?:\s*\*\s*\S+){5}
突出显示我想要提取的值,但我无法弄清楚如何突出显示我想要的值。
【问题讨论】: