【发布时间】:2019-06-29 02:09:25
【问题描述】:
我有一个包含 100 个文件夹的文件夹,命名如下:
parent_folder/05/01/
parent_folder/05/02/
parent_folder/05/03/
parent_folder/05/04/
...
parent_folder/05/29/
parent_folder/05/30/
如何使用正则表达式指定一个路径,该路径将仅选择文件夹的内容 01 to 10,然后是 11 to 20,最后是 21 to 30?
我在努力
"parent_folder/05/[1-10]*/*"
但它也会选择 11、12、... 一直到 19。
编辑:我想每隔 10 天在 pyspark 中读取一个大型数据集,但到目前为止,所有建议的答案似乎都失败了。
【问题讨论】:
-
当您说“选择”时,您需要对这些路径做什么?选择的路径是否需要传递给另一个程序?
-
我正在阅读一个庞大的数据库,我想在 pyspark 中分部分阅读。
-
[1-10] 无法按预期工作,因为正则表达式不会将“10”视为数字“十”。
-
你使用什么样的正则表达式? (perl、sed、grep、find)我认为您应该提供有关您想要什么以及如何实现选择的更多信息。
-
请尝试类似:
"parent_folder/05/"{01..10}.