运行 fgrep 多核 mac os x

【问题标题】：Run fgrep multicore mac os x运行 fgrep 多核 mac os x
【发布时间】：2015-02-12 12:57:55
【问题描述】：

我在我的 8 核 Mac OS X 上运行这个命令：

for i in $(cat file1);do grep "$i" file2; done > output.txt

我的文件 2 有 900 万行，所以需要很多时间。

是否可以使用所有内核更快地完成这项工作？

【问题讨论】：

请尝试在 UNIX & Linux 或 Ask Different 上提问。
摆脱循环并使用grep -f file1 file2 > output.txt会更有效。
但我想以与 file1 相同的顺序获得结果。我的脚本它可以工作，但它太慢了

标签： macos grep multicore

【解决方案1】：

你可以试试这个awk：

awk 'FNR==NR {a[$0];next} {for (i in a) if ($0~i) print}' file1 file2  > output.txt

但我猜Paul R 发布的grep 会更快。

grep -f file1 file2 > output.txt

【讨论】：

我知道这更快，但我希望输出与 file1 的顺序相同，为此我使用了我的脚本

【解决方案2】：

基于http://www.gnu.org/software/parallel/man.html#EXAMPLE:-Grepping-n-lines-for-m-regular-expressions

parallel -k parallel --pipepart --block 100M -a file2 -k grep {} :::: file1

【讨论】：

猜你喜欢

1970-01-01
1970-01-01
1970-01-01
1970-01-01
2012-02-12
1970-01-01
1970-01-01
1970-01-01
1970-01-01

相关资源

下载 2023-01-09
下载 2021-11-03
下载 2022-12-22
下载 2021-06-06
下载 2023-01-01

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode