【问题标题】:Can "perl -a" somehow re-join @F using the original whitespace?“perl -a”可以使用原始空格以某种方式重新加入@F吗?
【发布时间】:2017-12-28 23:52:52
【问题描述】:

为了便于阅读,我的输入混合了制表符和空格。我想使用perl -a 修改一个字段,然后以原始形式打印出该行。 (数据来自findup,显示重复文件的数量和它们浪费的空间。)输入是:

2 * 4096    backup/photos/photo.jpg photos/photo.jpg
2 * 111276032   backup/books/book.pdf book.pdf

输出会将字段 3 转换为千字节,如下所示:

2 * 4 KB    backup/photos/photo.jpg photos/photo.jpg
2 * 108668 KB   backup/books/book.pdf book.pdf

在我的梦想世界中,这将是我的代码,因为我可以将 perl 自动重组 @F 并保留原始空格:

perl -lanE '$F[2]=int($F[2]/1024)." KB"; print;'

在现实生活中,加入单个空格似乎是我唯一的选择:

perl -lanE '$F[2]=int($F[2]/1024)." KB"; print join(" ", @F);'

是否有任何自动变量可以记住分隔符?如果我有一个这样的魔法数组,代码将是:

perl -lanE 'BEGIN{use List::Util "reduce";} $F[2]=int($F[2]/1024)." KB"; print reduce { $a . shift(@magic) . $b } @F;'

【问题讨论】:

  • 顺便说一句,在元素之间使用空格打印:print "@F";

标签: perl text-processing


【解决方案1】:

不,没有这样的魔法物品。不过你可以手动完成

perl -wnE'@p = split /(\s+)/; $p[4] = int($p[4]/1024); print @p' input.txt

split 模式中的捕获括号意味着它也会被返回,因此您可以捕获精确的空格。由于数组中有空格,我们现在需要第五个字段。

事实证明,-F 具有相同的属性。感谢Сухой27。那么

perl -F'(\s+)' -lanE'$F[4] = int($F[4]/1024); say @F' input.txt

注意:with 5.20.0-F 现在暗示 -a-a 暗示 -n”。感谢ysth

【讨论】:

  • -F'(\s+)' 可以作为参数使用,say 会给出额外的换行符。
  • @Сухой27 哇。谢谢你。我想到了这一点并“回忆起”一个人只能在那里使用文字。 (我认为“回忆”来自$/ ...?)已修复并添加。
  • @piojo 更新了答案——事实证明这正是您所要求的。还修复了一个错误。
  • 谢谢,了解-F<group>split(/<group>/) 将非常有用!
【解决方案2】:

您可以找到该行的正确部分并对其进行修改:

perl -wpE's/^\s*+(?>\S+\s+){2}\K(\S+)/int($1\/1024) . " KB"/e'

【讨论】:

  • 在代码中转义 \ 太奇怪了,使用替代分隔符可以避免(例如 s!...!...!es{...}{...}e
猜你喜欢
  • 1970-01-01
  • 2015-07-05
  • 1970-01-01
  • 2023-01-28
  • 2010-09-08
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多