【问题标题】:Replace regex in a file, in-place, with Common Lisp用 Common Lisp 就地替换文件中的正则表达式
【发布时间】:2015-07-23 01:23:24
【问题描述】:

我正在尝试编写 Python 正则表达式搜索和替换的 Common Lisp 版本,并对文件进行就地修改:

import fileinput, re

for line in fileinput.input(inplace=1, backup='.bak'):
    line = re.sub(r"foo", "bar", line, re.M)
print (line)

这是我能想到的 Common Lisp 代码:

(require :cl-ppcre)

(defun in-place-subst (file)
  (with-open-file (stream file :direction :io :if-exists :overwrite)
    (loop for line = (read-line stream nil)
       while line do
         (write-line (cl-ppcre:regex-replace-all "foo" line "bar") stream))))

它确实有效。现在替换文本将附加在文件的末尾。我的直接问题是我不知道如何替换内容。

为了更好地解释,如果file.txt 包含:

1 foo
2 bar
3 foobar

调用后

(in-place-subst "file.txt")

我明白了:

1 foo
2 bar
3 foobar
1 bar
2 bar
3 barbar

而不是正确的替换:

1 bar
2 bar
3 barbar

我尝试了所有可能的with-open-file 选项(来自Successful Lisp),但没有成功:

Keyword      Value                Action if File Exists
----------   ------------------   ---------------------------------------
:IF-EXISTS   NIL                  return NIL
:IF-EXISTS   :ERROR               signal an error
:IF-EXISTS   :NEW-VERSION         next version (or error)
:IF-EXISTS   :RENAME              rename existing, create new
:IF-EXISTS   :SUPERSEDE           replace file upon CLOSE
:IF-EXISTS   :RENAME-AND-DELETE   rename and delete existing, create new
:IF-EXISTS   :OVERWRITE           reuse existing file (position at start)
:IF-EXISTS   :APPEND              reuse existing file (position at end)

有人可以向我发送正确的方向,以便该函数以正确的方式呈现file.txt吗?

另外,如果cl-ppcre 是可用的,Common Lisp 惯用 方法是什么?

有没有更简洁的方法来使用 Common Lisp 进行就地正则表达式替换?

【问题讨论】:

  • FILE-POSITION 读取并设置文件位置。您可能想尝试一下。
  • 感谢您的建议。我试过(file-position stream :start),试图重置流的文件位置,但没有太大进展。我确信可以用更多的代码来做到这一点,(也许在内存中制作副本,进行替换并回写),但我希望找到一种更简洁,或许更惯用的方式。
  • 保存文件位置。阅读该行。将文件位置重置为开头。写新行。请注意,它不会更改行的大小或扩展文件。如果您的替换时间更短或更长,那么您需要处理...
  • 谢谢,您的评论让我思考了很多,并帮助我了解了更多文件位置的细微差别。我想到,更简单的方法是首先写入临时文件(如 Renzo 的回答),特别是因为在使用无法提前知道长度的正则表达式时来回控制文件位置变得不平凡。不过,你的想法很有趣,也是一个很好的练习。我需要花更多的时间在上面。我觉得可能有比临时文件技术更“lisp-esque”的方式。非常感谢。
  • @RainerJoswig 我花了几个小时试图通过使用FILE-POSITION 读取和设置文件位置来使该功能正常工作。正如您所说,问题在于与原件长度不同的替换。我几乎让它工作,但我需要截断流。似乎这样的功能还不可能,除非有人使用 Franz:franz.com/support/documentation/current/doc/… 我还找到了一个建议:mail-archive.com/cdr-discuss@common-lisp.net/msg00044.html 你知道现在有什么图书馆提供这个吗?

标签: file-io lisp common-lisp idioms in-place


【解决方案1】:

在 Python 中,没有“就地”修改文件的原始操作;反而, 有一个辅助类fileinput 的功能,它给人一种错觉 通过首先将文件复制到备份文件来修改文件,然后 读取备份文件并将处理结果写入原始文件。来自manual

可选的就地过滤:如果传递了关键字参数inplace=1fileinput.input()FileInput 构造函数,文件被移动 到备份文件,标准输出被定向到输入文件 (如果与备份文件同名的文件已经存在, 它将被静默替换)。 这使得编写一个过滤器来重写其输入文件成为可能。 如果给出了备份参数(通常为备份='.'), 它指定备份文件的扩展名,备份文件保留 大约;默认情况下,扩展名是 '.bak' 并且在输出时被删除 文件已关闭。读取标准输入时禁用就地过滤。

因此,在 Common Lisp 中执行此操作的方式是模仿 Python code,首先将文件复制到备份文件,例如使用此function my-copy-file,然后编写以下代码:

(defun in-place-subst (file)
  (let ((backup-file (concatenate 'string file ".bak")))
    (my-copy-file file backup-file)
    (with-open-file (in-stream backup-file)
      (with-open-file (out-stream file :direction :output :if-exists :supersede)
        (loop for line = (read-line in-stream nil)
           while line do
             (write-line (cl-ppcre:regex-replace-all "foo" line "bar") out-stream))))))

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-01-12
    • 1970-01-01
    • 2018-12-19
    • 1970-01-01
    • 1970-01-01
    • 2019-01-24
    • 2017-08-09
    相关资源
    最近更新 更多