【发布时间】:2023-04-04 13:00:01
【问题描述】:
我有一些数据由终端记录并保存到打字稿文件中。我知道如果需要,我可以将其更改为 .txt。问题似乎是,尽管在要求文件编码时返回 UTF-8,但我得到的错误似乎暗示编码是别的东西。例如,我无法将内容复制并粘贴到 Word 或其他文本编辑器中。
无论如何,我没有运气使用标准的 .gsub! 或 .tr 方法从该文件中删除非数字字符。
输入看起来像这样:
_4ÑZŸs_4ÑZâ7o[?1034h
_4ÑZ8obash-3.2$ e4ÑZ”C
i[A e4ÑZõD
oscript -re4ÑZˇ?
i[Ae4ÑZ∑@
opython go.pyf4ÑZÌ
i
f4ÑZ£Ì
o
f4ÑZÊÚoattn 0
f4ÑZ,Ûoattn 0
attn 0
Hf4ÑZuÛoattn 0
attn 0
attn 0
attn 0
attn 0
attn 0
attn 0
其中“0”可以是 0 到 128 之间的任何数字。
我只想要单词“attn”之后的数字,而不是 attn。
这是我当前的代码:
File.open("input.txt").each do |line|
number = line.gsub('[0-9]+', ' ')
File.open("output.txt", "w+") { |f| f.write(number) }
end
根据我所做的任何小改动,我要么得到一个枚举器,要么只得到输入文件的最后一个数字。
从没想过做这么基本的事情会这么难。
加分:让程序输出这些数字以将它们插入到 Excel 工作表的第一列或第三列中的最佳方法是什么(无限期地,直到我在终端中终止程序)?
生成输入文件的 Python 程序只是从 Serial 对象中获取值并将它们输出到终端,终端会生成相关的文本文件。我只是试图将它们从这个文本文件手动移动到 Excel 中(我现在愚蠢地尝试使用简单的 Ruby 脚本自动执行一项任务)。
Python 或 Ruby 中的脚本就足够了,只要它需要一个 .txt 文件作为输入(因为我正在处理已经生成的数据)。
我有一台 Mac,所以我使用 Pages,如果这有什么不同的话。
Here 是有问题的原始文件。编辑:出于安全原因删除文件。
TL;DR
如何仅在新行上打印打字稿(看似非 UTF-8)文件中的数字(每个数字的长度为 1-3 位)?
-
如何自动化整个过程,让我的 Python 程序无限期地(在无限
李>while True:循环内)将值插入到.numbers(Mac 版 Excel)文件中?
谢谢!
【问题讨论】:
标签: python ruby regex excel terminal