【发布时间】:2019-09-10 03:56:37
【问题描述】:
我正在从事一个工程项目,我在该项目中使用来自存档的机器性能数据。机器大约每 5 秒产生一个数据集,然后这些数据在多个.txt 文件中按日期提供,每个文件包含以下格式的数据。下面显示的数据来自2013_04_17.txt 文件,该文件包含该特定日期的所有性能数据。
2013-04-27 00:00:05.011
V_1 100 V_2 26695 V_3 33197 V_4 c681 V_5 29532
V_6 4600 V_7 4606 V_8 4f55 V_9 5a V_10 8063 V_11 4300 V_12 4700
V_13 4504 V_14 4400 V_15 4202 V_16 255 V_17 4300 V_18 91 V_19 6f
V_20 300 V_21 14784
V_22 5.085 V_23 7.840 V_24 -8.061 V_25 36.961
2013-04-27 00:00:10.163
V_1 100 V_2 26695 V_3 33199 V_4 c681 V_5 29872
V_6 4600 V_7 4606 V_8 4f55 V_9 5a V_10 8063 V_11 4300 V_12 4700
V_13 4504 V_14 4400 V_15 4202 V_16 255 V_17 4300 V_18 91 V_19 6f
V_20 300 V_21 14790
V_22 5.085 V_23 7.840 V_24 -8.061 V_25 37.961
.......
我需要以表格格式或 CSV 格式查看这些数据,以便能够生成性能图并检测任何异常情况。但是,我没有足够的 Python 编程经验来解析这个文本文件。
我已经研究了 pandas 和正则表达式的一些想法,但未能达到预期的结果,我希望有一个表格形式的数据或一个带有标题作为变量日期、时间、 V_1、V_2、V_3等以及后续行作为每5s获取的所有值。
【问题讨论】:
-
查看文件,您可以通过在空行上拆分(“\n\n\n”或类似)将文本拆分为多个部分,然后将结果列表中的每个元素用空格和/或换行符。
标签: python r database csv text