【发布时间】:2019-12-10 11:32:33
【问题描述】:
我有一个大文本文件,内容如下:
158 lines of Text
2000 lines of Data
140 lines of Text
2000 lines of Data
140 lines of Text
.
.
.
总共有 5 组 2000 行数据,我希望 python 读取和写入 5 个不同的文本文件。 像这样的:
Data1.txt
Data2.txt
Data3.txt
.
.
网上浏览发现如下:reading sections from a large text file in python efficiently
def get_block(beg,end):
output=open("Output.txt",'a')
with open("input.txt",'r') as f:
for line in f:
line=line.strip("\r\n")
line=line.split("\t")
position=str(line[0])
if int(position)<=beg:
pass
elif int(position)>=end:
break
else:
for i in line:
output.write(("%s\t")%(i))
output.write("\n")
哪个问题与我的类似,但是,这个函数我得到以下错误:
File "/Users/aperego/Desktop/HexaPaper/DataToPlot/ReadThermo.py", line 8, in get_block
if int(position)<=beg:
ValueError: invalid literal for int() with base 10: 'LAMMPS (5 Jun 2019)'
我认为这是因为我的输入文本文件在数据集之间有很多文本行。此外,它只接受一个间隔的行,而我希望我的脚本一次运行并提取所有包含数据的行。
我不知道修改此脚本是否是解决此问题的最佳方法,或者是否有更好的方法来实现我想要的目标。任何帮助表示赞赏!
【问题讨论】:
-
"ValueError: int() 基数为 10 的无效文字:" 在哪一行代码中?
-
您好,我不确定我理解您要做什么,请您详细说明一下好吗?谢谢。
-
错误表示您尝试转换空字符串
int("")。在int(position)之前检查print(position) -
@LuísFlávioFerranteMarcos 我有一个大文本文件,其中我的数据由文本行分隔,我试图让 python 遍历文件,选择我需要的各种数据间隔并将其写入一个新的文本文件。
-
@ElisByberi 我修改了条目,以便您可以看到完整的错误
标签: python loops split large-data lammps