【问题标题】:Problem with columns when importing file with Pandas使用 Pandas 导入文件时出现列问题
【发布时间】:2021-07-16 13:24:24
【问题描述】:

在 Pandas 上导入文本文件时遇到问题。当我在文本中打开文件时,列没有问题,但是当我用 Pandas 打开时,我无法拆分列并且 Jupiter-notebook 将其识别为一列。我想要三列标题为'Z'H'和'err'。what will give me when I open the saved file

data= np.genfromtxt('/path/hubel.dat')
df=pd.DataFrame(data)
df.columns= ['Z', 'H', 'err']
df_groupby_err=df.groupby("err")
for err, H  in df.groupby("err"):
    if err<20:
        print( )
        print( H )
        print( ) 
f=open("hubble_error_edited-2.txt", "w")
for err, H in df.groupby("err"):
    if err<20:
        f.write("\n"+str(H)+""+ "\n")
f.close()
data= pd.read_csv("/path/hubble_error_edited-2.txt" )

【问题讨论】:

  • 如果我理解你的程序,你将数据读入数据帧,然后 groupby 并写出每个组的字符串表示(空格分隔),然后尝试使用 read_csv 当你没有逗号分隔值。
  • 您的minimal reproducible example 应始终包含数据的最小示例。为什么选择 numpy.genfromtxt 而不是 Pandas I/O tools 之一?

标签: python pandas dataframe split


【解决方案1】:

您可以尝试在separator参数中添加blank space

data= pd.read_csv("/path/hubble_error_edited-2.txt", sep=' ')

【讨论】:

    猜你喜欢
    • 2020-12-18
    • 1970-01-01
    • 2019-05-06
    • 2020-11-08
    • 1970-01-01
    • 2019-12-07
    • 1970-01-01
    • 1970-01-01
    • 2015-08-25
    相关资源
    最近更新 更多