【发布时间】:2021-01-05 13:01:14
【问题描述】:
我正在使用 pandas 将 csv 文件导入 python 数据框。 PFA 我的代码如下:
import pandas as pd
df=pd.read_csv('C:/Users/Administrator/Desktop/NSE_Normalize.csv')
当我使用上面的代码导入时,没有给出错误,但有一个警告,如图所示:
Columns (0,1,3) have mixed types.Specify dtype option on import or set low_memory=False.
通过参考答案Pandas read_csv low_memory and dtype options,我知道为什么会发生这种情况,并且我的文件具有模棱两可的数据类型。
我可以通过以下方式解决这个问题:
df = pd.read_csv("C:/Users/Administrator/Desktop/NSE_Normalize.csv",sep=',', error_bad_lines=False, index_col=False, dtype='unicode') as mentioned on [Specify dtype option on import or set low_memory=False][2]
但是当我导入与 Excel 工作簿(.xlsx 文件)相同的文件时。不会发生此错误。与对应的 csv 文件相比,导入的时间确实更长,但未显示错误。
因此,从上面的讨论中,我可能知道为什么在 python 中加载 .xlsx 文件的时间比它的 .csv 对应文件大吗?还有什么时候使用 .csv 导入和 .xlsx 导入?
这是我导入的文件:
【问题讨论】: