【发布时间】:2018-04-05 06:22:25
【问题描述】:
我正在尝试使用 SEC(美国证券交易委员会数据)。 SEC provides useful data in a txtformat。我在用
2017年第二季度财务报表数据集。你可以找到我使用的数据here。
我尝试将txt文件读入pandas dataframe。我尝试了以下方法:
sub = pd.read_fwf('sub.txt')
sub_1 = pd.read_csv('sub.txt')
使用 Pandas 的 read_fwf 函数没有错误 - 但输出完全是垃圾。这是数据框的头部:
adsh cik name sic countryba stprba cityba zipba bas1 bas2 baph countryma stprma cityma zipma mas1 mas2 countryinc stprinc ein former changed afs wksi fye form period fy fp filed accepted prevrpt detail instance nciks aciks Unnamed: 1
0 0000002178-17-000038\t2178\tADAMS RESOURCES & ... NaN
1 0000002488-17-000107\t2488\tADVANCED MICRO DEV... NaN
使用read_csv:Error tokenizing data. C error: Expected 2 fields in line 7, saw 3时确实出现错误
关于如何将数据读入熊猫数据框有什么想法吗?
【问题讨论】:
标签: python-3.x pandas import error-handling