导入导出数据
在导入,导出DataFrame数据时,会用到各种格式,分为 to_csv ;to_excel;to_hdf;to_sql;to_json;to_msgpack ;to_html;to_gbq ;to_stata;to_clipboard;to_pickle
可参照IO Tools 分类。
输出指定colums是,会用到arg colums,例如
to_csv(filename,columns=["col1","col2"],......) # 此处注意的是要使用双引号,单引号不起效果,不知道为什么,另外 # index,header设置为False会不写入行号(索引好)和列标 #也可如下方式使用list函数 to_csv(filename,columns = list('col1','col2'),......)
如果想要保存为ascii文本则可以使用to_csv,可以对是否保存索引(行号)等参数进设置。
调换colums顺序
若原始数据是这样的:
In [6]: df
Out[6]:
0 1 2 3 4 mean
0 0.445598 0.173835 0.343415 0.682252 0.582616 0.445543
1 0.881592 0.696942 0.702232 0.696724 0.373551 0.670208
2 0.662527 0.955193 0.131016 0.609548 0.804694 0.632596
3 0.260919 0.783467 0.593433 0.033426 0.512019 0.436653
4 0.131842 0.799367 0.182828 0.683330 0.019485 0.363371
5 0.498784 0.873495 0.383811 0.699289 0.480447 0.587165
6 0.388771 0.395757 0.745237 0.628406 0.784473 0.588529
7 0.147986 0.459451 0.310961 0.706435 0.100914 0.345149
8 0.394947 0.863494 0.585030 0.565944 0.356561 0.553195
9 0.689260 0.865243 0.136481 0.386582 0.730399 0.561593
In [7]: cols = df.columns.tolist()
In [8]: cols
Out[8]: [0L, 1L, 2L, 3L, 4L, 'mean']