【发布时间】:2017-02-01 15:22:59
【问题描述】:
我有一个csv,看起来像(标题 = 第一行):
name,a,a1,b,b1
arnold,300311,arnld01,300311,arnld01
sam,300713,sam01,300713,sam01
当我跑步时:
df = pd.read_csv('file.csv')
a 和 b 列的末尾有一个 .0,如下所示:
df.head()
name,a,a1,b,b1
arnold,300311.0,arnld01,300311.0,arnld01
sam,300713.0,sam01,300713.0,sam01
a 和 b 列是整数或空白,那么为什么 pd.read_csv() 将它们视为浮点数,我如何确保它们在读取时是整数?
【问题讨论】:
-
你用的是什么版本的python和pandas?我无法在 Python 3.5.1 或 Python 2.7.10 中使用 Pandas
0.18.1复制它 -
“空白”是什么意思?你的意思是
NaN值吗?如果是这样,该列将需要浮点 dtype,因为NaN是浮点数,而不是整数。您可能可以有选择地将非NaN值转换为整数,但我认为这不是可取的。将它们作为整数而不是浮点数有什么好处? -
Python 版本 = 3.5.1 |Anaconda 2.5.0(64 位)和 Pandas 0.18.1