【发布时间】:2020-07-10 06:09:40
【问题描述】:
我是 python 新手,所以对任何高级的 dum qa 表示歉意, 我想将 csv 作为数据框导入 pandas,做一些“df.groupby”(基于“mean”),并与其他数据框合并, 问题是“平均值”的值被视为一个对象: 植物对象 组件 int64 PerUnitPrice 对象 >> 这就是我所说的 数据类型:对象 Traceback(最近一次调用最后一次):
我确实尝试使用 '.astype(float)' 进行转换 - 出现错误 与 : price_['PerUnitPrice'] = pd.to_numeric(price_['PerUnitPrice'],errors='coerce') 部分起作用->>它将所有大于999的值设置为Nan,至少我认为它是这样做的
这是我正在导入的 csv 中的一些行:
【问题讨论】:
-
您是否尝试过使用数千个="," 作为 read_csv() 方法的参数来指示千位分隔符?
-
不描述代码,分享代码;不要截图数据,提供数据的文本样本。一旦你这样做了,人们将能够帮助你,而不必猜测问题是什么。
-
请提供minimal reproducible example,以及完整的错误消息。