【发布时间】:2014-08-10 13:47:41
【问题描述】:
我正在尝试以 60hz (~16ms) 的间隔对位置数据进行基本插值。当我尝试在数据帧上使用 pandas 0.14 插值时,它告诉我我的数据集中只有 NaN(不是真的)。当我尝试在从数据帧中提取的单个系列上运行它时,它返回相同的系列而没有填充 NaN。我尝试使用不同的方法将索引设置为整数,摆弄插值函数的轴和限制参数- 没有骰子。我做错了什么?
df.head(5) :
x y ms
0 20.5815 14.1821 333.3333
1 NaN NaN 350
2 20.6112 14.2013 366.6667
3 NaN NaN 383.3333
4 20.5349 14.2232 400
df = df.set_index(df.ms) # set indices to milliseconds
当我尝试运行时
df.interpolate(method='values')
我收到此错误:
---------------------------------------------------------------------------
TypeError Traceback (most recent call last)
<ipython-input-462-cb0f1f01eb84> in <module>()
12
13
---> 14 df.interpolate(method='values')
15
16
/Users/jsb/anaconda/lib/python2.7/site-packages/pandas/core/generic.pyc in interpolate(self, method, axis, limit, inplace, downcast, **kwargs)
2511
2512 if self._data.get_dtype_counts().get('object') == len(self.T):
-> 2513 raise TypeError("Cannot interpolate with all NaNs.")
2514
2515 # create/use the index
TypeError: Cannot interpolate with all NaNs.
我也尝试过运行单个系列,它只返回我输入的内容:
temp = df.x
temp.interpolate(method='values')
333.333333 20.5815
350.000000 NaN
366.666667 20.6112
383.333333 NaN
400.000000 20.5349 Name: x, dtype: object
编辑:
感谢 Jeff 启发解决方案。
添加:
df[['x','y','ms']] = df[['x','y','ms']].astype(float)
之前
df.interpolate(method='values')
插值成功了。
【问题讨论】:
-
你能显示 df.info();你可能有对象 dtypes
-
df0.info()
Float64Index:100 个条目,0.0 到 1650.0 数据列(共 3 列):x 46 个非空对象 y 46 个非-null object ms 100 个非空对象 dtypes: object(3) -
它们是对象 dtypes - 它们应该被转换成什么东西吗?
-
objectdtypes 不好。只有类似字符串的应该是objectdtype。您是如何生成/阅读这些内容的? -
他们刚刚被输入了 vanilla pd.csv_read。我唯一做的就是用
df = df[1:].reset_index(drop=True)删除一个额外的标题行,然后用df.rename(columns={'X center':'x', 'Y center': 'y'},inplace=True)重命名列。有什么我做错了吗?
标签: python-2.7 pandas time-series interpolation