【发布时间】:2016-04-03 00:21:01
【问题描述】:
我的(熊猫)数据框中有一列:
data['Start Date'].head()
type(data['Start Date'])
Output:
1/7/13
1/7/13
1/7/13
16/7/13
16/7/13
<class 'pandas.core.series.Series'>
当我将其转换为日期格式(如下)时,我收到错误 ValueError: Unknown string format
data['Start Date']= pd.to_datetime(data['Start Date'],dayfirst=True)
...
...
/Library/Python/2.7/site-packages/pandas/tseries/tools.pyc in _convert_listlike(arg, box, format, name)
381 return DatetimeIndex._simple_new(values, name=name, tz=tz)
382 except (ValueError, TypeError):
--> 383 raise e
384
385 if arg is None:
ValueError: Unknown string format
我在这里错过了什么?
【问题讨论】:
-
列中元素的具体数据类型是什么?
-
您可以通过
errors='coerce'(或早期版本中的coerce=True),然后查看哪个项目转换为NaT(因此无法转换为日期时间) -
类型是对象。我猜它被认为是字符串?
-
这可能确实是字符串(但也可以混合)。你试过我的建议了吗?