【发布时间】:2018-05-24 02:06:46
【问题描述】:
我有一个 csv 文件,其中包含很长的开始日期和结束日期列表,格式为 YYYYMMDD,即 20170516、20170430 ..
我必须找到start_date 和sell_date 之间的持续时间,它们最初是字符串格式的。
我必须添加这些日期之间的天数列。以下是我尝试过的。
import pandas as pd
import numpy as np
from datetime import datetime
from datetime import date
data = pd.read_csv('data/train.csv')
data['start_date'] = map(lambda t:datetime.strptime(t,'%Y%M%d'), data.start_date.values)
data['sell_date'] = map(lambda t:datetime.strptime(t,'%Y%M%d'), data.sell_date.values)
data['duration'] = data.sell_date.values - data.start_date.values
但这会产生以下错误
TypeError: unsupported operand type(s) for -: 'map' and 'map'
【问题讨论】:
标签: python python-3.x pandas