【发布时间】:2017-02-22 11:09:27
【问题描述】:
我正在使用一个简单的 csv 文件,其中包含有关卡路里摄入的数据。它有 4 列:cal、day、month、年份。它看起来像这样:
cal month year day
3668.4333 1 2002 10
3652.2498 1 2002 11
3647.8662 1 2002 12
3646.6843 1 2002 13
...
3661.9414 2 2003 14
# data types
cal float64
month int64
year int64
day int64
我正在尝试做一些简单的时间序列分析。因此,我想将month、year 和day 解析为单个列。我使用pandas 尝试了以下操作:
import pandas as pd
from pandas import Series, DataFrame, Panel
data = pd.read_csv('time_series_calories.csv', header=0, pars_dates=['day', 'month', 'year']], date_parser=True, infer_datetime_format=True)
我的问题是:(1)如何解析数据和(2)定义新列的数据类型?我知道还有很多其他类似的问题和答案(例如,请参阅here、here 和 here)——但到目前为止我还不能让它发挥作用。
【问题讨论】:
标签: python-3.x csv parsing pandas time-series