【发布时间】:2018-09-11 09:59:50
【问题描述】:
python新手,
尝试使用 pandas 对准备好比较的数据集进行排序,但是我需要先编辑某些方面才能进行比较。我的每个日期之前都有一个“A”,需要删除。除此之外,日期本身的格式是 YYYYDDD 需要更改为 DD/MM/YYYY 或我的其他数据集需要更改为 YYYYDDD,以最简单的为准。
我删除“A”的尝试如下,除了可能使用库“datetime”之外,我什至不知道从哪里开始修改日期。
import pandas as pd
import datetime
csv = '/home/student/Desktop/Ben_Folder/AirQuality/Test/2002_DDV.csv'
df = pd.read_csv(csv)
test = df(columns='Date'[1:7])
test.to_csv('Test.csv', header=['Date', 'AOD'])
数据集示例如下:
Date AOT
0 A2002185 0.0
1 A2002185 0.0
2 A2002185 0.0
3 A2002185 0.0
4 A2002185 0.0
【问题讨论】:
-
提供一个样本数据集(df.head()),那就很容易回答了
-
数据集确实有从001到365的变量,请参阅MODIS命名方法:lpdaac.usgs.gov/dataset_discovery/modis
标签: python pandas csv datetime