【问题标题】:Slicing and editiing date in .csv在 .csv 中拼接和编辑数据
【发布时间】:2018-09-11 09:59:50
【问题描述】:

python新手,

尝试使用 pandas 对准备好比较的数据集进行排序,但是我需要先编辑某些方面才能进行比较。我的每个日期之前都有一个“A”,需要删除。除此之外,日期本身的格式是 YYYYDDD 需要更改为 DD/MM/YYYY 或我的其他数据集需要更改为 YYYYDDD,以最简单的为准。

我删除“A”的尝试如下,除了可能使用库“datetime”之外,我什至不知道从哪里开始修改日期。

import pandas as pd
import datetime

csv = '/home/student/Desktop/Ben_Folder/AirQuality/Test/2002_DDV.csv'

df = pd.read_csv(csv)
test = df(columns='Date'[1:7])

test.to_csv('Test.csv', header=['Date', 'AOD'])

数据集示例如下:

       Date  AOT
0  A2002185  0.0
1  A2002185  0.0
2  A2002185  0.0
3  A2002185  0.0
4  A2002185  0.0

【问题讨论】:

标签: python pandas csv datetime


【解决方案1】:

Pandas 中的日期是stored as integers。您看到的任何 else 都只是这些整数的字符串表示形式。意识到这一点后,您将体会到转换为 datetime 对象的好处。

在这里你可以使用pd.to_datetime,它允许你指定你的格式:

df['Date'] = pd.to_datetime(df['Date'], format='A%Y%j')

print(df)

        Date  AOT
0 2002-07-04  0.0
1 2002-07-04  0.0
2 2002-07-04  0.0
3 2002-07-04  0.0
4 2002-07-04  0.0

Python's strftime directives 是构建自定义字符串格式的有用资源。

【讨论】:

  • 所以如果我想重新格式化为 DDMMYYYY 会是 %d%m%Y?我将如何应用它?
  • @Ben_Wright,如果您有新问题,请ask it separately。但请确保之前没有被问过。
猜你喜欢
  • 2016-10-31
  • 1970-01-01
  • 1970-01-01
  • 2022-11-10
  • 1970-01-01
  • 2018-12-31
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多