【问题标题】:Change date of a DateTimeIndex更改 DateTimeIndex 的日期
【发布时间】:2013-06-17 16:47:42
【问题描述】:

我有一个名为 data.csv 的 csv 文件,例如

TS;val
10:00;0.1
10:05;0.2
10:10;0.3
10:15;0.4

我使用这个脚本读取了这个 csv 文件

#!/usr/bin/env python
import pandas as pd

if __name__ == "__main__":
    yyyy = 2013
    mm = 2
    dd = 1

    df = pd.read_csv('data.csv', sep=';', parse_dates=[0], index_col=0)

    print(df)

我明白了

                     val
TS                      
2013-06-17 10:00:00  0.1
2013-06-17 10:05:00  0.2
2013-06-17 10:10:00  0.3
2013-06-17 10:15:00  0.4

我想将每个 DateTimeIndex 的日期更改为 2013-02-01

                     val
TS                      
2013-02-01 10:00:00  0.1
2013-02-01 10:05:00  0.2
2013-02-01 10:10:00  0.3
2013-02-01 10:15:00  0.4

有什么更简单的方法来做到这一点?

【问题讨论】:

  • 您可以在日期上使用datetime.replace(year, month, day)

标签: python pandas


【解决方案1】:

时间戳有一个replace 方法(就像日期时间一样):

In [11]: df.index.map(lambda t: t.replace(year=2013, month=2, day=1))
Out[11]:
array([Timestamp('2013-02-01 10:00:00', tz=None),
       Timestamp('2013-02-01 10:05:00', tz=None),
       Timestamp('2013-02-01 10:10:00', tz=None),
       Timestamp('2013-02-01 10:15:00', tz=None)], dtype=object)

因此将您的索引设置为:

In [12]: df.index = df.index.map(lambda t: t.replace(year=2013, month=2, day=1))

值得一提的是,您可以将date_parser 函数传递给read_csv,这对您来说可能更有意义:

In [21]: df = pd.read_csv(file_name, sep=';', parse_dates=[0], index_col=0, 
                          date_parser=lambda time: pd.Timestamp('2013/02/01 %s' % time))

In [22]: df
Out[22]:
                     val
TS
2013-02-01 10:00:00  0.1
2013-02-01 10:05:00  0.2
2013-02-01 10:10:00  0.3
2013-02-01 10:15:00  0.4

【讨论】:

  • 与安迪的回答略有不同:df.index = [ Timestamp('20130201') + timedelta(hours=t.hour,minutes=t.minute) for t in df.index.time ]
  • 它工作正常,但我想知道使用带有不同参数的 read_csv 是否会更有效。因为 read_csv 将日期设置为今天,我们替换了日期......也许我们可以只用一步来做到这一点?
  • @AndyHayden TOTD,我刚刚发布了同样的内容:(
  • 这给了TypeError: replace() takes no keyword arguments
  • @muon 当条目是时间戳或日期时间(其中 replace 方法接受上述 kwargs)时有效。如果是字符串,你会看到你描述的错误。
【解决方案2】:

提供date_parser

In [50]: pd.read_csv(StringIO(data), sep=';', parse_dates=[0], 
                     index_col=0, date_parser=lambda x: Timestamp('20130201 %s' % x))
Out[50]: 
                     val
TS                      
2013-02-01 10:00:00  0.1
2013-02-01 10:05:00  0.2
2013-02-01 10:10:00  0.3
2013-02-01 10:15:00  0.4

【讨论】:

    【解决方案3】:

    我看到了两种方法。第一个是最简单的:使用'string'.split(' ')。对于字符串bb jj,它将返回一个包含bbjj 2 个元素的列表,因此只需获取第一个元素即可。

    第二个选项是从字符串创建一个日期时间对象,然后按照您想要的方式重新格式化它。我认为这个解决方案更好。如果明天你想要另一种格式,这会容易得多。 为此:使用此处记录的strptime 函数:http://docs.python.org/2/library/datetime.html#datetime.datetime.strptime

    然后要从日期时间对象返回一个字符串,只需使用strftime function。所有不同的格式都可以在这里找到:http://docs.python.org/2/library/datetime.html#strftime-and-strptime-behavior

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2021-08-16
      • 2023-03-22
      • 2020-09-16
      • 2019-09-20
      • 2012-11-29
      • 1970-01-01
      • 2016-11-23
      • 2019-03-22
      相关资源
      最近更新 更多