【问题标题】:Manipulate data set column in r hadoop在 r hadoop 中操作数据集列
【发布时间】:2016-03-02 16:24:20
【问题描述】:

我有一个数据集,其中包含一个日期(2015 年 1 月 10 日、2016 年 1 月 10 日、2017 年 1 月 10 日)。我想改变它的格式(2015、2016、2017)。我需要使用 Hadoop 来做到这一点。

【问题讨论】:

标签: rhadoop


【解决方案1】:

使用正则表达式提取所需的值。

可以在此博客中找到带有示例的好教程:Extract date in required formats from hive tables

如果您只需要格式为“yyyy-MM”的年份和月份,请使用 regexp_extract(column_datetime,'(.*\-.*)\-.*',1)


编辑:最初 ^this^ 是作为 comment 发布的,但我将其包装为 answer,因此其他人可能会更快找到它。

【讨论】:

    【解决方案2】:

    另一种方式

    select regexp_replace('1/10/2015, 1/10/2016, 1/10/2017','(\\d/\\d\\d/)','') rr
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-07-22
      • 1970-01-01
      • 1970-01-01
      • 2010-11-13
      相关资源
      最近更新 更多