【问题标题】:How to load data separated by :: in pig如何在猪中加载由 :: 分隔的数据
【发布时间】:2018-03-25 19:20:53
【问题描述】:

我有一个文本文件,其中的字段由 :: 分隔,如下所示。

124::2345::3::647483
234::5940::3::939390
340::3492::3::948284

如何在 pig latin 中加载数据,使用 pigStorage 的参数是什么??

【问题讨论】:

    标签: hadoop apache-pig


    【解决方案1】:

    PigStorage 只接受单个字符。

    加载每一行的数据。使用带有正则表达式模式的STRSPLIT 来获取字段。

    A = LOAD 'data.txt' USING PigStorage('\n');
    B = FOREACH A GENERATE FLATTEN(STRSPLIT($0, '::'));
    

    \d B 输出

    (124,2345,3,647483)
    (234,5940,3,939390)
    (340,3492,3,948284)
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-09-16
      • 2014-02-13
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-11-27
      相关资源
      最近更新 更多