【问题标题】:sqoop import performance tuning by hardcoding boundary values通过硬编码边界值来调整 sqoop 导入性能
【发布时间】:2019-06-10 04:02:10
【问题描述】:

我正在尝试增加 sqoop 导入时间,同时使用按键拆分和映射器运行 ​​sqoop 导入。 它生成一个边界值查找查询(

19/01/09 00:32:37 INFO db.DataDrivenDBInputFormat: BoundingValsQuery: 
  SELECT MIN(TO_TIMESTAMP(USR_ACTN_DT, 'YYYY-MM-DD HH24:MI:SS.FF')), 
         MAX(TO_TIMESTAMP(USR_ACTN_DT, 'YYYY-MM-DD HH24:MI:SS.FF')) 
  FROM DB_schema.TABLENAME 
  WHERE ( USR_ACTN_DT > to_date('2018-12-03 19:45:12','YYYY-MM-DD HH24:MI:SS') )

)。

对我来说,边界查询大约需要 12 多个小时才能得到响应,我知道需要传递的边界值。 有没有办法在 sqoop 导入中直接传递边界值而不是边界查询..?

【问题讨论】:

    标签: import sqoop boundary


    【解决方案1】:

    当您知道需要传递的边界值时,您可以在 --boundary-query 参数下将该值指定为 --boundary-query 'select 1,100'

    如果它不起作用,请告诉我。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-12-22
      • 1970-01-01
      • 2015-02-25
      • 1970-01-01
      • 2012-06-22
      • 2013-10-04
      相关资源
      最近更新 更多