【发布时间】:2019-09-16 17:48:25
【问题描述】:
我有以下结构的查询:
SELECT 'SELECT ' || col_list || ' from schema.table;' from( Select table_name, rtrim(xmlagg(xml element(e, Case when datatype in ('blob', 'timestamp') then null else column_name end , ', ').extract('//text()') order by c_id).getclobval(), ', ' ) col_list from all_tab_cols where schema ='schema' and table in ('t1', 't2') group by table_name)
当前两列、第四列和第六列是 blob 或时间戳类型时,这会给我输出:
SELECT , , third_col, , fifth_col, from schema.table;
如何修改查询以使其提供:
SELECT third_col, fifth_col from schema.table;
这个生成的 select 语句进一步存储为 spark 数据帧中的一行(我使用的是 Scala)。因此,如果我们可以通过正则表达式或替换子字符串来修改查询,那也可以解决,我也愿意接受这些建议,但如果我不必以这种方式侵入并管理它,我将不胜感激在查询方面本身。
【问题讨论】:
标签: xml oracle scala apache-spark aggregation